Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9401–9450 of 10817 papers

Title	Date	Tasks	Status
A BERT Baseline for the Natural Questions	Jan 24, 2019	Natural QuestionsQuestion Answering	CodeCode Available
Continual Dialogue State Tracking via Example-Guided Question Answering	May 23, 2023	Continual LearningDialogue State Tracking	CodeCode Available
Context-VQA: Towards Context-Aware and Purposeful Visual Question Answering	Jul 28, 2023	Question AnsweringVisual Question Answering	CodeCode Available
Multi-granularity hierarchical attention fusion networks for reading comprehension and question answering	Nov 29, 2018	Question AnsweringReading Comprehension	CodeCode Available
Knowledge Corpus Error in Question Answering	Oct 27, 2023	Open-Domain Question AnsweringQuestion Answering	CodeCode Available
Contextualized Word Representations for Reading Comprehension	Dec 10, 2017	Language ModelingLanguage Modelling	CodeCode Available
Knowledge Diffusion for Neural Dialogue Generation	Jul 1, 2018	Dialogue GenerationQuestion Answering	CodeCode Available
Beyond Bilinear: Generalized Multimodal Factorized High-order Pooling for Visual Question Answering	Aug 10, 2017	Question AnsweringVisual Question Answering	CodeCode Available
Multigrid Neural Memory	Jun 13, 2019	Question Answering	CodeCode Available
Graph Learning in the Era of LLMs: A Survey from the Perspective of Data, Models, and Tasks	Dec 17, 2024	Domain GeneralizationGraph Learning	CodeCode Available
Contextualized Sequence Likelihood: Enhanced Confidence Scores for Natural Language Generation	Jun 3, 2024	Question AnsweringText Generation	CodeCode Available
GraphextQA: A Benchmark for Evaluating Graph-Enhanced Large Language Models	Oct 12, 2023	Answer GenerationHallucination	CodeCode Available
Graph-Based Reasoning over Heterogeneous External Knowledge for Commonsense Question Answering	Sep 9, 2019	Common Sense ReasoningGraph Attention	CodeCode Available
Are you tough enough? Framework for Robustness Validation of Machine Comprehension Systems	Oct 22, 2018	Question AnsweringReading Comprehension	CodeCode Available
Beyond Accuracy Optimization: Computer Vision Losses for Large Language Model Fine-Tuning	Sep 20, 2024	Language ModelingLanguage Modelling	CodeCode Available
Are you tough enough? Framework for Robustness Validation of Machine Comprehension Systems	Dec 5, 2018	Question AnsweringReading Comprehension	CodeCode Available
Multi-Hop Paragraph Retrieval for Open-Domain Question Answering	Jun 15, 2019	Open-Domain Question AnsweringQuestion Answering	CodeCode Available
A General Framework for Producing Interpretable Semantic Text Embeddings	Oct 4, 2024	Question AnsweringQuestion Generation	CodeCode Available
Adaptive Document Retrieval for Deep Question Answering	Aug 20, 2018	Question AnsweringRetrieval	CodeCode Available
Multi-hop Question Answering via Reasoning Chains	Oct 7, 2019	Coreference ResolutionMulti-hop Question Answering	CodeCode Available
GradBias: Unveiling Word Influence on Bias in Text-to-Image Generative Models	Aug 29, 2024	Bias DetectionFairness	CodeCode Available
Knowledge Generation for Zero-shot Knowledge-based VQA	Feb 4, 2024	Question AnsweringVisual Question Answering	CodeCode Available
Multi-hop Reading Comprehension via Deep Reinforcement Learning based Document Traversal	May 23, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available
Gotta: Generative Few-shot Question Answering by Prompt-based Cloze Data Augmentation	Jun 7, 2023	Data AugmentationQuestion Answering	CodeCode Available
Knowledge Graph Completion using Structural and Textual Embeddings	Apr 24, 2024	Knowledge Graph CompletionKnowledge Graphs	CodeCode Available
MURRE: Multi-Hop Table Retrieval with Removal for Open-Domain Text-to-SQL	Feb 16, 2024	Open-Domain Question AnsweringQuestion Answering	CodeCode Available
Multi-Image Visual Question Answering	Dec 27, 2021	Question AnsweringVisual Question Answering	CodeCode Available
Gold: A Global and Local-aware Denoising Framework for Commonsense Knowledge Graph Noise Detection	Oct 18, 2023	DenoisingKnowledge Graphs	CodeCode Available
Knowledge Graph Embedding via Dynamic Mapping Matrix	Jul 1, 2015	Graph EmbeddingKnowledge Graph Completion	CodeCode Available
Language Models Meet Anomaly Detection for Better Interpretability and Generalizability	Apr 11, 2024	Anomaly DetectionLanguage Modelling	CodeCode Available
GNN2R: Weakly-Supervised Rationale-Providing Question Answering over Knowledge Graphs	Dec 4, 2023	Explanation GenerationGraph Neural Network	CodeCode Available
Beyond Accuracy: A Consolidated Tool for Visual Question Answering Benchmarking	Oct 11, 2021	BenchmarkingQuestion Answering	CodeCode Available
Repurposing Entailment for Multi-Hop Question Answering Tasks	Apr 20, 2019	Multi-hop Question AnsweringQuestion Answering	CodeCode Available
GloVe: Global Vectors for Word Representation	Oct 1, 2014	Document ClassificationInformation Retrieval	CodeCode Available
GlossGPT: GPT for Word Sense Disambiguation using Few-shot Chain-of-Thought Prompting	Mar 1, 2025	Question AnsweringWord Sense Disambiguation	CodeCode Available
GLoMo: Unsupervisedly Learned Relational Graphs as Transferable Representations	Jun 14, 2018	image-classificationImage Classification	CodeCode Available
Question-Answering Approach to Evaluating Legal Summaries	Sep 26, 2023	Question Answering	CodeCode Available
Globally Normalized Reader	Sep 8, 2017	Data AugmentationQuestion Answering	CodeCode Available
Question Answering as Global Reasoning over Semantic Abstractions	Jun 9, 2019	Information RetrievalMultiple-choice	CodeCode Available
PediaBench: A Comprehensive Chinese Pediatric Dataset for Benchmarking Large Language Models	Dec 9, 2024	BenchmarkingInstruction Following	CodeCode Available
Peek Across: Improving Multi-Document Modeling via Cross-Document Question-Answering	May 24, 2023	Query-focused SummarizationQuestion Answering	CodeCode Available
Beyond 512 Tokens: Siamese Multi-depth Transformer-based Hierarchical Encoder for Long-Form Document Matching	Apr 26, 2020	ClusteringForm	CodeCode Available
Multilevel Hierarchical Network with Multiscale Sampling for Video Question Answering	May 9, 2022	multimodal interactionQuestion Answering	CodeCode Available
Give me Some Hard Questions: Synthetic Data Generation for Clinical QA	Dec 5, 2024	Question AnsweringQuestion Generation	CodeCode Available
Peering into the Mind of Language Models: An Approach for Attribution in Contextual Question Answering	May 28, 2024	Question Answering	CodeCode Available
Better RAG using Relevant Information Gain	Jul 16, 2024	DiversityQuestion Answering	CodeCode Available
Better Explain Transformers by Illuminating Important Information	Jan 18, 2024	Question Answering	CodeCode Available
Are You Talking to a Machine? Dataset and Methods for Multilingual Image Question Answering	May 21, 2015	Question AnsweringSentence	CodeCode Available
GETT-QA: Graph Embedding based T2T Transformer for Knowledge Graph Question Answering	Mar 23, 2023	Graph EmbeddingGraph Question Answering	CodeCode Available
Knowledge-Guided Prompt Learning for Request Quality Assurance in Public Code Review	Oct 29, 2024	Prompt LearningQuestion Answering	CodeCode Available

Show:10 25 50

← PrevPage 189 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified