Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8301–8325 of 10817 papers

Title	Date	Tasks	Status
``Look, some Green Circles!'': Learning to Quantify from Images	Aug 1, 2016	Question AnsweringVisual Question Answering (VQA)	—Unverified
Generating Dialogue Agents via Automated Planning	Feb 2, 2019	Question Answering	—Unverified
Rewriting Conversational Utterances with Instructed Large Language Models	Oct 10, 2024	Conversational SearchQuestion Answering	—Unverified
Combining Heterogeneous Models for Measuring Relational Similarity	Jun 1, 2013	Question Answering	—Unverified
ReWind: Understanding Long Videos with Instructed Learnable Memory	Nov 23, 2024	Large Language ModelQuestion Answering	—Unverified
Revolutionizing Retrieval-Augmented Generation with Enhanced PDF Structure Recognition	Jan 23, 2024	Question AnsweringRAG	—Unverified
Combining dependency information and generalization in a pattern-based approach to the classification of lexical-semantic relation instances	May 1, 2014	ClassificationGeneral Classification	—Unverified
Generating clickbait spoilers with an ensemble of large language models	May 25, 2024	Passage RetrievalQuestion Answering	—Unverified
Ask Your Neurons: A Neural-based Approach to Answering Questions about Images	May 5, 2015	Question Answering	—Unverified
Generating Answering Patterns from Factoid Arabic Questions	Sep 1, 2017	Information RetrievalQuestion Answering	—Unverified
Combining Deep Neural Reranking and Unsupervised Extraction for Multi-Query Focused Summarization	Feb 2, 2023	DiversityExtractive Summarization	—Unverified
Revisiting the Superficial Alignment Hypothesis	Sep 27, 2024	Instruction FollowingMath	—Unverified
Revisiting the Primacy of English in Zero-shot Cross-lingual Transfer	Jun 30, 2021	Cross-Lingual TransferQuestion Answering	—Unverified
ReXVQA: A Large-scale Visual Question Answering Benchmark for Generalist Chest X-ray Understanding	Jun 4, 2025	NegationNegation Detection	—Unverified
RGAR: Recurrence Generation-augmented Retrieval for Factual-aware Medical Question Answering	Feb 19, 2025	Decision MakingLanguage Modeling	—Unverified
Rhetorical relations markers in Russian RST Treebank	Sep 1, 2017	Coreference ResolutionQuestion Answering	—Unverified
Rich Knowledge Sources Bring Complex Knowledge Conflicts: Recalibrating Models to Reflect Conflicting Evidence	Oct 25, 2022	Language ModelingLanguage Modelling	—Unverified
RiddleSense: Reasoning about Riddle Questions Featuring Linguistic Creativity and Commonsense Knowledge	Jan 2, 2021	counterfactualCounterfactual Reasoning	—Unverified
Generating Answer Candidates for Quizzes and Answer-Aware Question Generators	Aug 29, 2021	Question AnsweringQuestion Generation	—Unverified
RS-MoE: Mixture of Experts for Remote Sensing Image Captioning and Visual Question Answering	Nov 3, 2024	DescriptiveImage Captioning	—Unverified
Right-truncatable Neural Word Embeddings	Jun 1, 2016	Dependency ParsingMachine Translation	—Unverified
RikiNet: Reading Wikipedia Pages for Natural Question Answering	Apr 30, 2020	Natural Language UnderstandingNatural Questions	—Unverified
Ripple Down Rules for Question Answering	Dec 12, 2014	Question Answering	—Unverified
Generating High Quality Proposition Banks for Multilingual Semantic Role Labeling	Jul 1, 2015	Question AnsweringSemantic Role Labeling	—Unverified
Revisiting the Open-Domain Question Answering Pipeline	Sep 2, 2020	Information RetrievalMachine Reading Comprehension	—Unverified

Show:10 25 50

← PrevPage 333 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified