Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4531–4540 of 10817 papers

Title	Date	Tasks	Status
Automatic recognition of habituals: a three-way classification of clausal aspect	Sep 1, 2015	General ClassificationQuestion Answering	—Unverified
Advancing Large Language Model Attribution through Self-Improving	Oct 17, 2024	Language ModelingLanguage Modelling	—Unverified
Inference Scaled GraphRAG: Improving Multi Hop Question Answering on Knowledge Graphs	Jun 24, 2025	Information RetrievalKnowledge Graphs	—Unverified
Automatic Question Generation using Relative Pronouns and Adverbs	Jul 1, 2018	DescriptiveDialogue Generation	—Unverified
Decision Knowledge Graphs: Construction of and Usage in Question Answering for Clinical Practice Guidelines	Aug 6, 2023	Knowledge GraphsQuestion Answering	—Unverified
Decipherment	Aug 1, 2013	DeciphermentPart-Of-Speech Tagging	—Unverified
Automatic Question-Answering Using A Deep Similarity Neural Network	Aug 5, 2017	Question Answering	—Unverified
An Empirical Evaluation of Visual Question Answering for Novel Objects	Apr 8, 2017	Question AnsweringVisual Question Answering	—Unverified
Inference to the Best Explanation in Large Language Models	Feb 16, 2024	Question Answering	—Unverified
Deceptive Answer Prediction with User Preference Graph	Aug 1, 2013	Answer SelectionCommunity Question Answering	—Unverified

Show:10 25 50

← PrevPage 454 of 1082Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified