Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5926–5950 of 10817 papers

Title	Date	Tasks	Status
Distill-SynthKG: Distilling Knowledge Graph Synthesis Workflow for Improved Coverage and Efficiency	Oct 22, 2024	Knowledge GraphsQuestion Answering	—Unverified
Benchmarking Retrieval-Augmented Large Language Models in Biomedical NLP: Application, Robustness, and Self-Awareness	May 13, 2024	Benchmarkingcounterfactual	—Unverified
An Inference Approach To Question Answering Over Knowledge Graphs	Dec 21, 2021	Knowledge GraphsQuestion Answering	—Unverified
Learning to Order Natural Language Texts	Aug 1, 2013	Concept-To-Text GenerationDocument Summarization	—Unverified
Long-form Question Answering: An Iterative Planning-Retrieval-Generation Approach	Nov 15, 2023	FormLong Form Question Answering	—Unverified
Learning to Navigate Wikipedia by Taking Random Walks	Oct 31, 2022	Fact VerificationNavigate	—Unverified
Learning to Model Multilingual Unrestricted Coreference in OntoNotes	Jul 1, 2012	Coreference ResolutionMachine Translation	—Unverified
Distilling Salient Reviews with Zero Labels	May 1, 2022	Question Answering	—Unverified
longhorns at DADC 2022: How many linguists does it take to fool a Question Answering model? A systematic approach to adversarial attacks.	Jul 1, 2022	Extractive Question-AnsweringQuestion Answering	—Unverified
Learning to Map Natural Language Statements into Knowledge Base Representations for Knowledge Base Construction	May 1, 2018	Graph EmbeddingKnowledge Base Construction	—Unverified
Learning to Make Inferences in a Semantic Parsing Task	Jan 1, 2016	Machine TranslationNatural Language Inference	—Unverified
Distilling an End-to-End Voice Assistant Without Instruction Training Data	Oct 3, 2024	Question Answering	—Unverified
Learning to Jointly Predict Ellipsis and Comparison Structures	Aug 1, 2016	Question AnsweringReading Comprehension	—Unverified
Benchmarking Poisoning Attacks against Retrieval-Augmented Generation	May 24, 2025	BenchmarkingQuestion Answering	—Unverified
An In-Context Schema Understanding Method for Knowledge Base Question Answering	Oct 22, 2023	In-Context LearningKnowledge Base Question Answering	—Unverified
Long-Tailed Question Answering in an Open World	May 11, 2023	Knowledge DistillationLanguage Modelling	—Unverified
Long-Term Memory Networks for Question Answering	Jul 6, 2017	Question Answering	—Unverified
Learning to Interactively Learn and Assist	Jun 24, 2019	Imitation LearningQuestion Answering	—Unverified
Learning to Initialize: Can Meta Learning Improve Cross-task Generalization in Prompt Tuning?	Feb 16, 2023	Few-Shot LearningLanguage Modeling	—Unverified
Learning to Inference Adaptively for Multimodal Large Language Models	Mar 13, 2025	HallucinationQuestion Answering	—Unverified
Learning to Imagine: Integrating Counterfactual Thinking in Neural Discrete Reasoning	May 1, 2022	counterfactualQuestion Answering	—Unverified
DistilDoc: Knowledge Distillation for Visually-Rich Document Applications	Jun 12, 2024	document-image-classificationDocument Image Classification	—Unverified
Learning to Identify Follow-Up Questions in Conversational Question Answering	Jul 1, 2020	Conversational Question AnsweringQuestion Answering	—Unverified
Learning to Generate Word Representations using Subword Information	Aug 1, 2018	ChunkingLanguage Modeling	—Unverified
Learning to Generate Questions by Recovering Answer-containing Sentences	Jan 1, 2021	Machine Reading ComprehensionQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 238 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified