Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9126–9150 of 10817 papers

Title	Date	Tasks	Status
Data-driven Approach for Quality Evaluation on Knowledge Sharing Platform	Mar 1, 2019	Question Answering	CodeCode Available
How to Determine the Preferred Image Distribution of a Black-Box Vision-Language Model?	Sep 3, 2024	In-Context LearningLanguage Modeling	CodeCode Available
MM-Prompt: Cross-Modal Prompt Tuning for Continual Visual Question Answering	May 26, 2025	Continual LearningQuestion Answering	CodeCode Available
InterroLang: Exploring NLP Models and Datasets through Dialogue-based Explanations	Oct 9, 2023	Dialogue Act ClassificationHate Speech Detection	CodeCode Available
QASC: A Dataset for Question Answering via Sentence Composition	Oct 25, 2019	Common Sense ReasoningMulti-hop Question Answering	CodeCode Available
QASiNa: Religious Domain Question Answering using Sirah Nabawiyah	Oct 12, 2023	Language ModellingLarge Language Model	CodeCode Available
IntKB: A Verifiable Interactive Framework for Knowledge Base Completion	Dec 1, 2020	Knowledge Base CompletionQuestion Answering	CodeCode Available
MM-R5: MultiModal Reasoning-Enhanced ReRanker via Reinforcement Learning for Document Retrieval	Jun 14, 2025	Instruction FollowingMultimodal Reasoning	CodeCode Available
Intrinsic Subgraph Generation for Interpretable Graph based Visual Question Answering	Mar 26, 2024	Decision MakingExplainable artificial intelligence	CodeCode Available
Bridging Background Knowledge Gaps in Translation with Automatic Explicitation	Dec 3, 2023	Question AnsweringTranslation	CodeCode Available
Introducing MathQA -- A Math-Aware Question Answering System	Jun 28, 2019	MathQuestion Answering	CodeCode Available
Data Distribution Bottlenecks in Grounding Language Models to Knowledge Bases	Sep 15, 2023	Data AugmentationKnowledge Base Question Answering	CodeCode Available
Data Augmentation for Biomedical Factoid Question Answering	Apr 10, 2022	Data AugmentationInformation Retrieval	CodeCode Available
BRENT: Bidirectional Retrieval Enhanced Norwegian Transformer	Apr 19, 2023	Dependency ParsingExtractive Question-Answering	CodeCode Available
A Claim Decomposition Benchmark for Long-form Answer Verification	Oct 16, 2024	FormHallucination	CodeCode Available
DARA: Decomposition-Alignment-Reasoning Autonomous Language Agent for Question Answering over Knowledge Graphs	Jun 11, 2024	In-Context LearningKnowledge Graphs	CodeCode Available
How Robust are the Tabular QA Models for Scientific Tables? A Study using Customized Dataset	Mar 30, 2024	Question Answering	CodeCode Available
How Much Knowledge Can You Pack into a LoRA Adapter without Harming LLM?	Feb 20, 2025	Question Answering	CodeCode Available
D3: Data Diversity Design for Systematic Generalization in Visual Question Answering	Sep 15, 2023	DiversityQuestion Answering	CodeCode Available
QASports: A Question Answering Dataset about Sports	Sep 25, 2023	Decision MakingQuestion Answering	CodeCode Available
RFiD: Towards Rational Fusion-in-Decoder for Open-Domain Question Answering	May 26, 2023	DecoderNatural Questions	CodeCode Available
CXReasonBench: A Benchmark for Evaluating Structured Diagnostic Reasoning in Chest X-rays	May 23, 2025	DiagnosticQuestion Answering	CodeCode Available
MobileBERT: a Compact Task-Agnostic BERT for Resource-Limited Devices	Apr 6, 2020	Natural Language InferenceQuestion Answering	CodeCode Available
QAVA: Query-Agnostic Visual Attack to Large Vision-Language Models	Apr 15, 2025	Question AnsweringVisual Question Answering	CodeCode Available
cViL: Cross-Lingual Training of Vision-Language Models using Knowledge Distillation	Jun 7, 2022	Knowledge DistillationQuestion Answering	CodeCode Available

Show:10 25 50

← PrevPage 366 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified