Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9101–9125 of 10817 papers

Title	Date	Tasks	Status
Declarative Knowledge Distillation from Large Language Models for Visual Question Answering Datasets	Oct 12, 2024	Knowledge DistillationQuestion Answering	CodeCode Available
Deceiving Question-Answering Models: A Hybrid Word-Level Adversarial Approach	Nov 12, 2024	Abstractive Text SummarizationMachine Translation	CodeCode Available
QA-NatVer: Question Answering for Natural Logic-based Fact Verification	Oct 22, 2023	counterfactualFact Verification	CodeCode Available
A Simple Baseline for Knowledge-Based Visual Question Answering	Oct 20, 2023	In-Context LearningQuestion Answering	CodeCode Available
DCQA: Document-Level Chart Question Answering towards Complex Reasoning and Common-Sense Understanding	Oct 29, 2023	Answer GenerationChart Question Answering	CodeCode Available
Overcoming Language Priors in Visual Question Answering via Distinguishing Superficially Similar Instances	Sep 18, 2022	AttributeQuestion Answering	CodeCode Available
How Well Do Large Language Models Understand Syntax? An Evaluation by Asking Natural Language Questions	Nov 14, 2023	Prepositional Phrase AttachmentQuestion Answering	CodeCode Available
MMCoQA: Conversational Question Answering over Text, Tables, and Images	May 1, 2022	BenchmarkingConversational Question Answering	CodeCode Available
Interpretable Multi-hop Reasoning for Forecasting Future Links on Temporal Knowledge Graphs	Sep 29, 2021	Knowledge GraphsQuestion Answering	CodeCode Available
Bridging Languages through Images with Deep Partial Canonical Correlation Analysis	Jul 1, 2018	Image DescriptionImage Retrieval	CodeCode Available
Interpretable Natural Language Segmentation Based on Link Grammar	Nov 14, 2020	Question AnsweringRetrieval	CodeCode Available
A Self-Attentive model for Knowledge Tracing	Jul 16, 2019	Ad-Hoc Information RetrievalKnowledge Tracing	CodeCode Available
DCN+: Mixed Objective and Deep Residual Coattention for Question Answering	Oct 31, 2017	Question Answering	CodeCode Available
Interpretable Proof Generation via Iterative Backward Reasoning	May 22, 2022	Question Answering	CodeCode Available
REXUP: I REason, I EXtract, I UPdate with Structured Compositional Reasoning for Visual Question Answering	Jul 27, 2020	Question AnsweringVisual Question Answering	CodeCode Available
DBLP-QuAD: A Question Answering Dataset over the DBLP Scholarly Knowledge Graph	Mar 23, 2023	Question Answering	CodeCode Available
Dataset and Neural Recurrent Sequence Labeling Model for Open-Domain Factoid Question Answering	Jul 21, 2016	Answer GenerationQuestion Answering	CodeCode Available
Response Quality Assessment for Retrieval-Augmented Generation via Conditional Conformal Factuality	Jun 26, 2025	Conformal PredictionQuestion Answering	CodeCode Available
QA-prompting: Improving Summarization with Large Language Models using Question-Answering	May 20, 2025	In-Context LearningQuestion Answering	CodeCode Available
MMM: Multi-stage Multi-task Learning for Multi-choice Reading Comprehension	Oct 1, 2019	Logical ReasoningMachine Reading Comprehension	CodeCode Available
Dataset and Benchmark for Urdu Natural Scenes Text Detection, Recognition and Visual Question Answering	May 21, 2024	DiversityInformation Retrieval	CodeCode Available
ArxivBench: Can LLMs Assist Researchers in Conducting Research?	Apr 6, 2025	ArticlesQuestion Answering	CodeCode Available
A Russian Jeopardy! Data Set for Question-Answering Systems	Dec 4, 2021	named-entity-recognitionNamed Entity Recognition	CodeCode Available
MM-PoE: Multiple Choice Reasoning via. Process of Elimination using Multi-Modal Models	Dec 10, 2024	Multiple-choiceQuestion Answering	CodeCode Available
How to Tune a Multilingual Encoder Model for Germanic Languages: A Study of PEFT, Full Fine-Tuning, and Language Adapters	Jan 10, 2025	named-entity-recognitionNamed Entity Recognition	CodeCode Available

Show:10 25 50

← PrevPage 365 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified