Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9101–9150 of 10817 papers

Title	Date	Tasks	Status
Outside Knowledge Conversational Video (OKCV) Dataset -- Dialoguing over Videos	Jun 11, 2025	Question AnsweringVisual Question Answering	CodeCode Available
Declarative Knowledge Distillation from Large Language Models for Visual Question Answering Datasets	Oct 12, 2024	Knowledge DistillationQuestion Answering	CodeCode Available
Bridging Languages through Images with Deep Partial Canonical Correlation Analysis	Jul 1, 2018	Image DescriptionImage Retrieval	CodeCode Available
Deceiving Question-Answering Models: A Hybrid Word-Level Adversarial Approach	Nov 12, 2024	Abstractive Text SummarizationMachine Translation	CodeCode Available
DCQA: Document-Level Chart Question Answering towards Complex Reasoning and Common-Sense Understanding	Oct 29, 2023	Answer GenerationChart Question Answering	CodeCode Available
A Simple Baseline for Knowledge-Based Visual Question Answering	Oct 20, 2023	In-Context LearningQuestion Answering	CodeCode Available
A Claim Decomposition Benchmark for Long-form Answer Verification	Oct 16, 2024	FormHallucination	CodeCode Available
DCN+: Mixed Objective and Deep Residual Coattention for Question Answering	Oct 31, 2017	Question Answering	CodeCode Available
How to Tune a Multilingual Encoder Model for Germanic Languages: A Study of PEFT, Full Fine-Tuning, and Language Adapters	Jan 10, 2025	named-entity-recognitionNamed Entity Recognition	CodeCode Available
QA-NatVer: Question Answering for Natural Logic-based Fact Verification	Oct 22, 2023	counterfactualFact Verification	CodeCode Available
Interpretable Multi-hop Reasoning for Forecasting Future Links on Temporal Knowledge Graphs	Sep 29, 2021	Knowledge GraphsQuestion Answering	CodeCode Available
MMCoQA: Conversational Question Answering over Text, Tables, and Images	May 1, 2022	BenchmarkingConversational Question Answering	CodeCode Available
Interpretable Natural Language Segmentation Based on Link Grammar	Nov 14, 2020	Question AnsweringRetrieval	CodeCode Available
Overcoming Language Priors in Visual Question Answering via Distinguishing Superficially Similar Instances	Sep 18, 2022	AttributeQuestion Answering	CodeCode Available
Bridging Background Knowledge Gaps in Translation with Automatic Explicitation	Dec 3, 2023	Question AnsweringTranslation	CodeCode Available
Interpretable Proof Generation via Iterative Backward Reasoning	May 22, 2022	Question Answering	CodeCode Available
DBLP-QuAD: A Question Answering Dataset over the DBLP Scholarly Knowledge Graph	Mar 23, 2023	Question Answering	CodeCode Available
A Self-Attentive model for Knowledge Tracing	Jul 16, 2019	Ad-Hoc Information RetrievalKnowledge Tracing	CodeCode Available
Dataset and Neural Recurrent Sequence Labeling Model for Open-Domain Factoid Question Answering	Jul 21, 2016	Answer GenerationQuestion Answering	CodeCode Available
Dataset and Benchmark for Urdu Natural Scenes Text Detection, Recognition and Visual Question Answering	May 21, 2024	DiversityInformation Retrieval	CodeCode Available
ArxivBench: Can LLMs Assist Researchers in Conducting Research?	Apr 6, 2025	ArticlesQuestion Answering	CodeCode Available
Resource-efficient Inference with Foundation Model Programs	Apr 9, 2025	modelQuestion Answering	CodeCode Available
MMM: Multi-stage Multi-task Learning for Multi-choice Reading Comprehension	Oct 1, 2019	Logical ReasoningMachine Reading Comprehension	CodeCode Available
Data-driven Approach for Quality Evaluation on Knowledge Sharing Platform	Mar 1, 2019	Question Answering	CodeCode Available
Aligning Language Models to Explicitly Handle Ambiguity	Apr 18, 2024	Language ModelingLanguage Modelling	CodeCode Available
QA-prompting: Improving Summarization with Large Language Models using Question-Answering	May 20, 2025	In-Context LearningQuestion Answering	CodeCode Available
How to Determine the Preferred Image Distribution of a Black-Box Vision-Language Model?	Sep 3, 2024	In-Context LearningLanguage Modeling	CodeCode Available
MM-PoE: Multiple Choice Reasoning via. Process of Elimination using Multi-Modal Models	Dec 10, 2024	Multiple-choiceQuestion Answering	CodeCode Available
How Robust are the Tabular QA Models for Scientific Tables? A Study using Customized Dataset	Mar 30, 2024	Question Answering	CodeCode Available
Data Distribution Bottlenecks in Grounding Language Models to Knowledge Bases	Sep 15, 2023	Data AugmentationKnowledge Base Question Answering	CodeCode Available
InterroLang: Exploring NLP Models and Datasets through Dialogue-based Explanations	Oct 9, 2023	Dialogue Act ClassificationHate Speech Detection	CodeCode Available
MM-Prompt: Cross-Modal Prompt Tuning for Continual Visual Question Answering	May 26, 2025	Continual LearningQuestion Answering	CodeCode Available
A Russian Jeopardy! Data Set for Question-Answering Systems	Dec 4, 2021	named-entity-recognitionNamed Entity Recognition	CodeCode Available
IntKB: A Verifiable Interactive Framework for Knowledge Base Completion	Dec 1, 2020	Knowledge Base CompletionQuestion Answering	CodeCode Available
ArtQuest: Countering Hidden Language Biases in ArtVQA	Jan 4, 2024	Question AnsweringVisual Question Answering	CodeCode Available
Intrinsic Subgraph Generation for Interpretable Graph based Visual Question Answering	Mar 26, 2024	Decision MakingExplainable artificial intelligence	CodeCode Available
MM-R5: MultiModal Reasoning-Enhanced ReRanker via Reinforcement Learning for Document Retrieval	Jun 14, 2025	Instruction FollowingMultimodal Reasoning	CodeCode Available
Introducing MathQA -- A Math-Aware Question Answering System	Jun 28, 2019	MathQuestion Answering	CodeCode Available
QASC: A Dataset for Question Answering via Sentence Composition	Oct 25, 2019	Common Sense ReasoningMulti-hop Question Answering	CodeCode Available
Data Augmentation for Biomedical Factoid Question Answering	Apr 10, 2022	Data AugmentationInformation Retrieval	CodeCode Available
DARA: Decomposition-Alignment-Reasoning Autonomous Language Agent for Question Answering over Knowledge Graphs	Jun 11, 2024	In-Context LearningKnowledge Graphs	CodeCode Available
BRENT: Bidirectional Retrieval Enhanced Norwegian Transformer	Apr 19, 2023	Dependency ParsingExtractive Question-Answering	CodeCode Available
Self-Bootstrapped Visual-Language Model for Knowledge Selection and Question Answering	Apr 22, 2024	Language ModelingLanguage Modelling	CodeCode Available
How Much Knowledge Can You Pack into a LoRA Adapter without Harming LLM?	Feb 20, 2025	Question Answering	CodeCode Available
How much do LLMs learn from negative examples?	Mar 18, 2025	Multiple-choiceQuestion Answering	CodeCode Available
D3: Data Diversity Design for Systematic Generalization in Visual Question Answering	Sep 15, 2023	DiversityQuestion Answering	CodeCode Available
CXReasonBench: A Benchmark for Evaluating Structured Diagnostic Reasoning in Chest X-rays	May 23, 2025	DiagnosticQuestion Answering	CodeCode Available
QASiNa: Religious Domain Question Answering using Sirah Nabawiyah	Oct 12, 2023	Language ModellingLarge Language Model	CodeCode Available
Sentence Embeddings for Russian NLU	Oct 29, 2019	Multiple-choiceParaphrase Identification	CodeCode Available
cViL: Cross-Lingual Training of Vision-Language Models using Knowledge Distillation	Jun 7, 2022	Knowledge DistillationQuestion Answering	CodeCode Available

Show:10 25 50

← PrevPage 183 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified