Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10001–10025 of 10817 papers

Title	Date	Tasks	Status
NOAHQA: Numerical Reasoning with Interpretable Graph Question Answering Dataset	Sep 22, 2021	Graph Question AnsweringQuestion Answering	CodeCode Available
No Images, No Problem: Retaining Knowledge in Continual VQA with Questions-Only Memory	Feb 6, 2025	Continual LearningQuestion Answering	CodeCode Available
Relation Extraction with Instance-Adapted Predicate Descriptions	Mar 22, 2025	DecoderQuestion Answering	CodeCode Available
Noise Estimation Using Density Estimation for Self-Supervised Multimodal Learning	Mar 6, 2020	Density EstimationNoise Estimation	CodeCode Available
EQA-RM: A Generative Embodied Reward Model with Test-time Scaling	Jun 12, 2025	Embodied Question AnsweringQuestion Answering	CodeCode Available
ClinKD: Cross-Modal Clinical Knowledge Distiller For Multi-Task Medical Images	Feb 9, 2025	Clinical KnowledgeMedical Visual Question Answering	CodeCode Available
Decomposed Prompting to Answer Questions on a Course Discussion Board	Jul 30, 2024	Language ModelingLanguage Modelling	CodeCode Available
AttenWalker: Unsupervised Long-Document Question Answering via Attention-based Graph Walking	May 3, 2023	Few-Shot LearningQuestion Answering	CodeCode Available
Episodic Memory Reader: Learning What to Remember for Question Answering from Streaming Data	Mar 14, 2019	Question AnsweringReading Comprehension	CodeCode Available
No Length Left Behind: Enhancing Knowledge Tracing for Modeling Sequences of Excessive or Insufficient Lengths	Aug 7, 2023	Knowledge TracingQuestion Answering	CodeCode Available
AQA: Adaptive Question Answering in a Society of LLMs via Contextual Multi-Armed Bandit	Sep 20, 2024	Question Answering	CodeCode Available
Episodic Memory in Lifelong Language Learning	Jun 3, 2019	Continual LearningGeneral Classification	CodeCode Available
Review-guided Helpful Answer Identification in E-commerce	Mar 13, 2020	Answer SelectionCommunity Question Answering	CodeCode Available
LLM Robustness Against Misinformation in Biomedical Question Answering	Oct 27, 2024	MisinformationQuestion Answering	CodeCode Available
Sentence Embeddings for Russian NLU	Oct 29, 2019	Multiple-choiceParaphrase Identification	CodeCode Available
EpiK-Eval: Evaluation for Language Models as Epistemic Models	Oct 23, 2023	Question Answering	CodeCode Available
Probing the Geometry of Truth: Consistency and Generalization of Truth Directions in LLMs Across Logical Transformations and Question Answering Tasks	Jun 1, 2025	In-Context LearningNegation	CodeCode Available
Entropy-Based Decoding for Retrieval-Augmented Large Language Models	Jun 25, 2024	Open-Domain Question AnsweringQuestion Answering	CodeCode Available
Active Learning to Guide Labeling Efforts for Question Difficulty Estimation	Sep 14, 2024	Active LearningQuestion Answering	CodeCode Available
Climate Finance Bench	May 28, 2025	Logical ReasoningQuantization	CodeCode Available
LLM-SQL-Solver: Can LLMs Determine SQL Equivalence?	Dec 16, 2023	Question AnsweringText to SQL	CodeCode Available
ELOQ: Resources for Enhancing LLM Detection of Out-of-Scope Questions	Oct 18, 2024	HallucinationNatural Questions	CodeCode Available
No One is Perfect: Analysing the Performance of Question Answering Components over the DBpedia Knowledge Graph	Sep 26, 2018	Knowledge GraphsQuestion Answering	CodeCode Available
Entity-Relation Extraction as Multi-Turn Question Answering	May 14, 2019	Machine Reading ComprehensionQuestion Answering	CodeCode Available
EntGPT: Linking Generative Large Language Models with Knowledge Bases	Feb 9, 2024	Entity DisambiguationEntity Linking	CodeCode Available

Show:10 25 50

← PrevPage 401 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified