Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10001–10050 of 10817 papers

Title	Date	Tasks	Status
LLM-Assisted Multi-Teacher Continual Learning for Visual Question Answering in Robotic Surgery	Feb 26, 2024	Continual LearningExemplar-Free	CodeCode Available
NLQxform: A Language Model-based Question to SPARQL Transformer	Nov 8, 2023	Graph Question AnsweringKnowledge Graphs	CodeCode Available
RACQUET: Unveiling the Dangers of Overlooked Referential Ambiguity in Visual LLMs	Dec 18, 2024	Question Answering	CodeCode Available
NOAHQA: Numerical Reasoning with Interpretable Graph Question Answering Dataset	Sep 22, 2021	Graph Question AnsweringQuestion Answering	CodeCode Available
No Images, No Problem: Retaining Knowledge in Continual VQA with Questions-Only Memory	Feb 6, 2025	Continual LearningQuestion Answering	CodeCode Available
Probing Commonsense Knowledge in Pre-trained Language Models with Sense-level Precision and Expanded Vocabulary	Oct 12, 2022	Question Answering	CodeCode Available
Episodic Memory Reader: Learning What to Remember for Question Answering from Streaming Data	Mar 14, 2019	Question AnsweringReading Comprehension	CodeCode Available
Noise Estimation Using Density Estimation for Self-Supervised Multimodal Learning	Mar 6, 2020	Density EstimationNoise Estimation	CodeCode Available
Climate Finance Bench	May 28, 2025	Logical ReasoningQuantization	CodeCode Available
RadioRAG: Factual large language models for enhanced diagnostics in radiology using online retrieval augmented generation	Jul 22, 2024	DiagnosticQuestion Answering	CodeCode Available
Episodic Memory in Lifelong Language Learning	Jun 3, 2019	Continual LearningGeneral Classification	CodeCode Available
AdaVQA: Overcoming Language Priors with Adapted Margin Cosine Loss	May 5, 2021	Question AnsweringVisual Question Answering	CodeCode Available
No Length Left Behind: Enhancing Knowledge Tracing for Modeling Sequences of Excessive or Insufficient Lengths	Aug 7, 2023	Knowledge TracingQuestion Answering	CodeCode Available
EpiK-Eval: Evaluation for Language Models as Epistemic Models	Oct 23, 2023	Question Answering	CodeCode Available
Attentive Pooling Networks	Feb 11, 2016	Answer SelectionQuestion Answering	CodeCode Available
LLM Robustness Against Misinformation in Biomedical Question Answering	Oct 27, 2024	MisinformationQuestion Answering	CodeCode Available
Relation Extraction with Instance-Adapted Predicate Descriptions	Mar 22, 2025	DecoderQuestion Answering	CodeCode Available
Entropy-Based Decoding for Retrieval-Augmented Large Language Models	Jun 25, 2024	Open-Domain Question AnsweringQuestion Answering	CodeCode Available
Applying recent advances in Visual Question Answering to Record Linkage	Jul 12, 2020	Question AnsweringVisual Question Answering	CodeCode Available
Entity-Relation Extraction as Multi-Turn Question Answering	May 14, 2019	Machine Reading ComprehensionQuestion Answering	CodeCode Available
Reverse Question Answering: Can an LLM Write a Question so Hard (or Bad) that it Can't Answer?	Oct 20, 2024	Question Answeringvalid	CodeCode Available
Probing the Geometry of Truth: Consistency and Generalization of Truth Directions in LLMs Across Logical Transformations and Question Answering Tasks	Jun 1, 2025	In-Context LearningNegation	CodeCode Available
LLM-SQL-Solver: Can LLMs Determine SQL Equivalence?	Dec 16, 2023	Question AnsweringText to SQL	CodeCode Available
Towards Answering Climate Questionnaires from Unstructured Climate Reports	Jan 11, 2023	Question Answeringtext-classification	CodeCode Available
Say What You Mean! Large Language Models Speak Too Positively about Negative Commonsense Knowledge	May 10, 2023	Language ModelingLanguage Modelling	CodeCode Available
EntGPT: Linking Generative Large Language Models with Knowledge Bases	Feb 9, 2024	Entity DisambiguationEntity Linking	CodeCode Available
Ensemble Transformer for Efficient and Accurate Ranking Tasks: an Application to Question Answering Systems	Jan 15, 2022	DiversityEfficient Neural Network	CodeCode Available
No One is Perfect: Analysing the Performance of Question Answering Components over the DBpedia Knowledge Graph	Sep 26, 2018	Knowledge GraphsQuestion Answering	CodeCode Available
Ensemble ALBERT on SQuAD 2.0	Oct 19, 2021	Question Answering	CodeCode Available
Enhancing Vietnamese VQA through Curriculum Learning on Raw and Augmented Text Representations	Mar 5, 2025	Question AnsweringVisual Question Answering	CodeCode Available
CLIFT: Analysing Natural Distribution Shift on Question Answering Models in Clinical Domain	Oct 19, 2023	Question Answering	CodeCode Available
No perspective, no perception!! Perspective-aware Healthcare Answer Summarization	Jun 13, 2024	Community Question AnsweringQuestion Answering	CodeCode Available
Spoken Question Answering and Speech Continuation Using Spectrogram-Powered LLM	May 24, 2023	Language ModellingQuestion Answering	CodeCode Available
Enhancing the Transformer with Explicit Relational Encoding for Math Problem Solving	Oct 15, 2019	MathQuestion Answering	CodeCode Available
Review-guided Helpful Answer Identification in E-commerce	Mar 13, 2020	Answer SelectionCommunity Question Answering	CodeCode Available
Enhancing the AI2 Diagrams Dataset Using Rhetorical Structure Theory	May 1, 2018	Question AnsweringVisual Question Answering (VQA)	CodeCode Available
NORMY: Non-Uniform History Modeling for Open Retrieval Conversational Question Answering	Feb 7, 2024	Conversational Question AnsweringKeyphrase Extraction	CodeCode Available
CLEVR-Ref+: Diagnosing Visual Reasoning with Referring Expressions	Jan 3, 2019	DiagnosticImage Segmentation	CodeCode Available
ELOQ: Resources for Enhancing LLM Detection of Out-of-Scope Questions	Oct 18, 2024	HallucinationNatural Questions	CodeCode Available
Localizing Open-Ontology QA Semantic Parsers in a Day Using Machine Translation	Oct 10, 2020	Machine TranslationNMT	CodeCode Available
Locally Smoothed Neural Networks	Nov 22, 2017	Face VerificationQuestion Answering	CodeCode Available
LocalRQA: From Generating Data to Locally Training, Testing, and Deploying Retrieval-Augmented QA Systems	Mar 1, 2024	Question AnsweringRetrieval	CodeCode Available
CLEVR\_HYP: A Challenge Dataset and Baselines for Visual Question Answering with Hypothetical Actions over Images	Jun 1, 2021	Question AnsweringVisual Question Answering	CodeCode Available
Enhancing textual textbook question answering with large language models and retrieval augmented generation	Feb 5, 2024	Multiple-choiceQuestion Answering	CodeCode Available
CLEVR_HYP: A Challenge Dataset and Baselines for Visual Question Answering with Hypothetical Actions over Images	Apr 13, 2021	Question AnsweringVisual Question Answering	CodeCode Available
Enhancing Temporal Modeling of Video LLMs via Time Gating	Oct 8, 2024	MVBenchQuestion Answering	CodeCode Available
Location Aware Modular Biencoder for Tourism Question Answering	Jan 4, 2024	Question AnsweringRetrieval	CodeCode Available
Enhancing SPARQL Generation by Triplet-order-sensitive Pre-training	Oct 8, 2024	Graph Question AnsweringLanguage Modeling	CodeCode Available
Enhancing Retrieval in QA Systems with Derived Feature Association	Oct 2, 2024	Question AnsweringRAG	CodeCode Available
Enhancing Paraphrase Type Generation: The Impact of DPO and RLHF Evaluated with Human-Ranked Data	May 28, 2025	Machine TranslationParaphrase Generation	CodeCode Available

Show:10 25 50

← PrevPage 201 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified