Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3701–3750 of 10817 papers

Title	Date	Tasks	Status
DoQA -- Accessing Domain-Specific FAQs via Conversational QA	May 4, 2020	Conversational Question AnsweringInformation Retrieval	—Unverified
Annotating Zero Anaphora for Question Answering	May 1, 2018	Question Answering	—Unverified
GEM-RAG: Graphical Eigen Memories For Retrieval Augmented Generation	Sep 23, 2024	Question AnsweringRAG	—Unverified
GenDec: A robust generative Question-decomposition method for Multi-hop reasoning	Feb 17, 2024	Multi-hop Question AnsweringQuestion Answering	—Unverified
General Embedding vs. Task-Specific Embedding: A Comparative Approach to Enhancing NLP Performance	Jan 30, 2025	Multi-Task Learning	—Unverified
Generalized Hadamard-Product Fusion Operators for Visual Question Answering	Mar 26, 2018	Neural Architecture SearchQuestion Answering	—Unverified
Generating Dialogue Agents via Automated Planning	Feb 2, 2019	Question Answering	—Unverified
Generating Training Data for Semantic Role Labeling based on Label Transfer from Linked Lexical Resources	Jan 1, 2016	General ClassificationMachine Translation	—Unverified
Character-Aware Neural Networks for Arabic Named Entity Recognition for Social Media	Dec 1, 2016	Feature EngineeringInformation Retrieval	—Unverified
How Additional Knowledge can Improve Natural Language Commonsense Question Answering?	Sep 19, 2019	ArticlesLanguage Modeling	—Unverified
Don’t Read Too Much Into It: Adaptive Computation for Open-Domain Question Answering	Nov 1, 2020	Open-Domain Question AnsweringQuestion Answering	—Unverified
Beyond Plain Spatial Knowledge: Determining Where Entities Are and Are Not Located, and For How Long	Aug 1, 2016	Coreference ResolutionQuestion Answering	—Unverified
Don't Read Too Much into It: Adaptive Computation for Open-Domain Question Answering	Nov 10, 2020	Open-Domain Question AnsweringQuestion Answering	—Unverified
Annotating the Focus of Negation in Japanese Text	May 1, 2014	Natural Language InferenceNegation	—Unverified
GEMeX: A Large-Scale, Groundable, and Explainable Medical VQA Benchmark for Chest X-ray Diagnosis	Nov 25, 2024	Medical Visual Question AnsweringMultiple-choice	—Unverified
Annotating Relation Inference in Context via Question Answering	Aug 1, 2016	Natural Language InferenceQuestion Answering	—Unverified
Are Multilingual Models the Best Choice for Moderately Under-resourced Languages? A Comprehensive Assessment for Catalan	Jul 16, 2021	Language ModelingLanguage Modelling	—Unverified
Do not let the history haunt you: Mitigating Compounding Errors in Conversational Question Answering	May 1, 2020	Conversational Question AnsweringQuestion Answering	—Unverified
Extending Neural Question Answering with Linguistic Input Features	Aug 1, 2019	Question Answering	—Unverified
Extending the Frontier of ChatGPT: Code Generation and Debugging	Jul 17, 2023	Code GenerationQuestion Answering	—Unverified
EKTVQA: Generalized use of External Knowledge to empower Scene Text in Text-VQA	Aug 22, 2021	Open-Ended Question AnsweringOptical Character Recognition (OCR)	—Unverified
Extracting Context-Rich Entailment Rules from Wikipedia Revision History	Jul 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
Do not let the history haunt you -- Mitigating Compounding Errors in Conversational Question Answering	May 12, 2020	Conversational Question AnsweringQuestion Answering	—Unverified
Extracting Definitions and Hypernym Relations relying on Syntactic Dependencies and Support Vector Machines	Aug 1, 2013	Question AnsweringRelation Extraction	—Unverified
Extracting Emotion Phrases from Tweets using BART	Mar 21, 2024	Question AnsweringSentiment Analysis	—Unverified
Extracting Factual Min/Max Age Information from Clinical Trial Studies	Apr 5, 2019	ArticlesPassage Retrieval	—Unverified
Beyond Logit Lens: Contextual Embeddings for Robust Hallucination Detection & Grounding in VLMs	Nov 28, 2024	AttributeHallucination	—Unverified
Extracting Opinion Expressions with semi-Markov Conditional Random Fields	Jul 1, 2012	Fine-Grained Opinion AnalysisQuestion Answering	—Unverified
Extracting Procedural Knowledge from Technical Documents	Oct 20, 2020	Question Answering	—Unverified
Extracting Psychological Indicators Using Question Answering	May 24, 2023	Question Answering	—Unverified
Extracting Semantics from Maintenance Records	Aug 11, 2021	Language Modellingnamed-entity-recognition	—Unverified
Extracting Spatial Entities and Relations in Korean Text	Dec 1, 2016	Entity Extraction using GANNamed Entity Recognition (NER)	—Unverified
Extracting Time Expressions from Clinical Text	Jul 1, 2015	Question AnsweringTemporal Information Extraction	—Unverified
Extracting Training Data from Document-Based VQA Models	Jul 11, 2024	MemorizationQuestion Answering	—Unverified
A Framework for Developing and Evaluating Word Embeddings of Drug-named Entity	Jul 1, 2018	Named Entity Recognition (NER)Outlier Detection	—Unverified
GEMeX-ThinkVG: Towards Thinking with Visual Grounding in Medical VQA via Reinforcement Learning	Jun 22, 2025	Answer GenerationDecision Making	—Unverified
Do Not Design, Learn: A Trainable Scoring Function for Uncertainty Estimation in Generative LLMs	Jun 17, 2024	Question Answering	—Unverified
Extraction of Product Specifications from the Web -- Going Beyond Tables and Lists	Jan 8, 2022	AttributeQuestion Answering	—Unverified
Extractive Headline Generation Based on Learning to Rank for Community Question Answering	Aug 1, 2018	ArticlesCommunity Question Answering	—Unverified
Extractive NarrativeQA with Heuristic Pre-Training	Nov 1, 2019	Natural Language InferencePassage Retrieval	—Unverified
Extractive Question Answering on Queries in Hindi and Tamil	Sep 27, 2022	Extractive Question-AnsweringQuestion Answering	—Unverified
ChartCitor: Multi-Agent Framework for Fine-Grained Chart Visual Attribution	Feb 3, 2025	Chart Question AnsweringQuestion Answering	—Unverified
Annotating Question Decomposition on Complex Medical Questions	May 1, 2014	Question AnsweringSentence	—Unverified
GC-KBVQA: A New Four-Stage Framework for Enhancing Knowledge Based Visual Question Answering Performance	May 25, 2025	Caption GenerationQuestion Answering	—Unverified
Extrinsic Evaluation of Machine Translation Metrics	Dec 20, 2022	Dialogue State TrackingMachine Translation	—Unverified
Do Multi-Hop Question Answering Systems Know How to Answer the Single-Hop Sub-Questions?	Feb 23, 2020	Multi-hop Question AnsweringQuestion Answering	—Unverified
EyeFound: A Multimodal Generalist Foundation Model for Ophthalmic Imaging	May 18, 2024	Question AnsweringVisual Question Answering	—Unverified
Look Before You Decide: Prompting Active Deduction of MLLMs for Assumptive Reasoning	Apr 19, 2024	Benchmarkingcounterfactual	—Unverified
Annotating Opinions in German Political News	May 1, 2012	BIG-bench Machine LearningOpinion Mining	—Unverified
DOMLIN at SemEval-2019 Task 8: Automated Fact Checking exploiting Ratings in Community Question Answering Forums	Jun 1, 2019	Community Question AnsweringFact Checking	—Unverified

Show:10 25 50

← PrevPage 75 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified