Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6801–6825 of 10817 papers

Title	Date	Tasks	Status
Episodic Memory Question Answering	May 3, 2022	AI AgentQuestion Answering	—Unverified
Natural Language Inference with Definition Embedding Considering Context On the Fly	Jul 1, 2018	Domain AdaptationInformation Retrieval	—Unverified
Encoding Knowledge Graph Entity Aliases in Attentive Neural Network for Wikidata Entity Linking	Dec 12, 2019	Entity LinkingKnowledge Graphs	—Unverified
Noun-MWP: Math Word Problems Meet Noun Answers	Oct 1, 2022	MathQuestion Answering	—Unverified
Natural Language Processing for the Legal Domain: A Survey of Tasks, Datasets, Models, and Challenges	Oct 25, 2024	Argument MiningDocument Summarization	—Unverified
Natural language processing for word sense disambiguation and information extraction	Apr 5, 2020	ManagementQuestion Answering	—Unverified
Hierarchical Banzhaf Interaction for General Video-Language Representation Learning	Dec 30, 2024	Contrastive LearningQuestion Answering	—Unverified
Natural Language Processing in Watson	Jun 1, 2012	Information RetrievalOpen-Domain Question Answering	—Unverified
A Picture May Be Worth a Hundred Words for Visual Question Answering	Jun 25, 2021	Data AugmentationDescriptive	—Unverified
Natural Language QA Approaches using Reasoning with External Knowledge	Mar 6, 2020	Question AnsweringSurvey	—Unverified
Natural Language Query Refinement for Problem Resolution from Crowd-Sourced Semi-Structured Data	Oct 1, 2013	Medical DiagnosisQuestion Answering	—Unverified
Natural Language Question Answering and Analytics for Diverse and Interlinked Datasets	Jun 1, 2015	Question Answering	—Unverified
HiddenTables & PyQTax: A Cooperative Game and Dataset For TableQA to Ensure Scale and Data Privacy Across a Myriad of Taxonomies	Jun 16, 2024	Question Answering	—Unverified
Natural Language Understanding and Inference with MLLM in Visual Question Answering: A Survey	Nov 26, 2024	Natural Language UnderstandingQuestion Answering	—Unverified
A Survey of Multimodal Retrieval-Augmented Generation	Mar 26, 2025	Information RetrievalQuestion Answering	—Unverified
Adding Morpho-semantic Relations to the Romanian Wordnet	May 1, 2012	Information RetrievalQuestion Answering	—Unverified
HFST-SweNER --- A New NER Resource for Swedish	May 1, 2014	Machine Translationnamed-entity-recognition	—Unverified
Natural Questions in Icelandic	Jun 1, 2022	Extractive Question-AnsweringNatural Questions	—Unverified
Context-augmented Retrieval: A Novel Framework for Fast Information Retrieval based Response Generation using Large Language Model	Jun 24, 2024	Answer GenerationInformation Retrieval	—Unverified
Natural Solution to FraCaS Entailment Problems	Aug 1, 2016	Automated Theorem ProvingNatural Language Inference	—Unverified
NOTE: Solution for KDD-CUP 2021 WikiKG90M-LSC	Jul 5, 2021	Feature EngineeringQuestion Answering	—Unverified
Heterogeneous Relational Reasoning in Knowledge Graphs with Reinforcement Learning	Mar 12, 2020	Graph Neural NetworkKnowledge Graphs	—Unverified
Navigating the Grey Area: How Expressions of Uncertainty and Overconfidence Affect Language Models	Feb 26, 2023	Decision MakingQuestion Answering	—Unverified
Navigating Uncertainty: Optimizing API Dependency for Hallucination Reduction in Closed-Book Question Answering	Jan 3, 2024	Hallucinationparameter-efficient fine-tuning	—Unverified
Content Models for Survey Generation: A Factoid-Based Evaluation	Jul 1, 2015	Dependency ParsingInformation Retrieval	—Unverified

Show:10 25 50

← PrevPage 273 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified