Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6776–6800 of 10817 papers

Title	Date	Tasks	Status
Named Entity Recognition for Arabic Social Media	Jun 1, 2015	Information Retrievalnamed-entity-recognition	—Unverified
Named Entity Recognition in Estonian	Aug 1, 2013	named-entity-recognitionNamed Entity Recognition	—Unverified
Named Entity Recognition System for Dialectal Arabic	Oct 1, 2014	Information Retrievalnamed-entity-recognition	—Unverified
Named Entity Recognition System for Sindhi Language	Sep 28, 2019	Information RetrievalMachine Translation	—Unverified
Named Entity Recognition System for Urdu	Dec 1, 2012	named-entity-recognitionNamed Entity Recognition	—Unverified
Named Entity Tagging a Very Large Unbalanced Corpus: Training and Evaluating NE Classifiers	May 1, 2014	ChunkingMachine Translation	—Unverified
Entity Resolution and Federated Learning get a Federated Resolution	Mar 11, 2018	Entity ResolutionFederated Learning	—Unverified
Noise Contrastive Estimation and Negative Sampling for Conditional Models: Consistency and Statistical Efficiency	Sep 6, 2018	ClassificationGeneral Classification	—Unverified
Hierarchical Banzhaf Interaction for General Video-Language Representation Learning	Dec 30, 2024	Contrastive LearningQuestion Answering	—Unverified
HiddenTables & PyQTax: A Cooperative Game and Dataset For TableQA to Ensure Scale and Data Privacy Across a Myriad of Taxonomies	Jun 16, 2024	Question Answering	—Unverified
A Survey of Multimodal Retrieval-Augmented Generation	Mar 26, 2025	Information RetrievalQuestion Answering	—Unverified
Narrowing the Knowledge Evaluation Gap: Open-Domain Question Answering with Multi-Granularity Answers	Jan 9, 2024	InformativenessOpen-Domain Question Answering	—Unverified
Narrowing the Loop: Integration of Resources and Linguistic Dataset Development with Interactive Machine Learning	Jun 1, 2015	Active LearningBIG-bench Machine Learning	—Unverified
N-ary Biographical Relation Extraction using Shortest Path Dependencies	Dec 1, 2016	Entity Extraction using GANNamed Entity Recognition (NER)	—Unverified
Env-QA: A Video Question Answering Benchmark for Comprehensive Understanding of Dynamic Environments	Jan 1, 2021	Question AnsweringVideo Question Answering	—Unverified
NativQA: Multilingual Culturally-Aligned Natural Query for LLMs	Jul 13, 2024	BenchmarkingQuestion Answering	—Unverified
Natural Answer Generation: From Factoid Answer to Full-length Answer using Grammar Correction	Dec 7, 2021	Answer GenerationQuestion Answering	—Unverified
Natural Answer Generation with Heterogeneous Memory	Jun 1, 2018	Answer GenerationDecoder	—Unverified
NaturalBench: Evaluating Vision-Language Models on Natural Adversarial Samples	Oct 18, 2024	AttributeQuestion Answering	—Unverified
Natural Human-Machine Interaction for Manipulating Formal Language: Bootstrapping with Mapping (Interaction homme-machine en domaine large \`a l'aide du langage naturel : une amorce par mise en correspondance) [in French]	Jul 1, 2014	Question Answering	—Unverified
Adding Morpho-semantic Relations to the Romanian Wordnet	May 1, 2012	Information RetrievalQuestion Answering	—Unverified
Natural Language Comprehension with the EpiReader	Jun 7, 2016	Question AnsweringReading Comprehension	—Unverified
Natural Language Deduction through Search over Statement Compositions	Jan 16, 2022	Fact CheckingQuestion Answering	—Unverified
HFST-SweNER --- A New NER Resource for Swedish	May 1, 2014	Machine Translationnamed-entity-recognition	—Unverified
Context-augmented Retrieval: A Novel Framework for Fast Information Retrieval based Response Generation using Large Language Model	Jun 24, 2024	Answer GenerationInformation Retrieval	—Unverified

Show:10 25 50

← PrevPage 272 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified