Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6826–6850 of 10817 papers

Title	Date	Tasks	Status
Hierarchical Conditional Relation Networks for Multimodal Video Question Answering	Oct 18, 2020	Question AnsweringRelation	—Unverified
Encoding Knowledge Graph Entity Aliases in Attentive Neural Network for Wikidata Entity Linking	Dec 12, 2019	Entity LinkingKnowledge Graphs	—Unverified
Object-Centric Diagnosis of Visual Reasoning	Dec 21, 2020	DiagnosticObject	—Unverified
NECE: Narrative Event Chain Extraction Toolkit	Aug 17, 2022	Question Answering	—Unverified
NeCo@ALQAC 2023: Legal Domain Knowledge Acquisition for Low-Resource Languages through Data Enrichment	Sep 11, 2023	Question AnsweringRetrieval	—Unverified
Hierarchical Banzhaf Interaction for General Video-Language Representation Learning	Dec 30, 2024	Contrastive LearningQuestion Answering	—Unverified
HiddenTables & PyQTax: A Cooperative Game and Dataset For TableQA to Ensure Scale and Data Privacy Across a Myriad of Taxonomies	Jun 16, 2024	Question Answering	—Unverified
A Survey of Multimodal Retrieval-Augmented Generation	Mar 26, 2025	Information RetrievalQuestion Answering	—Unverified
Negative Object Presence Evaluation (NOPE) to Measure Object Hallucination in Vision-Language Models	Oct 9, 2023	HallucinationObject	—Unverified
Adding Morpho-semantic Relations to the Romanian Wordnet	May 1, 2012	Information RetrievalQuestion Answering	—Unverified
Neglected Risks: The Disturbing Reality of Children's Images in Datasets and the Urgent Call for Accountability	Apr 20, 2025	Question AnsweringVisual Question Answering	—Unverified
NegVQA: Can Vision Language Models Understand Negation?	May 28, 2025	NegationQuestion Answering	—Unverified
Can Click Patterns across User's Query Logs Predict Answers to Definition Questions?	Apr 1, 2012	Question Answering	—Unverified
Object-Centric Representation Learning for Video Question Answering	Apr 12, 2021	ObjectQuestion Answering	—Unverified
HFST-SweNER --- A New NER Resource for Swedish	May 1, 2014	Machine Translationnamed-entity-recognition	—Unverified
Context-augmented Retrieval: A Novel Framework for Fast Information Retrieval based Response Generation using Large Language Model	Jun 24, 2024	Answer GenerationInformation Retrieval	—Unverified
Neural Abstractive Summarization with Structural Attention	Apr 21, 2020	Abstractive Text SummarizationArticles	—Unverified
Neural Approaches to Conversational AI	Sep 21, 2018	Question Answering	—Unverified
ERNIE-Search: Bridging Cross-Encoder with Dual-Encoder via Self On-the-fly Distillation for Dense Passage Retrieval	May 18, 2022	Knowledge DistillationOpen-Domain Question Answering	—Unverified
Neural Architectures for Open-Type Relation Argument Extraction	Mar 5, 2018	Question AnsweringRelation	—Unverified
Neural at ArchEHR-QA 2025: Agentic Prompt Optimization for Evidence-Grounded Clinical Question Answering	Jun 12, 2025	Answer GenerationQuestion Answering	—Unverified
Neural Attention for Learning to Rank Questions in Community Question Answering	Dec 1, 2016	Community Question AnsweringLearning-To-Rank	—Unverified
Neural Attention Models for Sequence Classification: Analysis and Application to Key Term Extraction and Dialogue Act Detection	Mar 31, 2016	Caption GenerationClassification	—Unverified
Heterogeneous Relational Reasoning in Knowledge Graphs with Reinforcement Learning	Mar 12, 2020	Graph Neural NetworkKnowledge Graphs	—Unverified
Content Models for Survey Generation: A Factoid-Based Evaluation	Jul 1, 2015	Dependency ParsingInformation Retrieval	—Unverified

Show:10 25 50

← PrevPage 274 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified