Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3461–3470 of 10817 papers

Title	Date	Tasks	Status	Score
Crake: Causal-Enhanced Table-Filler for Question Answering over Large Scale Knowledge Base	Jul 8, 2022	Question AnsweringRelation Extraction	CodeCode Available	5
Evaluating Fairness in Large Vision-Language Models Across Diverse Demographic Attributes and Prompts	Jun 25, 2024	FairnessQuestion Answering	CodeCode Available	5
Attribute Diversity Determines the Systematicity Gap in VQA	Nov 15, 2023	AttributeDiagnostic	CodeCode Available	5
Analyzing Vietnamese Legal Questions Using Deep Neural Networks with Biaffine Classifiers	Apr 27, 2023	Dependency ParsingPOS	CodeCode Available	5
Attributed and Predictive Entity Embedding for Fine-Grained Entity Typing in Knowledge Bases	Aug 1, 2018	Entity LinkingEntity Typing	CodeCode Available	5
Crafting In-context Examples according to LMs' Parametric Knowledge	Nov 16, 2023	HallucinationIn-Context Learning	CodeCode Available	5
AttenWalker: Unsupervised Long-Document Question Answering via Attention-based Graph Walking	May 3, 2023	Few-Shot LearningQuestion Answering	CodeCode Available	5
A Discrete Hard EM Approach for Weakly Supervised Question Answering	Sep 11, 2019	Question AnsweringTriviaQA	CodeCode Available	5
Attentive Pooling Networks	Feb 11, 2016	Answer SelectionQuestion Answering	CodeCode Available	5
CQASUMM: Building References for Community Question Answering Summarization Corpora	Nov 12, 2018	Community Question AnsweringDocument Summarization	CodeCode Available	5

Show:10 25 50

← PrevPage 347 of 1082Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified