Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4401–4410 of 10817 papers

Title	Date	Tasks	Status
Improving Event Coreference Resolution by Modeling Correlations between Event Coreference Chains and Document Topic Structures	Jul 1, 2018	coreference-resolutionCoreference Resolution	—Unverified
Designing Templates for Eliciting Commonsense Knowledge from Pretrained Sequence-to-Sequence Models	Dec 1, 2020	Multiple-choiceNatural Language Understanding	—Unverified
BACON: Improving Clarity of Image Captions via Bag-of-Concept Graphs	Jul 3, 2024	Image CaptioningImage Generation	—Unverified
Designing dialogue systems: A mean, grumpy, sarcastic chatbot in the browser	Sep 20, 2019	ChatbotDecoder	—Unverified
Designing a Robust Radiology Report Generation System	Nov 2, 2024	Decision MakingDiagnostic	—Unverified
Backward and Forward Language Modeling for Constrained Sentence Generation	Dec 21, 2015	Language ModelingLanguage Modelling	—Unverified
A Neural Approach to KGQA via SPARQL Silhouette Generation	Nov 16, 2021	Graph Question AnsweringMachine Translation	—Unverified
Designing a Communication Bridge between Communities: Participatory Design for a Question-Answering AI Agent	Aug 1, 2023	AI AgentQuestion Answering	—Unverified
Back to Basics for Monolingual Alignment: Exploiting Word Similarity and Contextual Evidence	Jan 1, 2014	Natural Language InferenceQuestion Answering	—Unverified
Design and Development of Rule-based open-domain Question-Answering System on SQuAD v2.0 Dataset	Mar 27, 2022	Open-Domain Question AnsweringQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 441 of 1082Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified