Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3731–3740 of 10817 papers

Title	Date	Tasks	Status
Extracting Semantics from Maintenance Records	Aug 11, 2021	Language Modellingnamed-entity-recognition	—Unverified
Extracting Spatial Entities and Relations in Korean Text	Dec 1, 2016	Entity Extraction using GANNamed Entity Recognition (NER)	—Unverified
Extracting Time Expressions from Clinical Text	Jul 1, 2015	Question AnsweringTemporal Information Extraction	—Unverified
Extracting Training Data from Document-Based VQA Models	Jul 11, 2024	MemorizationQuestion Answering	—Unverified
Do Not Design, Learn: A Trainable Scoring Function for Uncertainty Estimation in Generative LLMs	Jun 17, 2024	Question Answering	—Unverified
Extraction Meets Abstraction: Ideal Answer Generation for Biomedical Questions	Nov 1, 2018	Abstractive Text SummarizationAnswer Generation	—Unverified
Annotating Question Decomposition on Complex Medical Questions	May 1, 2014	Question AnsweringSentence	—Unverified
Extraction of Product Specifications from the Web -- Going Beyond Tables and Lists	Jan 8, 2022	AttributeQuestion Answering	—Unverified
Extractive Headline Generation Based on Learning to Rank for Community Question Answering	Aug 1, 2018	ArticlesCommunity Question Answering	—Unverified
Do Multi-Hop Question Answering Systems Know How to Answer the Single-Hop Sub-Questions?	Feb 23, 2020	Multi-hop Question AnsweringQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 374 of 1082Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified