Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2731–2740 of 10817 papers

Title	Date	Tasks	Status	Score
Bias patterns in the application of LLMs for clinical decision support: A comprehensive study	Apr 23, 2024	Decision MakingQuestion Answering	CodeCode Available	5
Learning to Generalize for Cross-domain QA	May 14, 2023	Data AugmentationDomain Generalization	CodeCode Available	5
bgGLUE: A Bulgarian General Language Understanding Evaluation Benchmark	Jun 4, 2023	Fact Checkingnamed-entity-recognition	CodeCode Available	5
Learning to Follow Object-Centric Image Editing Instructions Faithfully	Oct 29, 2023	ObjectQuestion Answering	CodeCode Available	5
An Open Source Contractual Language Understanding Application Using Machine Learning	Jun 1, 2022	Document Text ClassificationInformation Retrieval	CodeCode Available	5
Learning to Deceive Knowledge Graph Augmented Models via Targeted Perturbation	Oct 24, 2020	Knowledge GraphsQuestion Answering	CodeCode Available	5
Learning to Attend On Essential Terms: An Enhanced Retriever-Reader Model for Open-domain Question Answering	Aug 28, 2018	AI2 Reasoning ChallengeARC	CodeCode Available	5
Learning to Compose Neural Networks for Question Answering	Jan 7, 2016	Question Answeringreinforcement-learning	CodeCode Available	5
An Ontology-Enabled Approach For User-Centered and Knowledge-Enabled Explanations of AI Systems	Oct 23, 2024	Explainable artificial intelligenceQuestion Answering	CodeCode Available	5
Learning to Perform Role-Filler Binding with Schematic Knowledge	Feb 24, 2019	Question AnsweringSentence	CodeCode Available	5

Show:10 25 50

← PrevPage 274 of 1082Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified