Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2201–2225 of 10817 papers

Title	Date	Tasks	Status	Hype
Contextual Word Representations: A Contextual Introduction	Feb 15, 2019	Question AnsweringTranslation	CodeCode Available	1
Language Models are Unsupervised Multitask Learners	Feb 14, 2019	Common Sense ReasoningCoreference Resolution	CodeCode Available	1
BioBERT: a pre-trained biomedical language representation model for biomedical text mining	Jan 25, 2019	Drug–drug Interaction ExtractionFew-Shot Learning	CodeCode Available	1
Densely Connected Attention Propagation for Reading Comprehension	Nov 10, 2018	AllOpen-Domain Question Answering	CodeCode Available	1
CommonsenseQA: A Question Answering Challenge Targeting Commonsense Knowledge	Nov 2, 2018	Common Sense ReasoningMultiple-choice	CodeCode Available	1
Paragraph-level Neural Question Generation with Maxout Pointer and Gated Self-attention Networks	Oct 1, 2018	Question AnsweringQuestion Generation	CodeCode Available	1
HotpotQA: A Dataset for Diverse, Explainable Multi-hop Question Answering	Sep 25, 2018	Multi-hop Question AnsweringQuestion Answering	CodeCode Available	1
Transforming Question Answering Datasets Into Natural Language Inference Datasets	Sep 9, 2018	Natural Language InferenceQuestion Answering	CodeCode Available	1
Faithful Multimodal Explanation for Visual Question Answering	Sep 8, 2018	Explanatory Visual Question AnsweringQuestion Answering	CodeCode Available	1
emrQA: A Large Corpus for Question Answering on Electronic Medical Records	Sep 3, 2018	FormQuestion Answering	CodeCode Available	1
Evaluating Theory of Mind in Question Answering	Aug 28, 2018	Question Answering	CodeCode Available	1
Explainable Neural Computation via Stack Neural Module Networks	Jul 23, 2018	Decision MakingQuestion Answering	CodeCode Available	1
Jack the Reader - A Machine Reading Framework	Jun 20, 2018	ArticlesLink Prediction	CodeCode Available	1
The Natural Language Decathlon: Multitask Learning as Question Answering	Jun 20, 2018	DecoderDomain Adaptation	CodeCode Available	1
Know What You Don't Know: Unanswerable Questions for SQuAD	Jun 11, 2018	Natural Language UnderstandingQuestion Answering	CodeCode Available	1
Improving Language Understanding by Generative Pre-Training	Jun 11, 2018	Cloze TestDocument Classification	CodeCode Available	1
R-VQA: Learning Visual Relation Facts with Semantic Attention for Visual Question Answering	May 24, 2018	Question AnsweringRelation	CodeCode Available	1
QANet: Combining Local Convolution with Global Self-Attention for Reading Comprehension	Apr 23, 2018	Machine TranslationQuestion Answering	CodeCode Available	1
Spoken SQuAD: A Study of Mitigating the Impact of Speech Recognition Errors on Listening Comprehension	Apr 1, 2018	Question AnsweringReading Comprehension	CodeCode Available	1
Deep contextualized word representations	Feb 15, 2018	Citation Intent ClassificationConversational Response Selection	CodeCode Available	1
Interactive Grounded Language Acquisition and Generalization in a 2D World	Jan 31, 2018	Language AcquisitionQuestion Answering	CodeCode Available	1
AI2-THOR: An Interactive 3D Environment for Visual AI	Dec 14, 2017	Deep Reinforcement LearningImitation Learning	CodeCode Available	1
Indirect Supervision for Relation Extraction using Question-Answer Pairs	Oct 30, 2017	Question AnsweringRelation	CodeCode Available	1
Graph Attention Networks	Oct 30, 2017	Document ClassificationGraph Attention	CodeCode Available	1
Simple and Effective Multi-Paragraph Reading Comprehension	Oct 29, 2017	Question AnsweringReading Comprehension	CodeCode Available	1

Show:10 25 50

← PrevPage 89 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified