Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8376–8400 of 10817 papers

Title	Date	Tasks	Status
Adversarial Multimodal Network for Movie Question Answering	Jun 24, 2019	Question AnsweringVideo Question Answering	—Unverified
Integrating Knowledge and Reasoning in Image Understanding	Jun 24, 2019	Object RecognitionQuestion Answering	—Unverified
RUBi: Reducing Unimodal Biases in Visual Question Answering	Jun 24, 2019	Question AnsweringVisual Question Answering	CodeCode Available
Investigating Biases in Textual Entailment Datasets	Jun 23, 2019	BIG-bench Machine LearningNatural Language Inference	—Unverified
Semantically Driven Auto-completion	Jun 22, 2019	Question AnsweringSemantic Parsing	—Unverified
Adversarial Regularization for Visual Question Answering: Strengths, Shortcomings, and Side Effects	Jun 20, 2019	Question AnsweringVisual Question Answering	—Unverified
Hindi Question Generation Using Dependency Structures	Jun 20, 2019	Question AnsweringQuestion Generation	—Unverified
Multi-Hop Paragraph Retrieval for Open-Domain Question Answering	Jun 15, 2019	Open-Domain Question AnsweringQuestion Answering	CodeCode Available
NLProlog: Reasoning with Weak Unification for Question Answering in Natural Language	Jun 14, 2019	Question AnsweringSentence	CodeCode Available
Microsoft AI Challenge India 2018: Learning to Rank Passages for Web Question Answering with Deep Attention Networks	Jun 14, 2019	Deep AttentionLearning-To-Rank	—Unverified
Improving Visual Question Answering by Referring to Generated Paragraph Captions	Jun 14, 2019	DecoderImage Captioning	—Unverified
IITP at MEDIQA 2019: Systems Report for Natural Language Inference, Question Entailment and Question Answering	Jun 14, 2019	Medical Question AnsweringNatural Language Inference	—Unverified
Real-Time Open-Domain Question Answering with Dense-Sparse Phrase Index	Jun 13, 2019	GPUOpen-Domain Question Answering	CodeCode Available
Multigrid Neural Memory	Jun 13, 2019	Question Answering	CodeCode Available
Neural Arabic Question Answering	Jun 12, 2019	ArticlesInformation Retrieval	CodeCode Available
Unsupervised Question Answering by Cloze Translation	Jun 12, 2019	Natural QuestionsNMT	CodeCode Available
HEAD-QA: A Healthcare Dataset for Complex Reasoning	Jun 11, 2019	Information RetrievalPosition	—Unverified
Retrieve, Read, Rerank: Towards End-to-End Multi-Document Reading Comprehension	Jun 11, 2019	Question AnsweringReading Comprehension	CodeCode Available
Psycholinguistics meets Continual Learning: Measuring Catastrophic Forgetting in Visual Question Answering	Jun 10, 2019	Continual LearningQuestion Answering	—Unverified
Question Answering as Global Reasoning over Semantic Abstractions	Jun 9, 2019	Information RetrievalMultiple-choice	CodeCode Available
Gendered Pronoun Resolution using BERT and an extractive question answering formulation	Jun 9, 2019	coreference-resolutionCoreference Resolution	CodeCode Available
Deep Contextualized Biomedical Abbreviation Expansion	Jun 8, 2019	Information RetrievalQuestion Answering	—Unverified
RankQA: Neural Question Answering with Answer Re-Ranking	Jun 7, 2019	Question AnsweringReading Comprehension	CodeCode Available
How Does BERT Answer Questions? A Layer-Wise Analysis of Transformer Representations	Jun 7, 2019	Question Answering	—Unverified
ActivityNet-QA: A Dataset for Understanding Complex Web Videos via Question Answering	Jun 6, 2019	Question AnsweringVideo Question Answering	CodeCode Available

Show:10 25 50

← PrevPage 336 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified