Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8301–8325 of 10817 papers

Title	Date	Tasks	Status	Hype
ICDAR 2019 Competition on Scene Text Visual Question Answering	Jun 30, 2019	Question AnsweringVisual Question Answering	—Unverified	0
Introducing MathQA -- A Math-Aware Question Answering System	Jun 28, 2019	MathQuestion Answering	CodeCode Available	0
Open-Ended Long-Form Video Question Answering via Hierarchical Convolutional Self-Attention Networks	Jun 28, 2019	Answer GenerationDecoder	—Unverified	0
Interpretable Question Answering on Knowledge Bases and Text	Jun 26, 2019	Question Answering	—Unverified	0
Deep Modular Co-Attention Networks for Visual Question Answering	Jun 25, 2019	Question AnsweringVisual Question Answering	CodeCode Available	0
EQuANt (Enhanced Question Answer Network)	Jun 24, 2019	Machine Reading ComprehensionMulti-Task Learning	CodeCode Available	0
Learning to Interactively Learn and Assist	Jun 24, 2019	Imitation LearningQuestion Answering	—Unverified	0
RUBi: Reducing Unimodal Biases in Visual Question Answering	Jun 24, 2019	Question AnsweringVisual Question Answering	CodeCode Available	0
Adversarial Multimodal Network for Movie Question Answering	Jun 24, 2019	Question AnsweringVideo Question Answering	—Unverified	0
Integrating Knowledge and Reasoning in Image Understanding	Jun 24, 2019	Object RecognitionQuestion Answering	—Unverified	0
Investigating Biases in Textual Entailment Datasets	Jun 23, 2019	BIG-bench Machine LearningNatural Language Inference	—Unverified	0
Semantically Driven Auto-completion	Jun 22, 2019	Question AnsweringSemantic Parsing	—Unverified	0
Adversarial Regularization for Visual Question Answering: Strengths, Shortcomings, and Side Effects	Jun 20, 2019	Question AnsweringVisual Question Answering	—Unverified	0
Hindi Question Generation Using Dependency Structures	Jun 20, 2019	Question AnsweringQuestion Generation	—Unverified	0
XLNet: Generalized Autoregressive Pretraining for Language Understanding	Jun 19, 2019	Audio Question AnsweringChinese Reading Comprehension	CodeCode Available	1
Interconnected Question Generation with Coreference Alignment and Conversation Flow Modeling	Jun 17, 2019	Question AnsweringQuestion Generation	CodeCode Available	1
Avoiding Reasoning Shortcuts: Adversarial Evaluation, Training, and Model Development for Multi-Hop QA	Jun 17, 2019	Multi-hop Question AnsweringQuestion Answering	CodeCode Available	1
Multi-Hop Paragraph Retrieval for Open-Domain Question Answering	Jun 15, 2019	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	0
Microsoft AI Challenge India 2018: Learning to Rank Passages for Web Question Answering with Deep Attention Networks	Jun 14, 2019	Deep AttentionLearning-To-Rank	—Unverified	0
IITP at MEDIQA 2019: Systems Report for Natural Language Inference, Question Entailment and Question Answering	Jun 14, 2019	Medical Question AnsweringNatural Language Inference	—Unverified	0
Improving Visual Question Answering by Referring to Generated Paragraph Captions	Jun 14, 2019	DecoderImage Captioning	—Unverified	0
NLProlog: Reasoning with Weak Unification for Question Answering in Natural Language	Jun 14, 2019	Question AnsweringSentence	CodeCode Available	0
Multigrid Neural Memory	Jun 13, 2019	Question Answering	CodeCode Available	0
Real-Time Open-Domain Question Answering with Dense-Sparse Phrase Index	Jun 13, 2019	GPUOpen-Domain Question Answering	CodeCode Available	0
The Replica Dataset: A Digital Replica of Indoor Spaces	Jun 13, 2019	3D Scene ReconstructionInstruction Following	CodeCode Available	2

Show:10 25 50

← PrevPage 333 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified