Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8201–8225 of 10817 papers

Title	Date	Tasks	Status	Hype
CFO: A Framework for Building Production NLP Systems	Aug 16, 2019	Information RetrievalMachine Reading Comprehension	—Unverified	0
Learning Representations and Agents for Information Retrieval	Aug 16, 2019	Information RetrievalMachine Translation	—Unverified	0
Abductive Commonsense Reasoning	Aug 15, 2019	Multiple-choiceNatural Language Inference	CodeCode Available	0
Multi-class Hierarchical Question Classification for Multiple Choice Science Exams	Aug 15, 2019	ClassificationGeneral Classification	CodeCode Available	0
Integrating Multimodal Information in Large Pretrained Transformers	Aug 15, 2019	Multimodal Sentiment AnalysisQuestion Answering	CodeCode Available	0
A Multi-Type Multi-Span Network for Reading Comprehension that Requires Discrete Reasoning	Aug 15, 2019	NegationQuestion Answering	CodeCode Available	0
Reasoning-Driven Question-Answering for Natural Language Understanding	Aug 14, 2019	Common Sense ReasoningNatural Language Inference	—Unverified	0
Reactive Multi-Stage Feature Fusion for Multimodal Dialogue Modeling	Aug 14, 2019	Question AnsweringScene-Aware Dialogue	—Unverified	0
VideoNavQA: Bridging the Gap between Visual and Embodied Question Answering	Aug 14, 2019	Embodied Question AnsweringQuestion Answering	CodeCode Available	1
Towards Optimisation of Collaborative Question Answering over Knowledge Graphs	Aug 14, 2019	feature selectionKnowledge Graphs	—Unverified	0
SG-Net: Syntax-Guided Machine Reading Comprehension	Aug 14, 2019	Language ModellingMachine Reading Comprehension	CodeCode Available	0
Fusion of Detected Objects in Text for Visual Question Answering	Aug 14, 2019	Question AnsweringVisual Commonsense Reasoning	—Unverified	0
StructBERT: Incorporating Language Structures into Pre-training for Deep Language Understanding	Aug 13, 2019	Language ModelingLanguage Modelling	—Unverified	0
Variational Fusion for Multimodal Sentiment Analysis	Aug 13, 2019	Multimodal Sentiment AnalysisQuestion Answering	—Unverified	0
Generative Question Refinement with Deep Reinforcement Learning in Retrieval-based QA System	Aug 13, 2019	Deep Reinforcement LearningQuestion Answering	CodeCode Available	0
Why Does a Visual Question Have Different Answers?	Aug 12, 2019	Question AnsweringVisual Question Answering	—Unverified	0
AmazonQA: A Review-Based Question Answering Task	Aug 12, 2019	Answer GenerationInformation Retrieval	CodeCode Available	0
Multimodal Unified Attention Networks for Vision-and-Language Interactions	Aug 12, 2019	Question AnsweringVisual Grounding	—Unverified	0
Multi-modality Latent Interaction Network for Visual Question Answering	Aug 10, 2019	Language ModelingLanguage Modelling	—Unverified	0
TEQUILA: Temporal Question Answering over Knowledge Bases	Aug 9, 2019	Question Answering	—Unverified	0
A Generate-Validate Approach to Answering Questions about Qualitative Relationships	Aug 9, 2019	FormQuestion Answering	—Unverified	0
Question-Agnostic Attention for Visual Question Answering	Aug 9, 2019	Question AnsweringVisual Question Answering	—Unverified	0
CRIC: A VQA Dataset for Compositional Reasoning on Vision and Commonsense	Aug 8, 2019	Question AnsweringVisual Question Answering (VQA)	—Unverified	0
Mitigating Noisy Inputs for Question Answering	Aug 8, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
ViLBERT: Pretraining Task-Agnostic Visiolinguistic Representations for Vision-and-Language Tasks	Aug 6, 2019	Image RetrievalQuestion Answering	CodeCode Available	1

Show:10 25 50

← PrevPage 329 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified