Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8426–8450 of 10817 papers

Title	Date	Tasks	Status	Hype
Question Relatedness on Stack Overflow: The Task, Dataset, and Corpus-inspired Models	May 3, 2019	Community Question AnsweringMulti-class Classification	—Unverified	0
Pretrained Transformers for Simple Question Answering	May 2, 2019	Knowledge GraphsPrediction	—Unverified	0
Knowledge Authoring and Question Answering with KALM	May 2, 2019	Question AnsweringWorld Knowledge	—Unverified	0
Conditioning LSTM Decoder and Bi-directional Attention Based Question Answering System	May 2, 2019	DecoderQuestion Answering	CodeCode Available	0
Visual TTR - Modelling Visual Question Answering in Type Theory with Records	May 1, 2019	Question AnsweringVisual Question Answering	—Unverified	0
Declarative Question Answering over Knowledge Bases containing Natural Language Text with Answer Set Programming	May 1, 2019	Logical ReasoningNatural Language Inference	CodeCode Available	0
Disease Identification From Unstructured User Input	May 1, 2019	General ClassificationQuestion Answering	—Unverified	0
Cross-Task Knowledge Transfer for Visually-Grounded Navigation	May 1, 2019	Deep Reinforcement LearningDisentanglement	—Unverified	0
Generative Question Answering: Learning to Answer the Whole Question	May 1, 2019	Generative Question AnsweringLanguage Modeling	—Unverified	0
Improving Differentiable Neural Computers Through Memory Masking, De-allocation, and Link Distribution Sharpness Control	May 1, 2019	Question Answering	—Unverified	0
Learning to Decompose Compound Questions with Reinforcement Learning	May 1, 2019	Question Answeringreinforcement-learning	—Unverified	0
Scalable Neural Theorem Proving on Knowledge Bases and Natural Language	May 1, 2019	Automated Theorem ProvingLink Prediction	—Unverified	0
NLProlog: Reasoning with Weak Unification for Natural Language Question Answering	May 1, 2019	Question AnsweringSentence	—Unverified	0
Routing Networks and the Challenges of Modular and Compositional Computation	Apr 29, 2019	Language ModelingLanguage Modelling	CodeCode Available	0
OPIEC: An Open Information Extraction Corpus	Apr 28, 2019	Knowledge Base ConstructionOpen-Ended Question Answering	CodeCode Available	0
Using Context Information to Enhance Simple Question Answering	Apr 27, 2019	Question Answering	—Unverified	0
Soft Marginal TransE for Scholarly Knowledge Graph Completion	Apr 27, 2019	Knowledge Graph CompletionKnowledge Graphs	—Unverified	0
Understanding Dataset Design Choices for Multi-hop Reasoning	Apr 27, 2019	Multi-hop Question AnsweringMultiple-choice	—Unverified	0
The Neuro-Symbolic Concept Learner: Interpreting Scenes, Words, and Sentences From Natural Supervision	Apr 26, 2019	Image-text RetrievalObject	CodeCode Available	0
Data Poisoning Attack against Knowledge Graph Embedding	Apr 26, 2019	Data PoisoningGraph Embedding	—Unverified	0
Scene Graph Prediction with Limited Labels	Apr 25, 2019	Knowledge Base CompletionPrediction	CodeCode Available	0
TVQA+: Spatio-Temporal Grounding for Video Question Answering	Apr 25, 2019	Question AnsweringVideo Question Answering	CodeCode Available	0
Generating Long Sequences with Sparse Transformers	Apr 23, 2019	DiversityImage Generation	CodeCode Available	3
Improving Differentiable Neural Computers Through Memory Masking, De-allocation, and Link Distribution Sharpness Control	Apr 23, 2019	Question Answering	CodeCode Available	0
SocialIQA: Commonsense Reasoning about Social Interactions	Apr 22, 2019	Common Sense ReasoningCoreference Resolution	CodeCode Available	0

Show:10 25 50

← PrevPage 338 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified