Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8401–8425 of 10817 papers

Title	Date	Tasks	Status	Hype
SemEval-2019 Task 8: Fact Checking in Community Question Answering Forums	May 25, 2019	Community Question AnsweringFact Checking	CodeCode Available	0
Evaluating Variable-Length Multiple-Option Lists in Chatbots and Mobile Search	May 25, 2019	Question Answering	—Unverified	0
BoolQ: Exploring the Surprising Difficulty of Natural Yes/No Questions	May 24, 2019	Question AnsweringReading Comprehension	CodeCode Available	1
Controlling Risk of Web Question Answering	May 24, 2019	Machine Reading ComprehensionQuestion Answering	—Unverified	0
Self-Critical Reasoning for Robust Visual Question Answering	May 24, 2019	Question AnsweringVisual Question Answering	CodeCode Available	0
MatchZoo: A Learning, Practicing, and Developing System for Neural Text Matching	May 24, 2019	Information RetrievalQuestion Answering	CodeCode Available	0
Multi-hop Reading Comprehension via Deep Reinforcement Learning based Document Traversal	May 23, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
AttentionRNN: A Structured Spatial Attention Mechanism	May 22, 2019	Image CategorizationImage Generation	—Unverified	0
ANTIQUE: A Non-Factoid Question Answering Benchmark	May 22, 2019	Community Question AnsweringInformation Retrieval	CodeCode Available	0
Answering while Summarizing: Multi-task Learning for Multi-hop QA with Evidence Extraction	May 21, 2019	Answer SelectionExtractive Summarization	—Unverified	0
Estimating Node Importance in Knowledge Graphs Using Graph Neural Networks	May 21, 2019	Knowledge GraphsQuestion Answering	—Unverified	0
BERTSel: Answer Selection with Pre-trained Models	May 18, 2019	Answer SelectionNatural Language Inference	CodeCode Available	0
Functorial Question Answering	May 17, 2019	Question AnsweringSentence	CodeCode Available	0
Improving Question Answering over Incomplete KBs with Knowledge-Aware Reader	May 17, 2019	Question Answering	CodeCode Available	0
Adaptation of Deep Bidirectional Multilingual Transformers for Russian Language	May 17, 2019	Natural Language InferenceParaphrase Identification	CodeCode Available	0
Dynamically Fused Graph Network for Multi-hop Reasoning	May 16, 2019	Question Answering	CodeCode Available	1
Aligning Visual Regions and Textual Concepts for Semantic-Grounded Image Representations	May 15, 2019	Image CaptioningQuestion Answering	CodeCode Available	0
Entity-Relation Extraction as Multi-Turn Question Answering	May 14, 2019	Machine Reading ComprehensionQuestion Answering	CodeCode Available	0
BERT with History Answer Embedding for Conversational Question Answering	May 14, 2019	Conversational Question AnsweringConversational Search	CodeCode Available	0
Multi-step Retriever-Reader Interaction for Scalable Open-domain Question Answering	May 14, 2019	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	0
Cognitive Graph for Multi-Hop Reading Comprehension at Scale	May 14, 2019	Graph Neural NetworkMulti-hop Question Answering	CodeCode Available	0
Quantifying and Alleviating the Language Prior Problem in Visual Question Answering	May 13, 2019	Information RetrievalQuestion Answering	CodeCode Available	0
Controlled Natural Languages and Default Reasoning	May 11, 2019	ImplicaturesLogical Reasoning	—Unverified	0
Survey on Evaluation Methods for Dialogue Systems	May 10, 2019	Question AnsweringSurvey	—Unverified	0
Unified Language Model Pre-training for Natural Language Understanding and Generation	May 8, 2019	Abstractive Text SummarizationDocument Summarization	CodeCode Available	0

Show:10 25 50

← PrevPage 337 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified