Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8776–8800 of 10817 papers

Title	Date	Tasks	Status
Deep Attentive Sentence Ordering Network	Oct 1, 2018	Concept-To-Text GenerationDocument Summarization	—Unverified
Direct optimization of F-measure for retrieval-based personal question answering	Sep 28, 2018	Question Answeringreinforcement-learning	—Unverified
A Qualitative Comparison of CoQA, SQuAD 2.0 and QuAC	Sep 27, 2018	Question Answering	CodeCode Available
Learning Corresponded Rationales for Text Matching	Sep 27, 2018	Natural Language InferenceQuestion Answering	—Unverified
Learning to Coordinate Multiple Reinforcement Learning Agents for Diverse Query Reformulation	Sep 27, 2018	DiversityQuestion Answering	—Unverified
Denoise while Aggregating: Collaborative Learning in Open-Domain Question Answering	Sep 27, 2018	Open-Domain Question AnsweringQuestion Answering	—Unverified
No One is Perfect: Analysing the Performance of Question Answering Components over the DBpedia Knowledge Graph	Sep 26, 2018	Knowledge GraphsQuestion Answering	CodeCode Available
ComQA: A Community-sourced Dataset for Complex Factoid Question Answering with Paraphrase Clusters	Sep 25, 2018	Question Answering	—Unverified
Joint Multitask Learning for Community Question Answering Using Task-Specific Embeddings	Sep 24, 2018	Community Question AnsweringQuestion Answering	—Unverified
Stochastic Answer Networks for SQuAD 2.0	Sep 24, 2018	Machine Reading ComprehensionQuestion Answering	CodeCode Available
Textually Enriched Neural Module Networks for Visual Question Answering	Sep 23, 2018	Image CaptioningQuestion Answering	—Unverified
Neural Approaches to Conversational AI	Sep 21, 2018	Question Answering	—Unverified
Multimodal Dual Attention Memory for Video Story Question Answering	Sep 21, 2018	Question Answering	—Unverified
A Quantitative Evaluation of Natural Language Question Interpretation for Question Answering Systems	Sep 20, 2018	Question Answering	—Unverified
Symbolic Priors for RNN-based Semantic Parsing	Sep 20, 2018	Question AnsweringSemantic Parsing	CodeCode Available
Multi-task Learning with Sample Re-weighting for Machine Reading Comprehension	Sep 18, 2018	Machine Reading ComprehensionMachine Translation	CodeCode Available
Commonsense for Generative Multi-Hop Question Answering Tasks	Sep 17, 2018	DecoderImplicit Relations	CodeCode Available
Improving Natural Language Inference Using External Knowledge in the Science Questions Domain	Sep 15, 2018	Knowledge GraphsNatural Language Inference	—Unverified
Answering Science Exam Questions Using Query Rewriting with Background Knowledge	Sep 15, 2018	ARCInformation Retrieval	—Unverified
Knowledge Based Machine Reading Comprehension	Sep 12, 2018	Machine Reading ComprehensionQuestion Answering	—Unverified
The Wisdom of MaSSeS: Majority, Subjectivity, and Semantic Similarity in the Evaluation of VQA	Sep 12, 2018	Question AnsweringSemantic Similarity	—Unverified
The Visual QA Devil in the Details: The Impact of Early Fusion and Batch Norm on CLEVR	Sep 11, 2018	Question AnsweringRelational Reasoning	—Unverified
Answering Visual What-If Questions: From Actions to Predicted Scene Descriptions	Sep 11, 2018	Question AnsweringScene Understanding	—Unverified
How much should you ask? On the question structure in QA systems	Sep 11, 2018	Question Answeringvalid	—Unverified
Explicit Utilization of General Knowledge in Machine Reading Comprehension	Sep 10, 2018	General KnowledgeMachine Reading Comprehension	—Unverified

Show:10 25 50

← PrevPage 352 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified