Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8201–8225 of 10817 papers

Title	Date	Tasks	Status
Explainable High-order Visual Question Reasoning: A New Benchmark and Knowledge-routed Network	Sep 23, 2019	Question AnsweringTriplet	—Unverified
Designing dialogue systems: A mean, grumpy, sarcastic chatbot in the browser	Sep 20, 2019	ChatbotDecoder	—Unverified
How Additional Knowledge can Improve Natural Language Commonsense Question Answering?	Sep 19, 2019	ArticlesLanguage Modeling	—Unverified
Look, Read and Enrich. Learning from Scientific Figures and their Captions	Sep 19, 2019	Multi-modal ClassificationQuestion Answering	CodeCode Available
Learning Sparse Mixture of Experts for Visual Question Answering	Sep 19, 2019	Mixture-of-ExpertsQuestion Answering	—Unverified
Deep Contextualized Pairwise Semantic Similarity for Arabic Language Questions	Sep 19, 2019	Community Question AnsweringQuestion Answering	—Unverified
Triplet-Aware Scene Graph Embeddings	Sep 19, 2019	Data AugmentationGraph Embedding	—Unverified
What's Missing: A Knowledge Gap Guided Approach for Multi-hop Question Answering	Sep 19, 2019	Multi-hop Question AnsweringQuestion Answering	CodeCode Available
Pre-trained Language Model for Biomedical Question Answering	Sep 18, 2019	Language ModelingLanguage Modelling	CodeCode Available
Conversational AI : Open Domain Question Answering and Commonsense Reasoning	Sep 18, 2019	Common Sense ReasoningOpen-Domain Question Answering	—Unverified
Multi-step Entity-centric Information Retrieval for Multi-Hop Question Answering	Sep 17, 2019	Information RetrievalMulti-hop Question Answering	—Unverified
Do NLP Models Know Numbers? Probing Numeracy in Embeddings	Sep 17, 2019	Question Answering	CodeCode Available
Simple yet Effective Bridge Reasoning for Open-Domain Multi-Hop Question Answering	Sep 17, 2019	Information RetrievalMulti-hop Question Answering	—Unverified
Inverse Visual Question Answering with Multi-Level Attentions	Sep 17, 2019	Question AnsweringVisual Question Answering	—Unverified
KorQuAD1.0: Korean QA Dataset for Machine Reading Comprehension	Sep 16, 2019	ArticlesMachine Reading Comprehension	—Unverified
Addressing Semantic Drift in Question Generation for Semi-Supervised Question Answering	Sep 13, 2019	ArticlesQuestion Answering	CodeCode Available
Neural Correction Model for Open-Domain Named Entity Recognition	Sep 13, 2019	Multi-Task Learningnamed-entity-recognition	CodeCode Available
Finding Generalizable Evidence by Learning to Convince Q&A Models	Sep 12, 2019	Question Answering	CodeCode Available
NSURL-2019 Shared Task 8: Semantic Question Similarity in Arabic	Sep 12, 2019	Question AnsweringQuestion Similarity	—Unverified
Measuring Domain Portability and ErrorPropagation in Biomedical QA	Sep 12, 2019	Natural QuestionsQuestion Answering	—Unverified
Frustratingly Easy Natural Question Answering	Sep 11, 2019	Data AugmentationNatural Questions	—Unverified
A Discrete Hard EM Approach for Weakly Supervised Question Answering	Sep 11, 2019	Question AnsweringTriviaQA	CodeCode Available
Sunny and Dark Outside?! Improving Answer Consistency in VQA through Entailed Question Generation	Sep 10, 2019	Common Sense ReasoningData Augmentation	—Unverified
Question Generation by Transformers	Sep 9, 2019	ArticlesQuestion Answering	CodeCode Available
Span Selection Pre-training for Question Answering	Sep 9, 2019	Language ModelingLanguage Modelling	CodeCode Available

Show:10 25 50

← PrevPage 329 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified