Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8101–8150 of 10817 papers

Title	Date	Tasks	Status	Hype
Learning to Recognize the Unseen Visual Predicates	Sep 25, 2019	Question AnsweringVisual Question Answering	—Unverified	0
AdvCodec: Towards A Unified Framework for Adversarial Text Generation	Sep 25, 2019	Adversarial TextQuestion Answering	—Unverified	0
Why Does the VQA Model Answer No?: Improving Reasoning through Visual and Linguistic Inference	Sep 25, 2019	Common Sense ReasoningQuestion Answering	—Unverified	0
ASGen: Answer-containing Sentence Generation to Pre-Train Question Generator for Scale-up Data in Question Answering	Sep 25, 2019	Language ModelingLanguage Modelling	—Unverified	0
On Incorporating Semantic Prior Knowlegde in Deep Learning Through Embedding-Space Constraints	Sep 25, 2019	Data AugmentationQuestion Answering	—Unverified	0
Latent Question Reformulation and Information Accumulation for Multi-Hop Machine Reading	Sep 25, 2019	Question AnsweringReading Comprehension	—Unverified	0
Reducing Transformer Depth on Demand with Structured Dropout	Sep 25, 2019	Language ModelingLanguage Modelling	CodeCode Available	1
Question Answering is a Format; When is it Useful?	Sep 25, 2019	Machine TranslationQuestion Answering	—Unverified	0
UNITER: UNiversal Image-TExt Representation Learning	Sep 25, 2019	Image-text matchingImage-text Retrieval	CodeCode Available	1
Unified Vision-Language Pre-Training for Image Captioning and VQA	Sep 24, 2019	DecoderImage Captioning	CodeCode Available	2
Technical report on Conversational Question Answering	Sep 24, 2019	Conversational Question AnsweringData Augmentation	—Unverified	0
An Empirical Study of Content Understanding in Conversational Question Answering	Sep 24, 2019	Conversational Question AnsweringQuestion Answering	CodeCode Available	0
Portuguese Named Entity Recognition using BERT-CRF	Sep 23, 2019	named-entity-recognitionNamed Entity Recognition	CodeCode Available	0
Non-monotonic Logical Reasoning Guiding Deep Learning for Explainable Visual Question Answering	Sep 23, 2019	Inductive LearningLogical Reasoning	—Unverified	0
TinyBERT: Distilling BERT for Natural Language Understanding	Sep 23, 2019	Knowledge DistillationLanguage Modelling	CodeCode Available	0
Explainable High-order Visual Question Reasoning: A New Benchmark and Knowledge-routed Network	Sep 23, 2019	Question AnsweringTriplet	—Unverified	0
Designing dialogue systems: A mean, grumpy, sarcastic chatbot in the browser	Sep 20, 2019	ChatbotDecoder	—Unverified	0
How Additional Knowledge can Improve Natural Language Commonsense Question Answering?	Sep 19, 2019	ArticlesLanguage Modeling	—Unverified	0
What's Missing: A Knowledge Gap Guided Approach for Multi-hop Question Answering	Sep 19, 2019	Multi-hop Question AnsweringQuestion Answering	CodeCode Available	0
Look, Read and Enrich. Learning from Scientific Figures and their Captions	Sep 19, 2019	Multi-modal ClassificationQuestion Answering	CodeCode Available	0
Triplet-Aware Scene Graph Embeddings	Sep 19, 2019	Data AugmentationGraph Embedding	—Unverified	0
Learning Sparse Mixture of Experts for Visual Question Answering	Sep 19, 2019	Mixture-of-ExpertsQuestion Answering	—Unverified	0
Deep Contextualized Pairwise Semantic Similarity for Arabic Language Questions	Sep 19, 2019	Community Question AnsweringQuestion Answering	—Unverified	0
Pre-trained Language Model for Biomedical Question Answering	Sep 18, 2019	Language ModelingLanguage Modelling	CodeCode Available	0
Conversational AI : Open Domain Question Answering and Commonsense Reasoning	Sep 18, 2019	Common Sense ReasoningOpen-Domain Question Answering	—Unverified	0
Exploring Scholarly Data by Semantic Query on Knowledge Graph Embedding Space	Sep 17, 2019	Graph EmbeddingKnowledge Graph Completion	CodeCode Available	1
Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallelism	Sep 17, 2019	GPULAMBADA	CodeCode Available	2
Multi-step Entity-centric Information Retrieval for Multi-Hop Question Answering	Sep 17, 2019	Information RetrievalMulti-hop Question Answering	—Unverified	0
Simple yet Effective Bridge Reasoning for Open-Domain Multi-Hop Question Answering	Sep 17, 2019	Information RetrievalMulti-hop Question Answering	—Unverified	0
Do NLP Models Know Numbers? Probing Numeracy in Embeddings	Sep 17, 2019	Question Answering	CodeCode Available	0
Inverse Visual Question Answering with Multi-Level Attentions	Sep 17, 2019	Question AnsweringVisual Question Answering	—Unverified	0
KorQuAD1.0: Korean QA Dataset for Machine Reading Comprehension	Sep 16, 2019	ArticlesMachine Reading Comprehension	—Unverified	0
PubMedQA: A Dataset for Biomedical Research Question Answering	Sep 13, 2019	Question Answering	CodeCode Available	1
Neural Correction Model for Open-Domain Named Entity Recognition	Sep 13, 2019	Multi-Task Learningnamed-entity-recognition	CodeCode Available	0
Addressing Semantic Drift in Question Generation for Semi-Supervised Question Answering	Sep 13, 2019	ArticlesQuestion Answering	CodeCode Available	0
NSURL-2019 Shared Task 8: Semantic Question Similarity in Arabic	Sep 12, 2019	Question AnsweringQuestion Similarity	—Unverified	0
Measuring Domain Portability and ErrorPropagation in Biomedical QA	Sep 12, 2019	Natural QuestionsQuestion Answering	—Unverified	0
Finding Generalizable Evidence by Learning to Convince Q&A Models	Sep 12, 2019	Question Answering	CodeCode Available	0
Frustratingly Easy Natural Question Answering	Sep 11, 2019	Data AugmentationNatural Questions	—Unverified	0
A Discrete Hard EM Approach for Weakly Supervised Question Answering	Sep 11, 2019	Question AnsweringTriviaQA	CodeCode Available	0
How Does BERT Answer Questions? A Layer-Wise Analysis of Transformer Representations	Sep 11, 2019	Question Answering	CodeCode Available	1
Sunny and Dark Outside?! Improving Answer Consistency in VQA through Entailed Question Generation	Sep 10, 2019	Common Sense ReasoningData Augmentation	—Unverified	0
Question Generation by Transformers	Sep 9, 2019	ArticlesQuestion Answering	CodeCode Available	0
Span Selection Pre-training for Question Answering	Sep 9, 2019	Language ModelingLanguage Modelling	CodeCode Available	0
Graph-Based Reasoning over Heterogeneous External Knowledge for Commonsense Question Answering	Sep 9, 2019	Common Sense ReasoningGraph Attention	CodeCode Available	0
Don't Take the Easy Way Out: Ensemble Based Methods for Avoiding Known Dataset Biases	Sep 9, 2019	Natural Language InferenceQuestion Answering	CodeCode Available	1
Large Scale Question Answering using Tourism Data	Sep 8, 2019	Information RetrievalQuestion Answering	—Unverified	0
Abductive Reasoning as Self-Supervision for Common Sense Question Answering	Sep 6, 2019	Common Sense ReasoningDomain Adaptation	—Unverified	0
Effective Search of Logical Forms for Weakly Supervised Knowledge-Based Question Answering	Sep 6, 2019	Question AnsweringSemantic Parsing	—Unverified	0
Incorporating External Knowledge into Machine Reading for Generative Question Answering	Sep 6, 2019	Answer GenerationGenerative Question Answering	—Unverified	0

Show:10 25 50

← PrevPage 163 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified