Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8101–8125 of 10817 papers

Title	Date	Tasks	Status	Hype
Why Does the VQA Model Answer No?: Improving Reasoning through Visual and Linguistic Inference	Sep 25, 2019	Common Sense ReasoningQuestion Answering	—Unverified	0
AdvCodec: Towards A Unified Framework for Adversarial Text Generation	Sep 25, 2019	Adversarial TextQuestion Answering	—Unverified	0
UNITER: Learning UNiversal Image-TExt Representations	Sep 25, 2019	Image-text matchingImage-text Retrieval	—Unverified	0
ASGen: Answer-containing Sentence Generation to Pre-Train Question Generator for Scale-up Data in Question Answering	Sep 25, 2019	Language ModelingLanguage Modelling	—Unverified	0
On Incorporating Semantic Prior Knowlegde in Deep Learning Through Embedding-Space Constraints	Sep 25, 2019	Data AugmentationQuestion Answering	—Unverified	0
Latent Question Reformulation and Information Accumulation for Multi-Hop Machine Reading	Sep 25, 2019	Question AnsweringReading Comprehension	—Unverified	0
Reducing Transformer Depth on Demand with Structured Dropout	Sep 25, 2019	Language ModelingLanguage Modelling	CodeCode Available	1
Question Answering is a Format; When is it Useful?	Sep 25, 2019	Machine TranslationQuestion Answering	—Unverified	0
UNITER: UNiversal Image-TExt Representation Learning	Sep 25, 2019	Image-text matchingImage-text Retrieval	CodeCode Available	1
Unified Vision-Language Pre-Training for Image Captioning and VQA	Sep 24, 2019	DecoderImage Captioning	CodeCode Available	2
Technical report on Conversational Question Answering	Sep 24, 2019	Conversational Question AnsweringData Augmentation	—Unverified	0
An Empirical Study of Content Understanding in Conversational Question Answering	Sep 24, 2019	Conversational Question AnsweringQuestion Answering	CodeCode Available	0
Portuguese Named Entity Recognition using BERT-CRF	Sep 23, 2019	named-entity-recognitionNamed Entity Recognition	CodeCode Available	0
Non-monotonic Logical Reasoning Guiding Deep Learning for Explainable Visual Question Answering	Sep 23, 2019	Inductive LearningLogical Reasoning	—Unverified	0
TinyBERT: Distilling BERT for Natural Language Understanding	Sep 23, 2019	Knowledge DistillationLanguage Modelling	CodeCode Available	0
Explainable High-order Visual Question Reasoning: A New Benchmark and Knowledge-routed Network	Sep 23, 2019	Question AnsweringTriplet	—Unverified	0
Designing dialogue systems: A mean, grumpy, sarcastic chatbot in the browser	Sep 20, 2019	ChatbotDecoder	—Unverified	0
What's Missing: A Knowledge Gap Guided Approach for Multi-hop Question Answering	Sep 19, 2019	Multi-hop Question AnsweringQuestion Answering	CodeCode Available	0
How Additional Knowledge can Improve Natural Language Commonsense Question Answering?	Sep 19, 2019	ArticlesLanguage Modeling	—Unverified	0
Look, Read and Enrich. Learning from Scientific Figures and their Captions	Sep 19, 2019	Multi-modal ClassificationQuestion Answering	CodeCode Available	0
Learning Sparse Mixture of Experts for Visual Question Answering	Sep 19, 2019	Mixture-of-ExpertsQuestion Answering	—Unverified	0
Deep Contextualized Pairwise Semantic Similarity for Arabic Language Questions	Sep 19, 2019	Community Question AnsweringQuestion Answering	—Unverified	0
Triplet-Aware Scene Graph Embeddings	Sep 19, 2019	Data AugmentationGraph Embedding	—Unverified	0
Pre-trained Language Model for Biomedical Question Answering	Sep 18, 2019	Language ModelingLanguage Modelling	CodeCode Available	0
Conversational AI : Open Domain Question Answering and Commonsense Reasoning	Sep 18, 2019	Common Sense ReasoningOpen-Domain Question Answering	—Unverified	0

Show:10 25 50

← PrevPage 325 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified