Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7901–7925 of 10817 papers

Title	Date	Tasks	Status	Hype
12-in-1: Multi-Task Vision and Language Representation Learning	Dec 5, 2019	10-shot image generationImage Retrieval	CodeCode Available	0
Cooperative Reasoning on Knowledge Graph and Corpus: A Multi-agentReinforcement Learning Approach	Dec 4, 2019	Question Answering	—Unverified	0
An Exploration of Data Augmentation and Sampling Techniques for Domain-Agnostic Question Answering	Dec 4, 2019	Data AugmentationQuestion Answering	—Unverified	0
SemEval-2016 Task 3: Community Question Answering	Dec 3, 2019	Community Question AnsweringQuestion Answering	—Unverified	0
Unsupervised Inflection Generation Using Neural Language Modeling	Dec 3, 2019	Language ModelingLanguage Modelling	—Unverified	0
TutorialVQA: Question Answering Dataset for Tutorial Videos	Dec 2, 2019	Question AnsweringVideo Question Answering	CodeCode Available	0
Deep Bayesian Active Learning for Multiple Correct Outputs	Dec 2, 2019	Active LearningAnswer Generation	—Unverified	0
SemEval-2017 Task 3: Community Question Answering	Dec 2, 2019	Community Question AnsweringQuestion Answering	CodeCode Available	0
Building Discourse Parser for Thirukkural	Dec 1, 2019	EthicsInformation Retrieval	—Unverified	0
基於特徵粒度之訓練策略於中文口語問答系統之應用 (A Feature-granularity Training Strategy for Chinese Spoken Question Answering)	Dec 1, 2019	Question Answering	—Unverified	0
Deep Human Answer Understanding for Natural Reverse QA	Dec 1, 2019	Question Answering	—Unverified	0
Neural Shuffle-Exchange Networks - Sequence Processing in O(n log n) Time	Dec 1, 2019	LAMBADALanguage Modeling	CodeCode Available	0
TAB-VCR: Tags and Attributes based VCR Baselines	Dec 1, 2019	AttributeQuestion Answering	CodeCode Available	0
Compositional De-Attention Networks	Dec 1, 2019	Machine TranslationNatural Language Inference	—Unverified	0
RUBi: Reducing Unimodal Biases for Visual Question Answering	Dec 1, 2019	Question AnsweringVisual Question Answering	CodeCode Available	0
A Hybrid Approach Towards Two Stage Bengali Question Classification Utilizing Smart Data Balancing Technique	Nov 30, 2019	ClassificationGeneral Classification	—Unverified	0
A Free Lunch in Generating Datasets: Building a VQG and VQA System with Attention and Humans in the Loop	Nov 30, 2019	Question AnsweringQuestion Generation	—Unverified	0
Assessing the Robustness of Visual Question Answering Models	Nov 30, 2019	Question AnsweringVisual Question Answering	—Unverified	0
Evaluating Commonsense in Pre-trained Language Models	Nov 27, 2019	Language ModelingLanguage Modelling	CodeCode Available	0
Transfer Learning in Visual and Relational Reasoning	Nov 27, 2019	Question AnsweringRelational Reasoning	—Unverified	0
Label Dependent Deep Variational Paraphrase Generation	Nov 27, 2019	Machine Reading ComprehensionParaphrase Generation	—Unverified	0
JEC-QA: A Legal-Domain Question Answering Dataset	Nov 27, 2019	Question AnsweringReading Comprehension	—Unverified	0
PIQA: Reasoning about Physical Commonsense in Natural Language	Nov 26, 2019	ArticlesCommon Sense Reasoning	CodeCode Available	1
A Vietnamese Text-Based Conversational Agent	Nov 26, 2019	Question Answering	—Unverified	0
A Vietnamese Question Answering System	Nov 26, 2019	Question Answering	—Unverified	0

Show:10 25 50

← PrevPage 317 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified