Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7551–7575 of 10817 papers

Title	Date	Tasks	Status	Hype
Large-Scale Adversarial Training for Vision-and-Language Representation Learning	Jun 11, 2020	Image-text RetrievalQuestion Answering	CodeCode Available	1
Closed Loop Neural-Symbolic Learning via Integrating Neural Perception, Grammar Parsing, and Symbolic Reasoning	Jun 11, 2020	Question AnsweringReinforcement Learning (RL)	CodeCode Available	1
Exploring Weaknesses of VQA Models through Attribution Driven Insights	Jun 11, 2020	Question AnsweringVisual Question Answering	—Unverified	0
ClarQ: A large-scale and diverse dataset for Clarification Question Generation	Jun 10, 2020	Question AnsweringQuestion Generation	CodeCode Available	1
Estimating semantic structure for the VQA answer space	Jun 10, 2020	General ClassificationQuestion Answering	—Unverified	0
Foreseeing the Benefits of Incidental Supervision	Jun 9, 2020	InformativenessLearning Theory	CodeCode Available	0
Roses Are Red, Violets Are Blue... but Should Vqa Expect Them To?	Jun 9, 2020	Question AnsweringVisual Question Answering	CodeCode Available	1
Knowledge-Aided Open-Domain Question Answering	Jun 9, 2020	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
Counterfactual VQA: A Cause-Effect Look at Language Bias	Jun 8, 2020	Causal Inferencecounterfactual	CodeCode Available	1
Pre-training Polish Transformer-based Language Models at Scale	Jun 7, 2020	Machine TranslationQuestion Answering	CodeCode Available	1
Language Models as Fact Checkers?	Jun 7, 2020	Common Sense ReasoningLanguage Modeling	—Unverified	0
SERank: Optimize Sequencewise Learning to Rank Using Squeeze-and-Excitation Network	Jun 7, 2020	Learning-To-RankQuestion Answering	CodeCode Available	1
A Cross-Task Analysis of Text Span Representations	Jun 6, 2020	coreference-resolutionCoreference Resolution	CodeCode Available	1
DeBERTa: Decoding-enhanced BERT with Disentangled Attention	Jun 5, 2020	Common Sense ReasoningCoreference Resolution	CodeCode Available	2
English Intermediate-Task Training Improves Zero-Shot Cross-Lingual Transfer Too	Jun 3, 2020	Cross-Lingual TransferQuestion Answering	—Unverified	0
Interpreting Attention Models with Human Visual Attention in Machine Reading Comprehension	Jun 3, 2020	Machine Reading ComprehensionQuestion Answering	—Unverified	0
Open-Domain Question Answering with Pre-Constructed Question Spaces	Jun 2, 2020	Information RetrievalKnowledge Graphs	—Unverified	0
Subjective Question Answering: Deciphering the inner workings of Transformers in the realm of subjectivity	Jun 2, 2020	Opinion MiningQuestion Answering	CodeCode Available	0
BERT Based Multilingual Machine Comprehension in English and Hindi	Jun 2, 2020	Multilingual Machine Comprehension in English HindiQuestion Answering	CodeCode Available	0
Question Answering on Scholarly Knowledge Graphs	Jun 2, 2020	ArticlesKnowledge Base Question Answering	—Unverified	0
Building a Swedish Question-Answering Model	Jun 1, 2020	Machine Translationmodel	CodeCode Available	0
TA-Student VQA: Multi-Agents Training by Self-Questioning	Jun 1, 2020	DiversityQuestion Answering	—Unverified	0
Counterfactual Vision and Language Learning	Jun 1, 2020	counterfactualQuestion Answering	—Unverified	0
Attention-Based Context Aware Reasoning for Situation Recognition	Jun 1, 2020	Action RecognitionFine-grained Action Recognition	CodeCode Available	1
An Effective Contextual Language Modeling Framework for Speech Summarization with Augmented Features	Jun 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0

Show:10 25 50

← PrevPage 303 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified