Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7051–7075 of 10817 papers

Title	Date	Tasks	Status	Hype
Red Dragon AI at TextGraphs 2020 Shared Task: LIT : LSTM-Interleaved Transformer for Multi-Hop Explanation Ranking	Dec 28, 2020	Question AnsweringRe-Ranking	—Unverified	0
Commonsense Visual Sensemaking for Autonomous Driving: On Generalised Neurosymbolic Online Abduction Integrating Vision and Semantics	Dec 28, 2020	Autonomous DrivingQuestion Answering	—Unverified	0
Pivot Through English: Reliably Answering Multilingual Questions without Document Retrieval	Dec 28, 2020	Answer GenerationQuestion Answering	—Unverified	0
Explaining NLP Models via Minimal Contrastive Editing (MiCE)	Dec 27, 2020	counterfactualMultiple-choice	CodeCode Available	1
LOREN: Logic-Regularized Reasoning for Interpretable Fact Verification	Dec 25, 2020	Claim VerificationFact Verification	CodeCode Available	1
REM-Net: Recursive Erasure Memory Network for Commonsense Evidence Refinement	Dec 24, 2020	Question AnsweringWorld Knowledge	—Unverified	0
QUACKIE: A NLP Classification Task With Ground Truth Explanations	Dec 24, 2020	ClassificationGeneral Classification	—Unverified	0
Negation in Cognitive Reasoning	Dec 23, 2020	Formal LogicNegation	CodeCode Available	0
Learning Dense Representations of Phrases at Scale	Dec 23, 2020	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	2
Exploring and Analyzing Machine Commonsense Benchmarks	Dec 21, 2020	Common Sense ReasoningQuestion Answering	—Unverified	0
Object-Centric Diagnosis of Visual Reasoning	Dec 21, 2020	DiagnosticObject	—Unverified	0
Learning content and context with language bias for Visual Question Answering	Dec 21, 2020	Question AnsweringVisual Question Answering	CodeCode Available	0
Exploring Fluent Query Reformulations with Text-to-Text Transformers and Reinforcement Learning	Dec 18, 2020	intent-classificationIntent Classification	—Unverified	0
On Modality Bias in the TVQA Dataset	Dec 18, 2020	Question AnsweringVideo Question Answering	CodeCode Available	0
Trying Bilinear Pooling in Video-QA	Dec 18, 2020	Question AnsweringVideo Question Answering	—Unverified	0
Can Transformers Reason About Effects of Actions?	Dec 17, 2020	Common Sense ReasoningQuestion Answering	—Unverified	0
Overcoming Language Priors with Self-supervised Learning for Visual Question Answering	Dec 17, 2020	Question AnsweringSelf-Supervised Learning	CodeCode Available	1
MIX : a Multi-task Learning Approach to Solve Open-Domain Question Answering	Dec 17, 2020	Computational EfficiencyMulti-Task Learning	—Unverified	0
Clinical Temporal Relation Extraction with Probabilistic Soft Logic Regularization and Global Inference	Dec 16, 2020	Feature EngineeringMedical Question Answering	CodeCode Available	1
Knowledge-Routed Visual Question Reasoning: Challenges for Deep Representation Embedding	Dec 14, 2020	Question AnsweringVisual Question Answering	CodeCode Available	1
ParsiNLU: A Suite of Language Understanding Challenges for Persian	Dec 11, 2020	Machine TranslationNatural Language Inference	CodeCode Available	1
Multilingual Transfer Learning for QA Using Translation as Data Augmentation	Dec 10, 2020	Cross-Lingual TransferData Augmentation	—Unverified	0
BioMedBERT: A Pre-trained Biomedical Language Model for QA and IR	Dec 10, 2020	ArticlesInformation Retrieval	—Unverified	0
Fusing Context Into Knowledge Graph for Commonsense Question Answering	Dec 9, 2020	Common Sense ReasoningKnowledge Graphs	CodeCode Available	1
Simple is not Easy: A Simple Strong Baseline for TextVQA and TextCaps	Dec 9, 2020	DecoderImage Captioning	—Unverified	0

Show:10 25 50

← PrevPage 283 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified