Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6501–6525 of 10817 papers

Title	Date	Tasks	Status	Hype
Multi-Scale Progressive Attention Network for Video Question Answering	Aug 1, 2021	Question AnsweringRelational Reasoning	—Unverified	0
DESCGEN: A Distantly Supervised Datasetfor Generating Entity Descriptions	Aug 1, 2021	Document SummarizationEntity Linking	CodeCode Available	0
xMoCo: Cross Momentum Contrastive Learning for Open-Domain Question Answering	Aug 1, 2021	Contrastive LearningInformation Retrieval	—Unverified	0
In Factuality: Efficient Integration of Relevant Facts for Visual Question Answering	Aug 1, 2021	Question AnsweringVisual Question Answering	—Unverified	0
Recognizing Multimodal Entailment	Aug 1, 2021	Graph LearningQuestion Answering	—Unverified	0
COSY: COunterfactual SYntax for Cross-Lingual Understanding	Aug 1, 2021	counterfactualNatural Language Inference	CodeCode Available	0
Addressing Semantic Drift in Generative Question Answering with Auxiliary Extraction	Aug 1, 2021	DecoderGenerative Question Answering	—Unverified	0
Continuous Language Generative Flow	Aug 1, 2021	Data AugmentationDensity Estimation	CodeCode Available	1
BiQuAD: Towards QA based on deeper text understanding	Aug 1, 2021	Question AnsweringReading Comprehension	—Unverified	0
LIORI at SemEval-2021 Task 2: Span Prediction and Binary Classification approaches to Word-in-Context Disambiguation	Aug 1, 2021	Binary ClassificationData Augmentation	—Unverified	0
UoR at SemEval-2021 Task 4: Using Pre-trained BERT Token Embeddings for Question Answering of Abstract Meaning	Aug 1, 2021	Question AnsweringReading Comprehension	—Unverified	0
Attention-based Aspect Reasoning for Knowledge Base Question Answering on Clinical Notes	Aug 1, 2021	Knowledge Base Question AnsweringMachine Reading Comprehension	—Unverified	0
Automatic Claim Review for Climate Science via Explanation Generation	Jul 30, 2021	DecoderExplanation Generation	—Unverified	0
An Online Question Answering System based on Sub-graph Searching	Jul 29, 2021	Answer GenerationKnowledge Graphs	—Unverified	0
QA Dataset Explosion: A Taxonomy of NLP Resources for Question Answering and Reading Comprehension	Jul 27, 2021	Question AnsweringReading Comprehension	—Unverified	0
Greedy Gradient Ensemble for Robust Visual Question Answering	Jul 27, 2021	Question AnsweringVisual Question Answering	CodeCode Available	1
One Question Answering Model for Many Languages with Cross-lingual Dense Passage Retrieval	Jul 26, 2021	Answer GenerationPassage Retrieval	CodeCode Available	1
Thought Flow Nets: From Single Predictions to Trains of Model Thought	Jul 26, 2021	Question Answering	—Unverified	0
Hybrid Autoregressive Inference for Scalable Multi-hop Explanation Regeneration	Jul 25, 2021	Multi-hop Question AnsweringNatural Language Inference	CodeCode Available	0
X-GGM: Graph Generative Modeling for Out-of-Distribution Generalization in Visual Question Answering	Jul 24, 2021	AttributeOut-of-Distribution Generalization	CodeCode Available	0
The Effectiveness of Intermediate-Task Training for Code-Switched Natural Language Understanding	Jul 21, 2021	Language ModellingNatural Language Inference	—Unverified	0
CogME: A Cognition-Inspired Multi-Dimensional Evaluation Metric for Story Understanding	Jul 21, 2021	Question AnsweringSentence	—Unverified	0
Separating Skills and Concepts for Novel Visual Question Answering	Jul 19, 2021	AttributeContrastive Learning	CodeCode Available	1
Bridging the Gap between Language Model and Reading Comprehension: Unsupervised MRC via Self-Supervision	Jul 19, 2021	Language ModelingLanguage Modelling	—Unverified	0
A Discriminative Semantic Ranker for Question Retrieval	Jul 18, 2021	Question AnsweringRe-Ranking	—Unverified	0

Show:10 25 50

← PrevPage 261 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified