Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6701–6725 of 10817 papers

Title	Date	Tasks	Status
Medical Visual Question Answering: A Survey	Nov 19, 2021	Medical Visual Question AnsweringQuestion Answering	—Unverified
UFO: A UniFied TransfOrmer for Vision-Language Representation Learning	Nov 19, 2021	Image CaptioningImage-text matching	—Unverified
Dynamic-TinyBERT: Boost TinyBERT's Inference Efficiency by Dynamic Sequence Length	Nov 18, 2021	Computational EfficiencyHyperparameter Optimization	—Unverified
Achieving Human Parity on Visual Question Answering	Nov 17, 2021	Question AnsweringVisual Question Answering	—Unverified
Toward Fine-grained Causality Reasoning and CausalQA	Nov 16, 2021	Question AnsweringSentence	—Unverified
Flagging Comprehensibility Issues in Hindi Text with Question Answering	Nov 16, 2021	Question AnsweringTranslation	—Unverified
Unsupervised Open-Domain Question Answering with Higher Answerability	Nov 16, 2021	Machine Reading ComprehensionOpen-Domain Question Answering	—Unverified
Fill-in-the-Blank: A Challenging Video Understanding Evaluation Framework	Nov 16, 2021	Multiple-choiceQuestion Answering	—Unverified
Fantastic Questions and Where to Find Them: FairytaleQA--An Authentic Dataset for Narrative Comprehension	Nov 16, 2021	BenchmarkingQuestion Answering	—Unverified
Fair comparison of knowledge graphs for question answering	Nov 16, 2021	Knowledge GraphsQuestion Answering	—Unverified
Uncertainty-based Visual Question Answering: Estimating Semantic Inconsistency between Image and Knowledge Base	Nov 16, 2021	Question AnsweringSemantic Similarity	—Unverified
ARCNN: A Semantic Enhanced Relation Detection Model for Knowledge Base Question Answering	Nov 16, 2021	Knowledge Base Question AnsweringQuestion Answering	—Unverified
CCQA: A New Web-Scale Question Answering Dataset for Model Pre-Training	Nov 16, 2021	Open-Domain Question AnsweringQuestion Answering	—Unverified
ArchivalQA: A Large-scale Benchmark Dataset for Open Domain Question Answering over Archival News Collections	Nov 16, 2021	Open-Domain Question AnsweringQuestion Answering	—Unverified
Towards Faithful Response Generation for Chinese Table Question Answering	Nov 16, 2021	Question AnsweringResponse Generation	—Unverified
RNG-KBQA: Generation Augmented Iterative Ranking for Knowledge Base Question Answering	Nov 16, 2021	Entity LinkingKnowledge Base Question Answering	—Unverified
Event Detection via Derangement Question Answering	Nov 16, 2021	Event DetectionQuestion Answering	—Unverified
Retrieval Data Augmentation Informed by Downstream Question Answering Performance	Nov 16, 2021	Data AugmentationQuestion Answering	—Unverified
Can Explanations Be Useful for Calibrating Black Box Models?	Nov 16, 2021	Extractive Question-AnsweringFew-Shot Learning	—Unverified
Calibration of Machine Reading Systems at Scale	Nov 16, 2021	Claim VerificationOpen-Domain Question Answering	—Unverified
Simulating Bandit Learning from User Feedback for Extractive Question Answering	Nov 16, 2021	Extractive Question-AnsweringQuestion Answering	—Unverified
Enabling Multimodal Generation on CLIP via Vision-Language Knowledge Distillation	Nov 16, 2021	Image CaptioningKnowledge Distillation	—Unverified
Modeling Multi-hop Question Answering as Single Sequence Prediction	Nov 16, 2021	Answer GenerationDecoder	—Unverified
Breaking Down Questions for Outside-Knowledge Visual Question Answering	Nov 16, 2021	Graph Neural NetworkQuestion Answering	—Unverified
E-KAR: A Benchmark for Rationalizing Natural Language Analogical Reasoning	Nov 16, 2021	Explanation GenerationQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 269 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified