Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7001–7025 of 10817 papers

Title	Date	Tasks	Status	Hype
Baleen: Robust Multi-Hop Reasoning at Scale via Condensed Retrieval	Jan 2, 2021	Claim VerificationQuestion Answering	CodeCode Available	2
CDLM: Cross-Document Language Modeling	Jan 2, 2021	Citation RecommendationCoreference Resolution	CodeCode Available	1
RiddleSense: Reasoning about Riddle Questions Featuring Linguistic Creativity and Commonsense Knowledge	Jan 2, 2021	counterfactualCounterfactual Reasoning	—Unverified	0
TRAR: Routing the Attention Spans in Transformer for Visual Question Answering	Jan 1, 2021	Question AnsweringReferring Expression	CodeCode Available	1
Unshuffling Data for Improved Generalization in Visual Question Answering	Jan 1, 2021	Out-of-Distribution GeneralizationQuestion Answering	—Unverified	0
Env-QA: A Video Question Answering Benchmark for Comprehensive Understanding of Dynamic Environments	Jan 1, 2021	Question AnsweringVideo Question Answering	—Unverified	0
Multimodal Co-Attention Transformer for Survival Prediction in Gigapixel Whole Slide Images	Jan 1, 2021	AttributeMultiple Instance Learning	CodeCode Available	1
Video Question Answering Using Language-Guided Deep Compressed-Domain Video Feature	Jan 1, 2021	Question AnsweringVideo Compression	—Unverified	0
MDETR - Modulated Detection for End-to-End Multi-Modal Understanding	Jan 1, 2021	Phrase GroundingQuestion Answering	CodeCode Available	2
Linguistically Routing Capsule Network for Out-of-Distribution Visual Question Answering	Jan 1, 2021	Novel ConceptsQuestion Answering	—Unverified	0
Pano-AVQA: Grounded Audio-Visual Question Answering on 360deg Videos	Jan 1, 2021	Audio-visual Question AnsweringQuestion Answering	CodeCode Available	1
Hierarchical Graph Attention Network for Few-Shot Visual-Semantic Learning	Jan 1, 2021	Graph AttentionImage Captioning	—Unverified	0
HAIR: Hierarchical Visual-Semantic Relational Reasoning for Video Question Answering	Jan 1, 2021	Question AnsweringRelational Reasoning	—Unverified	0
NeurIPS 2020 EfficientQA Competition: Systems, Analyses and Lessons Learned	Jan 1, 2021	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
Multi-task Retrieval for Knowledge-Intensive Tasks	Jan 1, 2021	Fact CheckingOpen-Domain Question Answering	—Unverified	0
Rider: Reader-Guided Passage Reranking for Open-Domain Question Answering	Jan 1, 2021	Natural QuestionsOpen-Domain Question Answering	CodeCode Available	1
BanglaBERT: Language Model Pretraining and Benchmarks for Low-Resource Language Understanding Evaluation in Bangla	Jan 1, 2021	Document ClassificationLanguage Modeling	CodeCode Available	1
UnitedQA: A Hybrid Approach for Open Domain Question Answering	Jan 1, 2021	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
Symbol-Shift Equivariant Neural Networks	Jan 1, 2021	Question AnsweringSentence	—Unverified	0
MULTI-SPAN QUESTION ANSWERING USING SPAN-IMAGE NETWORK	Jan 1, 2021	Question Answeringvalid	—Unverified	0
Learning to Generate Questions by Recovering Answer-containing Sentences	Jan 1, 2021	Machine Reading ComprehensionQuestion Answering	—Unverified	0
PABI: A Unified PAC-Bayesian Informativeness Measure for Incidental Supervision Signals	Jan 1, 2021	Informativenessnamed-entity-recognition	—Unverified	0
Cluster-Former: Clustering-based Sparse Transformer for Question Answering	Jan 1, 2021	ClusteringQuestion Answering	—Unverified	0
Erasure for Advancing: Dynamic Self-Supervised Learning for Commonsense Reasoning	Jan 1, 2021	Question AnsweringSelf-Supervised Learning	—Unverified	0
Block Skim Transformer for Efficient Question Answering	Jan 1, 2021	Language ModelingLanguage Modelling	—Unverified	0

Show:10 25 50

← PrevPage 281 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified