Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7376–7400 of 10817 papers

Title	Date	Tasks	Status
Transformers in Vision: A Survey	Jan 4, 2021	Action RecognitionActivity Recognition	—Unverified
Retrieving and Reading: A Comprehensive Survey on Open-domain Question Answering	Jan 4, 2021	Machine Reading ComprehensionOpen-Domain Question Answering	—Unverified
Benchmarking Knowledge-Enhanced Commonsense Question Answering via Knowledge-to-Text Transformation	Jan 4, 2021	BenchmarkingQuestion Answering	—Unverified
RiddleSense: Reasoning about Riddle Questions Featuring Linguistic Creativity and Commonsense Knowledge	Jan 2, 2021	counterfactualCounterfactual Reasoning	—Unverified
Which Linguist Invented the Lightbulb? Presupposition Verification for Question-Answering	Jan 2, 2021	Explanation GenerationNatural Questions	—Unverified
UnitedQA: A Hybrid Approach for Open Domain Question Answering	Jan 1, 2021	Open-Domain Question AnsweringQuestion Answering	—Unverified
Pretrain Knowledge-Aware Language Models	Jan 1, 2021	Knowledge ProbingLanguage Modeling	—Unverified
Cluster-Former: Clustering-based Sparse Transformer for Question Answering	Jan 1, 2021	ClusteringQuestion Answering	—Unverified
ChemistryQA: A Complex Question Answering Dataset from Chemistry	Jan 1, 2021	Machine Reading ComprehensionMath	—Unverified
PABI: A Unified PAC-Bayesian Informativeness Measure for Incidental Supervision Signals	Jan 1, 2021	Informativenessnamed-entity-recognition	—Unverified
NeurIPS 2020 EfficientQA Competition: Systems, Analyses and Lessons Learned	Jan 1, 2021	Open-Domain Question AnsweringQuestion Answering	—Unverified
Erasure for Advancing: Dynamic Self-Supervised Learning for Commonsense Reasoning	Jan 1, 2021	Question AnsweringSelf-Supervised Learning	—Unverified
Env-QA: A Video Question Answering Benchmark for Comprehensive Understanding of Dynamic Environments	Jan 1, 2021	Question AnsweringVideo Question Answering	—Unverified
Multi-task Retrieval for Knowledge-Intensive Tasks	Jan 1, 2021	Fact CheckingOpen-Domain Question Answering	—Unverified
MULTI-SPAN QUESTION ANSWERING USING SPAN-IMAGE NETWORK	Jan 1, 2021	Question Answeringvalid	—Unverified
Video Question Answering Using Language-Guided Deep Compressed-Domain Video Feature	Jan 1, 2021	Question AnsweringVideo Compression	—Unverified
Block Skim Transformer for Efficient Question Answering	Jan 1, 2021	Language ModelingLanguage Modelling	—Unverified
Memory Representation in Transformer	Jan 1, 2021	Language ModelingLanguage Modelling	—Unverified
Linguistically Routing Capsule Network for Out-of-Distribution Visual Question Answering	Jan 1, 2021	Novel ConceptsQuestion Answering	—Unverified
Predicting the impact of dataset composition on model performance	Jan 1, 2021	Experimental DesignMachine Translation	—Unverified
Learning to Generate Questions by Recovering Answer-containing Sentences	Jan 1, 2021	Machine Reading ComprehensionQuestion Answering	—Unverified
Learning Contextualized Knowledge Graph Structures for Commonsense Reasoning	Jan 1, 2021	Knowledge GraphsNatural Language Inference	—Unverified
Differentiable End-to-End Program Executor for Sample and Computationally Efficient VQA	Jan 1, 2021	Question AnsweringVisual Question Answering	—Unverified
Unshuffling Data for Improved Generalization in Visual Question Answering	Jan 1, 2021	Out-of-Distribution GeneralizationQuestion Answering	—Unverified
Symbol-Shift Equivariant Neural Networks	Jan 1, 2021	Question AnsweringSentence	—Unverified

Show:10 25 50

← PrevPage 296 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified