Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7326–7350 of 10817 papers

Title	Date	Tasks	Status
Optimizing Inference Performance of Transformers on CPUs	Feb 12, 2021	Question AnsweringTranslation	—Unverified
Biomedical Question Answering: A Survey of Approaches and Challenges	Feb 10, 2021	Information RetrievalMachine Reading Comprehension	—Unverified
Information Extraction From Co-Occurring Similar Entities	Feb 10, 2021	DescriptiveKnowledge Graphs	—Unverified
Decontextualization: Making Sentences Stand-Alone	Feb 9, 2021	document understandingQuestion Answering	—Unverified
Memory Augmented Sequential Paragraph Retrieval for Multi-hop Question Answering	Feb 7, 2021	Information RetrievalMulti-hop Question Answering	—Unverified
Model Agnostic Answer Reranking System for Adversarial Question Answering	Feb 5, 2021	Question AnsweringReranking	—Unverified
Think you have Solved Direct-Answer Question Answering? Try ARC-DA, the Direct-Answer AI2 Reasoning Challenge	Feb 5, 2021	AI2 Reasoning ChallengeARC	—Unverified
Answer Questions with Right Image Regions: A Visual Attention Regularization Approach	Feb 3, 2021	Question AnsweringVisual Grounding	CodeCode Available
The GEM Benchmark: Natural Language Generation, its Evaluation and Metrics	Feb 2, 2021	Abstractive Text SummarizationCross-Lingual Abstractive Summarization	—Unverified
Revamp: Enhancing Accessible Information Seeking Experience of Online Shopping for Blind or Low Vision Users	Feb 1, 2021	DescriptiveInformation Retrieval	—Unverified
Do Question Answering Modeling Improvements Hold Across Benchmarks?	Feb 1, 2021	Question Answering	—Unverified
Self-Teaching Machines to Read and Comprehend with Large-Scale Multi-Subject Question-Answering Data	Feb 1, 2021	Machine Reading ComprehensionMultiple-choice	—Unverified
Commonsense Knowledge Mining from Term Definitions	Feb 1, 2021	Knowledge GraphsNatural Language Understanding	CodeCode Available
An Empirical Study on the Generalization Power of Neural Representations Learned via Visual Guessing Games	Jan 31, 2021	Question AnsweringVisual Question Answering	—Unverified
Weakly Supervised Neuro-Symbolic Module Networks for Numerical Reasoning	Jan 28, 2021	Dependency ParsingLanguage Modeling	—Unverified
Modeling Context in Answer Sentence Selection Systems on a Latency Budget	Jan 28, 2021	Machine Reading ComprehensionOpen-Domain Question Answering	—Unverified
VX2TEXT: End-to-End Learning of Video-Based Text Generation From Multimodal Inputs	Jan 28, 2021	DecoderQuestion Answering	—Unverified
Powering COVID-19 community Q&A with Curated Side Information	Jan 27, 2021	Community Question AnsweringQuestion Answering	—Unverified
Knowledge-driven Natural Language Understanding of English Text and its Applications	Jan 27, 2021	Natural Language UnderstandingQuestion Answering	—Unverified
Muppet: Massive Multi-task Representations with Pre-Finetuning	Jan 26, 2021	Abstractive Text SummarizationCommon Sense Reasoning	CodeCode Available
Representations for Question Answering from Documents with Tables and Text	Jan 26, 2021	Natural QuestionsQuestion Answering	—Unverified
Meta-Learning for Effective Multi-task and Multilingual Modelling	Jan 25, 2021	Meta-Learningnamed-entity-recognition	CodeCode Available
Unanswerable Questions about Images and Texts	Jan 25, 2021	Question AnsweringVisual Question Answering	—Unverified
A2P-MANN: Adaptive Attention Inference Hops Pruned Memory-Augmented Neural Networks	Jan 24, 2021	CPUGPU	—Unverified
Towards Natural Language Question Answering over Earth Observation Linked Data using Attention-based Neural Machine Translation	Jan 23, 2021	Earth ObservationMachine Translation	—Unverified

Show:10 25 50

← PrevPage 294 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified