Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7026–7050 of 10817 papers

Title	Date	Tasks	Status	Hype
Predicting the impact of dataset composition on model performance	Jan 1, 2021	Experimental DesignMachine Translation	—Unverified	0
Pretrain Knowledge-Aware Language Models	Jan 1, 2021	Knowledge ProbingLanguage Modeling	—Unverified	0
Block Skim Transformer for Efficient Question Answering	Jan 1, 2021	Language ModelingLanguage Modelling	—Unverified	0
Memory Representation in Transformer	Jan 1, 2021	Language ModelingLanguage Modelling	—Unverified	0
Learning Contextualized Knowledge Graph Structures for Commonsense Reasoning	Jan 1, 2021	Knowledge GraphsNatural Language Inference	—Unverified	0
Differentiable End-to-End Program Executor for Sample and Computationally Efficient VQA	Jan 1, 2021	Question AnsweringVisual Question Answering	—Unverified	0
ChemistryQA: A Complex Question Answering Dataset from Chemistry	Jan 1, 2021	Machine Reading ComprehensionMath	—Unverified	0
CLEAR: Contrastive Learning for Sentence Representation	Dec 31, 2020	Contrastive LearningLinguistic Acceptability	—Unverified	0
FiD-Ex: Improving Sequence-to-Sequence Models for Extractive Rationale Generation	Dec 31, 2020	DecoderFact Verification	—Unverified	0
AraGPT2: Pre-Trained Transformer for Arabic Language Generation	Dec 31, 2020	ArticlesLanguage Modeling	CodeCode Available	1
ERNIE-Doc: A Retrospective Long-Document Modeling Transformer	Dec 31, 2020	Language ModelingLanguage Modelling	CodeCode Available	0
Seeing is Knowing! Fact-based Visual Question Answering using Knowledge Graph Embeddings	Dec 31, 2020	Common Sense ReasoningKnowledge Graph Embeddings	—Unverified	0
Using Natural Language Relations between Answer Choices for Machine Comprehension	Dec 31, 2020	Natural Language InferenceQuestion Answering	CodeCode Available	0
Coreference Reasoning in Machine Reading Comprehension	Dec 31, 2020	coreference-resolutionCoreference Resolution	CodeCode Available	0
Studying Strategically: Learning to Mask for Closed-book QA	Dec 31, 2020	Language ModelingLanguage Modelling	—Unverified	0
HopRetriever: Retrieve Hops over Wikipedia to Answer Complex Questions	Dec 31, 2020	Document EmbeddingOpen-Domain Question Answering	—Unverified	0
ERICA: Improving Entity and Relation Understanding for Pre-trained Language Models via Contrastive Learning	Dec 30, 2020	Contrastive LearningEntity Typing	CodeCode Available	1
ECONET: Effective Continual Pretraining of Language Models for Event Temporal Reasoning	Dec 30, 2020	Continual PretrainingLanguage Modelling	CodeCode Available	1
Improving BERT with Syntax-aware Local Attention	Dec 30, 2020	Machine TranslationQuestion Answering	CodeCode Available	1
A Memory Efficient Baseline for Open Domain Question Answering	Dec 30, 2020	Dimensionality ReductionOpen-Domain Question Answering	CodeCode Available	1
Detecting Hate Speech in Multi-modal Memes	Dec 29, 2020	Binary ClassificationHate Speech Detection	CodeCode Available	1
Presenting a Dataset for Collaborator Recommending Systems in Academic Social Network: a Case Study on ReseachGate	Dec 29, 2020	Question Answering	—Unverified	0
UniK-QA: Unified Representations of Structured and Unstructured Knowledge for Open-Domain Question Answering	Dec 29, 2020	Knowledge Base Question AnsweringOpen-Domain Question Answering	CodeCode Available	1
Syntax-Enhanced Pre-trained Model	Dec 28, 2020	Entity Typingmodel	CodeCode Available	1
BURT: BERT-inspired Universal Representation from Learning Meaningful Segment	Dec 28, 2020	Information RetrievalQuestion Answering	—Unverified	0

Show:10 25 50

← PrevPage 282 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified