Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2076–2100 of 10817 papers

Title	Date	Tasks	Status	Hype
Exploring and Predicting Transferability across NLP Tasks	May 2, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
ProtoQA: A Question Answering Dataset for Prototypical Common-Sense Reasoning	May 2, 2020	Common Sense ReasoningQuestion Answering	CodeCode Available	1
BERT-kNN: Adding a kNN Search Component to Pretrained Language Models for Better QA	May 2, 2020	Information RetrievalLanguage Modeling	CodeCode Available	1
UnifiedQA: Crossing Format Boundaries With a Single QA System	May 2, 2020	Common Sense ReasoningLanguage Modeling	CodeCode Available	1
Connecting the Dots: A Knowledgeable Path Generator for Commonsense Question Answering	May 2, 2020	Knowledge GraphsLanguage Modeling	CodeCode Available	1
DeFormer: Decomposing Pre-trained Transformers for Faster Question Answering	May 2, 2020	Question Answering	CodeCode Available	1
Scalable Multi-Hop Relational Reasoning for Knowledge-Aware Question Answering	May 1, 2020	Knowledge GraphsQuestion Answering	CodeCode Available	1
Transformer-XH: Multi-Evidence Reasoning with eXtra Hop Attention	May 1, 2020	Fact VerificationMulti-hop Question Answering	CodeCode Available	1
Clinical Reading Comprehension: A Thorough Analysis of the emrQA Dataset	May 1, 2020	Machine Reading ComprehensionQuestion Answering	CodeCode Available	1
KLEJ: Comprehensive Benchmark for Polish Language Understanding	May 1, 2020	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
MTSI-BERT: A Session-aware Knowledge-based Conversational Agent	May 1, 2020	Chatbotintent-classification	CodeCode Available	1
HERO: Hierarchical Encoder for Video+Language Omni-representation Pre-training	May 1, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
KPQA: A Metric for Generative Question Answering Using Keyphrase Weights	May 1, 2020	Generative Question AnsweringQuestion Answering	CodeCode Available	1
SiBert: Enhanced Chinese Pre-trained Language Model with Sentence Insertion	May 1, 2020	Cloze TestLanguage Modeling	CodeCode Available	1
LifeQA: A Real-life Dataset for Video Question Answering	May 1, 2020	Multiple-choiceQuestion Answering	CodeCode Available	1
How do Decisions Emerge across Layers in Neural Models? Interpretation with Differentiable Masking	Apr 30, 2020	PredictionQuestion Answering	CodeCode Available	1
An Empirical Study of Pre-trained Transformers for Arabic Information Extraction	Apr 30, 2020	Cross-Lingual TransferLanguage Modelling	CodeCode Available	1
Progressively Pretrained Dense Corpus Index for Open-Domain Question Answering	Apr 30, 2020	Information RetrievalOpen-Domain Question Answering	CodeCode Available	1
Look at the First Sentence: Position Bias in Question Answering	Apr 30, 2020	Extractive Question-AnsweringPosition	CodeCode Available	1
Dynamic Language Binding in Relational Visual Reasoning	Apr 30, 2020	ObjectQuestion Answering	CodeCode Available	1
Empower Entity Set Expansion via Language Model Probing	Apr 29, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
SubjQA: A Dataset for Subjectivity and Review Comprehension	Apr 29, 2020	Question AnsweringSentiment Analysis	CodeCode Available	1
Event Extraction by Answering (Almost) Natural Questions	Apr 28, 2020	Event Argument ExtractionEvent Extraction	CodeCode Available	1
Conversational Question Answering over Passages by Leveraging Word Proximity Networks	Apr 27, 2020	Conversational Question AnsweringInformation Retrieval	CodeCode Available	1
SCDE: Sentence Cloze Dataset with High Quality Distractors From Examinations	Apr 27, 2020	Question AnsweringSentence	CodeCode Available	1

Show:10 25 50

← PrevPage 84 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified