Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6601–6625 of 10817 papers

Title	Date	Tasks	Status	Hype
A Mutual Information Maximization Approach for the Spurious Solution Problem in Weakly Supervised Question Answering	Jun 14, 2021	Question Answering	CodeCode Available	0
Thinking Like Transformers	Jun 13, 2021	Question Answering	CodeCode Available	1
Evaluating Entity Disambiguation and the Role of Popularity in Retrieval-Based NLP	Jun 12, 2021	Entity DisambiguationEntity Retrieval	CodeCode Available	1
BioELECTRA:Pretrained Biomedical text Encoder using Discriminators	Jun 11, 2021	ArticlesLanguage Modeling	CodeCode Available	1
Improving Pretrained Cross-Lingual Language Models via Self-Labeled Word Alignment	Jun 11, 2021	DenoisingLanguage Modeling	CodeCode Available	1
NAAQA: A Neural Architecture for Acoustic Question Answering	Jun 11, 2021	Acoustic Question AnsweringQuestion Answering	CodeCode Available	0
Grover's Algorithm for Question Answering	Jun 9, 2021	Question Answering	—Unverified	0
End-to-End Training of Multi-Document Reader and Retriever for Open-Domain Question Answering	Jun 9, 2021	Answer GenerationOpen-Domain Question Answering	CodeCode Available	1
What Would a Teacher Do? Predicting Future Talk Moves	Jun 9, 2021	Question Answering	—Unverified	0
Bayesian Attention Belief Networks	Jun 9, 2021	DecoderMachine Translation	—Unverified	0
DESCGEN: A Distantly Supervised Dataset for Generating Abstractive Entity Descriptions	Jun 9, 2021	Entity LinkingQuestion Answering	CodeCode Available	0
CLTR: An End-to-End, Transformer-Based System for Cell Level Table Retrieval and Table Question Answering	Jun 8, 2021	Question AnsweringRetrieval	CodeCode Available	1
Check It Again: Progressive Visual Question Answering via Visual Entailment	Jun 8, 2021	Question AnsweringVisual Entailment	CodeCode Available	1
Disfl-QA: A Benchmark Dataset for Understanding Disfluencies in Question Answering	Jun 8, 2021	Data AugmentationQuestion Answering	CodeCode Available	1
PAM: Understanding Product Images in Cross Product Category Attribute Extraction	Jun 8, 2021	AttributeAttribute Extraction	—Unverified	0
Comprehension Based Question Answering using Bloom's Taxonomy	Jun 8, 2021	Common Sense ReasoningQuestion Answering	—Unverified	0
VALUE: A Multi-Task Benchmark for Video-and-Language Understanding Evaluation	Jun 8, 2021	Multi-Task LearningQuestion Answering	CodeCode Available	1
Are VQA Systems RAD? Measuring Robustness to Augmented Data with Focused Interventions	Jun 8, 2021	Question AnsweringVisual Question Answering	—Unverified	0
XtremeDistilTransformers: Task Transfer for Task-agnostic Distillation	Jun 8, 2021	Knowledge DistillationNER	CodeCode Available	1
Measuring Conversational Uptake: A Case Study on Student-Teacher Interactions	Jun 7, 2021	MathQuestion Answering	CodeCode Available	1
Narrative Question Answering with Cutting-Edge Open-Domain QA Techniques: A Comprehensive Study	Jun 7, 2021	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
BERTnesia: Investigating the capture and forgetting of knowledge in BERT	Jun 5, 2021	Knowledge Base CompletionLanguage Modeling	CodeCode Available	0
Meaning Representation of Numeric Fused-Heads in UCCA	Jun 4, 2021	Machine TranslationNatural Language Inference	—Unverified	0
Self-supervised Dialogue Learning for Spoken Conversational Question Answering	Jun 4, 2021	Conversational Question Answeringcoreference-resolution	—Unverified	0
Prediction or Comparison: Toward Interpretable Qualitative Reasoning	Jun 4, 2021	PredictionQuestion Answering	—Unverified	0

Show:10 25 50

← PrevPage 265 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified