Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1776–1800 of 10817 papers

Title	Date	Tasks	Status	Hype
Consistency Regularization for Cross-Lingual Fine-Tuning	Jun 15, 2021	Machine TranslationQuestion Answering	CodeCode Available	1
Thinking Like Transformers	Jun 13, 2021	Question Answering	CodeCode Available	1
Evaluating Entity Disambiguation and the Role of Popularity in Retrieval-Based NLP	Jun 12, 2021	Entity DisambiguationEntity Retrieval	CodeCode Available	1
BioELECTRA:Pretrained Biomedical text Encoder using Discriminators	Jun 11, 2021	ArticlesLanguage Modeling	CodeCode Available	1
Improving Pretrained Cross-Lingual Language Models via Self-Labeled Word Alignment	Jun 11, 2021	DenoisingLanguage Modeling	CodeCode Available	1
End-to-End Training of Multi-Document Reader and Retriever for Open-Domain Question Answering	Jun 9, 2021	Answer GenerationOpen-Domain Question Answering	CodeCode Available	1
CLTR: An End-to-End, Transformer-Based System for Cell Level Table Retrieval and Table Question Answering	Jun 8, 2021	Question AnsweringRetrieval	CodeCode Available	1
XtremeDistilTransformers: Task Transfer for Task-agnostic Distillation	Jun 8, 2021	Knowledge DistillationNER	CodeCode Available	1
Disfl-QA: A Benchmark Dataset for Understanding Disfluencies in Question Answering	Jun 8, 2021	Data AugmentationQuestion Answering	CodeCode Available	1
VALUE: A Multi-Task Benchmark for Video-and-Language Understanding Evaluation	Jun 8, 2021	Multi-Task LearningQuestion Answering	CodeCode Available	1
Check It Again: Progressive Visual Question Answering via Visual Entailment	Jun 8, 2021	Question AnsweringVisual Entailment	CodeCode Available	1
Narrative Question Answering with Cutting-Edge Open-Domain QA Techniques: A Comprehensive Study	Jun 7, 2021	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
Measuring Conversational Uptake: A Case Study on Student-Teacher Interactions	Jun 7, 2021	MathQuestion Answering	CodeCode Available	1
Question Answering Over Temporal Knowledge Graphs	Jun 3, 2021	Knowledge GraphsQuestion Answering	CodeCode Available	1
Can Generative Pre-trained Language Models Serve as Knowledge Bases for Closed-book QA?	Jun 3, 2021	Question Answering	CodeCode Available	1
Syntax-augmented Multilingual BERT for Cross-lingual Transfer	Jun 3, 2021	Cross-Lingual Transfernamed-entity-recognition	CodeCode Available	1
Efficient Passage Retrieval with Hashing for Open-domain Question Answering	Jun 2, 2021	Natural QuestionsOpen-Domain Question Answering	CodeCode Available	1
Knowing More About Questions Can Help: Improving Calibration in Question Answering	Jun 2, 2021	Answer GenerationData Augmentation	CodeCode Available	1
Who Blames or Endorses Whom? Entity-to-Entity Directed Sentiment Extraction in News Text	Jun 2, 2021	Question AnsweringSentiment Analysis	CodeCode Available	1
SPARTQA: A Textual Question Answering Benchmark for Spatial Reasoning	Jun 1, 2021	Question AnsweringSpatial Reasoning	CodeCode Available	1
ConvoSumm: Conversation Summarization Benchmark and Improved Abstractive Summarization with Argument Mining	Jun 1, 2021	Abstractive Text SummarizationArgument Mining	CodeCode Available	1
DeCEMBERT: Learning from Noisy Instructional Videos via Dense Captions and Entropy Minimization	Jun 1, 2021	Question AnsweringRetrieval	CodeCode Available	1
A Semantic-based Method for Unsupervised Commonsense Question Answering	May 31, 2021	Question AnsweringSemantic Similarity	CodeCode Available	1
GeoQA: A Geometric Question Answering Benchmark Towards Multimodal Numerical Reasoning	May 30, 2021	MathMathematical Reasoning	CodeCode Available	1
SciFive: a text-to-text transformer model for biomedical literature	May 28, 2021	Document ClassificationDrug–drug Interaction Extraction	CodeCode Available	1

Show:10 25 50

← PrevPage 72 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified