Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2101–2125 of 10817 papers

Title	Date	Tasks	Status	Hype
MATINF: A Jointly Labeled Large-Scale Dataset for Classification, Question Answering and Summarization	Apr 26, 2020	ClassificationGeneral Classification	CodeCode Available	1
Deep Multimodal Neural Architecture Search	Apr 25, 2020	DecoderImage-text matching	CodeCode Available	1
SE-KGE: A Location-Aware Knowledge Graph Embedding Model for Geographic Question Answering and Spatial Semantic Lifting	Apr 25, 2020	Geographic Question AnsweringGraph Embedding	CodeCode Available	1
Lite Transformer with Long-Short Range Attention	Apr 24, 2020	Abstractive Text SummarizationAutoML	CodeCode Available	1
Template-Based Question Generation from Retrieved Sentences for Improved Unsupervised Question Answering	Apr 24, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
Generative Data Augmentation for Commonsense Reasoning	Apr 24, 2020	Common Sense ReasoningCoreference Resolution	CodeCode Available	1
Rapidly Bootstrapping a Question Answering Dataset for COVID-19	Apr 23, 2020	Question Answering	CodeCode Available	1
AmbigQA: Answering Ambiguous Open-domain Questions	Apr 22, 2020	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
Logic-Guided Data Augmentation and Regularization for Consistent Question Answering	Apr 21, 2020	Data AugmentationMachine Reading Comprehension	CodeCode Available	1
ETC: Encoding Long and Structured Inputs in Transformers	Apr 17, 2020	PositionQuestion Answering	CodeCode Available	1
Bridging Anaphora Resolution as Question Answering	Apr 16, 2020	Bridging Anaphora ResolutionQuestion Answering	CodeCode Available	1
HybridQA: A Dataset of Multi-Hop Question Answering over Tabular and Textual Data	Apr 15, 2020	Multi-hop Question AnsweringQuestion Answering	CodeCode Available	1
PALM: Pre-training an Autoencoding&Autoregressive Language Model for Context-conditioned Generation	Apr 14, 2020	Abstractive Text SummarizationConversational Response Generation	CodeCode Available	1
Toward Subgraph-Guided Knowledge Graph Question Generation with Graph Neural Networks	Apr 13, 2020	Data AugmentationDecoder	CodeCode Available	1
YouMakeup VQA Challenge: Towards Fine-grained Action Understanding in Domain-Specific Videos	Apr 12, 2020	Action UnderstandingQuestion Answering	CodeCode Available	1
Visual Grounding Methods for VQA are Working for the Wrong Reasons!	Apr 12, 2020	Question AnsweringVisual Grounding	CodeCode Available	1
Explaining Question Answering Models through Text Generation	Apr 12, 2020	Question AnsweringText Generation	CodeCode Available	1
Unsupervised Commonsense Question Answering with Self-Talk	Apr 11, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
Dense Passage Retrieval for Open-Domain Question Answering	Apr 10, 2020	Open-Domain Question AnsweringPassage Retrieval	CodeCode Available	1
Injecting Numerical Reasoning Skills into Language Models	Apr 9, 2020	Data AugmentationDecoder	CodeCode Available	1
Transformers to Learn Hierarchical Contexts in Multiparty Dialogue for Span-based Question Answering	Apr 7, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
What do Models Learn from Question Answering Datasets?	Apr 7, 2020	Question AnsweringReading Comprehension	CodeCode Available	1
Deep Learning Based Text Classification: A Comprehensive Review	Apr 6, 2020	BIG-bench Machine LearningClassification	CodeCode Available	1
Evaluating Multimodal Representations on Visual Semantic Textual Similarity	Apr 4, 2020	BenchmarkingImage Captioning	CodeCode Available	1
Pixel-BERT: Aligning Image Pixels with Text by Deep Multi-Modal Transformers	Apr 2, 2020	Image-text matchingImage-text Retrieval	CodeCode Available	1

Show:10 25 50

← PrevPage 85 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified