Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7726–7750 of 10817 papers

Title	Date	Tasks	Status	Hype
Knowledge-Based Visual Question Answering in Videos	Apr 17, 2020	Question AnsweringVideo Question Answering	—Unverified	0
Bridging Anaphora Resolution as Question Answering	Apr 16, 2020	Bridging Anaphora ResolutionQuestion Answering	CodeCode Available	1
A Methodology for Creating Question Answering Corpora Using Inverse Data Annotation	Apr 16, 2020	Question AnsweringSemantic Parsing	—Unverified	0
Learning Structured Embeddings of Knowledge Graphs with Adversarial Learning Framework	Apr 15, 2020	General ClassificationKnowledge Graph Completion	—Unverified	0
HybridQA: A Dataset of Multi-Hop Question Answering over Tabular and Textual Data	Apr 15, 2020	Multi-hop Question AnsweringQuestion Answering	CodeCode Available	1
A Simple Yet Strong Pipeline for HotpotQA	Apr 14, 2020	Multi-hop Question Answeringnamed-entity-recognition	—Unverified	0
PALM: Pre-training an Autoencoding&Autoregressive Language Model for Context-conditioned Generation	Apr 14, 2020	Abstractive Text SummarizationConversational Response Generation	CodeCode Available	1
Toward Subgraph-Guided Knowledge Graph Question Generation with Graph Neural Networks	Apr 13, 2020	Data AugmentationDecoder	CodeCode Available	1
Explaining Question Answering Models through Text Generation	Apr 12, 2020	Question AnsweringText Generation	CodeCode Available	1
An Entropy Clustering Approach for Assessing Visual Question Difficulty	Apr 12, 2020	ClusteringQuestion Answering	CodeCode Available	0
Visual Grounding Methods for VQA are Working for the Wrong Reasons!	Apr 12, 2020	Question AnsweringVisual Grounding	CodeCode Available	1
YouMakeup VQA Challenge: Towards Fine-grained Action Understanding in Domain-Specific Videos	Apr 12, 2020	Action UnderstandingQuestion Answering	CodeCode Available	1
Exploring The Spatial Reasoning Ability of Neural Models in Human IQ Tests	Apr 11, 2020	Question AnsweringSpatial Reasoning	—Unverified	0
Unsupervised Commonsense Question Answering with Self-Talk	Apr 11, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
Longformer: The Long-Document Transformer	Apr 10, 2020	DecoderLanguage Modeling	CodeCode Available	3
Dense Passage Retrieval for Open-Domain Question Answering	Apr 10, 2020	Open-Domain Question AnsweringPassage Retrieval	CodeCode Available	1
Rephrasing visual questions by specifying the entropy of the answer distribution	Apr 10, 2020	Question AnsweringVisual Question Answering	—Unverified	0
More Bang for Your Buck: Natural Perturbation for Robust Question Answering	Apr 9, 2020	Question Answering	—Unverified	0
Calibrating Structured Output Predictors for Natural Language Processing	Apr 9, 2020	named-entity-recognitionNamed Entity Recognition	—Unverified	0
Injecting Numerical Reasoning Skills into Language Models	Apr 9, 2020	Data AugmentationDecoder	CodeCode Available	1
A Multilingual Study of Multi-Sentence Compression using Word Vertex-Labeled Graphs and Integer Linear Programming	Apr 9, 2020	InformativenessQuestion Answering	—Unverified	0
Understanding Knowledge Gaps in Visual Question Answering: Implications for Gap Identification and Testing	Apr 8, 2020	DiversityQuestion Answering	—Unverified	0
What do Models Learn from Question Answering Datasets?	Apr 7, 2020	Question AnsweringReading Comprehension	CodeCode Available	1
Transformers to Learn Hierarchical Contexts in Multiparty Dialogue for Span-based Question Answering	Apr 7, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
Improving the Robustness of QA Models to Challenge Sets with Variational Question-Answer Pair Generation	Apr 7, 2020	Data AugmentationDiversity	CodeCode Available	0

Show:10 25 50

← PrevPage 310 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified