Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8951–8975 of 10817 papers

Title	Date	Tasks	Status
Syntax for Semantic Role Labeling, To Be, Or Not To Be	Jul 1, 2018	Dependency ParsingFeature Engineering	CodeCode Available
Trick Me If You Can: Adversarial Writing of Trivia Challenge Questions	Jul 1, 2018	Question Answering	—Unverified
Tackling Code-Switched NER: Participation of CMU	Jul 1, 2018	named-entity-recognitionNamed Entity Recognition	—Unverified
Tackling Adversarial Examples in QA via Answer Sentence Selection	Jul 1, 2018	ArticlesQuestion Answering	—Unverified
The price of debiasing automatic metrics in natural language evalaution	Jul 1, 2018	Abstractive Text SummarizationImage Captioning	—Unverified
The First Multilingual Surface Realisation Shared Task (SRâ18): Overview and Evaluation Results	Jul 1, 2018	Question AnsweringText Generation	—Unverified
Visual Attention Model for Name Tagging in Multimodal Social Media	Jul 1, 2018	Natural Language UnderstandingQuestion Answering	—Unverified
One-shot Learning for Question-Answering in Gaokao History Challenge	Jun 24, 2018	One-Shot LearningQuestion Answering	CodeCode Available
End-to-End Audio Visual Scene-Aware Dialog using Multimodal Attention-Based Video Features	Jun 21, 2018	Question AnsweringVideo Description	CodeCode Available
Learning Conditioned Graph Structures for Interpretable Visual Question Answering	Jun 19, 2018	Question AnsweringVisual Question Answering	CodeCode Available
Comparative Analysis of Neural QA models on SQuAD	Jun 18, 2018	Information RetrievalQuestion Answering	—Unverified
GLoMo: Unsupervisedly Learned Relational Graphs as Transferable Representations	Jun 14, 2018	image-classificationImage Classification	CodeCode Available
Learning Visual Knowledge Memory Networks for Visual Question Answering	Jun 13, 2018	Question AnsweringVisual Question Answering	—Unverified
FigureNet: A Deep Learning model for Question-Answering on Scientific Plots	Jun 12, 2018	Deep LearningQuestion Answering	—Unverified
iParaphrasing: Extracting Visually Grounded Paraphrases via an Image	Jun 12, 2018	Image CaptioningQuestion Answering	CodeCode Available
Neural Network Models for Paraphrase Identification, Semantic Textual Similarity, Natural Language Inference, and Question Answering	Jun 12, 2018	Natural Language InferenceParaphrase Identification	CodeCode Available
Focused Hierarchical RNNs for Conditional Sequence Processing	Jun 12, 2018	Open-Domain Question AnsweringPolicy Gradient Methods	—Unverified
Recurrent One-Hop Predictions for Reasoning over Knowledge Graphs	Jun 12, 2018	Knowledge Base CompletionKnowledge Graphs	—Unverified
Prosody Modifications for Question-Answering in Voice-Only Settings	Jun 11, 2018	InformativenessQuestion Answering	CodeCode Available
Adaptations of ROUGE and BLEU to Better Evaluate Machine Reading Comprehension Task	Jun 10, 2018	Machine Reading ComprehensionQuestion Answering	—Unverified
Cross-Dataset Adaptation for Visual Question Answering	Jun 10, 2018	Domain AdaptationQuestion Answering	—Unverified
Learning Answer Embeddings for Visual Question Answering	Jun 10, 2018	Question AnsweringTransfer Learning	—Unverified
SciDTB: Discourse Dependency TreeBank for Scientific Abstracts	Jun 10, 2018	ArticlesMachine Translation	CodeCode Available
Learning to Search in Long Documents Using Document Structure	Jun 9, 2018	Information RetrievalQuestion Answering	CodeCode Available
CS-VQA: Visual Question Answering with Compressively Sensed Images	Jun 8, 2018	Question AnsweringVisual Question Answering	—Unverified

Show:10 25 50

← PrevPage 359 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified