Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8951–9000 of 10817 papers

Title	Date	Tasks	Status
The First Multilingual Surface Realisation Shared Task (SRâ18): Overview and Evaluation Results	Jul 1, 2018	Question AnsweringText Generation	—Unverified
To Attend or not to Attend: A Case Study on Syntactic Structures for Semantic Relatedness	Jul 1, 2018	Machine TranslationParaphrase Identification	CodeCode Available
Tackling Code-Switched NER: Participation of CMU	Jul 1, 2018	named-entity-recognitionNamed Entity Recognition	—Unverified
Trick Me If You Can: Adversarial Writing of Trivia Challenge Questions	Jul 1, 2018	Question Answering	—Unverified
Syntax for Semantic Role Labeling, To Be, Or Not To Be	Jul 1, 2018	Dependency ParsingFeature Engineering	CodeCode Available
The price of debiasing automatic metrics in natural language evalaution	Jul 1, 2018	Abstractive Text SummarizationImage Captioning	—Unverified
Tackling Adversarial Examples in QA via Answer Sentence Selection	Jul 1, 2018	ArticlesQuestion Answering	—Unverified
One-shot Learning for Question-Answering in Gaokao History Challenge	Jun 24, 2018	One-Shot LearningQuestion Answering	CodeCode Available
End-to-End Audio Visual Scene-Aware Dialog using Multimodal Attention-Based Video Features	Jun 21, 2018	Question AnsweringVideo Description	CodeCode Available
Learning Conditioned Graph Structures for Interpretable Visual Question Answering	Jun 19, 2018	Question AnsweringVisual Question Answering	CodeCode Available
Comparative Analysis of Neural QA models on SQuAD	Jun 18, 2018	Information RetrievalQuestion Answering	—Unverified
GLoMo: Unsupervisedly Learned Relational Graphs as Transferable Representations	Jun 14, 2018	image-classificationImage Classification	CodeCode Available
Learning Visual Knowledge Memory Networks for Visual Question Answering	Jun 13, 2018	Question AnsweringVisual Question Answering	—Unverified
Neural Network Models for Paraphrase Identification, Semantic Textual Similarity, Natural Language Inference, and Question Answering	Jun 12, 2018	Natural Language InferenceParaphrase Identification	CodeCode Available
Focused Hierarchical RNNs for Conditional Sequence Processing	Jun 12, 2018	Open-Domain Question AnsweringPolicy Gradient Methods	—Unverified
iParaphrasing: Extracting Visually Grounded Paraphrases via an Image	Jun 12, 2018	Image CaptioningQuestion Answering	CodeCode Available
FigureNet: A Deep Learning model for Question-Answering on Scientific Plots	Jun 12, 2018	Deep LearningQuestion Answering	—Unverified
Recurrent One-Hop Predictions for Reasoning over Knowledge Graphs	Jun 12, 2018	Knowledge Base CompletionKnowledge Graphs	—Unverified
Prosody Modifications for Question-Answering in Voice-Only Settings	Jun 11, 2018	InformativenessQuestion Answering	CodeCode Available
Adaptations of ROUGE and BLEU to Better Evaluate Machine Reading Comprehension Task	Jun 10, 2018	Machine Reading ComprehensionQuestion Answering	—Unverified
Learning Answer Embeddings for Visual Question Answering	Jun 10, 2018	Question AnsweringTransfer Learning	—Unverified
Cross-Dataset Adaptation for Visual Question Answering	Jun 10, 2018	Domain AdaptationQuestion Answering	—Unverified
SciDTB: Discourse Dependency TreeBank for Scientific Abstracts	Jun 10, 2018	ArticlesMachine Translation	CodeCode Available
Learning to Search in Long Documents Using Document Structure	Jun 9, 2018	Information RetrievalQuestion Answering	CodeCode Available
CS-VQA: Visual Question Answering with Compressively Sensed Images	Jun 8, 2018	Question AnsweringVisual Question Answering	—Unverified
Focal Visual-Text Attention for Visual Question Answering	Jun 5, 2018	Memex Question AnsweringQuestion Answering	CodeCode Available
On the Flip Side: Identifying Counterexamples in Visual Question Answering	Jun 3, 2018	Question AnsweringVisual Question Answering	—Unverified
Multi-Cast Attention Networks for Retrieval-based Question Answering and Response Prediction	Jun 3, 2018	Question AnsweringRepresentation Learning	—Unverified
Pay-Per-Request Deployment of Neural Network Models Using Serverless Architectures	Jun 1, 2018	Answer SelectionManagement	—Unverified
Scaling Neural Machine Translation	Jun 1, 2018	GPUMachine Translation	CodeCode Available
Learning to Collaborate for Question Answering and Asking	Jun 1, 2018	Answer SelectionGenerative Adversarial Network	—Unverified
EXPR at SemEval-2018 Task 9: A Combined Approach for Hypernym Discovery	Jun 1, 2018	Hypernym DiscoveryInformation Retrieval	—Unverified
ArgumenText: Searching for Arguments in Heterogeneous Sources	Jun 1, 2018	Argument MiningArgument Retrieval	—Unverified
ELiRF-UPV at SemEval-2018 Task 11: Machine Comprehension using Commonsense Knowledge	Jun 1, 2018	Multiple-choiceQuestion Answering	—Unverified
Coarse Lexical Frame Acquisition at the Syntax--Semantics Interface Using a Latent-Variable PCFG Model	Jun 1, 2018	ClusteringQuestion Answering	—Unverified
NLP\_HZ at SemEval-2018 Task 9: a Nearest Neighbor Approach	Jun 1, 2018	Hypernym DiscoveryInformation Retrieval	—Unverified
CSReader at SemEval-2018 Task 11: Multiple Choice Question Answering as Textual Entailment	Jun 1, 2018	Common Sense ReasoningLanguage Modelling	—Unverified
Neural Event Extraction from Movies Description	Jun 1, 2018	Event ExtractionMachine Translation	—Unverified
FEUP at SemEval-2018 Task 5: An Experimental Study of a Question Answering System	Jun 1, 2018	ArticlesNamed Entity Recognition (NER)	—Unverified
Natural Answer Generation with Heterogeneous Memory	Jun 1, 2018	Answer GenerationDecoder	—Unverified
ClaiRE at SemEval-2018 Task 7: Classification of Relations using Embeddings	Jun 1, 2018	ClassificationGeneral Classification	—Unverified
Domain-Sensitive Temporal Tagging By Jannik Str\"otgen, Michael Gertz	Jun 1, 2018	Information RetrievalNamed Entity Recognition (NER)	—Unverified
Looking Beyond the Surface: A Challenge Set for Reading Comprehension over Multiple Sentences	Jun 1, 2018	DiversityNatural Language Inference	—Unverified
An Evaluation of Image-Based Verb Prediction Models against Human Eye-Tracking Data	Jun 1, 2018	General ClassificationQuestion Answering	—Unverified
Improve Neural Entity Recognition via Multi-Task Data Selection and Constrained Decoding	Jun 1, 2018	DecoderDomain Adaptation	—Unverified
Multi-Sentence Compression with Word Vertex-Labeled Graphs and Integer Linear Programming	Jun 1, 2018	InformativenessQuestion Answering	—Unverified
Challenging Reading Comprehension on Daily Conversation: Passage Completion on Multiparty Dialog	Jun 1, 2018	Question AnsweringReading Comprehension	—Unverified
Learning Word Embeddings for Low-Resource Languages by PU Learning	Jun 1, 2018	Document RankingImage Captioning	—Unverified
Categorizing Concepts With Basic Level for Vision-to-Language	Jun 1, 2018	ClusteringImage Captioning	—Unverified
IUCM at SemEval-2018 Task 11: Similar-Topic Texts as a Comprehension Knowledge Source	Jun 1, 2018	ClusteringLemmatization	CodeCode Available

Show:10 25 50

← PrevPage 180 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified