Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8976–9000 of 10817 papers

Title	Date	Tasks	Status
Focal Visual-Text Attention for Visual Question Answering	Jun 5, 2018	Memex Question AnsweringQuestion Answering	CodeCode Available
Multi-Cast Attention Networks for Retrieval-based Question Answering and Response Prediction	Jun 3, 2018	Question AnsweringRepresentation Learning	—Unverified
On the Flip Side: Identifying Counterexamples in Visual Question Answering	Jun 3, 2018	Question AnsweringVisual Question Answering	—Unverified
A Multimodal Translation-Based Approach for Knowledge Graph Representation Learning	Jun 1, 2018	Graph Representation LearningInformation Retrieval	—Unverified
Challenging Reading Comprehension on Daily Conversation: Passage Completion on Multiparty Dialog	Jun 1, 2018	Question AnsweringReading Comprehension	—Unverified
Natural Answer Generation with Heterogeneous Memory	Jun 1, 2018	Answer GenerationDecoder	—Unverified
EXPR at SemEval-2018 Task 9: A Combined Approach for Hypernym Discovery	Jun 1, 2018	Hypernym DiscoveryInformation Retrieval	—Unverified
ClaiRE at SemEval-2018 Task 7: Classification of Relations using Embeddings	Jun 1, 2018	ClassificationGeneral Classification	—Unverified
Pay-Per-Request Deployment of Neural Network Models Using Serverless Architectures	Jun 1, 2018	Answer SelectionManagement	—Unverified
ArgumenText: Searching for Arguments in Heterogeneous Sources	Jun 1, 2018	Argument MiningArgument Retrieval	—Unverified
Improve Neural Entity Recognition via Multi-Task Data Selection and Constrained Decoding	Jun 1, 2018	DecoderDomain Adaptation	—Unverified
Looking Beyond the Surface: A Challenge Set for Reading Comprehension over Multiple Sentences	Jun 1, 2018	DiversityNatural Language Inference	—Unverified
Learning Word Embeddings for Low-Resource Languages by PU Learning	Jun 1, 2018	Document RankingImage Captioning	—Unverified
Scaling Neural Machine Translation	Jun 1, 2018	GPUMachine Translation	CodeCode Available
Detecting and Resolving Shell Nouns in German	Jun 1, 2018	Question AnsweringSentiment Analysis	—Unverified
Domain-Sensitive Temporal Tagging By Jannik Str\"otgen, Michael Gertz	Jun 1, 2018	Information RetrievalNamed Entity Recognition (NER)	—Unverified
Coarse Lexical Frame Acquisition at the Syntax--Semantics Interface Using a Latent-Variable PCFG Model	Jun 1, 2018	ClusteringQuestion Answering	—Unverified
Learning to Collaborate for Question Answering and Asking	Jun 1, 2018	Answer SelectionGenerative Adversarial Network	—Unverified
IUCM at SemEval-2018 Task 11: Similar-Topic Texts as a Comprehension Knowledge Source	Jun 1, 2018	ClusteringLemmatization	CodeCode Available
FEUP at SemEval-2018 Task 5: An Experimental Study of a Question Answering System	Jun 1, 2018	ArticlesNamed Entity Recognition (NER)	—Unverified
Neural Event Extraction from Movies Description	Jun 1, 2018	Event ExtractionMachine Translation	—Unverified
ELiRF-UPV at SemEval-2018 Task 11: Machine Comprehension using Commonsense Knowledge	Jun 1, 2018	Multiple-choiceQuestion Answering	—Unverified
Determining Event Durations: Models and Error Analysis	Jun 1, 2018	Question Answering	—Unverified
Jiangnan at SemEval-2018 Task 11: Deep Neural Network with Attention Method for Machine Comprehension Task	Jun 1, 2018	Machine Reading ComprehensionNamed Entity Recognition (NER)	—Unverified
Categorizing Concepts With Basic Level for Vision-to-Language	Jun 1, 2018	ClusteringImage Captioning	—Unverified

Show:10 25 50

← PrevPage 360 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified