Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9701–9725 of 10817 papers

Title	Date	Tasks	Status
Learning to Answer Questions from Wikipedia Infoboxes	Nov 1, 2016	Answer SelectionOpen-Domain Question Answering	—Unverified
POLY: Mining Relational Paraphrases from Multilingual Sentences	Nov 1, 2016	Natural Language InferenceQuestion Answering	—Unverified
Citation Analysis with Neural Attention Models	Nov 1, 2016	Information RetrievalQuestion Answering	—Unverified
Building compositional semantics and higher-order inference system for a wide-coverage Japanese CCG parser	Nov 1, 2016	Dependency ParsingNatural Language Inference	—Unverified
MixKMeans: Clustering Question-Answer Archives	Nov 1, 2016	ClusteringQuestion Answering	—Unverified
Nested Propositions in Open Information Extraction	Nov 1, 2016	Open Information ExtractionQuestion Answering	—Unverified
Bilingually-constrained Synthetic Data for Implicit Discourse Relation Recognition	Nov 1, 2016	Domain AdaptationMachine Translation	—Unverified
It Takes Three to Tango: Triangulation Approach to Answer Ranking in Community Question Answering	Nov 1, 2016	Community Question AnsweringQuestion Answering	—Unverified
Learning Term Embeddings for Taxonomic Relation Identification Using Dynamic Weighting Neural Network	Nov 1, 2016	ClusteringLearning Word Embeddings	—Unverified
Discourse Parsing with Attention-based Hierarchical Neural Networks	Nov 1, 2016	Discourse ParsingDocument Summarization	—Unverified
Improving Semantic Parsing via Answer Type Inference	Nov 1, 2016	Knowledge Base PopulationQuestion Answering	—Unverified
Rule Extraction for Tree-to-Tree Transducers by Cost Minimization	Nov 1, 2016	Machine TranslationNatural Language Inference	—Unverified
On Generating Characteristic-rich Question Sets for QA Evaluation	Nov 1, 2016	Question Answering	—Unverified
Porting an Open Information Extraction System from English to German	Nov 1, 2016	Open Information ExtractionQuestion Answering	CodeCode Available
PaCCSS-IT: A Parallel Corpus of Complex-Simple Sentences for Automatic Text Simplification	Nov 1, 2016	Dependency ParsingDomain Adaptation	—Unverified
Combining Multiple Cues for Visual Madlibs Question Answering	Nov 1, 2016	AttributeGeneral Classification	—Unverified
Antecedent Selection for Sluicing: Structure and Content	Nov 1, 2016	ManagementQuestion Answering	—Unverified
A Stacking Gated Neural Architecture for Implicit Discourse Relation Classification	Nov 1, 2016	Feature EngineeringGeneral Classification	—Unverified
AMR Parsing with an Incremental Joint Model	Nov 1, 2016	Abstractive Text SummarizationAMR Parsing	—Unverified
Research on attention memory networks as a model for learning natural language inference	Nov 1, 2016	Natural Language InferenceQuestion Answering	—Unverified
Statistical Script Learning with Recurrent Neural Networks	Nov 1, 2016	Coreference ResolutionQuestion Answering	—Unverified
Towards Broad-coverage Meaning Representation: The Case of Comparison Structures	Nov 1, 2016	Question AnsweringReading Comprehension	—Unverified
Solving Verbal Questions in IQ Test by Knowledge-Powered Word Embedding	Nov 1, 2016	Face RecognitionQuestion Answering	—Unverified
Supervised Distributional Hypernym Discovery via Domain Adaptation	Nov 1, 2016	ClusteringDomain Adaptation	—Unverified
End-to-End Answer Chunk Extraction and Ranking for Reading Comprehension	Oct 31, 2016	Question AnsweringReading Comprehension	—Unverified

Show:10 25 50

← PrevPage 389 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified