Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8676–8700 of 10817 papers

Title	Date	Tasks	Status
The combination of context information to enhance simple question answering	Oct 9, 2018	Fact SelectionKnowledge Base Question Answering	—Unverified
CHOPT : Automated Hyperparameter Optimization Framework for Cloud-Based Machine Learning Platforms	Oct 8, 2018	BIG-bench Machine LearningHyperparameter Optimization	—Unverified
Overcoming Language Priors in Visual Question Answering with Adversarial Regularization	Oct 8, 2018	Question AnsweringVisual Grounding	—Unverified
FlowQA: Grasping Flow in History for Conversational Machine Comprehension	Oct 6, 2018	Question AnsweringReading Comprehension	CodeCode Available
Co-Stack Residual Affinity Networks with Multi-level Attention Refinement for Matching Text Sequences	Oct 6, 2018	Paraphrase IdentificationQuestion Answering	—Unverified
POIReviewQA: A Semantically Enriched POI Retrieval and Question Answering Dataset	Oct 5, 2018	Information RetrievalQuestion Answering	—Unverified
Neural-Symbolic VQA: Disentangling Reasoning from Vision and Language Understanding	Oct 4, 2018	Question AnsweringRepresentation Learning	CodeCode Available
Transfer Learning via Unsupervised Task Discovery for Visual Question Answering	Oct 3, 2018	Question AnsweringTransfer Learning	CodeCode Available
Self-training improves Recurrent Neural Networks performance for Temporal Relation Extraction	Oct 1, 2018	Feature EngineeringMachine Translation	—Unverified
In-domain Context-aware Token Embeddings Improve Biomedical Named Entity Recognition	Oct 1, 2018	Language ModelingLanguage Modelling	—Unverified
Curriculum Learning Based on Reward Sparseness for Deep Reinforcement Learning of Task Completion Dialogue Management	Oct 1, 2018	Deep Reinforcement LearningDialogue Management	—Unverified
Investigating the Challenges of Temporal Relation Extraction from Clinical Text	Oct 1, 2018	Named Entity Recognition (NER)Question Answering	—Unverified
Latent Entities Extraction: How to Extract Entities that Do Not Appear in the Text?	Oct 1, 2018	Multi-Task Learningnamed-entity-recognition	CodeCode Available
Commonsense Knowledge Base Completion and Generation	Oct 1, 2018	Knowledge Base CompletionQuestion Answering	—Unverified
Linguistically-Based Deep Unstructured Question Answering	Oct 1, 2018	Information RetrievalQuestion Answering	—Unverified
Multi-Granular Sequence Encoding via Dilated Compositional Units for Reading Comprehension	Oct 1, 2018	Open-Domain Question AnsweringQuestion Answering	—Unverified
A Probabilistic Model for Joint Learning of Word Embeddings from Texts and Images	Oct 1, 2018	Coreference ResolutionImage Classification	—Unverified
Neural Transition Based Parsing of Web Queries: An Entity Based Approach	Oct 1, 2018	Community Question AnsweringQuestion Answering	—Unverified
Generating Syntactic Paraphrases	Oct 1, 2018	Data-to-Text GenerationMachine Translation	—Unverified
Corpus-Driven Thematic Hierarchy Induction	Oct 1, 2018	Machine TranslationQuestion Answering	—Unverified
A Unified Syntax-aware Framework for Semantic Role Labeling	Oct 1, 2018	Machine TranslationQuestion Answering	CodeCode Available
Facts That Matter	Oct 1, 2018	ClusteringDiversity	CodeCode Available
Put It Back: Entity Typing with Language Model Enhancement	Oct 1, 2018	Entity LinkingEntity Typing	CodeCode Available
A dataset and baselines for sequential open-domain question answering	Oct 1, 2018	Information RetrievalOpen-Domain Question Answering	—Unverified
Improving Large-Scale Fact-Checking using Decomposable Attention Models and Lexical Tagging	Oct 1, 2018	Fact CheckingQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 348 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified