Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8651–8675 of 10817 papers

Title	Date	Tasks	Status	Hype
Shifting the Baseline: Single Modality Performance on Visual Navigation & QA	Nov 1, 2018	Question AnsweringVisual Navigation	—Unverified	0
Out of the Box: Reasoning with Graph Convolution Nets for Factual Visual Question Answering	Nov 1, 2018	Factual Visual Question AnsweringGeneral Knowledge	—Unverified	0
Improving Machine Reading Comprehension with General Reading Strategies	Oct 31, 2018	ARCLanguage Modeling	CodeCode Available	0
On the Effectiveness of Minimal Context Selection for Robust Question Answering	Oct 30, 2018	Adversarial RobustnessQuestion Answering	—Unverified	0
Compositional Attention Networks for Interpretability in Natural Language Question Answering	Oct 30, 2018	Logical ReasoningQuestion Answering	—Unverified	0
Do Explanations make VQA Models more Predictable to a Human?	Oct 29, 2018	Question AnsweringVisual Question Answering	—Unverified	0
TallyQA: Answering Complex Counting Questions	Oct 29, 2018	AttributeObject Counting	CodeCode Available	0
ReviewQA: a relational aspect-based opinion reading dataset	Oct 29, 2018	Question Answering	—Unverified	0
Software Expert Discovery via Knowledge Domain Embeddings in a Collaborative Network	Oct 26, 2018	Community Question AnsweringManagement	—Unverified	0
Finding Answers from the Word of God: Domain Adaptation for Neural Networks in Biblical Question Answering	Oct 26, 2018	Domain AdaptationQuestion Answering	—Unverified	0
Neural Modular Control for Embodied Question Answering	Oct 26, 2018	Embodied Question AnsweringImitation Learning	CodeCode Available	0
Text Embeddings for Retrieval From a Large Knowledge Base	Oct 24, 2018	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
What can AI do for me: Evaluating Machine Learning Interpretations in Cooperative Play	Oct 23, 2018	BIG-bench Machine LearningDecision Making	—Unverified	0
Making question answering more robust through relevant context selection	Oct 22, 2018	Question AnsweringRetrieval	—Unverified	0
Are you tough enough? Framework for Robustness Validation of Machine Comprehension Systems	Oct 22, 2018	Question AnsweringReading Comprehension	CodeCode Available	0
A Fully Attention-Based Information Retriever	Oct 22, 2018	Question Answering	CodeCode Available	0
A Knowledge-Grounded Multimodal Search-Based Conversational Agent	Oct 20, 2018	DecoderQuestion Answering	CodeCode Available	0
Lightweight Convolutional Approaches to Reading Comprehension on SQuAD	Oct 19, 2018	Question AnsweringReading Comprehension	—Unverified	0
Adversarial TableQA: Attention Supervision for Question Answering on Tables	Oct 18, 2018	Question Answering	—Unverified	0
On Evaluating Embedding Models for Knowledge Base Completion	Oct 17, 2018	Knowledge Base CompletionQuestion Answering	—Unverified	0
Finding Similar Medical Questions from Question Answering Websites	Oct 14, 2018	DiversityMedical Question Answering	—Unverified	0
Building Dynamic Knowledge Graphs from Text using Machine Reading Comprehension	Oct 12, 2018	Knowledge GraphsMachine Reading Comprehension	—Unverified	0
U-Net: Machine Reading Comprehension with Unanswerable Questions	Oct 12, 2018	Machine Reading ComprehensionQuestion Answering	CodeCode Available	0
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding	Oct 11, 2018	Citation Intent ClassificationCommon Sense Reasoning	CodeCode Available	3
Knowing Where to Look? Analysis on Attention of Visual Question Answering System	Oct 9, 2018	Question AnsweringVisual Question Answering	—Unverified	0

Show:10 25 50

← PrevPage 347 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified