Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9926–9950 of 10817 papers

Title	Date	Tasks	Status	Hype
``Who was Pietro Badoglio?'' Towards a QA system for Italian History	May 1, 2016	Question Answering	—Unverified	0
Question Answering via Integer Programming over Semi-Structured Knowledge	Apr 20, 2016	Information RetrievalQuestion Answering	—Unverified	0
Dialog-based Language Learning	Apr 20, 2016	Machine TranslationNatural Language Understanding	—Unverified	0
SSP: Semantic Space Projection for Knowledge Graph Embedding with Text Descriptions	Apr 17, 2016	Graph EmbeddingKnowledge Graph Embedding	—Unverified	0
Learning Models for Actions and Person-Object Interactions with Transfer to Question Answering	Apr 16, 2016	General ClassificationHuman-Object Interaction Detection	—Unverified	0
Why Artificial Intelligence Needs a Task Theory --- And What It Might Look Like	Apr 15, 2016	Board GamesQuestion Answering	—Unverified	0
Parallelizing Word2Vec in Shared and Distributed Memory	Apr 15, 2016	CPUMachine Translation	—Unverified	0
Moving Beyond the Turing Test with the Allen AI Science Challenge	Apr 14, 2016	Question Answering	CodeCode Available	0
Counting Everyday Objects in Everyday Scenes	Apr 12, 2016	ObjectObject Counting	CodeCode Available	0
Method of Tibetan Person Knowledge Extraction	Apr 11, 2016	graph constructionInformation Retrieval	—Unverified	0
Intelligent information extraction based on artificial neural network	Apr 11, 2016	Information RetrievalQuestion Answering	—Unverified	0
A Focused Dynamic Attention Model for Visual Question Answering	Apr 6, 2016	Question AnsweringVisual Question Answering	—Unverified	0
Multi-Field Structural Decomposition for Question Answering	Apr 4, 2016	Question Answering	—Unverified	0
Character-Level Question Answering with Attention	Apr 4, 2016	Data AugmentationDecoder	CodeCode Available	0
Neural Attention Models for Sequence Classification: Analysis and Application to Key Term Extraction and Dialogue Act Detection	Mar 31, 2016	Caption GenerationClassification	—Unverified	0
Recurrent Batch Normalization	Mar 30, 2016	General ClassificationLanguage Modeling	CodeCode Available	0
A Parallel-Hierarchical Model for Machine Comprehension on Sparse Data	Mar 29, 2016	Question AnsweringReading Comprehension	CodeCode Available	0
Recurrent Neural Network Encoder with Attention for Community Question Answering	Mar 23, 2016	Community Question AnsweringInformation Retrieval	—Unverified	0
Learning Executable Semantic Parsers for Natural Language Understanding	Mar 22, 2016	Natural Language UnderstandingQuestion Answering	—Unverified	0
Image Captioning and Visual Question Answering Based on Attributes and External Knowledge	Mar 9, 2016	General KnowledgeImage Captioning	—Unverified	0
Dynamic Memory Networks for Visual and Textual Question Answering	Mar 4, 2016	Question AnsweringVisual Question Answering	CodeCode Available	0
Text Understanding with the Attention Sum Reader Network	Mar 4, 2016	Machine Reading ComprehensionOpen-Domain Question Answering	CodeCode Available	0
Question Answering on Freebase via Relation Extraction and Textual Evidence	Mar 3, 2016	Question AnsweringRelation	CodeCode Available	0
The Myopia of Crowds: A Study of Collective Evaluation on Stack Exchange	Feb 24, 2016	Question Answering	—Unverified	0
Visual Genome: Connecting Language and Vision Using Crowdsourced Dense Image Annotations	Feb 23, 2016	image-classificationImage Classification	CodeCode Available	1

Show:10 25 50

← PrevPage 398 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified