Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8926–8950 of 10817 papers

Title	Date	Tasks	Status
Affordances in Grounded Language Learning	Jul 1, 2018	Grounded language learningQuestion Answering	—Unverified
A Simple End-to-End Question Answering Model for Product Information	Jul 1, 2018	Answer SelectionQuestion Answering	—Unverified
Knowledge Diffusion for Neural Dialogue Generation	Jul 1, 2018	Dialogue GenerationQuestion Answering	CodeCode Available
Identification of Alias Links among Participants in Narratives	Jul 1, 2018	coreference-resolutionCoreference Resolution	—Unverified
Recognizing Complex Entity Mentions: A Review and Future Directions	Jul 1, 2018	Entity LinkingNamed Entity Recognition (NER)	—Unverified
Improving Event Coreference Resolution by Modeling Correlations between Event Coreference Chains and Document Topic Structures	Jul 1, 2018	coreference-resolutionCoreference Resolution	—Unverified
Connecting Language and Vision to Actions	Jul 1, 2018	Image CaptioningLanguage Modeling	—Unverified
A Named Entity Recognition Shootout for German	Jul 1, 2018	Entity Linkingnamed-entity-recognition	—Unverified
RECIPE: Applying Open Domain Question Answering to Privacy Policies	Jul 1, 2018	DescriptiveOpen-Domain Question Answering	—Unverified
Bridging Languages through Images with Deep Partial Canonical Correlation Analysis	Jul 1, 2018	Image DescriptionImage Retrieval	CodeCode Available
DeepPavlov: Open-Source Library for Dialogue Systems	Jul 1, 2018	General Classificationintent-classification	—Unverified
Natural Language Inference with Definition Embedding Considering Context On the Fly	Jul 1, 2018	Domain AdaptationInformation Retrieval	—Unverified
Pushing the Limits of Radiology with Joint Modeling of Visual and Textual Information	Jul 1, 2018	Image ClassificationMachine Translation	—Unverified
Jack the Reader -- A Machine Reading Framework	Jul 1, 2018	ArticlesInformation Retrieval	CodeCode Available
Keyphrases Extraction from User-Generated Contents in Healthcare Domain Using Long Short-Term Memory Networks	Jul 1, 2018	Question AnsweringText Classification	—Unverified
Question Condensing Networks for Answer Selection in Community Question Answering	Jul 1, 2018	Answer SelectionCommunity Question Answering	CodeCode Available
Context-Aware Neural Model for Temporal Information Extraction	Jul 1, 2018	Information Retrievalmodel	—Unverified
Phrase2VecGLM: Neural generalized language model--based semantic tagging for complex query reformulation in medical IR	Jul 1, 2018	Document RankingInformation Retrieval	—Unverified
A Multi-Stage Memory Augmented Neural Network for Machine Reading Comprehension	Jul 1, 2018	Machine Reading ComprehensionQuestion Answering	—Unverified
Code-Mixed Question Answering Challenge: Crowd-sourcing Data and Techniques	Jul 1, 2018	Question AnsweringSentence	—Unverified
Proceedings of the Workshop on Machine Reading for Question Answering	Jul 1, 2018	Question AnsweringReading Comprehension	—Unverified
Transliteration Better than Translation? Answering Code-mixed Questions over a Knowledge Base	Jul 1, 2018	Automatic Speech Recognition (ASR)Information Retrieval	—Unverified
Semantically Equivalent Adversarial Rules for Debugging NLP models	Jul 1, 2018	Data AugmentationQuestion Answering	CodeCode Available
Systematic Error Analysis of the Stanford Question Answering Dataset	Jul 1, 2018	Common Sense ReasoningMachine Reading Comprehension	—Unverified
To Attend or not to Attend: A Case Study on Syntactic Structures for Semantic Relatedness	Jul 1, 2018	Machine TranslationParaphrase Identification	CodeCode Available

Show:10 25 50

← PrevPage 358 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified