Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9851–9875 of 10817 papers

Title	Date	Tasks	Status
Proceedings of the Workshop on Human-Computer Question Answering	Jun 1, 2016	Question Answering	—Unverified
Coreference Resolution for the Basque Language with BART	Jun 1, 2016	Chunkingcoreference-resolution	—Unverified
Cross-Lingual Question Answering Using Common Semantic Space	Jun 1, 2016	Cross-Lingual Question AnsweringEntity Linking	—Unverified
CaTeRS: Causal and Temporal Relation Scheme for Semantic Annotation of Event Structures	Jun 1, 2016	Question AnsweringRelation	—Unverified
Crowdsourcing for (almost) Real-time Question Answering	Jun 1, 2016	Community Question AnsweringQuestion Answering	—Unverified
``A Distorted Skull Lies in the Bottom Center...'' Identifying Paintings from Text Descriptions	Jun 1, 2016	Question AnsweringVisual Question Answering (VQA)	—Unverified
Applying Universal Schemas for Domain Specific Ontology Expansion	Jun 1, 2016	Link PredictionQuestion Answering	—Unverified
Open-domain Factoid Question Answering via Knowledge Graph Search	Jun 1, 2016	Knowledge GraphsOpen-Domain Question Answering	—Unverified
But What Do We Actually Know?	Jun 1, 2016	Information RetrievalQuestion Answering	—Unverified
Paraphrase for Open Question Answering: New Dataset and Methods	Jun 1, 2016	Open-Ended Question AnsweringOpen Information Extraction	—Unverified
Multimodal Use of an Upper-Level Event Ontology	Jun 1, 2016	Question AnsweringSemantic Role Labeling	—Unverified
Incorporating Selectional Preferences in Multi-hop Relation Extraction	Jun 1, 2016	Knowledge Base CompletionQuestion Answering	—Unverified
Discontinuous Genitives in Hindi/Urdu	Jun 1, 2016	Coreference ResolutionQuestion Answering	—Unverified
Learning Cross-lingual Representations with Matrix Factorization	Jun 1, 2016	Cross-Lingual Document ClassificationCross-Lingual Semantic Textual Similarity	—Unverified
Proceedings of the Joint Workshop on Bibliometric-enhanced Information Retrieval and Natural Language Processing for Digital Libraries (BIRNDL)	Jun 1, 2016	Information RetrievalQuestion Answering	—Unverified
Neural Enquirer: Learning to Query Tables in Natural Language	Jun 1, 2016	Learning to ExecuteQuestion Answering	—Unverified
Using Confusion Graphs to Understand Classifier Error	Jun 1, 2016	Question Answering	—Unverified
The Physics of Text: Ontological Realism in Information Extraction	Jun 1, 2016	Common Sense ReasoningOpen Information Extraction	—Unverified
Watson Discovery Advisor: Question-answering in an industrial setting	Jun 1, 2016	Open-Domain Question AnsweringQuestion Answering	—Unverified
UofR at SemEval-2016 Task 8: Learning Synchronous Hyperedge Replacement Grammar for AMR Parsing	Jun 1, 2016	AMR ParsingMachine Translation	—Unverified
VUACLTL at SemEval 2016 Task 12: A CRF Pipeline to Clinical TempEval	Jun 1, 2016	Domain AdaptationNatural Language Inference	—Unverified
UTA DLNLP at SemEval-2016 Task 12: Deep Learning Based Natural Language Processing System for Clinical Information Identification from Clinical Notes and Pathology Reports	Jun 1, 2016	Information RetrievalLanguage Modeling	—Unverified
Hitachi at SemEval-2016 Task 12: A Hybrid Approach for Temporal Information Extraction from Clinical Notes	Jun 1, 2016	Question AnsweringTemporal Information Extraction	—Unverified
OSU\_CHGCG at SemEval-2016 Task 9 : Chinese Semantic Dependency Parsing with Generalized Categorial Grammar	Jun 1, 2016	Dependency ParsingQuestion Answering	—Unverified
JUNLP at SemEval-2016 Task 13: A Language Independent Approach for Hypernym Identification	Jun 1, 2016	Natural Language InferenceQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 395 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified