Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9876–9900 of 10817 papers

Title	Date	Tasks	Status
Learning Cross-lingual Representations with Matrix Factorization	Jun 1, 2016	Cross-Lingual Document ClassificationCross-Lingual Semantic Textual Similarity	—Unverified
NUIG-UNLP at SemEval-2016 Task 13: A Simple Word Embedding-based Approach for Taxonomy Extraction	Jun 1, 2016	Natural Language InferenceQuestion Answering	—Unverified
ArabTAG: from a Handcrafted to a Semi-automatically Generated TAG	Jun 1, 2016	Question AnsweringTAG	—Unverified
Neural Enquirer: Learning to Query Tables in Natural Language	Jun 1, 2016	Learning to ExecuteQuestion Answering	—Unverified
Paraphrase for Open Question Answering: New Dataset and Methods	Jun 1, 2016	Open-Ended Question AnsweringOpen Information Extraction	—Unverified
Joint Learning with Global Inference for Comment Classification in Community Question Answering	Jun 1, 2016	Community Question AnsweringGeneral Classification	—Unverified
Proceedings of the Workshop on Human-Computer Question Answering	Jun 1, 2016	Question Answering	—Unverified
Proceedings of the Joint Workshop on Bibliometric-enhanced Information Retrieval and Natural Language Processing for Digital Libraries (BIRNDL)	Jun 1, 2016	Information RetrievalQuestion Answering	—Unverified
Question Answering with Knowledge Base, Web and Beyond	Jun 1, 2016	Question AnsweringText Matching	—Unverified
Pairwise Word Interaction Modeling with Deep Neural Networks for Semantic Similarity Measurement	Jun 1, 2016	Answer SelectionParaphrase Generation	—Unverified
Samsung Poland NLP Team at SemEval-2016 Task 1: Necessity for diversity; combining recursive autoencoders, WordNet and ensemble methods to measure semantic similarity.	Jun 1, 2016	DiversityMachine Translation	—Unverified
Explicit Argument Identification for Discourse Parsing In Hindi: A Hybrid Pipeline	Jun 1, 2016	Discourse ParsingQuestion Answering	—Unverified
An End-to-end Approach to Learning Semantic Frames with Feedforward Neural Network	Jun 1, 2016	ClusteringDependency Parsing	—Unverified
Hitachi at SemEval-2016 Task 12: A Hybrid Approach for Temporal Information Extraction from Clinical Notes	Jun 1, 2016	Question AnsweringTemporal Information Extraction	—Unverified
BIT at SemEval-2016 Task 1: Sentence Similarity Based on Alignments and Vector with the Weight of Information Content	Jun 1, 2016	Information RetrievalMachine Translation	—Unverified
Incorporating Selectional Preferences in Multi-hop Relation Extraction	Jun 1, 2016	Knowledge Base CompletionQuestion Answering	—Unverified
Multimodal Use of an Upper-Level Event Ontology	Jun 1, 2016	Question AnsweringSemantic Role Labeling	—Unverified
Crowdsourcing for (almost) Real-time Question Answering	Jun 1, 2016	Community Question AnsweringQuestion Answering	—Unverified
CaTeRS: Causal and Temporal Relation Scheme for Semantic Annotation of Event Structures	Jun 1, 2016	Question AnsweringRelation	—Unverified
ITNLP-AiKF at SemEval-2016 Task 3 a quesiton answering system using community QA repository	Jun 1, 2016	Answer SelectionCommunity Question Answering	—Unverified
Discontinuous Genitives in Hindi/Urdu	Jun 1, 2016	Coreference ResolutionQuestion Answering	—Unverified
Recent Progress in Deep Learning for NLP	Jun 1, 2016	Deep LearningMachine Translation	—Unverified
OSU\_CHGCG at SemEval-2016 Task 9 : Chinese Semantic Dependency Parsing with Generalized Categorial Grammar	Jun 1, 2016	Dependency ParsingQuestion Answering	—Unverified
PMI-cool at SemEval-2016 Task 3: Experiments with PMI and Goodness Polarity Lexicons for Community Question Answering	Jun 1, 2016	Community Question AnsweringQuestion Answering	—Unverified
Applying Universal Schemas for Domain Specific Ontology Expansion	Jun 1, 2016	Link PredictionQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 396 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified