Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10126–10150 of 10817 papers

Title	Date	Tasks	Status
Semantic Structure Analysis of Noun Phrases using Abstract Meaning Representation	Jul 1, 2015	Abstract Meaning RepresentationAMR Parsing	—Unverified
Sentiment and Belief: How to Think about, Represent, and Annotate Private States	Jul 1, 2015	Opinion MiningQuestion Answering	—Unverified
Transition-based Dependency DAG Parsing Using Dynamic Oracles	Jul 1, 2015	Dependency ParsingFeature Engineering	—Unverified
Thread-Level Information for Comment Classification in Community Question Answering	Jul 1, 2015	Answer SelectionClassification	—Unverified
Structural Representations for Learning Relations between Pairs of Texts	Jul 1, 2015	Feature EngineeringNatural Language Inference	—Unverified
Occam's Gates	Jun 27, 2015	General ClassificationQuestion Answering	—Unverified
Ask Me Anything: Dynamic Memory Networks for Natural Language Processing	Jun 24, 2015	General ClassificationPart-Of-Speech Tagging	CodeCode Available
Answer Sequence Learning with Neural Networks for Answer Selection in Community Question Answering	Jun 22, 2015	Answer SelectionCommunity Question Answering	—Unverified
The WDAqua ITN: Answering Questions using Web Data	Jun 10, 2015	Question Answering	—Unverified
Leveraging Textual Features for Best Answer Prediction in Community-based Question Answering	Jun 9, 2015	Question Answering	—Unverified
Large-scale Simple Question Answering with Memory Networks	Jun 5, 2015	Question AnsweringTransfer Learning	CodeCode Available
What value do explicit high level concepts have in vision to language problems?	Jun 3, 2015	Image CaptioningQuestion Answering	CodeCode Available
Semantic Annotation of Japanese Functional Expressions and its Impact on Factuality Analysis	Jun 1, 2015	ChunkingMachine Translation	—Unverified
yiGou: A Semantic Text Similarity Computing System Based on SVM	Jun 1, 2015	Machine TranslationQuestion Answering	—Unverified
TALN-UPF: Taxonomy Learning Exploiting CRF-Based Hypernym Extraction on Encyclopedic Definitions	Jun 1, 2015	Natural Language InferenceQuestion Answering	—Unverified
VectorSLU: A Continuous Word Vector Approach to Answer Selection in Community Question Answering Systems	Jun 1, 2015	Answer SelectionCommunity Question Answering	—Unverified
Semantics-based Graph Approach to Complex Question-Answering	Jun 1, 2015	Question Answering	—Unverified
Voltron: A Hybrid System For Answer Validation Based On Lexical And Distance Features	Jun 1, 2015	Answer SelectionCommunity Question Answering	—Unverified
VisKE: Visual Knowledge Extraction and Question Answering by Visual Verification of Relation Phrases	Jun 1, 2015	Question AnsweringRelation	—Unverified
TATO: Leveraging on Multiple Strategies for Semantic Textual Similarity	Jun 1, 2015	Machine TranslationNatural Language Inference	—Unverified
SemEval-2015 Task 17: Taxonomy Extraction Evaluation (TExEval)	Jun 1, 2015	Natural Language InferenceQuestion Answering	—Unverified
SemEval-2015 Task 14: Analysis of Clinical Text	Jun 1, 2015	Entity LinkingEpidemiology	—Unverified
SemEval-2015 Task 2: Semantic Textual Similarity, English, Spanish and Pilot on Interpretability	Jun 1, 2015	Natural Language InferenceQuestion Answering	—Unverified
Towards a Better Semantic Role Labeling of Complex Predicates	Jun 1, 2015	Question AnsweringSemantic Role Labeling	—Unverified
SemEval-2015 Task 5: QA TempEval - Evaluating Temporal Information Understanding with Question Answering	Jun 1, 2015	Question AnsweringTemporal Information Extraction	—Unverified

Show:10 25 50

← PrevPage 406 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified