Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9076–9100 of 10817 papers

Title	Date	Tasks	Status
MMQA: A Multi-domain Multi-lingual Question-Answering Framework for English and Hindi	May 1, 2018	Information RetrievalMachine Translation	—Unverified
A Large Automatically-Acquired All-Words List of Multiword Expressions Scored for Compositionality	May 1, 2018	AllInformation Retrieval	—Unverified
KIT-Multi: A Translation-Oriented Multilingual Embedding Corpus	May 1, 2018	Cross-Lingual Document ClassificationDocument Classification	—Unverified
Learning to Map Natural Language Statements into Knowledge Base Representations for Knowledge Base Construction	May 1, 2018	Graph EmbeddingKnowledge Base Construction	—Unverified
BioRead: A New Dataset for Biomedical Reading Comprehension	May 1, 2018	Information RetrievalMachine Reading Comprehension	CodeCode Available
Automatic Thesaurus Construction for Modern Hebrew	May 1, 2018	Machine TranslationQuestion Answering	—Unverified
SemR-11: A Multi-Lingual Gold-Standard for Semantic Similarity and Relatedness for Eleven Languages	May 1, 2018	Information RetrievalMachine Translation	—Unverified
The UIR Uncertainty Corpus for Chinese: Annotating Chinese Microblog Corpus for Uncertainty Identification from Social Media	May 1, 2018	Question Answering	—Unverified
Semi-supervised Training Data Generation for Multilingual Question Answering	May 1, 2018	Machine TranslationNamed Entity Recognition (NER)	—Unverified
Semi-automatic Korean FrameNet Annotation over KAIST Treebank	May 1, 2018	Dependency ParsingMorphological Analysis	—Unverified
Visual Choice of Plausible Alternatives: An Evaluation of Image-based Commonsense Causal Reasoning	May 1, 2018	Commonsense Causal ReasoningImage Captioning	CodeCode Available
Semantic Equivalence Detection: Are Interrogatives Harder than Declaratives?	May 1, 2018	Community Question AnsweringInformation Retrieval	—Unverified
Universal Dependencies for Amharic	May 1, 2018	Machine TranslationQuestion Answering	—Unverified
Towards AMR-BR: A SemBank for Brazilian Portuguese Language	May 1, 2018	Entity LinkingMachine Reading Comprehension	—Unverified
Towards an ISO Standard for the Annotation of Quantification	May 1, 2018	Question Answering	—Unverified
Towards a Standardized Dataset for Noun Compound Interpretation	May 1, 2018	Machine TranslationQuestion Answering	—Unverified
When ACE met KBP: End-to-End Evaluation of Knowledge Base Population with Component-level Annotation	May 1, 2018	Knowledge Base PopulationNamed Entity Recognition (NER)	—Unverified
T-REx: A Large Scale Alignment of Natural Language with Knowledge Base Triples	May 1, 2018	Entity LinkingKnowledge Base Population	CodeCode Available
SPADE: Evaluation Dataset for Monolingual Phrase Alignment	May 1, 2018	Machine TranslationParaphrase Identification	—Unverified
Transforming Wikipedia into a Large-Scale Fine-Grained Entity Type Corpus	May 1, 2018	Entity LinkingEntity Typing	—Unverified
Systems' Agreements and Disagreements in Temporal Processing: An Extensive Error Analysis of the TempEval-3 Task	May 1, 2018	Natural Language InferenceQuestion Answering	—Unverified
Weaver: Deep Co-Encoding of Questions and Documents for Machine Reading	Apr 27, 2018	Open-Domain Question AnsweringQuestion Answering	—Unverified
An ASP Methodology for Understanding Narratives about Stereotypical Activities	Apr 26, 2018	Question Answering	—Unverified
Movie Question Answering: Remembering the Textual Cues for Layered Visual Contents	Apr 25, 2018	Question AnsweringVideo Question Answering	—Unverified
End-Task Oriented Textual Entailment via Deep Explorations of Inter-Sentence Interactions	Apr 24, 2018	Natural Language InferencePosition	CodeCode Available

Show:10 25 50

← PrevPage 364 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified