Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9051–9075 of 10817 papers

Title	Date	Tasks	Status
Systems' Agreements and Disagreements in Temporal Processing: An Extensive Error Analysis of the TempEval-3 Task	May 1, 2018	Natural Language InferenceQuestion Answering	—Unverified
The UIR Uncertainty Corpus for Chinese: Annotating Chinese Microblog Corpus for Uncertainty Identification from Social Media	May 1, 2018	Question Answering	—Unverified
Towards AMR-BR: A SemBank for Brazilian Portuguese Language	May 1, 2018	Entity LinkingMachine Reading Comprehension	—Unverified
Enhancing the AI2 Diagrams Dataset Using Rhetorical Structure Theory	May 1, 2018	Question AnsweringVisual Question Answering (VQA)	CodeCode Available
Abstract Meaning Representation of Constructions: The More We Include, the Better the Representation	May 1, 2018	Abstract Meaning RepresentationMachine Translation	—Unverified
A Corpus to Learn Refer-to-as Relations for Nominals	May 1, 2018	Coreference ResolutionLearning Semantic Representations	—Unverified
Automatic Thesaurus Construction for Modern Hebrew	May 1, 2018	Machine TranslationQuestion Answering	—Unverified
Fine-grained Semantic Textual Similarity for Serbian	May 1, 2018	Information RetrievalMachine Translation	—Unverified
KRAUTS: A German Temporally Annotated News Corpus	May 1, 2018	Information RetrievalQuestion Answering	CodeCode Available
A Large Automatically-Acquired All-Words List of Multiword Expressions Scored for Compositionality	May 1, 2018	AllInformation Retrieval	—Unverified
Korean TimeBank Including Relative Temporal Information	May 1, 2018	Question AnsweringTemporal Information Extraction	—Unverified
C-HTS: A Concept-based Hierarchical Text Segmentation approach	May 1, 2018	Hierarchical Text SegmentationInformation Retrieval	CodeCode Available
ETPC - A Paraphrase Identification Corpus Annotated with Extended Paraphrase Typology and Negation	May 1, 2018	Natural Language InferenceNegation	CodeCode Available
Huge Automatically Extracted Training-Sets for Multilingual Word SenseDisambiguation	May 1, 2018	Question AnsweringSemantic Parsing	—Unverified
No more beating about the bush : A Step towards Idiom Handling for Indian Language NLP	May 1, 2018	Machine TranslationQuestion Answering	—Unverified
EventWiki: A Knowledge Base of Major Events	May 1, 2018	Question AnsweringSemantic Parsing	—Unverified
Action Verb Corpus	May 1, 2018	Action ClassificationLanguage Acquisition	—Unverified
Weaver: Deep Co-Encoding of Questions and Documents for Machine Reading	Apr 27, 2018	Open-Domain Question AnsweringQuestion Answering	—Unverified
An ASP Methodology for Understanding Narratives about Stereotypical Activities	Apr 26, 2018	Question Answering	—Unverified
Movie Question Answering: Remembering the Textual Cues for Layered Visual Contents	Apr 25, 2018	Question AnsweringVideo Question Answering	—Unverified
End-Task Oriented Textual Entailment via Deep Explorations of Inter-Sentence Interactions	Apr 24, 2018	Natural Language InferencePosition	CodeCode Available
TempQuestions: A Benchmark for Temporal Question Answering	Apr 23, 2018	Question Answering	—Unverified
How to Seq2seq for SQL	Apr 23, 2018	Question AnsweringTable-based Question Answering	—Unverified
Mixing Context Granularities for Improved Entity Linking on Question Answering Data across Entity Categories	Apr 23, 2018	Entity DisambiguationEntity Linking	CodeCode Available
Large Scale Scene Text Verification with Guided Attention	Apr 23, 2018	Question AnsweringScene Text Detection	—Unverified

Show:10 25 50

← PrevPage 363 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified