Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9051–9075 of 10817 papers

Title	Date	Tasks	Status
Building a Knowledge Graph from Natural Language Definitions for Interpretable Text Entailment Recognition	May 1, 2018	Information RetrievalOpen Information Extraction	—Unverified
Annotating Zero Anaphora for Question Answering	May 1, 2018	Question Answering	—Unverified
PhotoshopQuiA: A Corpus of Non-Factoid Questions and Answers for Why-Question Answering	May 1, 2018	Answer SelectionCommunity Question Answering	—Unverified
Augmenting Image Question Answering Dataset by Exploiting Image Captions	May 1, 2018	Data AugmentationImage Captioning	—Unverified
Finely Tuned, 2 Billion Token Based Word Embeddings for Portuguese	May 1, 2018	Named Entity Recognition (NER)Question Answering	—Unverified
ETPC - A Paraphrase Identification Corpus Annotated with Extended Paraphrase Typology and Negation	May 1, 2018	Natural Language InferenceNegation	CodeCode Available
Annotating Educational Questions for Student Response Analysis	May 1, 2018	Question AnsweringWord Embeddings	—Unverified
Annotating Attribution Relations in Arabic	May 1, 2018	Information RetrievalOpinion Mining	—Unverified
Action Verb Corpus	May 1, 2018	Action ClassificationLanguage Acquisition	—Unverified
Edit me: A Corpus and a Framework for Understanding Natural Language Image Editing	May 1, 2018	Image CaptioningQuestion Answering	—Unverified
Huge Automatically Extracted Training-Sets for Multilingual Word SenseDisambiguation	May 1, 2018	Question AnsweringSemantic Parsing	—Unverified
Fine-grained Semantic Textual Similarity for Serbian	May 1, 2018	Information RetrievalMachine Translation	—Unverified
EventWiki: A Knowledge Base of Major Events	May 1, 2018	Question AnsweringSemantic Parsing	—Unverified
Enhancing the AI2 Diagrams Dataset Using Rhetorical Structure Theory	May 1, 2018	Question AnsweringVisual Question Answering (VQA)	CodeCode Available
Korean TimeBank Including Relative Temporal Information	May 1, 2018	Question AnsweringTemporal Information Extraction	—Unverified
Portuguese Named Entity Recognition using Conditional Random Fields and Local Grammars	May 1, 2018	named-entity-recognitionNamed Entity Recognition	—Unverified
A New Annotated Portuguese/Spanish Corpus for the Multi-Sentence Compression Task	May 1, 2018	Abstractive Text SummarizationQuestion Answering	—Unverified
Retrofitting Word Representations for Unsupervised Sense Aware Word Similarities	May 1, 2018	Named Entity Recognition (NER)Question Answering	—Unverified
KRAUTS: A German Temporally Annotated News Corpus	May 1, 2018	Information RetrievalQuestion Answering	CodeCode Available
A Corpus to Learn Refer-to-as Relations for Nominals	May 1, 2018	Coreference ResolutionLearning Semantic Representations	—Unverified
Auto-hMDS: Automatic Construction of a Large Heterogeneous Multilingual Multi-Document Summarization Corpus	May 1, 2018	Abstractive Text SummarizationDocument Summarization	CodeCode Available
Abstract Meaning Representation of Constructions: The More We Include, the Better the Representation	May 1, 2018	Abstract Meaning RepresentationMachine Translation	—Unverified
Constructing a Lexicon of Relational Nouns	May 1, 2018	Natural Language InferenceQuestion Answering	—Unverified
No more beating about the bush : A Step towards Idiom Handling for Indian Language NLP	May 1, 2018	Machine TranslationQuestion Answering	—Unverified
Linking, Searching, and Visualizing Entities in Wikipedia	May 1, 2018	Entity Extraction using GANNamed Entity Recognition (NER)	—Unverified

Show:10 25 50

← PrevPage 363 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified