Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9051–9100 of 10817 papers

Title	Date	Tasks	Status
Annotating Zero Anaphora for Question Answering	May 1, 2018	Question Answering	—Unverified
ETPC - A Paraphrase Identification Corpus Annotated with Extended Paraphrase Typology and Negation	May 1, 2018	Natural Language InferenceNegation	CodeCode Available
Constructing a Lexicon of Relational Nouns	May 1, 2018	Natural Language InferenceQuestion Answering	—Unverified
Finely Tuned, 2 Billion Token Based Word Embeddings for Portuguese	May 1, 2018	Named Entity Recognition (NER)Question Answering	—Unverified
Auto-hMDS: Automatic Construction of a Large Heterogeneous Multilingual Multi-Document Summarization Corpus	May 1, 2018	Abstractive Text SummarizationDocument Summarization	CodeCode Available
A New Annotated Portuguese/Spanish Corpus for the Multi-Sentence Compression Task	May 1, 2018	Abstractive Text SummarizationQuestion Answering	—Unverified
A Large Automatically-Acquired All-Words List of Multiword Expressions Scored for Compositionality	May 1, 2018	AllInformation Retrieval	—Unverified
Retrofitting Word Representations for Unsupervised Sense Aware Word Similarities	May 1, 2018	Named Entity Recognition (NER)Question Answering	—Unverified
MMQA: A Multi-domain Multi-lingual Question-Answering Framework for English and Hindi	May 1, 2018	Information RetrievalMachine Translation	—Unverified
M-CNER: A Corpus for Chinese Named Entity Recognition in Multi-Domains	May 1, 2018	Chinese Named Entity Recognitionnamed-entity-recognition	—Unverified
C-HTS: A Concept-based Hierarchical Text Segmentation approach	May 1, 2018	Hierarchical Text SegmentationInformation Retrieval	CodeCode Available
KIT-Multi: A Translation-Oriented Multilingual Embedding Corpus	May 1, 2018	Cross-Lingual Document ClassificationDocument Classification	—Unverified
BioRead: A New Dataset for Biomedical Reading Comprehension	May 1, 2018	Information RetrievalMachine Reading Comprehension	CodeCode Available
Automatic Thesaurus Construction for Modern Hebrew	May 1, 2018	Machine TranslationQuestion Answering	—Unverified
A Multi-Domain Framework for Textual Similarity. A Case Study on Question-to-Question and Question-Answering Similarity Tasks	May 1, 2018	Community Question AnsweringNatural Language Inference	—Unverified
Portuguese Named Entity Recognition using Conditional Random Fields and Local Grammars	May 1, 2018	named-entity-recognitionNamed Entity Recognition	—Unverified
Annotating Attribution Relations in Arabic	May 1, 2018	Information RetrievalOpinion Mining	—Unverified
Augmenting Image Question Answering Dataset by Exploiting Image Captions	May 1, 2018	Data AugmentationImage Captioning	—Unverified
Korean TimeBank Including Relative Temporal Information	May 1, 2018	Question AnsweringTemporal Information Extraction	—Unverified
Linking, Searching, and Visualizing Entities in Wikipedia	May 1, 2018	Entity Extraction using GANNamed Entity Recognition (NER)	—Unverified
Edit me: A Corpus and a Framework for Understanding Natural Language Image Editing	May 1, 2018	Image CaptioningQuestion Answering	—Unverified
Building a Knowledge Graph from Natural Language Definitions for Interpretable Text Entailment Recognition	May 1, 2018	Information RetrievalOpen Information Extraction	—Unverified
Fine-grained Semantic Textual Similarity for Serbian	May 1, 2018	Information RetrievalMachine Translation	—Unverified
Learning to Map Natural Language Statements into Knowledge Base Representations for Knowledge Base Construction	May 1, 2018	Graph EmbeddingKnowledge Base Construction	—Unverified
A Corpus to Learn Refer-to-as Relations for Nominals	May 1, 2018	Coreference ResolutionLearning Semantic Representations	—Unverified
Huge Automatically Extracted Training-Sets for Multilingual Word SenseDisambiguation	May 1, 2018	Question AnsweringSemantic Parsing	—Unverified
Action Verb Corpus	May 1, 2018	Action ClassificationLanguage Acquisition	—Unverified
No more beating about the bush : A Step towards Idiom Handling for Indian Language NLP	May 1, 2018	Machine TranslationQuestion Answering	—Unverified
Annotating Educational Questions for Student Response Analysis	May 1, 2018	Question AnsweringWord Embeddings	—Unverified
Abstract Meaning Representation of Constructions: The More We Include, the Better the Representation	May 1, 2018	Abstract Meaning RepresentationMachine Translation	—Unverified
Graph Based Semi-Supervised Learning Approach for Tamil POS tagging	May 1, 2018	Graph SimilarityInformation Retrieval	—Unverified
Towards an ISO Standard for the Annotation of Quantification	May 1, 2018	Question Answering	—Unverified
Semi-automatic Korean FrameNet Annotation over KAIST Treebank	May 1, 2018	Dependency ParsingMorphological Analysis	—Unverified
Semi-supervised Training Data Generation for Multilingual Question Answering	May 1, 2018	Machine TranslationNamed Entity Recognition (NER)	—Unverified
Systems' Agreements and Disagreements in Temporal Processing: An Extensive Error Analysis of the TempEval-3 Task	May 1, 2018	Natural Language InferenceQuestion Answering	—Unverified
Semantic Equivalence Detection: Are Interrogatives Harder than Declaratives?	May 1, 2018	Community Question AnsweringInformation Retrieval	—Unverified
Towards AMR-BR: A SemBank for Brazilian Portuguese Language	May 1, 2018	Entity LinkingMachine Reading Comprehension	—Unverified
T-REx: A Large Scale Alignment of Natural Language with Knowledge Base Triples	May 1, 2018	Entity LinkingKnowledge Base Population	CodeCode Available
Universal Dependencies for Amharic	May 1, 2018	Machine TranslationQuestion Answering	—Unverified
SemR-11: A Multi-Lingual Gold-Standard for Semantic Similarity and Relatedness for Eleven Languages	May 1, 2018	Information RetrievalMachine Translation	—Unverified
When ACE met KBP: End-to-End Evaluation of Knowledge Base Population with Component-level Annotation	May 1, 2018	Knowledge Base PopulationNamed Entity Recognition (NER)	—Unverified
Visual Choice of Plausible Alternatives: An Evaluation of Image-based Commonsense Causal Reasoning	May 1, 2018	Commonsense Causal ReasoningImage Captioning	CodeCode Available
SPADE: Evaluation Dataset for Monolingual Phrase Alignment	May 1, 2018	Machine TranslationParaphrase Identification	—Unverified
Transforming Wikipedia into a Large-Scale Fine-Grained Entity Type Corpus	May 1, 2018	Entity LinkingEntity Typing	—Unverified
Towards a Standardized Dataset for Noun Compound Interpretation	May 1, 2018	Machine TranslationQuestion Answering	—Unverified
The UIR Uncertainty Corpus for Chinese: Annotating Chinese Microblog Corpus for Uncertainty Identification from Social Media	May 1, 2018	Question Answering	—Unverified
Weaver: Deep Co-Encoding of Questions and Documents for Machine Reading	Apr 27, 2018	Open-Domain Question AnsweringQuestion Answering	—Unverified
An ASP Methodology for Understanding Narratives about Stereotypical Activities	Apr 26, 2018	Question Answering	—Unverified
Movie Question Answering: Remembering the Textual Cues for Layered Visual Contents	Apr 25, 2018	Question AnsweringVideo Question Answering	—Unverified
End-Task Oriented Textual Entailment via Deep Explorations of Inter-Sentence Interactions	Apr 24, 2018	Natural Language InferencePosition	CodeCode Available

Show:10 25 50

← PrevPage 182 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified