Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9026–9050 of 10817 papers

Title	Date	Tasks	Status
Annotating Attribution Relations in Arabic	May 1, 2018	Information RetrievalOpinion Mining	—Unverified
Graph Based Semi-Supervised Learning Approach for Tamil POS tagging	May 1, 2018	Graph SimilarityInformation Retrieval	—Unverified
Edit me: A Corpus and a Framework for Understanding Natural Language Image Editing	May 1, 2018	Image CaptioningQuestion Answering	—Unverified
Portuguese Named Entity Recognition using Conditional Random Fields and Local Grammars	May 1, 2018	named-entity-recognitionNamed Entity Recognition	—Unverified
KIT-Multi: A Translation-Oriented Multilingual Embedding Corpus	May 1, 2018	Cross-Lingual Document ClassificationDocument Classification	—Unverified
A Multi-Domain Framework for Textual Similarity. A Case Study on Question-to-Question and Question-Answering Similarity Tasks	May 1, 2018	Community Question AnsweringNatural Language Inference	—Unverified
Constructing a Lexicon of Relational Nouns	May 1, 2018	Natural Language InferenceQuestion Answering	—Unverified
Augmenting Image Question Answering Dataset by Exploiting Image Captions	May 1, 2018	Data AugmentationImage Captioning	—Unverified
A New Annotated Portuguese/Spanish Corpus for the Multi-Sentence Compression Task	May 1, 2018	Abstractive Text SummarizationQuestion Answering	—Unverified
BioRead: A New Dataset for Biomedical Reading Comprehension	May 1, 2018	Information RetrievalMachine Reading Comprehension	CodeCode Available
Finely Tuned, 2 Billion Token Based Word Embeddings for Portuguese	May 1, 2018	Named Entity Recognition (NER)Question Answering	—Unverified
Annotating Zero Anaphora for Question Answering	May 1, 2018	Question Answering	—Unverified
SemR-11: A Multi-Lingual Gold-Standard for Semantic Similarity and Relatedness for Eleven Languages	May 1, 2018	Information RetrievalMachine Translation	—Unverified
Universal Dependencies for Amharic	May 1, 2018	Machine TranslationQuestion Answering	—Unverified
T-REx: A Large Scale Alignment of Natural Language with Knowledge Base Triples	May 1, 2018	Entity LinkingKnowledge Base Population	CodeCode Available
Semi-supervised Training Data Generation for Multilingual Question Answering	May 1, 2018	Machine TranslationNamed Entity Recognition (NER)	—Unverified
Towards a Standardized Dataset for Noun Compound Interpretation	May 1, 2018	Machine TranslationQuestion Answering	—Unverified
Semantic Equivalence Detection: Are Interrogatives Harder than Declaratives?	May 1, 2018	Community Question AnsweringInformation Retrieval	—Unverified
Transforming Wikipedia into a Large-Scale Fine-Grained Entity Type Corpus	May 1, 2018	Entity LinkingEntity Typing	—Unverified
SPADE: Evaluation Dataset for Monolingual Phrase Alignment	May 1, 2018	Machine TranslationParaphrase Identification	—Unverified
Semi-automatic Korean FrameNet Annotation over KAIST Treebank	May 1, 2018	Dependency ParsingMorphological Analysis	—Unverified
Visual Choice of Plausible Alternatives: An Evaluation of Image-based Commonsense Causal Reasoning	May 1, 2018	Commonsense Causal ReasoningImage Captioning	CodeCode Available
Retrofitting Word Representations for Unsupervised Sense Aware Word Similarities	May 1, 2018	Named Entity Recognition (NER)Question Answering	—Unverified
When ACE met KBP: End-to-End Evaluation of Knowledge Base Population with Component-level Annotation	May 1, 2018	Knowledge Base PopulationNamed Entity Recognition (NER)	—Unverified
Towards an ISO Standard for the Annotation of Quantification	May 1, 2018	Question Answering	—Unverified

Show:10 25 50

← PrevPage 362 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified