Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7651–7675 of 10817 papers

Title	Date	Tasks	Status	Hype
A French Corpus for Semantic Similarity	May 1, 2020	Information RetrievalMachine Translation	—Unverified	0
WorldTree V2: A Corpus of Science-Domain Structured Explanations and Inference Patterns supporting Multi-Hop Inference	May 1, 2020	Question AnsweringWorld Knowledge	—Unverified	0
Automatic Spanish Translation of SQuAD Dataset for Multi-lingual Question Answering	May 1, 2020	Question AnsweringTAR	—Unverified	0
An Empirical Comparison of Question Classification Methods for Question Answering Systems	May 1, 2020	ClassificationGeneral Classification	—Unverified	0
Assessing Users' Reputation from Syntactic and Semantic Information in Community Question Answering	May 1, 2020	Community Question AnsweringQuestion Answering	—Unverified	0
Generating Responses that Reflect Meta Information in User-Generated Question Answer Pairs	May 1, 2020	Question Answering	—Unverified	0
The Margarita Dialogue Corpus: A Data Set for Time-Offset Interactions and Unstructured Dialogue Systems	May 1, 2020	Question AnsweringRetrieval	—Unverified	0
MTSI-BERT: A Session-aware Knowledge-based Conversational Agent	May 1, 2020	Chatbotintent-classification	CodeCode Available	1
Do not let the history haunt you: Mitigating Compounding Errors in Conversational Question Answering	May 1, 2020	Conversational Question AnsweringQuestion Answering	—Unverified	0
LifeQA: A Real-life Dataset for Video Question Answering	May 1, 2020	Multiple-choiceQuestion Answering	CodeCode Available	1
TED-Q: TED Talks and the Questions they Evoke	May 1, 2020	Conversational Question AnsweringQuestion Answering	—Unverified	0
Automated Discovery of Mathematical Definitions in Text	May 1, 2020	ArticlesBinary Classification	—Unverified	0
SiBert: Enhanced Chinese Pre-trained Language Model with Sentence Insertion	May 1, 2020	Cloze TestLanguage Modeling	CodeCode Available	1
Image Position Prediction in Multimodal Documents	May 1, 2020	ArticlesCaption Generation	—Unverified	0
Conversational Question Answering in Low Resource Scenarios: A Dataset and Case Study for Basque	May 1, 2020	Conversational Question AnsweringCross-Lingual Transfer	—Unverified	0
FRAQUE: a FRAme-based QUEstion-answering system for the Public Administration domain	May 1, 2020	Question AnsweringWord Embeddings	—Unverified	0
``A Passage to India'': Pre-trained Word Embeddings for Indian Languages	May 1, 2020	Information RetrievalMachine Translation	—Unverified	0
Clinical Reading Comprehension: A Thorough Analysis of the emrQA Dataset	May 1, 2020	Machine Reading ComprehensionQuestion Answering	CodeCode Available	1
KLEJ: Comprehensive Benchmark for Polish Language Understanding	May 1, 2020	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
Scalable Multi-Hop Relational Reasoning for Knowledge-Aware Question Answering	May 1, 2020	Knowledge GraphsQuestion Answering	CodeCode Available	1
Self-supervised Knowledge Triplet Learning for Zero-shot Question Answering	May 1, 2020	Knowledge GraphsQuestion Answering	—Unverified	0
TORQUE: A Reading Comprehension Dataset of Temporal Ordering Questions	May 1, 2020	Machine Reading ComprehensionQuestion Answering	—Unverified	0
Visuo-Linguistic Question Answering (VLQA) Challenge	May 1, 2020	Question AnsweringReading Comprehension	CodeCode Available	0
KPQA: A Metric for Generative Question Answering Using Keyphrase Weights	May 1, 2020	Generative Question AnsweringQuestion Answering	CodeCode Available	1
HERO: Hierarchical Encoder for Video+Language Omni-representation Pre-training	May 1, 2020	Language ModelingLanguage Modelling	CodeCode Available	1

Show:10 25 50

← PrevPage 307 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified