Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7826–7850 of 10817 papers

Title	Date	Tasks	Status
ForecastQA: A Question Answering Challenge for Event Forecasting with Temporal Text Data	May 2, 2020	Knowledge GraphsLanguage Modelling	—Unverified
Is Multihop QA in DiRe Condition? Measuring and Reducing Disconnected Reasoning	May 2, 2020	Multi-hop Question AnsweringQuestion Answering	CodeCode Available
AVA: an Automatic eValuation Approach to Question Answering Systems	May 2, 2020	Question Answering	—Unverified
FRAQUE: a FRAme-based QUEstion-answering system for the Public Administration domain	May 1, 2020	Question AnsweringWord Embeddings	—Unverified
Chat or Learn: a Data-Driven Robust Question-Answering System	May 1, 2020	ArticlesChatbot	—Unverified
The Margarita Dialogue Corpus: A Data Set for Time-Offset Interactions and Unstructured Dialogue Systems	May 1, 2020	Question AnsweringRetrieval	—Unverified
Evaluation of Dataset Selection for Pre-Training and Fine-Tuning Transformer Language Models for Clinical Question Answering	May 1, 2020	Machine Reading ComprehensionQuestion Answering	—Unverified
AIA-BDE: A Corpus of FAQs in Portuguese and their Variations	May 1, 2020	Information RetrievalNatural Language Inference	—Unverified
NeurQuRI: Neural Question Requirement Inspector for Answerability Prediction in Machine Reading Comprehension	May 1, 2020	answerability predictionMachine Reading Comprehension	—Unverified
Neural Symbolic Reader: Scalable Integration of Distributed and Symbolic Representations for Reading Comprehension	May 1, 2020	Data AugmentationMath	—Unverified
Self-supervised Knowledge Triplet Learning for Zero-shot Question Answering	May 1, 2020	Knowledge GraphsQuestion Answering	—Unverified
``A Passage to India'': Pre-trained Word Embeddings for Indian Languages	May 1, 2020	Information RetrievalMachine Translation	—Unverified
ScholarlyRead: A New Dataset for Scientific Article Reading Comprehension	May 1, 2020	ArticlesQuestion Answering	—Unverified
A Corpus for Visual Question Answering Annotated with Frame Semantic Information	May 1, 2020	Question AnsweringVisual Question Answering	—Unverified
TED-Q: TED Talks and the Questions they Evoke	May 1, 2020	Conversational Question AnsweringQuestion Answering	—Unverified
A French Corpus for Semantic Similarity	May 1, 2020	Information RetrievalMachine Translation	—Unverified
Do not let the history haunt you: Mitigating Compounding Errors in Conversational Question Answering	May 1, 2020	Conversational Question AnsweringQuestion Answering	—Unverified
WorldTree V2: A Corpus of Science-Domain Structured Explanations and Inference Patterns supporting Multi-Hop Inference	May 1, 2020	Question AnsweringWorld Knowledge	—Unverified
Visuo-Linguistic Question Answering (VLQA) Challenge	May 1, 2020	Question AnsweringReading Comprehension	CodeCode Available
TORQUE: A Reading Comprehension Dataset of Temporal Ordering Questions	May 1, 2020	Machine Reading ComprehensionQuestion Answering	—Unverified
Automatic Spanish Translation of SQuAD Dataset for Multi-lingual Question Answering	May 1, 2020	Question AnsweringTAR	—Unverified
An Empirical Comparison of Question Classification Methods for Question Answering Systems	May 1, 2020	ClassificationGeneral Classification	—Unverified
Automated Discovery of Mathematical Definitions in Text	May 1, 2020	ArticlesBinary Classification	—Unverified
Image Position Prediction in Multimodal Documents	May 1, 2020	ArticlesCaption Generation	—Unverified
Conversational Question Answering in Low Resource Scenarios: A Dataset and Case Study for Basque	May 1, 2020	Conversational Question AnsweringCross-Lingual Transfer	—Unverified

Show:10 25 50

← PrevPage 314 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified