Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7801–7850 of 10817 papers

Title	Date	Tasks	Status
English Intermediate-Task Training Improves Zero-Shot Cross-Lingual Transfer Too	May 26, 2020	Cross-Lingual TransferHellaSwag	—Unverified
History-Aware Question Answering in a Blocks World Dialogue System	May 26, 2020	Natural Language UnderstandingQuestion Answering	—Unverified
Generating Semantically Valid Adversarial Questions for TableQA	May 26, 2020	Adversarial AttackQuestion Answering	—Unverified
An Audio-enriched BERT-based Framework for Spoken Multiple-choice Question Answering	May 25, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Complex KBQA System using Multiple Reasoning Paths	May 22, 2020	Natural Language UnderstandingQuestion Answering	—Unverified
Comparative Study of Machine Learning Models and BERT on SQuAD	May 22, 2020	BIG-bench Machine LearningQuestion Answering	CodeCode Available
Functorial Language Games for Question Answering	May 19, 2020	Question Answering	—Unverified
On the Value of Out-of-Distribution Testing: An Example of Goodhart's Law	May 19, 2020	Model SelectionQuestion Answering	—Unverified
Towards Question Format Independent Numerical Reasoning: A Set of Prerequisite Tasks	May 18, 2020	Natural Language InferenceQuestion Answering	—Unverified
Support-BERT: Predicting Quality of Question-Answer Pairs in MSDN using Deep Bidirectional Transformer	May 17, 2020	Community Question AnsweringQuestion Answering	—Unverified
CS-NLP team at SemEval-2020 Task 4: Evaluation of State-of-the-art NLP Deep Learning Architectures on Commonsense Reasoning Task	May 17, 2020	Multiple-choiceNatural Language Inference	—Unverified
Context-Based Quotation Recommendation	May 17, 2020	ArticlesOpen-Domain Question Answering	—Unverified
Visual Relationship Detection using Scene Graphs: A Survey	May 16, 2020	Graph GenerationImage Generation	—Unverified
An Evaluation of Recent Neural Sequence Tagging Models in Turkish Named Entity Recognition	May 14, 2020	named-entity-recognitionNamed Entity Recognition	—Unverified
Do not let the history haunt you -- Mitigating Compounding Errors in Conversational Question Answering	May 12, 2020	Conversational Question AnsweringQuestion Answering	—Unverified
Maximizing Information Gain in Partially Observable Environments via Prediction Reward	May 11, 2020	PredictionQuestion Answering	—Unverified
How Context Affects Language Models' Factual Predictions	May 10, 2020	Information RetrievalLanguage Modeling	—Unverified
Character Matters: Video Story Understanding with Character-Aware Relations	May 9, 2020	Question Answering	—Unverified
DramaQA: Character-Centered Video Story Understanding with Hierarchical QA	May 7, 2020	Question AnsweringVideo Question Answering	CodeCode Available
Where is Linked Data in Question Answering over Linked Data?	May 7, 2020	Question Answering	—Unverified
CounQER: A System for Discovering and Linking Count Information in Knowledge Bases	May 7, 2020	Question Answering	CodeCode Available
A Large-Scale, Open-Domain, Mixed-Interface Dialogue-Based ITS for STEM	May 6, 2020	BIG-bench Machine LearningQuestion Answering	—Unverified
Probabilistic Assumptions Matter: Improved Models for Distantly-Supervised Document-Level Question Answering	May 5, 2020	Extractive Question-AnsweringQuestion Answering	CodeCode Available
Visual Question Answering with Prior Class Semantics	May 4, 2020	Question AnsweringVisual Question Answering	—Unverified
DoQA -- Accessing Domain-Specific FAQs via Conversational QA	May 4, 2020	Conversational Question AnsweringInformation Retrieval	—Unverified
ForecastQA: A Question Answering Challenge for Event Forecasting with Temporal Text Data	May 2, 2020	Knowledge GraphsLanguage Modelling	—Unverified
Is Multihop QA in DiRe Condition? Measuring and Reducing Disconnected Reasoning	May 2, 2020	Multi-hop Question AnsweringQuestion Answering	CodeCode Available
AVA: an Automatic eValuation Approach to Question Answering Systems	May 2, 2020	Question Answering	—Unverified
FRAQUE: a FRAme-based QUEstion-answering system for the Public Administration domain	May 1, 2020	Question AnsweringWord Embeddings	—Unverified
Chat or Learn: a Data-Driven Robust Question-Answering System	May 1, 2020	ArticlesChatbot	—Unverified
The Margarita Dialogue Corpus: A Data Set for Time-Offset Interactions and Unstructured Dialogue Systems	May 1, 2020	Question AnsweringRetrieval	—Unverified
Evaluation of Dataset Selection for Pre-Training and Fine-Tuning Transformer Language Models for Clinical Question Answering	May 1, 2020	Machine Reading ComprehensionQuestion Answering	—Unverified
AIA-BDE: A Corpus of FAQs in Portuguese and their Variations	May 1, 2020	Information RetrievalNatural Language Inference	—Unverified
NeurQuRI: Neural Question Requirement Inspector for Answerability Prediction in Machine Reading Comprehension	May 1, 2020	answerability predictionMachine Reading Comprehension	—Unverified
Neural Symbolic Reader: Scalable Integration of Distributed and Symbolic Representations for Reading Comprehension	May 1, 2020	Data AugmentationMath	—Unverified
Self-supervised Knowledge Triplet Learning for Zero-shot Question Answering	May 1, 2020	Knowledge GraphsQuestion Answering	—Unverified
``A Passage to India'': Pre-trained Word Embeddings for Indian Languages	May 1, 2020	Information RetrievalMachine Translation	—Unverified
ScholarlyRead: A New Dataset for Scientific Article Reading Comprehension	May 1, 2020	ArticlesQuestion Answering	—Unverified
A Corpus for Visual Question Answering Annotated with Frame Semantic Information	May 1, 2020	Question AnsweringVisual Question Answering	—Unverified
TED-Q: TED Talks and the Questions they Evoke	May 1, 2020	Conversational Question AnsweringQuestion Answering	—Unverified
A French Corpus for Semantic Similarity	May 1, 2020	Information RetrievalMachine Translation	—Unverified
Do not let the history haunt you: Mitigating Compounding Errors in Conversational Question Answering	May 1, 2020	Conversational Question AnsweringQuestion Answering	—Unverified
WorldTree V2: A Corpus of Science-Domain Structured Explanations and Inference Patterns supporting Multi-Hop Inference	May 1, 2020	Question AnsweringWorld Knowledge	—Unverified
Visuo-Linguistic Question Answering (VLQA) Challenge	May 1, 2020	Question AnsweringReading Comprehension	CodeCode Available
TORQUE: A Reading Comprehension Dataset of Temporal Ordering Questions	May 1, 2020	Machine Reading ComprehensionQuestion Answering	—Unverified
Automatic Spanish Translation of SQuAD Dataset for Multi-lingual Question Answering	May 1, 2020	Question AnsweringTAR	—Unverified
An Empirical Comparison of Question Classification Methods for Question Answering Systems	May 1, 2020	ClassificationGeneral Classification	—Unverified
Automated Discovery of Mathematical Definitions in Text	May 1, 2020	ArticlesBinary Classification	—Unverified
Image Position Prediction in Multimodal Documents	May 1, 2020	ArticlesCaption Generation	—Unverified
Conversational Question Answering in Low Resource Scenarios: A Dataset and Case Study for Basque	May 1, 2020	Conversational Question AnsweringCross-Lingual Transfer	—Unverified

Show:10 25 50

← PrevPage 157 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified