Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7801–7825 of 10817 papers

Title	Date	Tasks	Status
English Intermediate-Task Training Improves Zero-Shot Cross-Lingual Transfer Too	May 26, 2020	Cross-Lingual TransferHellaSwag	—Unverified
History-Aware Question Answering in a Blocks World Dialogue System	May 26, 2020	Natural Language UnderstandingQuestion Answering	—Unverified
Generating Semantically Valid Adversarial Questions for TableQA	May 26, 2020	Adversarial AttackQuestion Answering	—Unverified
An Audio-enriched BERT-based Framework for Spoken Multiple-choice Question Answering	May 25, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Complex KBQA System using Multiple Reasoning Paths	May 22, 2020	Natural Language UnderstandingQuestion Answering	—Unverified
Comparative Study of Machine Learning Models and BERT on SQuAD	May 22, 2020	BIG-bench Machine LearningQuestion Answering	CodeCode Available
Functorial Language Games for Question Answering	May 19, 2020	Question Answering	—Unverified
On the Value of Out-of-Distribution Testing: An Example of Goodhart's Law	May 19, 2020	Model SelectionQuestion Answering	—Unverified
Towards Question Format Independent Numerical Reasoning: A Set of Prerequisite Tasks	May 18, 2020	Natural Language InferenceQuestion Answering	—Unverified
Support-BERT: Predicting Quality of Question-Answer Pairs in MSDN using Deep Bidirectional Transformer	May 17, 2020	Community Question AnsweringQuestion Answering	—Unverified
CS-NLP team at SemEval-2020 Task 4: Evaluation of State-of-the-art NLP Deep Learning Architectures on Commonsense Reasoning Task	May 17, 2020	Multiple-choiceNatural Language Inference	—Unverified
Context-Based Quotation Recommendation	May 17, 2020	ArticlesOpen-Domain Question Answering	—Unverified
Visual Relationship Detection using Scene Graphs: A Survey	May 16, 2020	Graph GenerationImage Generation	—Unverified
An Evaluation of Recent Neural Sequence Tagging Models in Turkish Named Entity Recognition	May 14, 2020	named-entity-recognitionNamed Entity Recognition	—Unverified
Do not let the history haunt you -- Mitigating Compounding Errors in Conversational Question Answering	May 12, 2020	Conversational Question AnsweringQuestion Answering	—Unverified
Maximizing Information Gain in Partially Observable Environments via Prediction Reward	May 11, 2020	PredictionQuestion Answering	—Unverified
How Context Affects Language Models' Factual Predictions	May 10, 2020	Information RetrievalLanguage Modeling	—Unverified
Character Matters: Video Story Understanding with Character-Aware Relations	May 9, 2020	Question Answering	—Unverified
DramaQA: Character-Centered Video Story Understanding with Hierarchical QA	May 7, 2020	Question AnsweringVideo Question Answering	CodeCode Available
Where is Linked Data in Question Answering over Linked Data?	May 7, 2020	Question Answering	—Unverified
CounQER: A System for Discovering and Linking Count Information in Knowledge Bases	May 7, 2020	Question Answering	CodeCode Available
A Large-Scale, Open-Domain, Mixed-Interface Dialogue-Based ITS for STEM	May 6, 2020	BIG-bench Machine LearningQuestion Answering	—Unverified
Probabilistic Assumptions Matter: Improved Models for Distantly-Supervised Document-Level Question Answering	May 5, 2020	Extractive Question-AnsweringQuestion Answering	CodeCode Available
DoQA -- Accessing Domain-Specific FAQs via Conversational QA	May 4, 2020	Conversational Question AnsweringInformation Retrieval	—Unverified
Visual Question Answering with Prior Class Semantics	May 4, 2020	Question AnsweringVisual Question Answering	—Unverified

Show:10 25 50

← PrevPage 313 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified