Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7476–7500 of 10817 papers

Title	Date	Tasks	Status	Hype
Image Captioning with Compositional Neural Module Networks	Jul 10, 2020	Image CaptioningQuestion Answering	—Unverified	0
What Can We Learn From Almost a Decade of Food Tweets	Jul 10, 2020	Question AnsweringSentiment Analysis	CodeCode Available	0
Less is More: Rejecting Unreliable Reviews for Product Question Answering	Jul 9, 2020	Community Question AnsweringConformal Prediction	CodeCode Available	0
Advances of Transformer-Based Models for News Headline Generation	Jul 9, 2020	Headline Generationnamed-entity-recognition	CodeCode Available	1
IQ-VQA: Intelligent Visual Question Answering	Jul 8, 2020	Question AnsweringVisual Question Answering	CodeCode Available	0
KQA Pro: A Dataset with Explicit Compositional Programs for Complex Question Answering over Knowledge Base	Jul 8, 2020	AttributeDiagnostic	CodeCode Available	1
What Gives the Answer Away? Question Answering Bias Analysis on Video QA Datasets	Jul 7, 2020	Multiple-choiceQuestion Answering	—Unverified	0
Auto-captions on GIF: A Large-scale Video-sentence Dataset for Vision-language Pre-training	Jul 5, 2020	DecoderQuestion Answering	—Unverified	0
Modality Shifting Attention Network for Multi-modal Video Question Answering	Jul 4, 2020	Question AnsweringTemporal Localization	—Unverified	0
Text Data Augmentation: Towards better detection of spear-phishing emails	Jul 4, 2020	Data AugmentationGeneral Classification	—Unverified	0
Eliminating Catastrophic Interference with Biased Competition	Jul 3, 2020	Question AnsweringVisual Question Answering	—Unverified	0
El Departamento de Nosotros: How Machine Translated Corpora Affects Language Models in MRC Tasks	Jul 3, 2020	Machine TranslationQuestion Answering	CodeCode Available	0
A Competence-aware Curriculum for Visual Concepts Learning via Question Answering	Jul 3, 2020	Question Answering	—Unverified	0
Visual Question Answering as a Multi-Task Problem	Jul 3, 2020	Question AnsweringVisual Question Answering	—Unverified	0
Facts as Experts: Adaptable and Interpretable Neural Memory over Symbolic Knowledge	Jul 2, 2020	Language ModelingLanguage Modelling	—Unverified	0
Scene Graph Reasoning for Visual Question Answering	Jul 2, 2020	NavigateQuestion Answering	—Unverified	0
Leveraging Passage Retrieval with Generative Models for Open Domain Question Answering	Jul 2, 2020	Natural QuestionsOpen-Domain Question Answering	CodeCode Available	1
The Impact of Explanations on AI Competency Prediction in VQA	Jul 2, 2020	AI AgentLanguage Modeling	—Unverified	0
Detecting Ongoing Events Using Contextual Word and Sentence Embeddings	Jul 2, 2020	AttributeEvent Detection	—Unverified	0
IIE-NLP-NUT at SemEval-2020 Task 4: Guiding PLM with Prompt Template Reconstruction Strategy for ComVE	Jul 2, 2020	Multiple-choiceQuestion Answering	—Unverified	0
Project PIAF: Building a Native French Question-Answering Dataset	Jul 2, 2020	Question Answering	CodeCode Available	1
COVID-QA: A Question Answering Dataset for COVID-19	Jul 1, 2020	ArticlesQuestion Answering	CodeCode Available	1
How Self-Attention Improves Rare Class Performance in a Question-Answering Dialogue Agent	Jul 1, 2020	Language ModelingLanguage Modelling	—Unverified	0
Asking Effective and Diverse Questions: A Machine Reading Comprehension based Framework for Joint Entity-Relation Extraction	Jul 1, 2020	DiversityMachine Reading Comprehension	CodeCode Available	1
Relevance-guided Supervision for OpenQA with ColBERT	Jul 1, 2020	Natural QuestionsOpen-Domain Question Answering	CodeCode Available	2

Show:10 25 50

← PrevPage 300 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified