Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7726–7750 of 10817 papers

Title	Date	Tasks	Status
What Gives the Answer Away? Question Answering Bias Analysis on Video QA Datasets	Jul 7, 2020	Multiple-choiceQuestion Answering	—Unverified
Auto-captions on GIF: A Large-scale Video-sentence Dataset for Vision-language Pre-training	Jul 5, 2020	DecoderQuestion Answering	—Unverified
Modality Shifting Attention Network for Multi-modal Video Question Answering	Jul 4, 2020	Question AnsweringTemporal Localization	—Unverified
Text Data Augmentation: Towards better detection of spear-phishing emails	Jul 4, 2020	Data AugmentationGeneral Classification	—Unverified
Visual Question Answering as a Multi-Task Problem	Jul 3, 2020	Question AnsweringVisual Question Answering	—Unverified
Eliminating Catastrophic Interference with Biased Competition	Jul 3, 2020	Question AnsweringVisual Question Answering	—Unverified
El Departamento de Nosotros: How Machine Translated Corpora Affects Language Models in MRC Tasks	Jul 3, 2020	Machine TranslationQuestion Answering	CodeCode Available
A Competence-aware Curriculum for Visual Concepts Learning via Question Answering	Jul 3, 2020	Question Answering	—Unverified
Facts as Experts: Adaptable and Interpretable Neural Memory over Symbolic Knowledge	Jul 2, 2020	Language ModelingLanguage Modelling	—Unverified
Scene Graph Reasoning for Visual Question Answering	Jul 2, 2020	NavigateQuestion Answering	—Unverified
The Impact of Explanations on AI Competency Prediction in VQA	Jul 2, 2020	AI AgentLanguage Modeling	—Unverified
Detecting Ongoing Events Using Contextual Word and Sentence Embeddings	Jul 2, 2020	AttributeEvent Detection	—Unverified
IIE-NLP-NUT at SemEval-2020 Task 4: Guiding PLM with Prompt Template Reconstruction Strategy for ComVE	Jul 2, 2020	Multiple-choiceQuestion Answering	—Unverified
Aligned Dual Channel Graph Convolutional Network for Visual Question Answering	Jul 1, 2020	Question AnsweringVisual Question Answering	—Unverified
Open-Domain Question Answering	Jul 1, 2020	Open-Domain Question AnsweringQuestion Answering	—Unverified
On the Importance of Diversity in Question Generation for QA	Jul 1, 2020	DiversityQuestion Answering	—Unverified
Evaluating and Enhancing the Robustness of Neural Network-based Dependency Parsing Models with Adversarial Examples	Jul 1, 2020	Dependency ParsingQuestion Answering	—Unverified
Multi-source Meta Transfer for Low Resource Multiple-Choice Question Answering	Jul 1, 2020	Domain AdaptationLogical Reasoning	—Unverified
Multimodal Neural Graph Memory Networks for Visual Question Answering	Jul 1, 2020	Graph Neural NetworkQuestion Answering	—Unverified
SimsterQ: A Similarity based Clustering Approach to Opinion Question Answering	Jul 1, 2020	ClusteringQuestion Answering	—Unverified
Answering Complex Questions by Combining Information from Curated and Extracted Knowledge Bases	Jul 1, 2020	Question Answering	—Unverified
DoQA - Accessing Domain-Specific FAQs via Conversational QA	Jul 1, 2020	Conversational Question AnsweringInformation Retrieval	—Unverified
Learning to Identify Follow-Up Questions in Conversational Question Answering	Jul 1, 2020	Conversational Question AnsweringQuestion Answering	—Unverified
Developing a How-to Tip Machine Comprehension Dataset and its Evaluation in Machine Comprehension by BERT	Jul 1, 2020	Question AnsweringReading Comprehension	—Unverified
COVID-19 Literature Knowledge Graph Construction and Drug Repurposing Report Generation	Jul 1, 2020	graph constructionKnowledge Graphs	—Unverified

Show:10 25 50

← PrevPage 310 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified