Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7926–7950 of 10817 papers

Title	Date	Tasks	Status
Knowledge Graphs and Knowledge Networks: The Story in Brief	Mar 7, 2020	Knowledge GraphsLink Prediction	—Unverified
Practical Annotation Strategies for Question Answering Datasets	Mar 6, 2020	Question Answering	—Unverified
Noise Estimation Using Density Estimation for Self-Supervised Multimodal Learning	Mar 6, 2020	Density EstimationNoise Estimation	CodeCode Available
Natural Language QA Approaches using Reasoning with External Knowledge	Mar 6, 2020	Question AnsweringSurvey	—Unverified
Uncovering Hidden Semantics of Set Information in Knowledge Bases	Mar 6, 2020	PositionQuestion Answering	CodeCode Available
A Study on Efficiency, Accuracy and Document Structure for Answer Sentence Selection	Mar 4, 2020	Question AnsweringSentence	—Unverified
A Question-Centric Model for Visual Question Answering in Medical Imaging	Mar 2, 2020	Medical Image AnalysisQuestion Answering	CodeCode Available
A Study on Multimodal and Interactive Explanations for Visual Question Answering	Mar 1, 2020	Explainable Artificial Intelligence (XAI)Prediction	—Unverified
DC-BERT: Decoupling Question and Document for Efficient Contextual Encoding	Feb 28, 2020	Natural QuestionsOpen-Domain Question Answering	—Unverified
Unshuffling Data for Improved Generalization	Feb 27, 2020	ClusteringData Augmentation	—Unverified
Masking Orchestration: Multi-task Pretraining for Multi-role Dialogue Representation Learning	Feb 27, 2020	Dialogue UnderstandingQuestion Answering	CodeCode Available
Adv-BERT: BERT is not robust on misspellings! Generating nature adversarial samples on BERT	Feb 27, 2020	Question AnsweringSentence	—Unverified
Generating Followup Questions for Interpretable Multi-hop Question Answering	Feb 27, 2020	Multi-hop Question AnsweringQuestion Answering	—Unverified
Exploring BERT Parameter Efficiency on the Stanford Question Answering Dataset v2.0	Feb 25, 2020	Question Answering	—Unverified
Multimodal Transformer with Pointer Network for the DSTC8 AVSD Challenge	Feb 25, 2020	Question AnsweringVideo Question Answering	—Unverified
End-to-End Entity Linking and Disambiguation leveraging Word and Knowledge Graph Embeddings	Feb 25, 2020	Entity DisambiguationEntity Linking	—Unverified
FONDUE: A Framework for Node Disambiguation Using Network Embeddings	Feb 24, 2020	Knowledge GraphsNetwork Embedding	—Unverified
On the General Value of Evidence, and Bilingual Scene-Text Visual Question Answering	Feb 24, 2020	Question AnsweringReferring Expression	—Unverified
Do Multi-Hop Question Answering Systems Know How to Answer the Single-Hop Sub-Questions?	Feb 23, 2020	Multi-hop Question AnsweringQuestion Answering	—Unverified
Training Question Answering Models From Synthetic Data	Feb 22, 2020	Answer GenerationData Augmentation	—Unverified
Is Aligning Embedding Spaces a Challenging Task? A Study on Heterogeneous Embedding Alignment Methods	Feb 21, 2020	Entity DisambiguationKnowledge Graph Completion	—Unverified
VQA-LOL: Visual Question Answering under the Lens of Logic	Feb 19, 2020	NegationQuestion Answering	—Unverified
Interactive Natural Language-based Person Search	Feb 19, 2020	Person SearchQuestion Answering	CodeCode Available
Neural Relation Prediction for Simple Question Answering over Knowledge Graph	Feb 18, 2020	Knowledge GraphsQuestion Answering	—Unverified
CQ-VQA: Visual Question Answering on Categorized Questions	Feb 17, 2020	Question AnsweringVisual Question Answering	—Unverified

Show:10 25 50

← PrevPage 318 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified