Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1901–1950 of 10817 papers

Title	Date	Tasks	Status	Hype
TRAR: Routing the Attention Spans in Transformer for Visual Question Answering	Jan 1, 2021	Question AnsweringReferring Expression	CodeCode Available	1
Pano-AVQA: Grounded Audio-Visual Question Answering on 360deg Videos	Jan 1, 2021	Audio-visual Question AnsweringQuestion Answering	CodeCode Available	1
Multimodal Co-Attention Transformer for Survival Prediction in Gigapixel Whole Slide Images	Jan 1, 2021	AttributeMultiple Instance Learning	CodeCode Available	1
BanglaBERT: Language Model Pretraining and Benchmarks for Low-Resource Language Understanding Evaluation in Bangla	Jan 1, 2021	Document ClassificationLanguage Modeling	CodeCode Available	1
AraGPT2: Pre-Trained Transformer for Arabic Language Generation	Dec 31, 2020	ArticlesLanguage Modeling	CodeCode Available	1
ECONET: Effective Continual Pretraining of Language Models for Event Temporal Reasoning	Dec 30, 2020	Continual PretrainingLanguage Modelling	CodeCode Available	1
Improving BERT with Syntax-aware Local Attention	Dec 30, 2020	Machine TranslationQuestion Answering	CodeCode Available	1
ERICA: Improving Entity and Relation Understanding for Pre-trained Language Models via Contrastive Learning	Dec 30, 2020	Contrastive LearningEntity Typing	CodeCode Available	1
A Memory Efficient Baseline for Open Domain Question Answering	Dec 30, 2020	Dimensionality ReductionOpen-Domain Question Answering	CodeCode Available	1
UniK-QA: Unified Representations of Structured and Unstructured Knowledge for Open-Domain Question Answering	Dec 29, 2020	Knowledge Base Question AnsweringOpen-Domain Question Answering	CodeCode Available	1
Detecting Hate Speech in Multi-modal Memes	Dec 29, 2020	Binary ClassificationHate Speech Detection	CodeCode Available	1
Syntax-Enhanced Pre-trained Model	Dec 28, 2020	Entity Typingmodel	CodeCode Available	1
Explaining NLP Models via Minimal Contrastive Editing (MiCE)	Dec 27, 2020	counterfactualMultiple-choice	CodeCode Available	1
LOREN: Logic-Regularized Reasoning for Interpretable Fact Verification	Dec 25, 2020	Claim VerificationFact Verification	CodeCode Available	1
Overcoming Language Priors with Self-supervised Learning for Visual Question Answering	Dec 17, 2020	Question AnsweringSelf-Supervised Learning	CodeCode Available	1
Clinical Temporal Relation Extraction with Probabilistic Soft Logic Regularization and Global Inference	Dec 16, 2020	Feature EngineeringMedical Question Answering	CodeCode Available	1
Knowledge-Routed Visual Question Reasoning: Challenges for Deep Representation Embedding	Dec 14, 2020	Question AnsweringVisual Question Answering	CodeCode Available	1
ParsiNLU: A Suite of Language Understanding Challenges for Persian	Dec 11, 2020	Machine TranslationNatural Language Inference	CodeCode Available	1
Fusing Context Into Knowledge Graph for Commonsense Question Answering	Dec 9, 2020	Common Sense ReasoningKnowledge Graphs	CodeCode Available	1
Distilling Knowledge from Reader to Retriever for Question Answering	Dec 8, 2020	Information RetrievalKnowledge Distillation	CodeCode Available	1
TAP: Text-Aware Pre-training for Text-VQA and Text-Caption	Dec 8, 2020	Caption GenerationLanguage Modeling	CodeCode Available	1
CRAFT: A Benchmark for Causal Reasoning About Forces and inTeractions	Dec 8, 2020	counterfactualDescriptive	CodeCode Available	1
FloodNet: A High Resolution Aerial Imagery Dataset for Post Flood Scene Understanding	Dec 5, 2020	image-classificationImage Classification	CodeCode Available	1
How Can We Know When Language Models Know? On the Calibration of Language Models for Question Answering	Dec 2, 2020	Common Sense ReasoningQuestion Answering	CodeCode Available	1
SeMantic AnsweR Type prediction task (SMART) at ISWC 2020 Semantic Web Challenge	Dec 1, 2020	Knowledge Base Question AnsweringPrediction	CodeCode Available	1
H-Mem: Harnessing synaptic plasticity with Hebbian Memory Networks	Dec 1, 2020	Question Answering	CodeCode Available	1
Just Ask: Learning to Answer Questions from Millions of Narrated Videos	Dec 1, 2020	Question AnsweringQuestion Generation	CodeCode Available	1
Point and Ask: Incorporating Pointing into Visual Question Answering	Nov 27, 2020	Question AnsweringVisual Question Answering	CodeCode Available	1
Answering Ambiguous Questions through Generative Evidence Fusion and Round-Trip Prediction	Nov 26, 2020	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
XTQA: Span-Level Explanations of the Textbook Question Answering	Nov 25, 2020	Question Answering	CodeCode Available	1
Large Scale Multimodal Classification Using an Ensemble of Transformer Models and Co-Attention	Nov 23, 2020	ClassificationGeneral Classification	CodeCode Available	1
LRTA: A Transparent Neural-Symbolic Reasoning Framework with Modular Supervision for Visual Question Answering	Nov 21, 2020	Answer GenerationQuestion Answering	CodeCode Available	1
EasyTransfer -- A Simple and Scalable Deep Transfer Learning Platform for NLP Applications	Nov 18, 2020	Compiler OptimizationConversational Question Answering	CodeCode Available	1
Learning Associative Inference Using Fast Weight Memory	Nov 16, 2020	Language ModellingMeta Reinforcement Learning	CodeCode Available	1
Beyond I.I.D.: Three Levels of Generalization for Question Answering on Knowledge Bases	Nov 16, 2020	Knowledge Base Question AnsweringQuestion Answering	CodeCode Available	1
NLPGym -- A toolkit for evaluating RL agents on Natural Language Processing Tasks	Nov 16, 2020	Multi-Label ClassificationMUlTI-LABEL-ClASSIFICATION	CodeCode Available	1
Utilizing Bidirectional Encoder Representations from Transformers for Answer Selection	Nov 14, 2020	Answer SelectionCommunity Question Answering	CodeCode Available	1
VisBERT: Hidden-State Visualizations for Transformers	Nov 9, 2020	Multi-hop Question AnsweringQuestion Answering	CodeCode Available	1
Knowledge-driven Data Construction for Zero-shot Evaluation in Commonsense Question Answering	Nov 7, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
Disentangling 3D Prototypical Networks For Few-Shot Concept Learning	Nov 6, 2020	3D geometry3D Object Detection	CodeCode Available	1
Context-Aware Answer Extraction in Question Answering	Nov 5, 2020	Multi-Task LearningPrediction	CodeCode Available	1
EXAMS: A Multi-Subject High School Examinations Dataset for Cross-Lingual and Multilingual Question Answering	Nov 5, 2020	Question AnsweringTransfer Learning	CodeCode Available	1
CharBERT: Character-aware Pre-trained Language Model	Nov 3, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
Constructing A Multi-hop QA Dataset for Comprehensive Evaluation of Reasoning Steps	Nov 2, 2020	Multi-hop Question AnsweringQuestion Answering	CodeCode Available	1
Learning to Contrast the Counterfactual Samples for Robust Visual Question Answering	Nov 1, 2020	Contrastive Learningcounterfactual	CodeCode Available	1
The RELX Dataset and Matching the Multilingual Blanks for Cross-Lingual Relation Classification	Nov 1, 2020	ClassificationQuestion Answering	CodeCode Available	1
ConceptBert: Concept-Aware Representation for Visual Question Answering	Nov 1, 2020	Common Sense ReasoningQuestion Answering	CodeCode Available	1
Question Answering with Long Multiple-Span Answers	Nov 1, 2020	Question AnsweringSentence	CodeCode Available	1
CliniQG4QA: Generating Diverse Questions for Domain Adaptation of Clinical Question Answering	Oct 30, 2020	Domain AdaptationQuestion Answering	CodeCode Available	1
Few-Shot Complex Knowledge Base Question Answering via Meta Reinforcement Learning	Oct 29, 2020	Knowledge Base Question AnsweringMeta Reinforcement Learning	CodeCode Available	1

Show:10 25 50

← PrevPage 39 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified