Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1751–1775 of 10817 papers

Title	Date	Tasks	Status	Hype
How Much Can CLIP Benefit Vision-and-Language Tasks?	Jul 13, 2021	Question AnsweringVision and Language Navigation	CodeCode Available	1
Graphhopper: Multi-Hop Scene Graph Reasoning for Visual Question Answering	Jul 13, 2021	NavigateQuestion Answering	CodeCode Available	1
PonderNet: Learning to Ponder	Jul 12, 2021	Question Answering	CodeCode Available	1
Zero-shot Visual Question Answering using Knowledge Graph	Jul 12, 2021	Knowledge GraphsQuestion Answering	CodeCode Available	1
DualVGR: A Dual-Visual Graph Reasoning Unit for Video Question Answering	Jul 10, 2021	Graph AttentionQuestion Answering	CodeCode Available	1
Benchmarking for Biomedical Natural Language Processing Tasks with a Domain Specific ALBERT	Jul 9, 2021	BenchmarkingDocument Classification	CodeCode Available	1
A Long Short-Term Memory for AI Applications in Spike-based Neuromorphic Hardware	Jul 8, 2021	Question AnsweringTime Series	CodeCode Available	1
Mind Your Outliers! Investigating the Negative Impact of Outliers on Active Learning for Visual Question Answering	Jul 6, 2021	Active LearningObject Recognition	CodeCode Available	1
Training Adaptive Computation for Open-Domain Question Answering with Computational Constraints	Jul 5, 2021	Computational EfficiencyGPU	CodeCode Available	1
Ethics Sheets for AI Tasks	Jul 2, 2021	ArticlesEmotion Recognition	CodeCode Available	1
Reinforcement Learning for Abstractive Question Summarization with Question-aware Semantic Rewards	Jul 1, 2021	Question AnsweringQuestion Generation	CodeCode Available	1
AIT-QA: Question Answering Dataset over Complex Tables in the Airline Industry	Jun 24, 2021	Question AnsweringSemantic Parsing	CodeCode Available	1
Abg-CoQA: Clarifying Ambiguity in Conversational Question Answering	Jun 22, 2021	4kConversational Question Answering	CodeCode Available	1
ABCD: A Graph Framework to Convert Complex Sentences to a Covering Set of Simple Sentences	Jun 22, 2021	Argument MiningDecoder	CodeCode Available	1
Learn to Resolve Conversational Dependency: A Consistency Training Framework for Conversational Question Answering	Jun 22, 2021	Conversational Question AnsweringQuestion Answering	CodeCode Available	1
RSTNet: Captioning With Adaptive Attention on Visual and Non-Visual Words	Jun 19, 2021	DecoderImage Captioning	CodeCode Available	1
NExT-QA: Next Phase of Question-Answering to Explaining Temporal Actions	Jun 19, 2021	Question AnsweringVideo Question Answering	CodeCode Available	1
Perception Matters: Detecting Perception Failures of VQA Models Using Metamorphic Testing	Jun 19, 2021	BenchmarkingDNN Testing	CodeCode Available	1
Predicting Human Scanpaths in Visual Question Answering	Jun 19, 2021	Deep Reinforcement LearningQuestion Answering	CodeCode Available	1
SPBERT: An Efficient Pre-training BERT on SPARQL Queries for Question Answering over Knowledge Graphs	Jun 18, 2021	DecoderKnowledge Graphs	CodeCode Available	1
LNN-EL: A Neuro-Symbolic Approach to Short-text Entity Linking	Jun 17, 2021	Entity LinkingInductive Bias	CodeCode Available	1
Modeling Worlds in Text	Jun 17, 2021	Knowledge GraphsQuestion Answering	CodeCode Available	1
DocNLI: A Large-scale Dataset for Document-level Natural Language Inference	Jun 17, 2021	Natural Language InferenceQuestion Answering	CodeCode Available	1
Probing Image-Language Transformers for Verb Understanding	Jun 16, 2021	Image RetrievalQuestion Answering	CodeCode Available	1
Consistency Regularization for Cross-Lingual Fine-Tuning	Jun 15, 2021	Machine TranslationQuestion Answering	CodeCode Available	1

Show:10 25 50

← PrevPage 71 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified