Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1751–1800 of 10817 papers

Title	Date	Tasks	Status	Hype
How Much Can CLIP Benefit Vision-and-Language Tasks?	Jul 13, 2021	Question AnsweringVision and Language Navigation	CodeCode Available	1
Graphhopper: Multi-Hop Scene Graph Reasoning for Visual Question Answering	Jul 13, 2021	NavigateQuestion Answering	CodeCode Available	1
Zero-shot Visual Question Answering using Knowledge Graph	Jul 12, 2021	Knowledge GraphsQuestion Answering	CodeCode Available	1
PonderNet: Learning to Ponder	Jul 12, 2021	Question Answering	CodeCode Available	1
DualVGR: A Dual-Visual Graph Reasoning Unit for Video Question Answering	Jul 10, 2021	Graph AttentionQuestion Answering	CodeCode Available	1
Benchmarking for Biomedical Natural Language Processing Tasks with a Domain Specific ALBERT	Jul 9, 2021	BenchmarkingDocument Classification	CodeCode Available	1
A Long Short-Term Memory for AI Applications in Spike-based Neuromorphic Hardware	Jul 8, 2021	Question AnsweringTime Series	CodeCode Available	1
Mind Your Outliers! Investigating the Negative Impact of Outliers on Active Learning for Visual Question Answering	Jul 6, 2021	Active LearningObject Recognition	CodeCode Available	1
Training Adaptive Computation for Open-Domain Question Answering with Computational Constraints	Jul 5, 2021	Computational EfficiencyGPU	CodeCode Available	1
Ethics Sheets for AI Tasks	Jul 2, 2021	ArticlesEmotion Recognition	CodeCode Available	1
Reinforcement Learning for Abstractive Question Summarization with Question-aware Semantic Rewards	Jul 1, 2021	Question AnsweringQuestion Generation	CodeCode Available	1
AIT-QA: Question Answering Dataset over Complex Tables in the Airline Industry	Jun 24, 2021	Question AnsweringSemantic Parsing	CodeCode Available	1
Learn to Resolve Conversational Dependency: A Consistency Training Framework for Conversational Question Answering	Jun 22, 2021	Conversational Question AnsweringQuestion Answering	CodeCode Available	1
Abg-CoQA: Clarifying Ambiguity in Conversational Question Answering	Jun 22, 2021	4kConversational Question Answering	CodeCode Available	1
ABCD: A Graph Framework to Convert Complex Sentences to a Covering Set of Simple Sentences	Jun 22, 2021	Argument MiningDecoder	CodeCode Available	1
RSTNet: Captioning With Adaptive Attention on Visual and Non-Visual Words	Jun 19, 2021	DecoderImage Captioning	CodeCode Available	1
NExT-QA: Next Phase of Question-Answering to Explaining Temporal Actions	Jun 19, 2021	Question AnsweringVideo Question Answering	CodeCode Available	1
Perception Matters: Detecting Perception Failures of VQA Models Using Metamorphic Testing	Jun 19, 2021	BenchmarkingDNN Testing	CodeCode Available	1
Predicting Human Scanpaths in Visual Question Answering	Jun 19, 2021	Deep Reinforcement LearningQuestion Answering	CodeCode Available	1
SPBERT: An Efficient Pre-training BERT on SPARQL Queries for Question Answering over Knowledge Graphs	Jun 18, 2021	DecoderKnowledge Graphs	CodeCode Available	1
LNN-EL: A Neuro-Symbolic Approach to Short-text Entity Linking	Jun 17, 2021	Entity LinkingInductive Bias	CodeCode Available	1
DocNLI: A Large-scale Dataset for Document-level Natural Language Inference	Jun 17, 2021	Natural Language InferenceQuestion Answering	CodeCode Available	1
Modeling Worlds in Text	Jun 17, 2021	Knowledge GraphsQuestion Answering	CodeCode Available	1
Probing Image-Language Transformers for Verb Understanding	Jun 16, 2021	Image RetrievalQuestion Answering	CodeCode Available	1
Question Answering Infused Pre-training of General-Purpose Contextualized Representations	Jun 15, 2021	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
Consistency Regularization for Cross-Lingual Fine-Tuning	Jun 15, 2021	Machine TranslationQuestion Answering	CodeCode Available	1
Thinking Like Transformers	Jun 13, 2021	Question Answering	CodeCode Available	1
Evaluating Entity Disambiguation and the Role of Popularity in Retrieval-Based NLP	Jun 12, 2021	Entity DisambiguationEntity Retrieval	CodeCode Available	1
BioELECTRA:Pretrained Biomedical text Encoder using Discriminators	Jun 11, 2021	ArticlesLanguage Modeling	CodeCode Available	1
Improving Pretrained Cross-Lingual Language Models via Self-Labeled Word Alignment	Jun 11, 2021	DenoisingLanguage Modeling	CodeCode Available	1
End-to-End Training of Multi-Document Reader and Retriever for Open-Domain Question Answering	Jun 9, 2021	Answer GenerationOpen-Domain Question Answering	CodeCode Available	1
CLTR: An End-to-End, Transformer-Based System for Cell Level Table Retrieval and Table Question Answering	Jun 8, 2021	Question AnsweringRetrieval	CodeCode Available	1
XtremeDistilTransformers: Task Transfer for Task-agnostic Distillation	Jun 8, 2021	Knowledge DistillationNER	CodeCode Available	1
Disfl-QA: A Benchmark Dataset for Understanding Disfluencies in Question Answering	Jun 8, 2021	Data AugmentationQuestion Answering	CodeCode Available	1
VALUE: A Multi-Task Benchmark for Video-and-Language Understanding Evaluation	Jun 8, 2021	Multi-Task LearningQuestion Answering	CodeCode Available	1
Check It Again: Progressive Visual Question Answering via Visual Entailment	Jun 8, 2021	Question AnsweringVisual Entailment	CodeCode Available	1
Narrative Question Answering with Cutting-Edge Open-Domain QA Techniques: A Comprehensive Study	Jun 7, 2021	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
Measuring Conversational Uptake: A Case Study on Student-Teacher Interactions	Jun 7, 2021	MathQuestion Answering	CodeCode Available	1
Question Answering Over Temporal Knowledge Graphs	Jun 3, 2021	Knowledge GraphsQuestion Answering	CodeCode Available	1
Can Generative Pre-trained Language Models Serve as Knowledge Bases for Closed-book QA?	Jun 3, 2021	Question Answering	CodeCode Available	1
Syntax-augmented Multilingual BERT for Cross-lingual Transfer	Jun 3, 2021	Cross-Lingual Transfernamed-entity-recognition	CodeCode Available	1
Efficient Passage Retrieval with Hashing for Open-domain Question Answering	Jun 2, 2021	Natural QuestionsOpen-Domain Question Answering	CodeCode Available	1
Knowing More About Questions Can Help: Improving Calibration in Question Answering	Jun 2, 2021	Answer GenerationData Augmentation	CodeCode Available	1
Who Blames or Endorses Whom? Entity-to-Entity Directed Sentiment Extraction in News Text	Jun 2, 2021	Question AnsweringSentiment Analysis	CodeCode Available	1
SPARTQA: A Textual Question Answering Benchmark for Spatial Reasoning	Jun 1, 2021	Question AnsweringSpatial Reasoning	CodeCode Available	1
ConvoSumm: Conversation Summarization Benchmark and Improved Abstractive Summarization with Argument Mining	Jun 1, 2021	Abstractive Text SummarizationArgument Mining	CodeCode Available	1
DeCEMBERT: Learning from Noisy Instructional Videos via Dense Captions and Entropy Minimization	Jun 1, 2021	Question AnsweringRetrieval	CodeCode Available	1
A Semantic-based Method for Unsupervised Commonsense Question Answering	May 31, 2021	Question AnsweringSemantic Similarity	CodeCode Available	1
GeoQA: A Geometric Question Answering Benchmark Towards Multimodal Numerical Reasoning	May 30, 2021	MathMathematical Reasoning	CodeCode Available	1
SciFive: a text-to-text transformer model for biomedical literature	May 28, 2021	Document ClassificationDrug–drug Interaction Extraction	CodeCode Available	1

Show:10 25 50

← PrevPage 36 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified