Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9651–9700 of 10817 papers

Title	Date	Tasks	Status
Learned in Translation: Contextualized Word Vectors	Aug 1, 2017	General ClassificationMachine Translation	CodeCode Available
Learn from Downstream and Be Yourself in Multimodal Large Language Model Fine-Tuning	Nov 17, 2024	Image CaptioningLanguage Modeling	CodeCode Available
BEEDS: Large-Scale Biomedical Event Extraction using Distant Supervision and Question Answering	May 1, 2022	Event ExtractionKnowledge Base Population	CodeCode Available
Learning a Cost-Effective Annotation Policy for Question Answering	Oct 7, 2020	Question Answering	CodeCode Available
Learning Action-Effect Dynamics for Hypothetical Vision-Language Reasoning Task	Dec 7, 2022	DecoderGraph Question Answering	CodeCode Available
Analyzing Social Biases in Japanese Large Language Models	Jun 4, 2024	Question Answering	CodeCode Available
PlainQAFact: Automatic Factuality Evaluation Metric for Biomedical Plain Language Summaries Generation	Mar 11, 2025	Question Answering	CodeCode Available
Learning a Natural Language Interface with Neural Programmer	Nov 28, 2016	Natural Language QueriesProgram induction	CodeCode Available
Comparative Study of Machine Learning Models and BERT on SQuAD	May 22, 2020	BIG-bench Machine LearningQuestion Answering	CodeCode Available
Plan-and-Refine: Diverse and Comprehensive Retrieval-Augmented Generation	Apr 10, 2025	Question AnsweringRetrieval	CodeCode Available
Multi-step Retriever-Reader Interaction for Scalable Open-domain Question Answering	May 14, 2019	Open-Domain Question AnsweringQuestion Answering	CodeCode Available
Compact Trilinear Interaction for Visual Question Answering	Sep 26, 2019	BenchmarkingKnowledge Distillation	CodeCode Available
Question Answering through Transfer Learning from Large Fine-grained Supervision Data	Feb 7, 2017	Question AnsweringTransfer Learning	CodeCode Available
FedQAS: Privacy-aware machine reading comprehension with federated learning	Feb 9, 2022	Conversational Question AnsweringFederated Learning	CodeCode Available
CommVQA: Situating Visual Question Answering in Communicative Contexts	Feb 22, 2024	Question AnsweringVisual Question Answering	CodeCode Available
Multi-Target Embodied Question Answering	Apr 9, 2019	Embodied Question AnsweringNavigate	CodeCode Available
Multi-Task Dense Retrieval via Model Uncertainty Fusion for Open-Domain Question Answering	Nov 1, 2021	ArticlesOpen-Domain Question Answering	CodeCode Available
Retrieval Helps or Hurts? A Deeper Dive into the Efficacy of Retrieval Augmentation to Language Models	Feb 21, 2024	MemorizationQuestion Answering	CodeCode Available
Multi-tasking Dialogue Comprehension with Discourse Parsing	Oct 7, 2021	Discourse ParsingMachine Reading Comprehension	CodeCode Available
Learning by Correction: Efficient Tuning Task for Zero-Shot Generative Vision-Language Reasoning	Apr 1, 2024	Image CaptioningInstruction Following	CodeCode Available
Multi-Task Learning for Conversational Question Answering over a Large-Scale Knowledge Base	Oct 11, 2019	Conversational Question AnsweringMulti-Task Learning	CodeCode Available
Multi-task Learning with Sample Re-weighting for Machine Reading Comprehension	Sep 18, 2018	Machine Reading ComprehensionMachine Translation	CodeCode Available
p-Laplacian Adaptation for Generative Pre-trained Vision-Language Models	Dec 17, 2023	Image CaptioningQuestion Answering	CodeCode Available
Learning Conditioned Graph Structures for Interpretable Visual Question Answering	Jun 19, 2018	Question AnsweringVisual Question Answering	CodeCode Available
BatchPrompt: Accomplish more with less	Sep 1, 2023	8kLanguage Modelling	CodeCode Available
Learning content and context with language bias for Visual Question Answering	Dec 21, 2020	Question AnsweringVisual Question Answering	CodeCode Available
PLATO: Pre-trained Dialogue Generation Model with Discrete Latent Variable	Oct 17, 2019	Conversational Question AnsweringDialogue Generation	CodeCode Available
Multi-Task Learning with Multi-View Attention for Answer Selection and Knowledge Base Question Answering	Dec 6, 2018	Answer SelectionKnowledge Base Question Answering	CodeCode Available
FedNLP: Benchmarking Federated Learning Methods for Natural Language Processing Tasks	Apr 18, 2021	BenchmarkingFederated Learning	CodeCode Available
Plausible Extractive Rationalization through Semi-Supervised Entailment Signal	Feb 13, 2024	Natural Language InferenceQuestion Answering	CodeCode Available
Robust Data Watermarking in Language Models by Injecting Fictitious Knowledge	Mar 6, 2025	Continual PretrainingMemorization	CodeCode Available
MULTITAT: Benchmarking Multilingual Table-and-Text Question Answering	Feb 24, 2025	BenchmarkingQuestion Answering	CodeCode Available
Playing Text-Adventure Games with Graph-Based Deep Reinforcement Learning	Dec 4, 2018	Deep Reinforcement LearningEfficient Exploration	CodeCode Available
FEDMEKI: A Benchmark for Scaling Medical Foundation Models via Federated Knowledge Injection	Aug 17, 2024	Federated LearningMedical Visual Question Answering	CodeCode Available
Federated Document Visual Question Answering: A Pilot Study	May 10, 2024	Federated LearningQuestion Answering	CodeCode Available
Learning Distributed Representations of Texts and Entities from Knowledge Base	May 6, 2017	Entity DisambiguationEntity Linking	CodeCode Available
Learning Efficient and Generalizable Graph Retriever for Knowledge-Graph Question Answering	Jun 11, 2025	Graph Question AnsweringKnowledge Graphs	CodeCode Available
Analyzing Semantic Faithfulness of Language Models via Input Intervention on Question Answering	Dec 21, 2022	Conversational Question AnsweringNegation	CodeCode Available
Reference Free Domain Adaptation for Translation of Noisy Questions with Question Specific Rewards	Oct 23, 2023	Community Question AnsweringDomain Adaptation	CodeCode Available
FAT ALBERT: Finding Answers in Large Texts using Semantic Similarity Attention Layer based on BERT	Aug 22, 2020	Multiple-choiceQuestion Answering	CodeCode Available
Barlow constrained optimization for Visual Question Answering	Mar 7, 2022	Question AnsweringVisual Question Answering	CodeCode Available
BAND: Biomedical Alert News Dataset	May 23, 2023	ArticlesEpidemiology	CodeCode Available
Adopting Two Supervisors for Efficient Use of Large-Scale Remote Deep Neural Networks	Apr 5, 2023	image-classificationImage Classification	CodeCode Available
Fast Reading Comprehension with ConvNets	Nov 12, 2017	Question AnsweringReading Comprehension	CodeCode Available
Plug-and-Play VQA: Zero-shot VQA by Conjoining Large Pretrained Models with Zero Training	Oct 17, 2022	Image CaptioningNetwork Interpretation	CodeCode Available
Fast Linear Model for Knowledge Graph Embeddings	Oct 30, 2017	General ClassificationKnowledge Base Completion	CodeCode Available
Multi-View Graph Representation Learning for Answering Hybrid Numerical Reasoning Question	May 5, 2023	DecoderGraph Representation Learning	CodeCode Available
Learning from Lexical Perturbations for Consistent Visual Question Answering	Nov 26, 2020	Question AnsweringVisual Question Answering	CodeCode Available
Multi-VQG: Generating Engaging Questions for Multiple Images	Nov 14, 2022	Question AnsweringQuestion Generation	CodeCode Available
Community Question Answering Entity Linking via Leveraging Auxiliary Data	May 24, 2022	Community Question AnsweringEntity Linking	CodeCode Available

Show:10 25 50

← PrevPage 194 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified