Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9501–9550 of 10817 papers

Title	Date	Tasks	Status
Gendered Pronoun Resolution using BERT and an extractive question answering formulation	Jun 9, 2019	coreference-resolutionCoreference Resolution	CodeCode Available
Multi-modal Factorized Bilinear Pooling with Co-Attention Learning for Visual Question Answering	Aug 4, 2017	Question AnsweringVisual Question Answering	CodeCode Available
Kvasir-VQA: A Text-Image Pair GI Tract Dataset	Sep 2, 2024	Image CaptioningImage Generation	CodeCode Available
Kvasir-VQA-x1: A Multimodal Dataset for Medical Reasoning and Robust MedVQA in Gastrointestinal Endoscopy	Jun 11, 2025	Medical Visual Question AnsweringQuestion Answering	CodeCode Available
Context Independent Term Mapper for European Languages	Sep 1, 2013	Information RetrievalMachine Translation	CodeCode Available
Gated Orthogonal Recurrent Units: On Learning to Forget	Jun 8, 2017	DenoisingQuestion Answering	CodeCode Available
Recurrent Batch Normalization	Mar 30, 2016	General ClassificationLanguage Modeling	CodeCode Available
Gated End-to-End Memory Networks	Oct 13, 2016	dialog state trackingQuestion Answering	CodeCode Available
KwaiChat: A Large-Scale Video-Driven Multilingual Mixed-Type Dialogue Corpus	Mar 10, 2025	In-Context LearningQuestion Answering	CodeCode Available
Context-Driven Index Trimming: A Data Quality Perspective to Enhancing Precision of RALMs	Aug 10, 2024	Question AnsweringRetrieval	CodeCode Available
Analyzing Vietnamese Legal Questions Using Deep Neural Networks with Biaffine Classifiers	Apr 27, 2023	Dependency ParsingPOS	CodeCode Available
Gated Convolutional Bidirectional Attention-based Model for Off-topic Spoken Response Detection	Apr 20, 2020	Machine Reading ComprehensionQuestion Answering	CodeCode Available
Gated-Attention Readers for Text Comprehension	Jun 5, 2016	Answer SelectionOpen-Domain Question Answering	CodeCode Available
Adversarial Feature Adaptation for Cross-lingual Relation Classification	Aug 1, 2018	ClassificationDomain Adaptation	CodeCode Available
Context-Aware Representations for Knowledge Base Relation Extraction	Sep 1, 2017	Question AnsweringRelation	CodeCode Available
Game of Sketches: Deep Recurrent Models of Pictionary-style Word Guessing	Jan 29, 2018	Question AnsweringVisual Question Answering	CodeCode Available
A Benchmark for Generalizable and Interpretable Temporal Question Answering over Knowledge Bases	Jan 15, 2022	Knowledge Base Question AnsweringQuestion Answering	CodeCode Available
Recurrent Relational Networks	Nov 21, 2017	DiagnosticQuestion Answering	CodeCode Available
Multimodal Hypothetical Summary for Retrieval-based Multi-image Question Answering	Dec 19, 2024	Contrastive LearningLanguage Modeling	CodeCode Available
FusionNet: Fusing via Fully-Aware Attention with Application to Machine Comprehension	Nov 16, 2017	Question AnsweringReading Comprehension	CodeCode Available
Fully Automated Fact Checking Using External Sources	Oct 1, 2017	Community Question AnsweringFact Checking	CodeCode Available
Fully Authentic Visual Question Answering Dataset from Online Communities	Nov 27, 2023	Question AnsweringVisual Question Answering	CodeCode Available
Are Vision LLMs Road-Ready? A Comprehensive Benchmark for Safety-Critical Driving Video Understanding	Apr 20, 2025	Autonomous DrivingImage Captioning	CodeCode Available
Adversarial Examples for Evaluating Reading Comprehension Systems	Jul 23, 2017	Question AnsweringReading Comprehension	CodeCode Available
Adapting Visual Question Answering Models for Enhancing Multimodal Community Q&A Platforms	Aug 29, 2018	Community Question AnsweringGeneral Classification	CodeCode Available
BERT Knows Punta Cana is not just beautiful, it's gorgeous: Ranking Scalar Adjectives with Contextualised Representations	Oct 6, 2020	Natural Language UnderstandingQuestion Answering	CodeCode Available
Context-aware Frame-Semantic Role Labeling	Jan 1, 2015	Question AnsweringScene Generation	CodeCode Available
E-BERT: Efficient-Yet-Effective Entity Embeddings for BERT	Nov 9, 2019	Entity EmbeddingsEntity Linking	CodeCode Available
Language Fusion for Parameter-Efficient Cross-lingual Transfer	Jan 12, 2025	Cross-Lingual TransferNatural Language Inference	CodeCode Available
From Roots to Rewards: Dynamic Tree Reasoning with RL	Jul 17, 2025	Computational EfficiencyQuestion Answering	CodeCode Available
Constraint-Based Question Answering with Knowledge Graph	Dec 1, 2016	Question Answering	CodeCode Available
Multimodal Large Language Models and Tunings: Vision, Language, Sensors, Audio, and Beyond	Oct 8, 2024	Question AnsweringVisual Question Answering	CodeCode Available
From Philosophy to Interfaces: an Explanatory Method and a Tool Inspired by Achinstein's Theory of Explanation	Sep 9, 2021	Explainable Artificial Intelligence (XAI)Knowledge Graphs	CodeCode Available
PersoNER: Persian Named-Entity Recognition	Dec 1, 2016	Machine Translationnamed-entity-recognition	CodeCode Available
Developing PUGG for Polish: A Modern Approach to KBQA, MRC, and IR Dataset Construction	Aug 5, 2024	Information RetrievalKnowledge Base Question Answering	CodeCode Available
Adaptation of Deep Bidirectional Multilingual Transformers for Russian Language	May 17, 2019	Natural Language InferenceParaphrase Identification	CodeCode Available
PEYMA: A Tagged Corpus for Persian Named Entities	Jan 30, 2018	NERQuestion Answering	CodeCode Available
Language Model Knowledge Distillation for Efficient Question Answering in Spanish	Dec 7, 2023	Knowledge DistillationLanguage Modeling	CodeCode Available
BERTHop: An Effective Vision-and-Language Model for Chest X-ray Disease Diagnosis	Aug 10, 2021	Language ModelingLanguage Modelling	CodeCode Available
Language models are better than humans at next-token prediction	Dec 21, 2022	Question Answering	CodeCode Available
Recursive Visual Attention in Visual Dialog	Dec 6, 2018	Question AnsweringVisual Dialog	CodeCode Available
From Models to Microtheories: Distilling a Model's Topical Knowledge for Grounded Question Answering	Dec 23, 2024	Question Answering	CodeCode Available
From Images to Textual Prompts: Zero-shot VQA with Frozen Large Language Models	Dec 21, 2022	Question AnsweringVisual Question Answering	CodeCode Available
From Feature Importance to Natural Language Explanations Using LLMs with RAG	Jul 30, 2024	counterfactualCounterfactual Reasoning	CodeCode Available
Analyzing the Behavior of Visual Question Answering Models	Jun 23, 2016	Question AnsweringVisual Question Answering	CodeCode Available
Consistency Training by Synthetic Question Generation for Conversational Question Answering	Apr 17, 2024	Conversational Question AnsweringData Augmentation	CodeCode Available
Language Models as Knowledge Bases?	Sep 3, 2019	Language ModellingOpen-Domain Question Answering	CodeCode Available
Language Models as Knowledge Bases for Visual Word Sense Disambiguation	Oct 3, 2023	Image CaptioningMultiple-choice	CodeCode Available
From Cloze to Comprehension: Retrofitting Pre-trained Masked Language Model to Pre-trained Machine Reader	Dec 9, 2022	ClassificationExtractive Question-Answering	CodeCode Available
Multimodal Preference Data Synthetic Alignment with Reward Model	Dec 23, 2024	2kCaption Generation	CodeCode Available

Show:10 25 50

← PrevPage 191 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified