Medical Visual Question Answering

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 97 papers

Title	Date	Tasks	Status	Hype	Score
MC-CoT: A Modular Collaborative CoT Framework for Zero-shot Medical-VQA with LLM and MLLM Integration	Oct 6, 2024	Medical Visual Question AnsweringQuestion Answering	CodeCode Available	1	5
MedAgentBoard: Benchmarking Multi-Agent Collaboration with Conventional Methods for Diverse Medical Tasks	May 18, 2025	BenchmarkingMedical Visual Question Answering	CodeCode Available	1	5
Worse than Random? An Embarrassingly Simple Probing Evaluation of Large Multimodal Models in Medical VQA	May 30, 2024	DiagnosticMedical Diagnosis	CodeCode Available	1	5
MedCoT: Medical Chain of Thought via Hierarchical Expert	Dec 18, 2024	DiagnosticMedical Visual Question Answering	CodeCode Available	1	5
PMC-VQA: Visual Instruction Tuning for Medical Visual Question Answering	May 17, 2023	BenchmarkingDiagnostic	CodeCode Available	1	5
Gemini Goes to Med School: Exploring the Capabilities of Multimodal Large Language Models on Medical Challenge Problems & Hallucinations	Feb 10, 2024	DiagnosticHallucination	CodeCode Available	1	5
A Survey of Medical Vision-and-Language Applications and Their Techniques	Nov 19, 2024	Decision MakingDiagnostic	CodeCode Available	1	5
Rad-ReStruct: A Novel VQA Benchmark and Method for Structured Radiology Reporting	Jul 11, 2023	Medical Visual Question AnsweringQuestion Answering	CodeCode Available	1	5
Self-supervised vision-language pretraining for Medical visual question answering	Nov 24, 2022	Contrastive LearningImage-text matching	CodeCode Available	1	5
SLAKE: A Semantically-Labeled Knowledge-Enhanced Dataset for Medical Visual Question Answering	Feb 18, 2021	Medical Visual Question AnsweringQuestion Answering	CodeCode Available	1	5
STLLaVA-Med: Self-Training Large Language and Vision Assistant for Medical Question-Answering	Jun 28, 2024	Medical DiagnosisMedical Question Answering	CodeCode Available	1	5
Surgical-VQLA++: Adversarial Contrastive Learning for Calibrated Robust Visual Question-Localized Answering in Robotic Surgery	Aug 9, 2024	Contrastive LearningMedical Visual Question Answering	CodeCode Available	1	5
Towards Medical Artificial General Intelligence via Knowledge-Enhanced Multimodal Pretraining	Apr 26, 2023	cross-modal alignmentMedical Visual Question Answering	CodeCode Available	1	5
ClinKD: Cross-Modal Clinical Knowledge Distiller For Multi-Task Medical Images	Feb 9, 2025	Clinical KnowledgeMedical Visual Question Answering	CodeCode Available	0	5
Targeted Visual Prompting for Medical Visual Question Answering	Aug 6, 2024	Medical Visual Question AnsweringQuestion Answering	CodeCode Available	0	5
FEDMEKI: A Benchmark for Scaling Medical Foundation Models via Federated Knowledge Injection	Aug 17, 2024	Federated LearningMedical Visual Question Answering	CodeCode Available	0	5
A Dual-Attention Learning Network with Word and Sentence Embedding for Medical Visual Question Answering	Oct 1, 2022	Medical Visual Question AnsweringQuestion Answering	CodeCode Available	0	5
Med-PMC: Medical Personalized Multi-modal Consultation with a Proactive Ask-First-Observe-Next Paradigm	Aug 16, 2024	Decision MakingMedical Visual Question Answering	CodeCode Available	0	5
Hallucination Benchmark in Medical Visual Question Answering	Jan 11, 2024	HallucinationMedical Visual Question Answering	CodeCode Available	0	5
Hierarchical Deep Multi-modal Network for Medical Visual Question Answering	Sep 27, 2020	DescriptiveMedical Visual Question Answering	CodeCode Available	0	5
Kvasir-VQA: A Text-Image Pair GI Tract Dataset	Sep 2, 2024	Image CaptioningImage Generation	CodeCode Available	0	5
Kvasir-VQA-x1: A Multimodal Dataset for Medical Reasoning and Robust MedVQA in Gastrointestinal Endoscopy	Jun 11, 2025	Medical Visual Question AnsweringQuestion Answering	CodeCode Available	0	5
WangLab at MEDIQA-M3G 2024: Multimodal Medical Answer Generation using Large Language Models	Apr 22, 2024	Answer Generationimage-classification	—Unverified	0	0
Which Client is Reliable?: A Reliable and Personalized Prompt-based Federated Learning for Medical Image Question Answering	Oct 23, 2024	Federated LearningMedical Visual Question Answering	—Unverified	0	0
Does CLIP Benefit Visual Question Answering in the Medical Domain as Much as it Does in the General Domain?	Dec 27, 2021	ArticlesMedical Visual Question Answering	—Unverified	0	0

Show:10 25 50

← PrevPage 2 of 4Next →

No leaderboard results yet.