SOTAVerified|Agents Browse Leaderboard About

Image Comprehension

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11–20 of 49 papers

Title	Date	Tasks	Status	Hype
New Dataset and Methods for Fine-Grained Compositional Referring Expression Comprehension via Specialist-MLLM Collaboration	Feb 27, 2025	Image ComprehensionReferring Expression	CodeCode Available	1
RSUniVLM: A Unified Vision Language Model for Remote Sensing via Granularity-oriented Mixture of Experts	Dec 7, 2024	Change DetectionImage Comprehension	CodeCode Available	1
FineCops-Ref: A new Dataset and Task for Fine-Grained Compositional Referring Expression Comprehension	Sep 23, 2024	Image ComprehensionReferring Expression	CodeCode Available	1
Paying More Attention to Image: A Training-Free Method for Alleviating Hallucination in LVLMs	Jul 31, 2024	HallucinationImage Comprehension	CodeCode Available	1
RegionBLIP: A Unified Multi-modal Pre-training Framework for Holistic and Regional Comprehension	Aug 3, 2023	Image Comprehension	CodeCode Available	1
ArtGPT-4: Towards Artistic-understanding Large Vision-Language Models with Enhanced Adapter	May 12, 2023	Image ComprehensionLanguage Modelling	CodeCode Available	1
CSVQA: A Chinese Multimodal Benchmark for Evaluating STEM Reasoning Capabilities of VLMs	May 30, 2025	DiagnosticImage Comprehension	—Unverified	0
RGB-Th-Bench: A Dense benchmark for Visual-Thermal Understanding of Vision Language Models	Mar 25, 2025	Image ComprehensionVisual Reasoning	—Unverified	0
RAD: Retrieval-Augmented Decision-Making of Meta-Actions with Vision-Language Models in Autonomous Driving	Mar 18, 2025	Autonomous DrivingDecision Making	—Unverified	0
CMMCoT: Enhancing Complex Multi-Image Comprehension via Multi-Modal Chain-of-Thought and Memory Augmentation	Mar 7, 2025	Image ComprehensionMemorization	—Unverified	0

Show:10 25 50

← PrevPage 2 of 5Next →

No leaderboard results yet.