SOTAVerified|Agents Browse Leaderboard About

Image Comprehension

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 31–40 of 49 papers

Title	Date	Tasks	Status	Hype
FullAnno: A Data Engine for Enhancing Image Comprehension of MLLMs	Sep 20, 2024	Image CaptioningImage Comprehension	—Unverified	0
IW-Bench: Evaluating Large Multimodal Models for Converting Image-to-Web	Sep 14, 2024	Image Comprehension	—Unverified	0
Alleviating Hallucination in Large Vision-Language Models with Active Retrieval Augmentation	Aug 1, 2024	HallucinationImage Comprehension	—Unverified	0
InternLM-XComposer-2.5: A Versatile Large Vision Language Model Supporting Long-Contextual Input and Output	Jul 3, 2024	ArticlesImage Comprehension	CodeCode Available	0
Unveiling Glitches: A Deep Dive into Image Encoding Bugs within CLIP	Jun 30, 2024	HallucinationImage Comprehension	—Unverified	0
VGA: Vision GUI Assistant -- Minimizing Hallucinations through Image-Centric Fine-Tuning	Jun 20, 2024	Image ComprehensionQuestion Answering	CodeCode Available	0
Multiplane Prior Guided Few-Shot Aerial Scene Rendering	Jun 7, 2024	Image ComprehensionNeRF	—Unverified	0
MM-MATH: Advancing Multimodal Math Evaluation with Process Evaluation and Fine-grained Classification	Apr 7, 2024	Image ComprehensionMath	CodeCode Available	0
Rec-GPT4V: Multimodal Recommendation with Large Vision-Language Models	Feb 13, 2024	Image ComprehensionMultimodal Recommendation	—Unverified	0
Muffin or Chihuahua? Challenging Multimodal Large Language Models with Multipanel VQA	Jan 29, 2024	BenchmarkingImage Comprehension	—Unverified	0

Show:10 25 50

← PrevPage 4 of 5Next →

No leaderboard results yet.