SOTAVerified|Agents Browse Leaderboard About Blog

Image Comprehension

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 41–49 of 49 papers

Title	Date	Tasks	Status	Hype
What Large Language Models Bring to Text-rich VQA?	Nov 13, 2023	Image ComprehensionOptical Character Recognition (OCR)	—Unverified	0
On the Performance of Multimodal Language Models	Oct 4, 2023	BenchmarkingBinary Classification	—Unverified	0
InternLM-XComposer: A Vision-Language Large Model for Advanced Text-image Comprehension and Composition	Sep 26, 2023	ArticlesImage Comprehension	CodeCode Available	0
Towards Practical and Efficient Image-to-Speech Captioning with Vision-Language Pre-training and Multi-modal Tokens	Sep 15, 2023	Image ComprehensionLanguage Modeling	—Unverified	0
RegionBLIP: A Unified Multi-modal Pre-training Framework for Holistic and Regional Comprehension	Aug 3, 2023	Image Comprehension	CodeCode Available	1
Hierarchical Open-vocabulary Universal Image Segmentation	Jul 3, 2023	Image ComprehensionImage Segmentation	CodeCode Available	2
JourneyDB: A Benchmark for Generative Image Understanding	Jul 3, 2023	Image CaptioningImage Comprehension	CodeCode Available	2
ArtGPT-4: Towards Artistic-understanding Large Vision-Language Models with Enhanced Adapter	May 12, 2023	Image ComprehensionLanguage Modelling	CodeCode Available	1
An End-to-End OCR Text Re-organization Sequence Learning for Rich-text Detail Image Comprehension	Aug 1, 2020	Decoderglobal-optimization	—Unverified	0

Show:10 25 50

← PrevPage 5 of 5Next →

No leaderboard results yet.