SOTAVerified|Agents Browse Leaderboard About Blog

Caption Generation

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11–20 of 310 papers

Title	Date	Tasks	Status	Hype
LoVR: A Benchmark for Long Video Retrieval in Multimodal Contexts	May 20, 2025	Caption GenerationRetrieval	CodeCode Available	1
Vision-Language Modeling Meets Remote Sensing: Models, Datasets and Perspectives	May 20, 2025	Caption GenerationContrastive Learning	—Unverified	0
VideoMultiAgents: A Multi-Agent Framework for Video Question Answering	Apr 25, 2025	Caption GenerationEgoSchema	CodeCode Available	1
TimeSoccer: An End-to-End Multimodal Large Language Model for Soccer Commentary Generation	Apr 24, 2025	Caption GenerationDense Video Captioning	—Unverified	0
Low-hallucination Synthetic Captions for Large-Scale Vision-Language Model Pre-training	Apr 17, 2025	Caption GenerationHallucination	—Unverified	0
3D CoCa: Contrastive Learners are 3D Captioners	Apr 13, 2025	3D dense captioningCaption Generation	CodeCode Available	0
Group-based Distinctive Image Captioning with Memory Difference Encoding and Attention	Apr 3, 2025	Caption GenerationContrastive Learning	—Unverified	0
Identifying Multi-modal Knowledge Neurons in Pretrained Transformers via Two-stage Filtering	Mar 29, 2025	Caption Generationknowledge editing	—Unverified	0
LaPIG: Cross-Modal Generation of Paired Thermal and Visible Facial Images	Mar 20, 2025	Caption GenerationDiversity	—Unverified	0
Will Pre-Training Ever End? A First Step Toward Next-Generation Foundation MLLMs via Self-Improving Systematic Cognition	Mar 16, 2025	Caption GenerationImage Captioning	CodeCode Available	1

Show:10 25 50

← PrevPage 2 of 31Next →

No leaderboard results yet.