Caption Generation

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 310 papers

Title	Date	Tasks	Status	Hype	Score
Betrayed by Captions: Joint Caption Grounding and Generation for Open Vocabulary Instance Segmentation	Jan 2, 2023	Caption GenerationInstance Segmentation	CodeCode Available	1	5
MotionBank: A Large-scale Video Motion Benchmark with Disentangled Rule-based Annotations	Oct 17, 2024	Caption GenerationMotion Generation	CodeCode Available	1	5
EfficientVLM: Fast and Accurate Vision-Language Models via Knowledge Distillation and Modal-adaptive Pruning	Oct 14, 2022	Caption GenerationKnowledge Distillation	CodeCode Available	1	5
GL-RG: Global-Local Representation Granularity for Video Captioning	May 22, 2022	Caption GenerationDescriptive	CodeCode Available	1	5
SwinBERT: End-to-End Transformers with Sparse Attention for Video Captioning	Nov 25, 2021	Caption GenerationQuestion Answering	CodeCode Available	1	5
End-to-End Dense Video Captioning with Parallel Decoding	Aug 17, 2021	Caption GenerationDense Video Captioning	CodeCode Available	1	5
Rethinking Surgical Captioning: End-to-End Window-Based MLP Transformer Using Patches	Jun 30, 2022	Caption GenerationVideo Captioning	CodeCode Available	1	5
Distractors-Immune Representation Learning with Cross-modal Contrastive Regularization for Change Captioning	Jul 16, 2024	Caption Generationcross-modal alignment	CodeCode Available	1	5
Injecting Semantic Concepts into End-to-End Image Captioning	Dec 9, 2021	Caption GenerationImage Captioning	CodeCode Available	1	5
Improving Image Captioning with Better Use of Captions	Jun 21, 2020	Caption GenerationImage Captioning	CodeCode Available	1	5
Large-scale Pre-training for Grounded Video Caption Generation	Mar 13, 2025	Caption Generation	CodeCode Available	1	5
LoVR: A Benchmark for Long Video Retrieval in Multimodal Contexts	May 20, 2025	Caption GenerationRetrieval	CodeCode Available	1	5
HCQA @ Ego4D EgoSchema Challenge 2024	Jun 22, 2024	Caption Generation	CodeCode Available	1	5
Deep Reinforcement Learning For Sequence to Sequence Models	May 24, 2018	Abstractive Text SummarizationCaption Generation	CodeCode Available	1	5
Human-like Controllable Image Captioning with Verb-specific Semantic Roles	Mar 22, 2021	Caption Generationcontrollable image captioning	CodeCode Available	1	5
Microsoft COCO Captions: Data Collection and Evaluation Server	Apr 1, 2015	Caption Generation	CodeCode Available	1	5
Conceptual 12M: Pushing Web-Scale Image-Text Pre-Training To Recognize Long-Tail Visual Concepts	Feb 17, 2021	Caption GenerationDiversity	CodeCode Available	1	5
Connecting What to Say With Where to Look by Modeling Human Attention Traces	May 12, 2021	Caption GenerationImage Captioning	CodeCode Available	1	5
MusiLingo: Bridging Music and Text with Pre-trained Language Models for Music Captioning and Query Response	Sep 15, 2023	Caption GenerationLanguage Modelling	CodeCode Available	1	5
COSMic: A Coherence-Aware Generation Metric for Image Descriptions	Sep 11, 2021	Caption GenerationImage Captioning	CodeCode Available	1	5
Croc: Pretraining Large Multimodal Models with Cross-Modal Comprehension	Oct 18, 2024	Caption Generation	CodeCode Available	1	5
Improving Image Captioning by Leveraging Intra- and Inter-layer Global Representation in Transformer Network	Dec 13, 2020	Caption GenerationDecoder	CodeCode Available	1	5
Say As You Wish: Fine-grained Control of Image Caption Generation with Abstract Scene Graphs	Mar 1, 2020	AttributeCaption Generation	CodeCode Available	1	5
Belief Revision based Caption Re-ranker with Visual Semantic Information	Sep 16, 2022	Caption GenerationImage Captioning	CodeCode Available	1	5
Team RUC_AIM3 Technical Report at ActivityNet 2021: Entities Object Localization	Jun 11, 2021	Caption GenerationObject	CodeCode Available	1	5

Show:10 25 50

← PrevPage 2 of 13Next →

No leaderboard results yet.