Caption Generation

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 310 papers

Title	Date	Tasks	Status
Structural and Functional Decomposition for Personality Image Captioning in a Communication Game	Nov 17, 2020	Caption GenerationImage Captioning	—Unverified
StyleNet: Generating Attractive Visual Captions With Styles	Jul 1, 2017	Caption Generation	—Unverified
Taming Encoder for Zero Fine-tuning Image Customization with Text-to-Image Diffusion Models	Apr 5, 2023	Caption GenerationImage Generation	—Unverified
Temporal Knowledge-Aware Image Captioning	Nov 16, 2021	Caption GenerationImage Captioning	—Unverified
Temporal Object Captioning for Street Scene Videos from LiDAR Tracks	May 22, 2025	Caption GenerationVideo Captioning	—Unverified
THE DCASE 2021 CHALLENGE TASK 6 SYSTEM: AUTOMATED AUDIO CAPTIONING WITH WEAKLY SUPERVISED PRE-TRAING AND WORD SELECTION METHODS	Jul 6, 2021	Audio captioningCaption Generation	—Unverified
The NTT DCASE2020 Challenge Task 6 system: Automated Audio Captioning with Keywords and Sentence Length Estimation	Jul 1, 2020	Audio captioningCaption Generation	—Unverified
The Solution for the ICCV 2023 1st Scientific Figure Captioning Challenge	Mar 26, 2024	Caption GenerationImage Captioning	—Unverified
The Use of Object Labels and Spatial Prepositions as Keywords in a Web-Retrieval-Based Image Caption Generation System	Apr 1, 2017	Caption GenerationImage Retrieval	—Unverified
Time Series Language Model for Descriptive Caption Generation	Jan 3, 2025	Caption GenerationDenoising	—Unverified
TimeSoccer: An End-to-End Multimodal Large Language Model for Soccer Commentary Generation	Apr 24, 2025	Caption GenerationDense Video Captioning	—Unverified
Topic Scene Graph Generation by Attention Distillation From Caption	Jan 1, 2021	Caption GenerationGraph Generation	—Unverified
TPsgtR: Neural-Symbolic Tensor Product Scene-Graph-Triplet Representation for Image Captioning	Nov 22, 2019	Caption GenerationImage Captioning	—Unverified
Uncertainty-Aware Image Captioning	Nov 30, 2022	Caption GenerationImage Captioning	—Unverified
Understanding How Paper Writers Use AI-Generated Captions in Figure Caption Writing	Jan 10, 2025	Caption Generation	—Unverified
Unleashing Text-to-Image Diffusion Prior for Zero-Shot Image Captioning	Dec 31, 2024	Caption GenerationDecoder	—Unverified
Unpaired Cross-lingual Image Caption Generation with Self-Supervised Rewards	Aug 15, 2019	Caption GenerationImage Captioning	—Unverified
UNISON: Unpaired Cross-lingual Image Captioning	Oct 3, 2020	Caption GenerationImage Captioning	—Unverified
ViCo: Engaging Video Comment Generation with Human Preference Rewards	Aug 22, 2023	Caption GenerationComment Generation	—Unverified
Video Caption Dataset for Describing Human Actions in Japanese	Mar 10, 2020	Caption Generation	—Unverified
Video Captioning in Compressed Video	Jan 2, 2021	Caption GenerationVideo Captioning	—Unverified
Video Captioning with Guidance of Multimodal Latent Topics	Aug 31, 2017	Caption GenerationDecoder	—Unverified
Vision-Language Modeling Meets Remote Sensing: Models, Datasets and Perspectives	May 20, 2025	Caption GenerationContrastive Learning	—Unverified
Visual Analytics for Efficient Image Exploration and User-Guided Image Captioning	Nov 2, 2023	Caption GenerationEfficient Exploration	—Unverified
Visual Fact Checker: Enabling High-Fidelity Detailed Caption Generation	Apr 30, 2024	Caption GenerationHallucination	—Unverified
WAT2019: English-Hindi Translation on Hindi Visual Genome Dataset	Nov 1, 2019	Caption GenerationTranslation	—Unverified
Denoising Large-Scale Image Captioning from Alt-text Data using Content Selection Models	Sep 10, 2020	Caption GenerationDenoising	—Unverified
Weakly Supervised Dense Video Captioning via Jointly Usage of Knowledge Distillation and Cross-modal Matching	May 18, 2021	Caption GenerationCross-Modal Retrieval	—Unverified
What is not where: the challenge of integrating spatial representations into deep learning architectures	Jul 21, 2018	Caption GenerationDeep Learning	—Unverified
Word to Sentence Visual Semantic Similarity for Caption Generation: Lessons Learned	Sep 26, 2022	Caption GenerationSemantic Similarity	—Unverified
XMeCap: Meme Caption Generation with Sub-Image Adaptability	Jul 24, 2024	Caption GenerationMeme Captioning	—Unverified
LoHoRavens: A Long-Horizon Language-Conditioned Benchmark for Robotic Tabletop Manipulation	Oct 18, 2023	Caption GenerationInstruction Following	—Unverified
LongCaptioning: Unlocking the Power of Long Caption Generation in Large Multimodal Models	Feb 21, 2025	Caption GenerationVideo Captioning	—Unverified
Low-hallucination Synthetic Captions for Large-Scale Vision-Language Model Pre-training	Apr 17, 2025	Caption GenerationHallucination	—Unverified
LuoJiaHOG: A Hierarchy Oriented Geo-aware Image Caption Dataset for Remote Sensing Image-Text Retrival	Mar 16, 2024	Caption GenerationImage-text Retrieval	—Unverified
MAGIC: Multimodal relAtional Graph adversarIal inferenCe for Diverse and Unpaired Text-based Image Captioning	Dec 13, 2021	Caption GenerationDescriptive	—Unverified
MAMS: Model-Agnostic Module Selection Framework for Video Captioning	Jan 30, 2025	Caption GenerationVideo Captioning	—Unverified
MAT: A Multimodal Attentive Translator for Image Captioning	Feb 18, 2017	Caption GenerationImage Captioning	—Unverified
Measuring and Mitigating Hallucinations in Vision-Language Dataset Generation for Remote Sensing	Jan 24, 2025	Caption GenerationDataset Generation	—Unverified
Medical Image Captioning via Generative Pretrained Transformers	Sep 28, 2022	Caption GenerationDescriptive	—Unverified
MICap: A Unified Model for Identity-aware Movie Descriptions	May 19, 2024	Caption GenerationDecoder	—Unverified
Mind's Eye: A Recurrent Visual Representation for Image Caption Generation	Jun 1, 2015	Caption GenerationImage Description	—Unverified
Multilingual Image Corpus – Towards a Multimodal and Multilingual Dataset	Jun 1, 2022	Caption Generationimage-classification	—Unverified
Multi-modal Dependency Tree for Video Captioning	Dec 1, 2021	Caption GenerationDependency Parsing	—Unverified
Multi-Modal Generative Embedding Model	May 29, 2024	Caption GenerationCross-Modal Retrieval	—Unverified
Multimodal Intelligence: Representation Learning, Information Fusion, and Applications	Nov 10, 2019	Caption GenerationImage Generation	—Unverified
Multi-modal reward for visual relationships-based image captioning	Mar 19, 2023	Caption GenerationDeep Reinforcement Learning	—Unverified
Multi-Similarity Contrastive Learning	Jul 6, 2023	Caption GenerationContrastive Learning	—Unverified
Multi-task Sequence to Sequence Learning	Nov 19, 2015	Caption GenerationDecoder	—Unverified
Neural Attention Models for Sequence Classification: Analysis and Application to Key Term Extraction and Dialogue Act Detection	Mar 31, 2016	Caption GenerationClassification	—Unverified

Show:10 25 50

← PrevPage 5 of 7Next →

No leaderboard results yet.