Caption Generation

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–275 of 310 papers

Title	Date	Tasks	Status
Everything is a Video: Unifying Modalities through Next-Frame Prediction	Nov 15, 2024	Caption GenerationCross-Modal Retrieval	—Unverified
Examining the Effects of Language-and-Vision Data Augmentation for Generation of Descriptions of Human Faces	Jun 1, 2022	Caption GenerationData Augmentation	—Unverified
Explainable Image Captioning using CNN- CNN architecture and Hierarchical Attention	Jun 28, 2024	Caption GenerationDecoder	—Unverified
EzAudio: Enhancing Text-to-Audio Generation with Efficient Diffusion Transformer	Sep 17, 2024	Audio GenerationCaption Generation	—Unverified
FaceGemma: Enhancing Image Captioning with Facial Attributes for Portrait Images	Sep 24, 2023	AttributeCaption Generation	—Unverified
Fast, Diverse and Accurate Image Captioning Guided By Part-of-Speech	May 31, 2018	Caption GenerationDiversity	—Unverified
Fast Image Caption Generation with Position Alignment	Dec 13, 2019	Caption GenerationDecoder	—Unverified
Feature Fusion Effects of Tensor Product Representation on (De)Compositional Network for Caption Generation for Images	Dec 17, 2018	Caption GenerationImage Captioning	—Unverified
Less for More: Enhanced Feedback-aligned Mixed LLMs for Molecule Caption Generation and Fine-Grained NLI Evaluation	May 22, 2024	Caption GenerationHallucination	—Unverified
FE-LWS: Refined Image-Text Representations via Decoder Stacking and Fused Encodings for Remote Sensing Image Captioning	Feb 13, 2025	Caption GenerationDecoder	—Unverified
Fine-Grained Video Captioning through Scene Graph Consolidation	Feb 23, 2025	Caption GenerationImage Captioning	—Unverified
Fusion Models for Improved Visual Captioning	Oct 28, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
GC-KBVQA: A New Four-Stage Framework for Enhancing Knowledge Based Visual Question Answering Performance	May 25, 2025	Caption GenerationQuestion Answering	—Unverified
GEM-VPC: A dual Graph-Enhanced Multimodal integration for Video Paragraph Captioning	Oct 12, 2024	Caption GenerationDecoder	—Unverified
Generating captions without looking beyond objects	Oct 12, 2016	Caption GenerationImage Captioning	—Unverified
Generating Image Captions in Arabic using Root-Word Based Recurrent Neural Networks and Deep Neural Networks	Jun 1, 2018	Caption GenerationImage Captioning	—Unverified
Generating image captions with external encyclopedic knowledge	Oct 10, 2022	Caption GenerationImage Captioning	—Unverified
Generating Video Description using Sequence-to-sequence Model with Temporal Attention	Dec 1, 2016	Caption GenerationSentence	—Unverified
Geo-Aware Image Caption Generation	Dec 1, 2020	Caption GenerationImage Captioning	—Unverified
Geometry-Entangled Visual Semantic Transformer for Image Captioning	Sep 29, 2021	Caption GenerationImage Captioning	—Unverified
GNNFormer: A Graph-based Framework for Cytopathology Report Generation	Mar 17, 2023	Caption GenerationGraph Neural Network	—Unverified
GNN-ViTCap: GNN-Enhanced Multiple Instance Learning with Vision Transformers for Whole Slide Image Classification and Captioning	Jul 9, 2025	Caption GenerationClustering	—Unverified
Goal-driven text descriptions for images	Aug 28, 2021	AI AgentCaption Generation	—Unverified
Grounded Video Caption Generation	Nov 12, 2024	Caption GenerationImage Captioning	—Unverified
Group-based Distinctive Image Captioning with Memory Difference Encoding and Attention	Apr 3, 2025	Caption GenerationContrastive Learning	—Unverified

Show:10 25 50

← PrevPage 11 of 13Next →

No leaderboard results yet.