Caption Generation

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 310 papers

Title	Date	Tasks	Status
Sequence to Sequence - Video to Text	Dec 1, 2015	Caption GenerationLanguage Modeling	—Unverified
Set Prediction Guided by Semantic Concepts for Diverse Video Captioning	Dec 25, 2023	Caption GenerationDiversity	—Unverified
Simultaneous Segmentation and Recognition: Towards more accurate Ego Gesture Recognition	Sep 18, 2019	Activity RecognitionCaption Generation	—Unverified
Skip-Gram âˆ’ Zipf + Uniform = Vector Additivity	Jul 1, 2017	Caption GenerationDimensionality Reduction	—Unverified
SLAM-AAC: Enhancing Audio Captioning with Paraphrasing Augmentation and CLAP-Refine through LLMs	Oct 12, 2024	AudioCapsAudio captioning	—Unverified
Social Media Ready Caption Generation for Brands	Jan 3, 2024	Caption GenerationImage Captioning	—Unverified
Soft + Hardwired Attention: An LSTM Framework for Human Trajectory Prediction and Abnormal Event Detection	Feb 18, 2017	Caption GenerationEvent Detection	—Unverified
Spatio-Temporal Dynamics and Semantic Attribute Enriched Visual Encoding for Video Captioning	Feb 27, 2019	AttributeCaption Generation	—Unverified
Stacked Cross-modal Feature Consolidation Attention Networks for Image Captioning	Feb 8, 2023	Caption GenerationDecoder	—Unverified
Stack-VS: Stacked Visual-Semantic Attention for Image Caption Generation	Sep 5, 2019	AttributeCaption Generation	—Unverified
Structural and Functional Decomposition for Personality Image Captioning in a Communication Game	Nov 17, 2020	Caption GenerationImage Captioning	—Unverified
StyleNet: Generating Attractive Visual Captions With Styles	Jul 1, 2017	Caption Generation	—Unverified
Taming Encoder for Zero Fine-tuning Image Customization with Text-to-Image Diffusion Models	Apr 5, 2023	Caption GenerationImage Generation	—Unverified
Temporal Knowledge-Aware Image Captioning	Nov 16, 2021	Caption GenerationImage Captioning	—Unverified
Temporal Object Captioning for Street Scene Videos from LiDAR Tracks	May 22, 2025	Caption GenerationVideo Captioning	—Unverified
THE DCASE 2021 CHALLENGE TASK 6 SYSTEM: AUTOMATED AUDIO CAPTIONING WITH WEAKLY SUPERVISED PRE-TRAING AND WORD SELECTION METHODS	Jul 6, 2021	Audio captioningCaption Generation	—Unverified
The NTT DCASE2020 Challenge Task 6 system: Automated Audio Captioning with Keywords and Sentence Length Estimation	Jul 1, 2020	Audio captioningCaption Generation	—Unverified
The Solution for the ICCV 2023 1st Scientific Figure Captioning Challenge	Mar 26, 2024	Caption GenerationImage Captioning	—Unverified
The Use of Object Labels and Spatial Prepositions as Keywords in a Web-Retrieval-Based Image Caption Generation System	Apr 1, 2017	Caption GenerationImage Retrieval	—Unverified
Time Series Language Model for Descriptive Caption Generation	Jan 3, 2025	Caption GenerationDenoising	—Unverified
TimeSoccer: An End-to-End Multimodal Large Language Model for Soccer Commentary Generation	Apr 24, 2025	Caption GenerationDense Video Captioning	—Unverified
Topic Scene Graph Generation by Attention Distillation From Caption	Jan 1, 2021	Caption GenerationGraph Generation	—Unverified
TPsgtR: Neural-Symbolic Tensor Product Scene-Graph-Triplet Representation for Image Captioning	Nov 22, 2019	Caption GenerationImage Captioning	—Unverified
Uncertainty-Aware Image Captioning	Nov 30, 2022	Caption GenerationImage Captioning	—Unverified
Understanding How Paper Writers Use AI-Generated Captions in Figure Caption Writing	Jan 10, 2025	Caption Generation	—Unverified
Unleashing Text-to-Image Diffusion Prior for Zero-Shot Image Captioning	Dec 31, 2024	Caption GenerationDecoder	—Unverified
Unpaired Cross-lingual Image Caption Generation with Self-Supervised Rewards	Aug 15, 2019	Caption GenerationImage Captioning	—Unverified
UNISON: Unpaired Cross-lingual Image Captioning	Oct 3, 2020	Caption GenerationImage Captioning	—Unverified
ViCo: Engaging Video Comment Generation with Human Preference Rewards	Aug 22, 2023	Caption GenerationComment Generation	—Unverified
Video Caption Dataset for Describing Human Actions in Japanese	Mar 10, 2020	Caption Generation	—Unverified
Video Captioning in Compressed Video	Jan 2, 2021	Caption GenerationVideo Captioning	—Unverified
Video Captioning with Guidance of Multimodal Latent Topics	Aug 31, 2017	Caption GenerationDecoder	—Unverified
Vision-Language Modeling Meets Remote Sensing: Models, Datasets and Perspectives	May 20, 2025	Caption GenerationContrastive Learning	—Unverified
Visual Analytics for Efficient Image Exploration and User-Guided Image Captioning	Nov 2, 2023	Caption GenerationEfficient Exploration	—Unverified
Visual Fact Checker: Enabling High-Fidelity Detailed Caption Generation	Apr 30, 2024	Caption GenerationHallucination	—Unverified
WAT2019: English-Hindi Translation on Hindi Visual Genome Dataset	Nov 1, 2019	Caption GenerationTranslation	—Unverified
Denoising Large-Scale Image Captioning from Alt-text Data using Content Selection Models	Sep 10, 2020	Caption GenerationDenoising	—Unverified
Weakly Supervised Dense Video Captioning via Jointly Usage of Knowledge Distillation and Cross-modal Matching	May 18, 2021	Caption GenerationCross-Modal Retrieval	—Unverified
What is not where: the challenge of integrating spatial representations into deep learning architectures	Jul 21, 2018	Caption GenerationDeep Learning	—Unverified
Word to Sentence Visual Semantic Similarity for Caption Generation: Lessons Learned	Sep 26, 2022	Caption GenerationSemantic Similarity	—Unverified
XMeCap: Meme Caption Generation with Sub-Image Adaptability	Jul 24, 2024	Caption GenerationMeme Captioning	—Unverified
YouMakeup: A Large-Scale Domain-Specific Multimodal Dataset for Fine-Grained Semantic Comprehension	Nov 1, 2019	Caption GenerationQuestion Answering	—Unverified
3G structure for image caption generation	Apr 21, 2019	Caption GenerationSentence	—Unverified
3M: Multi-style image caption generation using Multi-modality features under Multi-UPDOWN model	Mar 20, 2021	Caption GenerationImage Captioning	—Unverified
A Comparative Study of Pre-trained CNNs and GRU-Based Attention for Image Caption Generation	Oct 11, 2023	Caption GenerationDecoder	—Unverified
A Deep Neural Framework for Image Caption Generation Using GRU-Based Attention Mechanism	Mar 3, 2022	Caption GenerationDecoder	—Unverified
Advancing Large Multi-modal Models with Explicit Chain-of-Reasoning and Visual Question Generation	Jan 18, 2024	Caption GenerationLanguage Modeling	—Unverified
AIC-AB NET: A Neural Network for Image Captioning with Spatial Attention and Text Attributes	Jul 14, 2023	AttributeCaption Generation	—Unverified
Auto-ACD: A Large-scale Dataset for Audio-Language Representation Learning	Sep 20, 2023	Audio captioningCaption Generation	—Unverified
Aligning Images and Text with Semantic Role Labels for Fine-Grained Cross-Modal Understanding	Jun 1, 2022	Caption GenerationImage Retrieval	—Unverified

Show:10 25 50

← PrevPage 4 of 7Next →

No leaderboard results yet.