Caption Generation

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 126–150 of 310 papers

Title	Date	Tasks	Status
GNN-ViTCap: GNN-Enhanced Multiple Instance Learning with Vision Transformers for Whole Slide Image Classification and Captioning	Jul 9, 2025	Caption GenerationClustering	—Unverified
LaPIG: Cross-Modal Generation of Paired Thermal and Visible Facial Images	Mar 20, 2025	Caption GenerationDiversity	—Unverified
Automated Audio Captioning: An Overview of Recent Progress and New Challenges	May 12, 2022	Audio captioningCaption Generation	—Unverified
Knowledge driven Description Synthesis for Floor Plan Interpretation	Mar 15, 2021	Caption GenerationDescriptive	—Unverified
Efficient Audio Captioning Transformer with Patchout and Text Guidance	Apr 6, 2023	Audio captioningCaption Generation	—Unverified
EditInspector: A Benchmark for Evaluation of Text-Guided Image Edits	Jun 11, 2025	Artifact DetectionCaption Generation	—Unverified
Common Subspace for Model and Similarity: Phrase Learning for Caption Generation From Images	Dec 1, 2015	Caption GenerationDescriptive	—Unverified
Language Production Dynamics with Recurrent Neural Networks	Jul 1, 2018	Caption GenerationLanguage Modeling	—Unverified
LoHoRavens: A Long-Horizon Language-Conditioned Benchmark for Robotic Tabletop Manipulation	Oct 18, 2023	Caption GenerationInstruction Following	—Unverified
Clue: Cross-modal Coherence Modeling for Caption Generation	May 2, 2020	Caption Generationcontrollable image captioning	—Unverified
DS@BioMed at ImageCLEFmedical Caption 2024: Enhanced Attention Mechanisms in Medical Caption Generation through Concept Detection Integration	Jun 1, 2024	Caption GenerationImage Captioning	—Unverified
Domain Adaptation for Neural Networks by Parameter Augmentation	Jul 1, 2016	Caption GenerationDomain Adaptation	—Unverified
Do Large Multimodal Models Solve Caption Generation for Scientific Figures? Lessons Learned from SCICAP Challenge 2023	Jan 31, 2025	ArticlesCaption Generation	—Unverified
Does Object Grounding Really Reduce Hallucination of Large Vision-Language Models?	Jun 20, 2024	Caption GenerationHallucination	—Unverified
Image Captioning using Facial Expression and Attention	Aug 8, 2019	Caption GenerationImage Captioning	—Unverified
Attention-based transformer models for image captioning across languages: An in-depth survey and evaluation	Jun 3, 2025	Caption GenerationImage Captioning	—Unverified
Image Caption Generation Framework for Assamese News using Attention Mechanism	Dec 1, 2021	Caption GenerationDecoder	—Unverified
Auto-ACD: A Large-scale Dataset for Audio-Language Representation Learning	Sep 20, 2023	Audio captioningCaption Generation	—Unverified
Image Caption Generation for Low-Resource Assamese Language	Nov 1, 2022	Caption GenerationDecoder	—Unverified
IG Captioner: Information Gain Captioners are Strong Zero-shot Classifiers	Nov 27, 2023	Caption GenerationImage-text Retrieval	—Unverified
Chittron: An Automatic Bangla Image Captioning System	Sep 2, 2018	Caption GenerationImage Captioning	—Unverified
Image to Bengali Caption Generation Using Deep CNN and Bidirectional Gated Recurrent Unit	Dec 22, 2020	Caption GenerationDecoder	—Unverified
Diverse and Accurate Image Description Using a Variational Auto-Encoder with an Additive Gaussian Encoding Space	Nov 19, 2017	Caption GenerationImage Description	—Unverified
Image Captioning with Integrated Bottom-Up and Multi-level Residual Top-Down Attention for Game Scene Understanding	Jun 16, 2019	Caption GenerationImage Captioning	—Unverified
Improving Image Captioning with Better Use of Caption	Jul 1, 2020	Caption GenerationImage Captioning	—Unverified

Show:10 25 50

← PrevPage 6 of 13Next →

No leaderboard results yet.