Caption Generation

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 310 papers

Title	Date	Tasks	Status
A Comparative Study of Pre-trained CNNs and GRU-Based Attention for Image Caption Generation	Oct 11, 2023	Caption GenerationDecoder	—Unverified
FaceGemma: Enhancing Image Captioning with Facial Attributes for Portrait Images	Sep 24, 2023	AttributeCaption Generation	—Unverified
Fast, Diverse and Accurate Image Captioning Guided By Part-of-Speech	May 31, 2018	Caption GenerationDiversity	—Unverified
Fast Image Caption Generation with Position Alignment	Dec 13, 2019	Caption GenerationDecoder	—Unverified
Learning a Recurrent Visual Representation for Image Caption Generation	Nov 20, 2014	Caption GenerationImage Retrieval	—Unverified
Less for More: Enhanced Feedback-aligned Mixed LLMs for Molecule Caption Generation and Fine-Grained NLI Evaluation	May 22, 2024	Caption GenerationHallucination	—Unverified
Enhancing Chest X-ray Classification through Knowledge Injection in Cross-Modality Learning	Feb 19, 2025	Caption GenerationClassification	—Unverified
FE-LWS: Refined Image-Text Representations via Decoder Stacking and Fused Encodings for Remote Sensing Image Captioning	Feb 13, 2025	Caption GenerationDecoder	—Unverified
End to End Recognition System for Recognizing Offline Unconstrained Vietnamese Handwriting	May 14, 2019	Caption GenerationDecoder	—Unverified
Fine-Grained Video Captioning through Scene Graph Consolidation	Feb 23, 2025	Caption GenerationImage Captioning	—Unverified
Learning from Massive Human Videos for Universal Humanoid Pose Control	Dec 18, 2024	Caption GenerationHumanoid Control	—Unverified
D3Net: A Unified Speaker-Listener Architecture for 3D Dense Captioning and Visual Grounding	Dec 2, 2021	3D dense captioning3D visual grounding	—Unverified
LLMs in Political Science: Heralding a New Era of Visual Analysis	Feb 29, 2024	Caption GenerationFace Identification	—Unverified
Fusion Models for Improved Visual Captioning	Oct 28, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
GC-KBVQA: A New Four-Stage Framework for Enhancing Knowledge Based Visual Question Answering Performance	May 25, 2025	Caption GenerationQuestion Answering	—Unverified
GEM-VPC: A dual Graph-Enhanced Multimodal integration for Video Paragraph Captioning	Oct 12, 2024	Caption GenerationDecoder	—Unverified
Generating captions without looking beyond objects	Oct 12, 2016	Caption GenerationImage Captioning	—Unverified
Generating Image Captions in Arabic using Root-Word Based Recurrent Neural Networks and Deep Neural Networks	Jun 1, 2018	Caption GenerationImage Captioning	—Unverified
Empirical Analysis of Image Caption Generation using Deep Learning	May 14, 2021	Caption GenerationDecoder	—Unverified
Generating Video Description using Sequence-to-sequence Model with Temporal Attention	Dec 1, 2016	Caption GenerationSentence	—Unverified
E-MMAD: Multimodal Advertising Caption Generation Based on Structured Information	Nov 16, 2021	Caption Generationvalid	—Unverified
Geometry-Entangled Visual Semantic Transformer for Image Captioning	Sep 29, 2021	Caption GenerationImage Captioning	—Unverified
Deep Verifier Networks: Verification of Deep Discriminative Models with Deep Generative Models	Nov 18, 2019	Anomaly DetectionAutonomous Driving	—Unverified
Aligning Images and Text with Semantic Role Labels for Fine-Grained Cross-Modal Understanding	Jun 1, 2022	Caption GenerationImage Retrieval	—Unverified
GNNFormer: A Graph-based Framework for Cytopathology Report Generation	Mar 17, 2023	Caption GenerationGraph Neural Network	—Unverified
GNN-ViTCap: GNN-Enhanced Multiple Instance Learning with Vision Transformers for Whole Slide Image Classification and Captioning	Jul 9, 2025	Caption GenerationClustering	—Unverified
LaPIG: Cross-Modal Generation of Paired Thermal and Visible Facial Images	Mar 20, 2025	Caption GenerationDiversity	—Unverified
Automated Audio Captioning: An Overview of Recent Progress and New Challenges	May 12, 2022	Audio captioningCaption Generation	—Unverified
Knowledge driven Description Synthesis for Floor Plan Interpretation	Mar 15, 2021	Caption GenerationDescriptive	—Unverified
Efficient Audio Captioning Transformer with Patchout and Text Guidance	Apr 6, 2023	Audio captioningCaption Generation	—Unverified
EditInspector: A Benchmark for Evaluation of Text-Guided Image Edits	Jun 11, 2025	Artifact DetectionCaption Generation	—Unverified
Common Subspace for Model and Similarity: Phrase Learning for Caption Generation From Images	Dec 1, 2015	Caption GenerationDescriptive	—Unverified
Language Production Dynamics with Recurrent Neural Networks	Jul 1, 2018	Caption GenerationLanguage Modeling	—Unverified
LoHoRavens: A Long-Horizon Language-Conditioned Benchmark for Robotic Tabletop Manipulation	Oct 18, 2023	Caption GenerationInstruction Following	—Unverified
Clue: Cross-modal Coherence Modeling for Caption Generation	May 2, 2020	Caption Generationcontrollable image captioning	—Unverified
DS@BioMed at ImageCLEFmedical Caption 2024: Enhanced Attention Mechanisms in Medical Caption Generation through Concept Detection Integration	Jun 1, 2024	Caption GenerationImage Captioning	—Unverified
Domain Adaptation for Neural Networks by Parameter Augmentation	Jul 1, 2016	Caption GenerationDomain Adaptation	—Unverified
Do Large Multimodal Models Solve Caption Generation for Scientific Figures? Lessons Learned from SCICAP Challenge 2023	Jan 31, 2025	ArticlesCaption Generation	—Unverified
Does Object Grounding Really Reduce Hallucination of Large Vision-Language Models?	Jun 20, 2024	Caption GenerationHallucination	—Unverified
Image Captioning using Facial Expression and Attention	Aug 8, 2019	Caption GenerationImage Captioning	—Unverified
Attention-based transformer models for image captioning across languages: An in-depth survey and evaluation	Jun 3, 2025	Caption GenerationImage Captioning	—Unverified
Image Caption Generation Framework for Assamese News using Attention Mechanism	Dec 1, 2021	Caption GenerationDecoder	—Unverified
Auto-ACD: A Large-scale Dataset for Audio-Language Representation Learning	Sep 20, 2023	Audio captioningCaption Generation	—Unverified
Image Caption Generation for Low-Resource Assamese Language	Nov 1, 2022	Caption GenerationDecoder	—Unverified
IG Captioner: Information Gain Captioners are Strong Zero-shot Classifiers	Nov 27, 2023	Caption GenerationImage-text Retrieval	—Unverified
Chittron: An Automatic Bangla Image Captioning System	Sep 2, 2018	Caption GenerationImage Captioning	—Unverified
Image to Bengali Caption Generation Using Deep CNN and Bidirectional Gated Recurrent Unit	Dec 22, 2020	Caption GenerationDecoder	—Unverified
Diverse and Accurate Image Description Using a Variational Auto-Encoder with an Additive Gaussian Encoding Space	Nov 19, 2017	Caption GenerationImage Description	—Unverified
Image Captioning with Integrated Bottom-Up and Multi-level Residual Top-Down Attention for Game Scene Understanding	Jun 16, 2019	Caption GenerationImage Captioning	—Unverified
Improving Image Captioning with Better Use of Caption	Jul 1, 2020	Caption GenerationImage Captioning	—Unverified

Show:10 25 50

← PrevPage 3 of 7Next →

No leaderboard results yet.