Caption Generation

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 126–150 of 310 papers

Title	Date	Tasks	Status
GNN-ViTCap: GNN-Enhanced Multiple Instance Learning with Vision Transformers for Whole Slide Image Classification and Captioning	Jul 9, 2025	Caption GenerationClustering	—Unverified
Generating image captions with external encyclopedic knowledge	Oct 10, 2022	Caption GenerationImage Captioning	—Unverified
Deep Learning Approaches on Image Captioning: A Review	Jan 31, 2022	Caption GenerationDeep Learning	—Unverified
VidCoM: Fast Video Comprehension through Large Language Models with Multimodal Tools	Oct 16, 2023	Caption GenerationDescriptive	—Unverified
End-to-End Video Captioning	Apr 4, 2019	Action RecognitionCaption Generation	—Unverified
Generating Image Captions in Arabic using Root-Word Based Recurrent Neural Networks and Deep Neural Networks	Jun 1, 2018	Caption GenerationImage Captioning	—Unverified
Generating captions without looking beyond objects	Oct 12, 2016	Caption GenerationImage Captioning	—Unverified
GEM-VPC: A dual Graph-Enhanced Multimodal integration for Video Paragraph Captioning	Oct 12, 2024	Caption GenerationDecoder	—Unverified
GC-KBVQA: A New Four-Stage Framework for Enhancing Knowledge Based Visual Question Answering Performance	May 25, 2025	Caption GenerationQuestion Answering	—Unverified
Deep Bayesian Natural Language Processing	Jul 1, 2019	Caption GenerationClustering	—Unverified
Bi-directional Contextual Attention for 3D Dense Captioning	Aug 13, 2024	3D dense captioningAttribute	—Unverified
Fusion Models for Improved Visual Captioning	Oct 28, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
DECap: Towards Generalized Explicit Caption Editing via Diffusion Mechanism	Nov 25, 2023	Caption GenerationDenoising	—Unverified
D3Net: A Unified Speaker-Listener Architecture for 3D Dense Captioning and Visual Grounding	Dec 2, 2021	3D dense captioning3D visual grounding	—Unverified
BEV-TSR: Text-Scene Retrieval in BEV Space for Autonomous Driving	Jan 2, 2024	Autonomous DrivingCaption Generation	—Unverified
An encoder-decoder based framework for hindi image caption generation	Jul 9, 2021	Caption GenerationDecoder	—Unverified
Advancing Large Multi-modal Models with Explicit Chain-of-Reasoning and Visual Question Generation	Jan 18, 2024	Caption GenerationLanguage Modeling	—Unverified
Fine-Grained Video Captioning through Scene Graph Consolidation	Feb 23, 2025	Caption GenerationImage Captioning	—Unverified
Cross-modal Coherence Modeling for Caption Generation	Jul 1, 2020	Caption Generationcontrollable image captioning	—Unverified
FE-LWS: Refined Image-Text Representations via Decoder Stacking and Fused Encodings for Remote Sensing Image Captioning	Feb 13, 2025	Caption GenerationDecoder	—Unverified
Cross-Lingual Image Caption Generation	Aug 1, 2016	Caption GenerationDependency Parsing	—Unverified
Less for More: Enhanced Feedback-aligned Mixed LLMs for Molecule Caption Generation and Fine-Grained NLI Evaluation	May 22, 2024	Caption GenerationHallucination	—Unverified
Feature Fusion Effects of Tensor Product Representation on (De)Compositional Network for Caption Generation for Images	Dec 17, 2018	Caption GenerationImage Captioning	—Unverified
Fast Image Caption Generation with Position Alignment	Dec 13, 2019	Caption GenerationDecoder	—Unverified
Fast, Diverse and Accurate Image Captioning Guided By Part-of-Speech	May 31, 2018	Caption GenerationDiversity	—Unverified

Show:10 25 50

← PrevPage 6 of 13Next →

No leaderboard results yet.