Caption Generation

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 310 papers

Title	Date	Tasks	Status
Bi-directional Contextual Attention for 3D Dense Captioning	Aug 13, 2024	3D dense captioningAttribute	—Unverified
Dual-path Collaborative Generation Network for Emotional Video Captioning	Aug 6, 2024	Caption GenerationVideo Captioning	CodeCode Available
XMeCap: Meme Caption Generation with Sub-Image Adaptability	Jul 24, 2024	Caption GenerationMeme Captioning	—Unverified
Continual Panoptic Perception: Towards Multi-modal Incremental Interpretation of Remote Sensing Images	Jul 19, 2024	Caption GenerationContinual Learning	CodeCode Available
Explainable Image Captioning using CNN- CNN architecture and Hierarchical Attention	Jun 28, 2024	Caption GenerationDecoder	—Unverified
Does Object Grounding Really Reduce Hallucination of Large Vision-Language Models?	Jun 20, 2024	Caption GenerationHallucination	—Unverified
Enhancing Cross-Prompt Transferability in Vision-Language Models through Contextual Injection of Target Tokens	Jun 19, 2024	Caption Generationimage-classification	CodeCode Available
Humor in AI: Massive Scale Crowd-Sourced Preferences and Benchmarks for Cartoon Captioning	Jun 15, 2024	Caption Generation	CodeCode Available
DS@BioMed at ImageCLEFmedical Caption 2024: Enhanced Attention Mechanisms in Medical Caption Generation through Concept Detection Integration	Jun 1, 2024	Caption GenerationImage Captioning	—Unverified
Multi-Modal Generative Embedding Model	May 29, 2024	Caption GenerationCross-Modal Retrieval	—Unverified
Less for More: Enhanced Feedback-aligned Mixed LLMs for Molecule Caption Generation and Fine-Grained NLI Evaluation	May 22, 2024	Caption GenerationHallucination	—Unverified
MICap: A Unified Model for Identity-aware Movie Descriptions	May 19, 2024	Caption GenerationDecoder	—Unverified
Visual Fact Checker: Enabling High-Fidelity Detailed Caption Generation	Apr 30, 2024	Caption GenerationHallucination	—Unverified
The Solution for the ICCV 2023 1st Scientific Figure Captioning Challenge	Mar 26, 2024	Caption GenerationImage Captioning	—Unverified
LuoJiaHOG: A Hierarchy Oriented Geo-aware Image Caption Dataset for Remote Sensing Image-Text Retrival	Mar 16, 2024	Caption GenerationImage-text Retrieval	—Unverified
PathM3: A Multimodal Multi-Task Multiple Instance Learning Framework for Whole Slide Image Classification and Captioning	Mar 13, 2024	Caption GenerationDiagnostic	—Unverified
Enhancing Image Caption Generation Using Reinforcement Learning with Human Feedback	Mar 11, 2024	Caption Generationreinforcement-learning	—Unverified
LLMs in Political Science: Heralding a New Era of Visual Analysis	Feb 29, 2024	Caption GenerationFace Identification	—Unverified
Advancing Large Multi-modal Models with Explicit Chain-of-Reasoning and Visual Question Generation	Jan 18, 2024	Caption GenerationLanguage Modeling	—Unverified
Social Media Ready Caption Generation for Brands	Jan 3, 2024	Caption GenerationImage Captioning	—Unverified
BEV-TSR: Text-Scene Retrieval in BEV Space for Autonomous Driving	Jan 2, 2024	Autonomous DrivingCaption Generation	—Unverified
Set Prediction Guided by Semantic Concepts for Diverse Video Captioning	Dec 25, 2023	Caption GenerationDiversity	—Unverified
Automatic Report Generation for Histopathology images using pre-trained Vision Transformers and BERT	Dec 3, 2023	Caption GenerationDecoder	CodeCode Available
Enhancing Image Captioning with Neural Models	Dec 1, 2023	Caption GenerationImage Captioning	—Unverified
IG Captioner: Information Gain Captioners are Strong Zero-shot Classifiers	Nov 27, 2023	Caption GenerationImage-text Retrieval	—Unverified
DECap: Towards Generalized Explicit Caption Editing via Diffusion Mechanism	Nov 25, 2023	Caption GenerationDenoising	—Unverified
Dense Video Captioning: A Survey of Techniques, Datasets and Evaluation Protocols	Nov 5, 2023	Caption GenerationDense Video Captioning	—Unverified
Visual Analytics for Efficient Image Exploration and User-Guided Image Captioning	Nov 2, 2023	Caption GenerationEfficient Exploration	—Unverified
LoHoRavens: A Long-Horizon Language-Conditioned Benchmark for Robotic Tabletop Manipulation	Oct 18, 2023	Caption GenerationInstruction Following	—Unverified
VidCoM: Fast Video Comprehension through Large Language Models with Multimodal Tools	Oct 16, 2023	Caption GenerationDescriptive	—Unverified
ViPE: Visualise Pretty-much Everything	Oct 16, 2023	Caption GenerationFigurative Language Visualization	CodeCode Available
A Comparative Study of Pre-trained CNNs and GRU-Based Attention for Image Caption Generation	Oct 11, 2023	Caption GenerationDecoder	—Unverified
FaceGemma: Enhancing Image Captioning with Facial Attributes for Portrait Images	Sep 24, 2023	AttributeCaption Generation	—Unverified
Auto-ACD: A Large-scale Dataset for Audio-Language Representation Learning	Sep 20, 2023	Audio captioningCaption Generation	—Unverified
ViCo: Engaging Video Comment Generation with Human Preference Rewards	Aug 22, 2023	Caption GenerationComment Generation	—Unverified
FigCaps-HF: A Figure-to-Caption Generative Framework and Benchmark with Human Feedback	Jul 20, 2023	Caption Generation	CodeCode Available
AIC-AB NET: A Neural Network for Image Captioning with Spatial Attention and Text Attributes	Jul 14, 2023	AttributeCaption Generation	—Unverified
Multi-Similarity Contrastive Learning	Jul 6, 2023	Caption GenerationContrastive Learning	—Unverified
Knowledge Distillation for Efficient Audio-Visual Video Captioning	Jun 16, 2023	Audio-Visual Video CaptioningCaption Generation	—Unverified
SciCap+: A Knowledge Augmented Dataset to Study the Challenges of Scientific Figure Captioning	Jun 6, 2023	Caption GenerationImage Captioning	CodeCode Available
CapText: Large Language Model-based Caption Generation From Image Context and Description	Jun 1, 2023	Caption GenerationImage to text	—Unverified
RealignDiff: Boosting Text-to-Image Diffusion Model with Coarse-to-fine Semantic Re-alignment	May 31, 2023	Caption GenerationLanguage Modelling	—Unverified
HAAV: Hierarchical Aggregation of Augmented Views for Image Captioning	May 25, 2023	Caption GenerationDecoder	—Unverified
DiffCap: Exploring Continuous Diffusion on Image Captioning	May 20, 2023	Caption GenerationDiversity	—Unverified
Efficient Audio Captioning Transformer with Patchout and Text Guidance	Apr 6, 2023	Audio captioningCaption Generation	—Unverified
Taming Encoder for Zero Fine-tuning Image Customization with Text-to-Image Diffusion Models	Apr 5, 2023	Caption GenerationImage Generation	—Unverified
Multi-modal reward for visual relationships-based image captioning	Mar 19, 2023	Caption GenerationDeep Reinforcement Learning	—Unverified
GNNFormer: A Graph-based Framework for Cytopathology Report Generation	Mar 17, 2023	Caption GenerationGraph Neural Network	—Unverified
Summaries as Captions: Generating Figure Captions for Scientific Documents with Automated Text Summarization	Feb 23, 2023	Abstractive Text SummarizationCaption Generation	CodeCode Available
Stacked Cross-modal Feature Consolidation Attention Networks for Image Captioning	Feb 8, 2023	Caption GenerationDecoder	—Unverified

Show:10 25 50

← PrevPage 3 of 7Next →

No leaderboard results yet.