Caption Generation

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 310 papers

Title	Date	Tasks	Status	Hype
MusiLingo: Bridging Music and Text with Pre-trained Language Models for Music Captioning and Query Response	Sep 15, 2023	Caption GenerationLanguage Modelling	CodeCode Available	1
Vote2Cap-DETR++: Decoupling Localization and Describing for End-to-End 3D Dense Captioning	Sep 6, 2023	3D dense captioningCaption Generation	CodeCode Available	1
ViCo: Engaging Video Comment Generation with Human Preference Rewards	Aug 22, 2023	Caption GenerationComment Generation	—Unverified	0
Music Understanding LLaMA: Advancing Text-to-Music Generation with Question Answering and Captioning	Aug 22, 2023	Caption GenerationLarge Language Model	CodeCode Available	2
Fine-tuning Multimodal LLMs to Follow Zero-shot Demonstrative Instructions	Aug 8, 2023	Caption GenerationImage Captioning	CodeCode Available	2
Transferable Decoding with Visual Entities for Zero-Shot Image Captioning	Jul 31, 2023	Caption GenerationHallucination	CodeCode Available	1
FigCaps-HF: A Figure-to-Caption Generative Framework and Benchmark with Human Feedback	Jul 20, 2023	Caption Generation	CodeCode Available	0
AIC-AB NET: A Neural Network for Image Captioning with Spatial Attention and Text Attributes	Jul 14, 2023	AttributeCaption Generation	—Unverified	0
Multi-Similarity Contrastive Learning	Jul 6, 2023	Caption GenerationContrastive Learning	—Unverified	0
Knowledge Distillation for Efficient Audio-Visual Video Captioning	Jun 16, 2023	Audio-Visual Video CaptioningCaption Generation	—Unverified	0
SciCap+: A Knowledge Augmented Dataset to Study the Challenges of Scientific Figure Captioning	Jun 6, 2023	Caption GenerationImage Captioning	CodeCode Available	0
CapText: Large Language Model-based Caption Generation From Image Context and Description	Jun 1, 2023	Caption GenerationImage to text	—Unverified	0
RealignDiff: Boosting Text-to-Image Diffusion Model with Coarse-to-fine Semantic Re-alignment	May 31, 2023	Caption GenerationLanguage Modelling	—Unverified	0
HAAV: Hierarchical Aggregation of Augmented Views for Image Captioning	May 25, 2023	Caption GenerationDecoder	—Unverified	0
DiffCap: Exploring Continuous Diffusion on Image Captioning	May 20, 2023	Caption GenerationDiversity	—Unverified	0
Efficient Audio Captioning Transformer with Patchout and Text Guidance	Apr 6, 2023	Audio captioningCaption Generation	—Unverified	0
Taming Encoder for Zero Fine-tuning Image Customization with Text-to-Image Diffusion Models	Apr 5, 2023	Caption GenerationImage Generation	—Unverified	0
Multi-modal reward for visual relationships-based image captioning	Mar 19, 2023	Caption GenerationDeep Reinforcement Learning	—Unverified	0
GNNFormer: A Graph-based Framework for Cytopathology Report Generation	Mar 17, 2023	Caption GenerationGraph Neural Network	—Unverified	0
Summaries as Captions: Generating Figure Captions for Scientific Documents with Automated Text Summarization	Feb 23, 2023	Abstractive Text SummarizationCaption Generation	CodeCode Available	0
Stacked Cross-modal Feature Consolidation Attention Networks for Image Captioning	Feb 8, 2023	Caption GenerationDecoder	—Unverified	0
Transform, Contrast and Tell: Coherent Entity-Aware Multi-Image Captioning	Feb 4, 2023	Caption GenerationCoherence Evaluation	CodeCode Available	0
Betrayed by Captions: Joint Caption Grounding and Generation for Open Vocabulary Instance Segmentation	Jan 2, 2023	Caption GenerationInstance Segmentation	CodeCode Available	1
Uncertainty-Aware Image Captioning	Nov 30, 2022	Caption GenerationImage Captioning	—Unverified	0
Retrieval-Augmented Multimodal Language Modeling	Nov 22, 2022	Caption GenerationImage Captioning	—Unverified	0

Show:10 25 50

← PrevPage 5 of 13Next →

No leaderboard results yet.