SOTAVerified|Agents Browse Leaderboard About Blog

Image Paragraph Captioning

Image paragraph captioning involves generating a detailed, multi-sentence description of the content of an image.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–10 of 17 papers

Title	Date	Tasks	Status	Hype
VLIS: Unimodal Language Models Guide Multimodal Language Generation	Oct 15, 2023	Caption GenerationExplanation Generation	CodeCode Available	1
Enhancing image captioning with depth information using a Transformer-based framework	Jul 24, 2023	Image CaptioningImage Paragraph Captioning	—Unverified	0
Bypass Network for Semantics Driven Image Paragraph Captioning	Jun 21, 2022	Image Paragraph CaptioningSentence	—Unverified	0
Visual Clues: Bridging Vision and Language Foundations for Image Paragraph Captioning	Jun 3, 2022	Image Paragraph CaptioningLanguage Modeling	—Unverified	0
Matching Visual Features to Hierarchical Semantic Topics for Image Paragraph Captioning	May 10, 2021	Image Paragraph CaptioningLanguage Modeling	CodeCode Available	0
When an Image Tells a Story: The Role of Visual and Semantic Information for Generating Paragraph Descriptions	Dec 1, 2020	Image Paragraph CaptioningSentence	—Unverified	0
Interactive Key-Value Memory-augmented Attention for Image Paragraph Captioning	Dec 1, 2020	DecoderImage Paragraph Captioning	—Unverified	0
Hierarchical Scene Graph Encoder-Decoder for Image Paragraph Captioning	Oct 12, 2020	DecoderImage Paragraph Captioning	—Unverified	0
Improving Diversity and Reducing Redundancy in Paragraph Captions	Jul 19, 2020	DecoderDense Captioning	—Unverified	0
Dual-CNN: A Convolutional language decoder for paragraph image captioning	Feb 14, 2020	DecoderDiversity	—Unverified	0

Show:10 25 50

← PrevPage 1 of 2Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	HSGED(SLL)	BLEU-4	11.26	—	Unverified
2	SCST training, w/ rep. penalty	BLEU-4	10.58	—	Unverified
3	IMAP	BLEU-4	10.29	—	Unverified
4	CAE-LSTM	BLEU-4	9.67	—	Unverified
5	Diverse and Coherent Paragraph Generation from Images	BLEU-4	9.43	—	Unverified
6	RTT-GAN (Semi + Fully)	BLEU-4	9.21	—	Unverified
7	Regions-Hierarchical (ours)	BLEU-4	8.69	—	Unverified
8	Dual-CNN	BLEU-4	8.6	—	Unverified
9	Depth-aware Attention Model (DAM)	BLEU-4	6.7	—	Unverified
10	IMG+LNG	BLEU-4	4.67	—	Unverified