Visual Storytelling

( Image credit: No Metrics Are Perfect )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 115 papers

Title	Date	Tasks	Status
VinaBench: Benchmark for Faithful and Consistent Visual Narratives	Mar 26, 2025	Visual Storytelling	—Unverified
MIRAGE: Multimodal Immersive Reasoning and Guided Exploration for Red-Team Jailbreak Attacks	Mar 24, 2025	Visual Storytelling	—Unverified
Toyteller: AI-powered Visual Storytelling Through Toy-Playing with Character Symbols	Jan 23, 2025	Motion GenerationText Generation	—Unverified
Generative Visual Communication in the Era of Vision-Language Models	Nov 27, 2024	Visual Storytelling	—Unverified
A Comprehensive Survey and Guide to Multimodal Large Language Models in Vision-Language Tasks	Nov 9, 2024	Visual Storytelling	—Unverified
KAHANI: Culturally-Nuanced Visual Storytelling Pipeline for Non-Western Cultures	Oct 25, 2024	Story GenerationVisual Storytelling	—Unverified
Multimodal Large Language Models and Tunings: Vision, Language, Sensors, Audio, and Beyond	Oct 8, 2024	Question AnsweringVisual Question Answering	CodeCode Available
Generating Visual Stories with Grounded and Coreferent Characters	Sep 20, 2024	Story GenerationVisual Storytelling	—Unverified
Semantic Alignment for Multimodal Large Language Models	Aug 23, 2024	Large Language ModelVisual Storytelling	—Unverified
Story3D-Agent: Exploring 3D Storytelling Visualization with Large Language Models	Aug 21, 2024	Logical ReasoningMotion Synthesis	—Unverified
Context-aware Visual Storytelling with Visual Prefix Tuning and Contrastive Learning	Aug 12, 2024	Contrastive LearningInformativeness	—Unverified
ContextualStory: Consistent Visual Storytelling with Spatially-Enhanced and Storyline Context	Jul 13, 2024	Image GenerationStory Continuation	CodeCode Available
Not (yet) the whole story: Evaluating Visual Storytelling Requires More than Measuring Coherence, Grounding, and Repetition	Jul 5, 2024	Visual GroundingVisual Storytelling	CodeCode Available
Improving Visual Storytelling with Multimodal Large Language Models	Jul 2, 2024	Visual Storytelling	—Unverified
TARN-VIST: Topic Aware Reinforcement Network for Visual Storytelling	Mar 18, 2024	Image CaptioningVisual Storytelling	—Unverified
AesopAgent: Agent-driven Evolutionary System on Story-to-Video Production	Mar 12, 2024	Image GenerationRAG	—Unverified
Metamorpheus: Interactive, Affective, and Creative Dream Narration Through Metaphorical Visual Storytelling	Mar 1, 2024	ARCVisual Storytelling	—Unverified
SCO-VIST: Social Interaction Commonsense Knowledge-based Visual Storytelling	Feb 1, 2024	DiversityImage Captioning	—Unverified
MagicScroll: Nontypical Aspect-Ratio Image Generation for Visual Storytelling via Multi-Layered Semantic-Aware Denoising	Dec 18, 2023	DenoisingImage Generation	—Unverified
DiffuVST: Narrating Fictional Scenes with Global-History-Guided Denoising Models	Dec 12, 2023	DenoisingDiversity	—Unverified
GROOViST: A Metric for Grounding Objects in Visual Storytelling	Oct 26, 2023	Visual GroundingVisual Storytelling	CodeCode Available
Visual Storytelling with Question-Answer Plans	Oct 8, 2023	Visual Storytelling	—Unverified
Envisioning Narrative Intelligence: A Creative Visual Storytelling Anthology	Oct 6, 2023	Story GenerationVisual Storytelling	CodeCode Available
Comics for Everyone: Generating Accessible Text Descriptions for Comic Strips	Oct 1, 2023	Language ModelingLanguage Modelling	—Unverified
Text-Only Training for Visual Storytelling	Aug 17, 2023	DiversityInformativeness	—Unverified

Show:10 25 50

← PrevPage 2 of 5Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GLAC Net	METEOR	30.14	—	Unverified
2	HEGR	BLEU-4	16.7	—	Unverified
3	HBSG	BLEU-4	15.4	—	Unverified
4	IRW	BLEU-4	15.4	—	Unverified
5	CoVS	BLEU-4	15.2	—	Unverified
6	SGEmb	BLEU-4	14.8	—	Unverified
7	SentiStory	BLEU-4	14.8	—	Unverified
8	SGVST	BLEU-4	14.7	—	Unverified
9	INet	BLEU-4	14.7	—	Unverified
10	TAVST (RL)	BLEU-4	14.6	—	Unverified