Video Generation

( Various Video Generation Tasks. Gif credit: MaGViT )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1251–1300 of 1466 papers

Title	Date	Tasks	Status
Interspatial Attention for Efficient 4D Human Video Generation	May 21, 2025	Video Generation	—Unverified
Investigating Memorization in Video Diffusion Models	Oct 29, 2024	MemorizationVideo Generation	—Unverified
IPO: Iterative Preference Optimization for Text-to-Video Generation	Feb 4, 2025	Large Language ModelText-to-Video Generation	—Unverified
Is Your World Simulator a Good Story Presenter? A Consecutive Events-Based Benchmark for Future Long Video Generation	Dec 17, 2024	Story CompletionVideo Generation	—Unverified
JavisDiT: Joint Audio-Video Diffusion Transformer with Hierarchical Spatio-Temporal Prior Synchronization	Mar 30, 2025	Video Generation	—Unverified
Jointly Harnessing Prior Structures and Temporal Consistency for Sign Language Video Generation	Jul 8, 2022	Image AnimationText Generation	—Unverified
Jointly Trained Image and Video Generation using Residual Vectors	Dec 17, 2019	DisentanglementImage Generation	—Unverified
JointTuner: Appearance-Motion Adaptive Joint Training for Customized Video Generation	Mar 31, 2025	Video Generation	—Unverified
JoyHallo: Digital human model for Mandarin	Sep 20, 2024	modelText Generation	—Unverified
JPEG-LM: LLMs as Image Generators with Canonical Codec Representations	Aug 15, 2024	Image GenerationQuantization	—Unverified
JVID: Joint Video-Image Diffusion for Visual-Quality and Temporal-Consistency in Video Generation	Sep 21, 2024	Video Generation	—Unverified
Koala-36M: A Large-scale Video Dataset Improving Consistency between Fine-grained Conditions and Video Content	Oct 10, 2024	Video AlignmentVideo Generation	—Unverified
Kubrick: Multimodal Agent Collaborations for Synthetic Video Generation	Aug 19, 2024	Instruction FollowingLarge Language Model	—Unverified
Label-Conditioned Next-Frame Video Generation with Neural Flows	Oct 16, 2019	Video Generation	—Unverified
LaMD: Latent Motion Diffusion for Image-Conditional Video Generation	Apr 23, 2023	Motion GenerationVideo Generation	—Unverified
LAMP: Learn A Motion Pattern for Few-Shot Video Generation	Jan 1, 2024	GPUImage Animation	—Unverified
Large Motion Video Autoencoding with Cross-modal Video VAE	Dec 23, 2024	Video Generation	—Unverified
Latent-Reframe: Enabling Camera Control for Video Diffusion Model without Training	Dec 8, 2024	Video Generation	—Unverified
Latent-Shift: Latent Diffusion with Temporal Shift for Efficient Text-to-Video Generation	Apr 17, 2023	Image GenerationSuper-Resolution	—Unverified
LayerAnimate: Layer-specific Control for Animation	Jan 14, 2025	Video Generation	—Unverified
Layered Controllable Video Generation	Nov 24, 2021	Video Generation	—Unverified
Learning Long-Term Style-Preserving Blind Video Temporal Consistency	Mar 12, 2021	Image ManipulationStyle Transfer	—Unverified
Learning Online Scale Transformation for Talking Head Video Generation	Jul 13, 2024	Face ReenactmentVideo Generation	—Unverified
Learning Real-World Action-Video Dynamics with Heterogeneous Masked Autoregression	Feb 6, 2025	Computational EfficiencyVideo Generation	—Unverified
Learnings from Scaling Visual Tokenizers for Reconstruction and Generation	Jan 16, 2025	DecoderImage Generation	—Unverified
Learning Temporally Consistent Video Depth from Video Diffusion Priors	Jun 3, 2024	Depth EstimationNovel View Synthesis	—Unverified
Learning to Deblur and Generate High Frame Rate Video with an Event Camera	Mar 2, 2020	DeblurringVideo Generation	—Unverified
Learning to Generate Videos Using Neural Uncertainty Priors	Jan 1, 2021	DiversityVideo Generation	—Unverified
Learning Universal Policies via Text-Guided Video Generation	Jan 31, 2023	Decision MakingImage Generation	—Unverified
Learning World Models for Interactive Video Generation	May 28, 2025	In-Context LearningRetrieval	—Unverified
Lets Play Music: Audio-driven Performance Video Generation	Nov 5, 2020	Video Generation	—Unverified
LetsTalk: Latent Diffusion Transformer for Talking Video Synthesis	Nov 24, 2024	DiversityImage Animation	—Unverified
Leveraging Pre-Trained Visual Models for AI-Generated Video Detection	Jul 17, 2025	MisinformationVideo Generation	—Unverified
License Plate Images Generation with Diffusion Models	Jan 6, 2025	License Plate RecognitionSynthetic Data Generation	—Unverified
LiftImage3D: Lifting Any Single Image to 3D Gaussians with Video Generation Priors	Dec 12, 2024	3D ReconstructionImage to 3D	—Unverified
LinGen: Towards High-Resolution Minute-Length Text-to-Video Generation with Linear Computational Complexity	Dec 13, 2024	GPUMamba	—Unverified
LipGen: Viseme-Guided Lip Video Generation for Enhancing Visual Speech Recognition	Jan 8, 2025	Lip Readingspeech-recognition	—Unverified
LivePhoto: Real Image Animation with Text-guided Motion Control	Dec 5, 2023	Image AnimationText-to-Video Generation	—Unverified
LLM as an Art Director (LaDi): Using LLMs to improve Text-to-Media Generators	Nov 7, 2023	Image GenerationRetrieval	—Unverified
LLM-based Realistic Safety-Critical Driving Video Generation	Jul 2, 2025	Autonomous DrivingAutonomous Vehicles	—Unverified
LLM-grounded Video Diffusion Models	Sep 29, 2023	Language ModelingLanguage Modelling	—Unverified
LLMPopcorn: An Empirical Study of LLMs as Assistants for Popular Micro-video Generation	Feb 18, 2025	BenchmarkingText Generation	—Unverified
LMP: Leveraging Motion Prior in Zero-Shot Video Generation with Diffusion Transformer	May 20, 2025	Image to Video GenerationVideo Generation	—Unverified
Long Context Tuning for Video Generation	Mar 13, 2025	Video Generation	—Unverified
LongDiff: Training-Free Long Video Generation in One Go	Mar 23, 2025	PositionVideo Generation	—Unverified
LongDWM: Cross-Granularity Distillation for Building a Long-Term Driving World Model	Jun 2, 2025	Video Generation	—Unverified
Long-Term Human Video Generation of Multiple Futures Using Poses	Apr 16, 2019	Autonomous DrivingPose Prediction	—Unverified
Long Video Diffusion Generation with Segmented Cross-Attention and Content-Rich Video Data Curation	Dec 2, 2024	DiversityVideo Generation	—Unverified
Loong: Generating Minute-level Long Videos with Autoregressive Language Models	Oct 3, 2024	Video Generation	—Unverified
LoopAnimate: Loopable Salient Object Animation	Apr 14, 2024	GPUObject	—Unverified

Show:10 25 50

← PrevPage 26 of 30Next →

All datasets UCF-101 BAIR Robot Pushing Sky Time-lapse UCF-101 16 frames, 64x64, Unconditional UCF-101 16 frames, Unconditional, Single GPU LAION-400M Taichi UCF-101 16 frames, 128x128, Unconditional Kinetics-600 12 frames, 64x64 How2Sign Kinetics-600 12 frames, 128x128 Kinetics-600 48 frames, 64x64

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MCVD	FVD16	2,460	—	Unverified
2	VDM	FVD16	1,396	—	Unverified
3	TGAN-v2 (128x128)	FVD16	1,209	—	Unverified
4	MCVD (64x64)	FVD16	1,143	—	Unverified
5	MoCoGAN-HD (256x256, unconditional)	FVD16	700	—	Unverified
6	MagicVideo (256x256, text-conditional)	FVD16	699	—	Unverified
7	TATS (256x256)	FVD16	635	—	Unverified
8	FIFO-Diffusion	FVD128	596.64	—	Unverified
9	DIGAN (128x128, unconditional)	FVD16	577	—	Unverified
10	LVDM (256x256, unconditional)	FVD16	552	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN	FVD score	503	—	Unverified
2	Baseline (from LVT)	FVD score	320.9	—	Unverified
3	SVG-FP (from FVD)	FVD score	315.5	—	Unverified
4	CDNA (from FVD)	FVD score	296.5	—	Unverified
5	SV2P (from FVD)	FVD score	262.5	—	Unverified
6	SVG-LP (from vRNN)	FVD score	256.62	—	Unverified
7	WAM	FVD score	159.6	—	Unverified
8	VRNN 1L	FVD score	149.22	—	Unverified
9	SAVP (from vRNN)	FVD score	143.43	—	Unverified
10	Hier-VRNN	FVD score	143.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN-HD (128x128)	FVD 16	183.6	—	Unverified
2	TATS (128x128)	FVD 16	132.6	—	Unverified
3	Long-video GAN (256x256)	FVD 16	116.5	—	Unverified
4	DIGAN (128x128)	FVD 16	114.6	—	Unverified
5	Long-video GAN (128x128)	FVD 16	107.5	—	Unverified
6	LVDM (256x256)	FVD 16	95.2	—	Unverified
7	DDMI	FVD 16	66.25	—	Unverified
8	Latte + LeanVAE	FVD 16	49.59	—	Unverified
9	StyleSV (256x256)	FVD 16	49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Video Diffusion Model	Inception Score	57	—	Unverified
2	TGAN-ODE	Inception Score	15.2	—	Unverified
3	TGAN-F	Inception Score	13.62	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGAN-F	Inception Score	22.91	—	Unverified
2	TGANv2	Inception Score	21.45	—	Unverified
3	TGANv2-ODE	Inception Score	21.02	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Imagen original (constant=6)	CLIP R-Precision	92.12	—	Unverified
2	Imagen fully distilled (oscillate (15,1))	CLIP R-Precision	90.97	—	Unverified
3	Imagen distilled (constant=6)	CLIP R-Precision	90.88	—	Unverified
4	Imagen original (oscillate(15,1))	CLIP R-Precision	89.91	—	Unverified
5	Imagen fully distilled (constant=6)	CLIP R-Precision	89.68	—	Unverified
6	Imagen distilled (oscillate (15,1))	CLIP R-Precision	88.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DIGAN (256x256)	FVD16	156.7	—	Unverified
2	MoCoGAN-HD (128x128)	FVD16	144.7	—	Unverified
3	DIGAN (128x128)	FVD16	128.1	—	Unverified
4	LVDM (256x256)	FVD16	99	—	Unverified
5	TATS (128x128)	FVD16	94.6	—	Unverified
6	StyleSV (256x256)	FVD16	82.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGANv2 (2020)	Inception Score	28.87	—	Unverified
2	DVD-GAN	Inception Score	27.38	—	Unverified
3	VideoGPT	Inception Score	24.69	—	Unverified
4	TGANv2	Inception Score	24.34	—	Unverified
5	TGAN-F	Inception Score	22.91	—	Unverified
6	TGANv2-ODE	Inception Score	21.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FVD	31.1	—	Unverified
2	MAGVIT	FVD	9.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	INR-V	FVD16	144	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	2.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	12.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiT-XL/2 + CVAE-FT-SE	FID	8.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoAssembler (Zero-Shot, 256x256, class-conditional)	FVD16	252	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PG-SWGAN-3D	FID	404.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StyleSV	FVD16	207.2	—	Unverified