Video Generation

( Various Video Generation Tasks. Gif credit: MaGViT )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 751–800 of 1466 papers

Title	Date	Tasks	Status
T-SVG: Text-Driven Stereoscopic Video Generation	Dec 12, 2024	Depth EstimationText-to-Video Generation	—Unverified
Tuning-Free Long Video Generation via Global-Local Collaborative Diffusion	Jan 8, 2025	DenoisingDiversity	—Unverified
Tuning-Free Noise Rectification for High Fidelity Image-to-Video Generation	Mar 5, 2024	DenoisingImage Animation	—Unverified
Turbo2K: Towards Ultra-Efficient and High-Quality 2K Video Synthesis	Apr 20, 2025	2kKnowledge Distillation	—Unverified
Tutorial on Diffusion Models for Imaging and Vision	Mar 26, 2024	Image GenerationText to Image Generation	—Unverified
TVG: A Training-free Transition Video Generation Method with Diffusion Models	Aug 24, 2024	GPRVideo Generation	—Unverified
UltraVideo: High-Quality UHD Video Dataset with Comprehensive Captions	Jun 16, 2025	4k8k	—Unverified
Unconditional Priors Matter! Improving Conditional Generation of Fine-Tuned Diffusion Models	Mar 26, 2025	Video Generation	—Unverified
Understanding World or Predicting Future? A Comprehensive Survey of World Models	Nov 21, 2024	Autonomous DrivingDecision Making	—Unverified
UniCP: A Unified Caching and Pruning Framework for Efficient Video Generation	Feb 6, 2025	Computational EfficiencyVideo Generation	—Unverified
Unified Dense Prediction of Video Diffusion	Mar 12, 2025	PredictionVideo Generation	—Unverified
Unified Video Action Model	Feb 28, 2025	modelPrediction	—Unverified
UniForm: A Unified Multi-Task Diffusion Transformer for Audio-Video Generation	Feb 6, 2025	Audio GenerationDiversity	—Unverified
UniGeo: Taming Video Diffusion for Unified Consistent Geometry Estimation	May 30, 2025	Video Generation	—Unverified
UniReal: Universal Image Generation and Editing via Learning Real-world Dynamics	Dec 10, 2024	Image GenerationVideo Generation	—Unverified
UniVG: Towards UNIfied-modal Video Generation	Jan 17, 2024	Video Generation	—Unverified
Unlearning Concepts from Text-to-Video Diffusion Models	Jul 19, 2024	Text-to-Video GenerationVideo Generation	—Unverified
Unleashing Generalization of End-to-End Autonomous Driving with Controllable Long Video Generation	Jun 3, 2024	Autonomous DrivingVideo Generation	—Unverified
Unpaired Cartoon Image Synthesis via Gated Cycle Mapping	Jan 1, 2022	Image GenerationVideo Generation	—Unverified
Unsupervised Bi-directional Flow-based Video Generation from one Snapshot	Mar 3, 2019	Video Generation	—Unverified
V3GAN: Decomposing Background, Foreground and Motion for Video Generation	Mar 26, 2022	Generative Adversarial NetworkVideo Generation	—Unverified
VACT: A Video Automatic Causal Testing System and a Benchmark	Mar 8, 2025	Large Language ModelVideo Generation	—Unverified
VAST 1.0: A Unified Framework for Controllable and Consistent Video Generation	Dec 21, 2024	Video Generation	—Unverified
VD3D: Taming Large Video Diffusion Transformers for 3D Camera Control	Jul 17, 2024	Video Generation	—Unverified
VEnhancer: Generative Space-Time Enhancement for Video Generation	Jul 10, 2024	Data AugmentationSuper-Resolution	—Unverified
V-Express: Conditional Dropout for Progressive Training of Portrait Video Generation	Jun 4, 2024	Video Generation	—Unverified
VFRTok: Variable Frame Rates Video Tokenizer with Duration-Proportional Information Assumption	May 17, 2025	DecoderPosition	—Unverified
ViBe: A Text-to-Video Benchmark for Evaluating Hallucination in Large Multimodal Models	Nov 16, 2024	HallucinationVideo Generation	—Unverified
ViBiDSampler: Enhancing Video Interpolation Using Bidirectional Diffusion Sampler	Oct 8, 2024	GPUVideo Generation	—Unverified
ViDA-MAN: Visual Dialog with Digital Humans	Oct 26, 2021	speech-recognitionSpeech Recognition	—Unverified
VidCRAFT3: Camera, Object, and Lighting Control for Image-to-Video Generation	Feb 11, 2025	Image to Video GenerationObject	—Unverified
VideoAnydoor: High-fidelity Video Object Insertion with Precise Motion Control	Jan 2, 2025	Talking Head GenerationVideo Generation	—Unverified
Video as the New Language for Real-World Decision Making	Feb 27, 2024	Decision MakingIn-Context Learning	—Unverified
VideoAuteur: Towards Long Narrative Video Generation	Jan 10, 2025	Video Generation	—Unverified
Video Autoencoder: self-supervised disentanglement of static 3D structure and motion	Oct 6, 2021	Camera Pose EstimationDisentanglement	—Unverified
Video-Bench: Human-Aligned Video Generation Benchmark	Jan 1, 2025	Large Language ModelVideo Generation	—Unverified
VideoBooth: Diffusion-based Video Generation with Image Prompts	Dec 1, 2023	Video Generation	—Unverified
Video Content Swapping Using GAN	Nov 21, 2021	Data AugmentationVideo Generation	—Unverified
Video Creation by Demonstration	Dec 12, 2024	Video Generation	—Unverified
VideoDirectorGPT: Consistent Multi-scene Video Generation via LLM-Guided Planning	Sep 26, 2023	Image GenerationVideo Generation	—Unverified
VideoDPO: Omni-Preference Alignment for Video Diffusion Generation	Dec 18, 2024	Image GenerationText-to-Video Generation	—Unverified
VideoDreamer: Customized Multi-Subject Text-to-Video Generation with Disen-Mix Finetuning	Nov 2, 2023	AttributeText-to-Video Generation	—Unverified
Video Editing via Factorized Diffusion Distillation	Mar 14, 2024	Video EditingVideo Generation	—Unverified
VideoFlow: A Conditional Flow-Based Model for Stochastic Video Generation	Mar 4, 2019	Predict Future Video FramesVideo Generation	—Unverified
VideoGen: A Reference-Guided Latent Diffusion Approach for High Definition Text-to-Video Generation	Sep 1, 2023	DecoderImage Generation	—Unverified
Video Generation Beyond a Single Clip	Apr 15, 2023	Video Generation	—Unverified
Video Generation from Text Employing Latent Path Construction for Temporal Modeling	Jul 29, 2021	Text-to-Video GenerationVideo Generation	—Unverified
Video Generation with Consistency Tuning	Mar 11, 2024	Video Generation	—Unverified
Video Generation with Learned Action Prior	Jun 20, 2024	Image GenerationImage Reconstruction	—Unverified
VideoGen: Generative Modeling of Videos using VQ-VAE and Transformers	Jan 1, 2021	PositionVideo Generation	—Unverified

Show:10 25 50

← PrevPage 16 of 30Next →

All datasets UCF-101 BAIR Robot Pushing Sky Time-lapse UCF-101 16 frames, 64x64, Unconditional UCF-101 16 frames, Unconditional, Single GPU LAION-400M Taichi UCF-101 16 frames, 128x128, Unconditional Kinetics-600 12 frames, 64x64 How2Sign Kinetics-600 12 frames, 128x128 Kinetics-600 48 frames, 64x64

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MCVD	FVD16	2,460	—	Unverified
2	VDM	FVD16	1,396	—	Unverified
3	TGAN-v2 (128x128)	FVD16	1,209	—	Unverified
4	MCVD (64x64)	FVD16	1,143	—	Unverified
5	MoCoGAN-HD (256x256, unconditional)	FVD16	700	—	Unverified
6	MagicVideo (256x256, text-conditional)	FVD16	699	—	Unverified
7	TATS (256x256)	FVD16	635	—	Unverified
8	FIFO-Diffusion	FVD128	596.64	—	Unverified
9	DIGAN (128x128, unconditional)	FVD16	577	—	Unverified
10	LVDM (256x256, unconditional)	FVD16	552	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN	FVD score	503	—	Unverified
2	Baseline (from LVT)	FVD score	320.9	—	Unverified
3	SVG-FP (from FVD)	FVD score	315.5	—	Unverified
4	CDNA (from FVD)	FVD score	296.5	—	Unverified
5	SV2P (from FVD)	FVD score	262.5	—	Unverified
6	SVG-LP (from vRNN)	FVD score	256.62	—	Unverified
7	WAM	FVD score	159.6	—	Unverified
8	VRNN 1L	FVD score	149.22	—	Unverified
9	SAVP (from vRNN)	FVD score	143.43	—	Unverified
10	Hier-VRNN	FVD score	143.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN-HD (128x128)	FVD 16	183.6	—	Unverified
2	TATS (128x128)	FVD 16	132.6	—	Unverified
3	Long-video GAN (256x256)	FVD 16	116.5	—	Unverified
4	DIGAN (128x128)	FVD 16	114.6	—	Unverified
5	Long-video GAN (128x128)	FVD 16	107.5	—	Unverified
6	LVDM (256x256)	FVD 16	95.2	—	Unverified
7	DDMI	FVD 16	66.25	—	Unverified
8	Latte + LeanVAE	FVD 16	49.59	—	Unverified
9	StyleSV (256x256)	FVD 16	49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Video Diffusion Model	Inception Score	57	—	Unverified
2	TGAN-ODE	Inception Score	15.2	—	Unverified
3	TGAN-F	Inception Score	13.62	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGAN-F	Inception Score	22.91	—	Unverified
2	TGANv2	Inception Score	21.45	—	Unverified
3	TGANv2-ODE	Inception Score	21.02	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Imagen original (constant=6)	CLIP R-Precision	92.12	—	Unverified
2	Imagen fully distilled (oscillate (15,1))	CLIP R-Precision	90.97	—	Unverified
3	Imagen distilled (constant=6)	CLIP R-Precision	90.88	—	Unverified
4	Imagen original (oscillate(15,1))	CLIP R-Precision	89.91	—	Unverified
5	Imagen fully distilled (constant=6)	CLIP R-Precision	89.68	—	Unverified
6	Imagen distilled (oscillate (15,1))	CLIP R-Precision	88.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DIGAN (256x256)	FVD16	156.7	—	Unverified
2	MoCoGAN-HD (128x128)	FVD16	144.7	—	Unverified
3	DIGAN (128x128)	FVD16	128.1	—	Unverified
4	LVDM (256x256)	FVD16	99	—	Unverified
5	TATS (128x128)	FVD16	94.6	—	Unverified
6	StyleSV (256x256)	FVD16	82.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGANv2 (2020)	Inception Score	28.87	—	Unverified
2	DVD-GAN	Inception Score	27.38	—	Unverified
3	VideoGPT	Inception Score	24.69	—	Unverified
4	TGANv2	Inception Score	24.34	—	Unverified
5	TGAN-F	Inception Score	22.91	—	Unverified
6	TGANv2-ODE	Inception Score	21.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FVD	31.1	—	Unverified
2	MAGVIT	FVD	9.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	INR-V	FVD16	144	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	2.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	12.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiT-XL/2 + CVAE-FT-SE	FID	8.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoAssembler (Zero-Shot, 256x256, class-conditional)	FVD16	252	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PG-SWGAN-3D	FID	404.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StyleSV	FVD16	207.2	—	Unverified