Video Generation

( Various Video Generation Tasks. Gif credit: MaGViT )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1351–1400 of 1466 papers

Title	Date	Tasks	Status
Transformation-based Adversarial Video Prediction on Large-Scale Data	Mar 9, 2020	PredictionVideo Generation	—Unverified
Transformers for Learning on Noisy and Task-Level Manifolds: Approximation and Generalization Insights	May 6, 2025	Video Generation	—Unverified
Transframer: Arbitrary Frame Prediction with Generative Models	Mar 17, 2022	image-classificationImage Classification	—Unverified
TR-DQ: Time-Rotation Diffusion Quantization	Mar 9, 2025	Image GenerationQuantization	—Unverified
TRIP: Temporal Residual Learning with Image Noise Prior for Image-to-Video Diffusion Models	Mar 25, 2024	Image to Video GenerationRelational Reasoning	—Unverified
T-SVG: Text-Driven Stereoscopic Video Generation	Dec 12, 2024	Depth EstimationText-to-Video Generation	—Unverified
Tuning-Free Long Video Generation via Global-Local Collaborative Diffusion	Jan 8, 2025	DenoisingDiversity	—Unverified
Tuning-Free Noise Rectification for High Fidelity Image-to-Video Generation	Mar 5, 2024	DenoisingImage Animation	—Unverified
Turbo2K: Towards Ultra-Efficient and High-Quality 2K Video Synthesis	Apr 20, 2025	2kKnowledge Distillation	—Unverified
Tutorial on Diffusion Models for Imaging and Vision	Mar 26, 2024	Image GenerationText to Image Generation	—Unverified
TVG: A Training-free Transition Video Generation Method with Diffusion Models	Aug 24, 2024	GPRVideo Generation	—Unverified
UltraVideo: High-Quality UHD Video Dataset with Comprehensive Captions	Jun 16, 2025	4k8k	—Unverified
Unconditional Priors Matter! Improving Conditional Generation of Fine-Tuned Diffusion Models	Mar 26, 2025	Video Generation	—Unverified
Understanding World or Predicting Future? A Comprehensive Survey of World Models	Nov 21, 2024	Autonomous DrivingDecision Making	—Unverified
UniCP: A Unified Caching and Pruning Framework for Efficient Video Generation	Feb 6, 2025	Computational EfficiencyVideo Generation	—Unverified
Unified Dense Prediction of Video Diffusion	Mar 12, 2025	PredictionVideo Generation	—Unverified
Unified Video Action Model	Feb 28, 2025	modelPrediction	—Unverified
Time-Conditioned Generative Modeling of Object-Centric Representations for Video Decomposition and Prediction	Jan 21, 2023	DisentanglementGaussian Processes	CodeCode Available
Train Sparsely, Generate Densely: Memory-efficient Unsupervised Training of High-resolution Temporal GAN	Nov 22, 2018	Generative Adversarial NetworkVideo Generation	CodeCode Available
Frame-wise Conditioning Adaptation for Fine-Tuning Diffusion Models in Text-to-Video Prediction	Mar 17, 2025	Video GenerationVideo Prediction	CodeCode Available
Talking Face Generation by Conditional Recurrent Adversarial Network	Apr 13, 2018	Constrained Lip-synchronizationFace Generation	CodeCode Available
Causally Steered Diffusion for Automated Video Counterfactual Generation	Jun 17, 2025	counterfactualVideo Editing	CodeCode Available
Synthesizing Audio from Silent Video using Sequence to Sequence Modeling	Apr 25, 2024	DecoderDiversity	CodeCode Available
FIND: Fine-tuning Initial Noise Distribution with Policy Optimization for Diffusion Models	Jul 28, 2024	DenoisingVideo Generation	CodeCode Available
Sync-DRAW: Automatic Video Generation using Deep Recurrent Attentive Architectures	Nov 30, 2016	Text-to-Video GenerationVideo Generation	CodeCode Available
G3AN: Disentangling Appearance and Motion for Video Generation	Dec 11, 2019	Video Generation	CodeCode Available
Magic 1-For-1: Generating One Minute Video Clips within One Minute	Feb 11, 2025	Image GenerationImage to Video Generation	CodeCode Available
High Frame Rate Video Reconstruction based on an Event Camera	Mar 12, 2019	Video GenerationVideo Reconstruction	CodeCode Available
Lumos-1: On Autoregressive Video Generation from a Unified Model Perspective	Jul 11, 2025	Video Generation	CodeCode Available
StoryGAN: A Sequential Conditional GAN for Story Visualization	Dec 6, 2018	SentenceStory Visualization	CodeCode Available
Towards Understanding Unsafe Video Generation	Jul 17, 2024	Image GenerationVideo Generation	CodeCode Available
Towards Using Clothes Style Transfer for Scenario-aware Person Video Generation	Oct 14, 2021	DecoderStyle Transfer	CodeCode Available
Stochastic Video Generation with a Learned Prior	Feb 21, 2018	Video GenerationVideo Prediction	CodeCode Available
Lower Dimensional Kernels for Video Discriminators	Dec 18, 2019	GPUVideo Generation	CodeCode Available
Stochastic Talking Face Generation Using Latent Distribution Matching	Nov 21, 2020	Face GenerationTalking Face Generation	CodeCode Available
LIFI: Towards Linguistically Informed Frame Interpolation	Oct 30, 2020	Video Generation	CodeCode Available
Stochastic Adversarial Video Prediction	Apr 4, 2018	PredictionRepresentation Learning	CodeCode Available
Learning to navigate image manifolds induced by generative adversarial networks for unsupervised video generation	Jan 23, 2019	NavigateVideo Generation	CodeCode Available
Learning to Forecast and Refine Residual Motion for Image-to-Video Generation	Jul 26, 2018	Human Pose ForecastingImage to Video Generation	CodeCode Available
Stable Video Diffusion: Scaling Latent Video Diffusion Models to Large Datasets	Nov 25, 2023	Image GenerationImage to Video Generation	CodeCode Available
InfLVG: Reinforce Inference-Time Consistent Long Video Generation with GRPO	May 23, 2025	Text-to-Video GenerationVideo Generation	CodeCode Available
Annotated Biomedical Video Generation using Denoising Diffusion Probabilistic Models and Flow Fields	Mar 26, 2024	Cell SegmentationDenoising	CodeCode Available
Adaptive Appearance Rendering	Apr 24, 2021	DecoderVideo Generation	CodeCode Available
Infinite Nature: Perpetual View Generation of Natural Scenes from a Single Image	Dec 17, 2020	Image GenerationPerpetual View Generation	CodeCode Available
Trans4D: Realistic Geometry-Aware Transition for Compositional Text-to-4D Synthesis	Oct 9, 2024	Video Generation	CodeCode Available
Factorized-Dreamer: Training A High-Quality Video Generator with Limited and Low-Quality Data	Aug 19, 2024	DescriptiveImage to Video Generation	CodeCode Available
3-D PET Image Generation with tumour masks using TGAN	Nov 2, 2021	Image GenerationImage Segmentation	CodeCode Available
Improving Video Generation for Multi-functional Applications	Nov 30, 2017	ColorizationFuture prediction	CodeCode Available
Improved Conditional VRNNs for Video Prediction	Apr 27, 2019	PredictionVideo Generation	CodeCode Available
Source Camera Verification from Strongly Stabilized Videos	Nov 26, 2019	Video Generation	CodeCode Available

Show:10 25 50

← PrevPage 28 of 30Next →

All datasets UCF-101 BAIR Robot Pushing Sky Time-lapse UCF-101 16 frames, 64x64, Unconditional UCF-101 16 frames, Unconditional, Single GPU LAION-400M Taichi UCF-101 16 frames, 128x128, Unconditional Kinetics-600 12 frames, 64x64 How2Sign Kinetics-600 12 frames, 128x128 Kinetics-600 48 frames, 64x64

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MCVD	FVD16	2,460	—	Unverified
2	VDM	FVD16	1,396	—	Unverified
3	TGAN-v2 (128x128)	FVD16	1,209	—	Unverified
4	MCVD (64x64)	FVD16	1,143	—	Unverified
5	MoCoGAN-HD (256x256, unconditional)	FVD16	700	—	Unverified
6	MagicVideo (256x256, text-conditional)	FVD16	699	—	Unverified
7	TATS (256x256)	FVD16	635	—	Unverified
8	FIFO-Diffusion	FVD128	596.64	—	Unverified
9	DIGAN (128x128, unconditional)	FVD16	577	—	Unverified
10	LVDM (256x256, unconditional)	FVD16	552	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN	FVD score	503	—	Unverified
2	Baseline (from LVT)	FVD score	320.9	—	Unverified
3	SVG-FP (from FVD)	FVD score	315.5	—	Unverified
4	CDNA (from FVD)	FVD score	296.5	—	Unverified
5	SV2P (from FVD)	FVD score	262.5	—	Unverified
6	SVG-LP (from vRNN)	FVD score	256.62	—	Unverified
7	WAM	FVD score	159.6	—	Unverified
8	VRNN 1L	FVD score	149.22	—	Unverified
9	SAVP (from vRNN)	FVD score	143.43	—	Unverified
10	Hier-VRNN	FVD score	143.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN-HD (128x128)	FVD 16	183.6	—	Unverified
2	TATS (128x128)	FVD 16	132.6	—	Unverified
3	Long-video GAN (256x256)	FVD 16	116.5	—	Unverified
4	DIGAN (128x128)	FVD 16	114.6	—	Unverified
5	Long-video GAN (128x128)	FVD 16	107.5	—	Unverified
6	LVDM (256x256)	FVD 16	95.2	—	Unverified
7	DDMI	FVD 16	66.25	—	Unverified
8	Latte + LeanVAE	FVD 16	49.59	—	Unverified
9	StyleSV (256x256)	FVD 16	49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Video Diffusion Model	Inception Score	57	—	Unverified
2	TGAN-ODE	Inception Score	15.2	—	Unverified
3	TGAN-F	Inception Score	13.62	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGAN-F	Inception Score	22.91	—	Unverified
2	TGANv2	Inception Score	21.45	—	Unverified
3	TGANv2-ODE	Inception Score	21.02	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Imagen original (constant=6)	CLIP R-Precision	92.12	—	Unverified
2	Imagen fully distilled (oscillate (15,1))	CLIP R-Precision	90.97	—	Unverified
3	Imagen distilled (constant=6)	CLIP R-Precision	90.88	—	Unverified
4	Imagen original (oscillate(15,1))	CLIP R-Precision	89.91	—	Unverified
5	Imagen fully distilled (constant=6)	CLIP R-Precision	89.68	—	Unverified
6	Imagen distilled (oscillate (15,1))	CLIP R-Precision	88.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DIGAN (256x256)	FVD16	156.7	—	Unverified
2	MoCoGAN-HD (128x128)	FVD16	144.7	—	Unverified
3	DIGAN (128x128)	FVD16	128.1	—	Unverified
4	LVDM (256x256)	FVD16	99	—	Unverified
5	TATS (128x128)	FVD16	94.6	—	Unverified
6	StyleSV (256x256)	FVD16	82.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGANv2 (2020)	Inception Score	28.87	—	Unverified
2	DVD-GAN	Inception Score	27.38	—	Unverified
3	VideoGPT	Inception Score	24.69	—	Unverified
4	TGANv2	Inception Score	24.34	—	Unverified
5	TGAN-F	Inception Score	22.91	—	Unverified
6	TGANv2-ODE	Inception Score	21.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FVD	31.1	—	Unverified
2	MAGVIT	FVD	9.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	INR-V	FVD16	144	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	2.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	12.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiT-XL/2 + CVAE-FT-SE	FID	8.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoAssembler (Zero-Shot, 256x256, class-conditional)	FVD16	252	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PG-SWGAN-3D	FID	404.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StyleSV	FVD16	207.2	—	Unverified