Video Generation

( Various Video Generation Tasks. Gif credit: MaGViT )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1101–1150 of 1466 papers

Title	Date	Tasks	Status
Improving Dynamic Object Interactions in Text-to-Video Generation with AI Feedback	Dec 3, 2024	ObjectOffline RL	—Unverified
Improving the Diffusability of Autoencoders	Feb 20, 2025	DecoderImage Generation	—Unverified
Improving Video Generation with Human Feedback	Jan 23, 2025	Video Generation	—Unverified
IM-Zero: Instance-level Motion Controllable Video Generation in a Zero-shot Manner	Jan 1, 2025	Motion GenerationText-to-Video Generation	—Unverified
Individual Content and Motion Dynamics Preserved Pruning for Video Diffusion Models	Nov 27, 2024	Model CompressionVideo Generation	—Unverified
Inference Optimization of Foundation Models on AI Accelerators	Jul 12, 2024	Inference OptimizationModel Compression	—Unverified
InfinityDrive: Breaking Time Limits in Driving World Models	Dec 2, 2024	Autonomous DrivingDiversity	—Unverified
Inflation with Diffusion: Efficient Temporal Adaptation for Text-to-Video Super-Resolution	Jan 18, 2024	Super-ResolutionVideo Generation	—Unverified
InMoDeGAN: Interpretable Motion Decomposition Generative Adversarial Network for Video Generation	Jan 8, 2021	Generative Adversarial NetworkVideo Generation	—Unverified
InstanceCap: Improving Text-to-Video Generation via Instance-aware Structured Caption	Dec 12, 2024	Text-to-Video GenerationVideo Generation	—Unverified
Instructional Video Generation	Dec 5, 2024	Video Generation	—Unverified
InstructVideo: Instructing Video Diffusion Models with Human Feedback	Dec 19, 2023	Video Generation	—Unverified
Intelligent Video Editing: Incorporating Modern Talking Face Generation Algorithms in a Video Editor	Oct 16, 2021	Face GenerationTalking Face Generation	—Unverified
Intention-driven Ego-to-Exo Video Generation	Mar 14, 2024	Optical Flow EstimationStereo Matching	—Unverified
Interactive Video Generation via Domain Adaptation	May 30, 2025	AttributeDenoising	—Unverified
InterAnimate: Taming Region-aware Diffusion Model for Realistic Human Interaction Animation	Apr 15, 2025	DenoisingVideo Generation	—Unverified
InterDyn: Controllable Interactive Dynamics with Video Diffusion Models	Dec 16, 2024	Video Generation	—Unverified
InternVid: A Large-scale Video-Text Dataset for Multimodal Understanding and Generation	Jul 13, 2023	Action RecognitionContrastive Learning	—Unverified
Interspatial Attention for Efficient 4D Human Video Generation	May 21, 2025	Video Generation	—Unverified
Investigating Memorization in Video Diffusion Models	Oct 29, 2024	MemorizationVideo Generation	—Unverified
IPO: Iterative Preference Optimization for Text-to-Video Generation	Feb 4, 2025	Large Language ModelText-to-Video Generation	—Unverified
Is Your World Simulator a Good Story Presenter? A Consecutive Events-Based Benchmark for Future Long Video Generation	Dec 17, 2024	Story CompletionVideo Generation	—Unverified
JavisDiT: Joint Audio-Video Diffusion Transformer with Hierarchical Spatio-Temporal Prior Synchronization	Mar 30, 2025	Video Generation	—Unverified
Jointly Harnessing Prior Structures and Temporal Consistency for Sign Language Video Generation	Jul 8, 2022	Image AnimationText Generation	—Unverified
Jointly Trained Image and Video Generation using Residual Vectors	Dec 17, 2019	DisentanglementImage Generation	—Unverified
JointTuner: Appearance-Motion Adaptive Joint Training for Customized Video Generation	Mar 31, 2025	Video Generation	—Unverified
JoyHallo: Digital human model for Mandarin	Sep 20, 2024	modelText Generation	—Unverified
JPEG-LM: LLMs as Image Generators with Canonical Codec Representations	Aug 15, 2024	Image GenerationQuantization	—Unverified
JVID: Joint Video-Image Diffusion for Visual-Quality and Temporal-Consistency in Video Generation	Sep 21, 2024	Video Generation	—Unverified
Koala-36M: A Large-scale Video Dataset Improving Consistency between Fine-grained Conditions and Video Content	Oct 10, 2024	Video AlignmentVideo Generation	—Unverified
Kubrick: Multimodal Agent Collaborations for Synthetic Video Generation	Aug 19, 2024	Instruction FollowingLarge Language Model	—Unverified
Label-Conditioned Next-Frame Video Generation with Neural Flows	Oct 16, 2019	Video Generation	—Unverified
LaMD: Latent Motion Diffusion for Image-Conditional Video Generation	Apr 23, 2023	Motion GenerationVideo Generation	—Unverified
LAMP: Learn A Motion Pattern for Few-Shot Video Generation	Jan 1, 2024	GPUImage Animation	—Unverified
Large Motion Video Autoencoding with Cross-modal Video VAE	Dec 23, 2024	Video Generation	—Unverified
Latent-Reframe: Enabling Camera Control for Video Diffusion Model without Training	Dec 8, 2024	Video Generation	—Unverified
Latent-Shift: Latent Diffusion with Temporal Shift for Efficient Text-to-Video Generation	Apr 17, 2023	Image GenerationSuper-Resolution	—Unverified
LayerAnimate: Layer-specific Control for Animation	Jan 14, 2025	Video Generation	—Unverified
Layered Controllable Video Generation	Nov 24, 2021	Video Generation	—Unverified
Learning Long-Term Style-Preserving Blind Video Temporal Consistency	Mar 12, 2021	Image ManipulationStyle Transfer	—Unverified
Learning Online Scale Transformation for Talking Head Video Generation	Jul 13, 2024	Face ReenactmentVideo Generation	—Unverified
Learning Real-World Action-Video Dynamics with Heterogeneous Masked Autoregression	Feb 6, 2025	Computational EfficiencyVideo Generation	—Unverified
Learnings from Scaling Visual Tokenizers for Reconstruction and Generation	Jan 16, 2025	DecoderImage Generation	—Unverified
Learning Temporally Consistent Video Depth from Video Diffusion Priors	Jun 3, 2024	Depth EstimationNovel View Synthesis	—Unverified
Learning to Deblur and Generate High Frame Rate Video with an Event Camera	Mar 2, 2020	DeblurringVideo Generation	—Unverified
Learning to Generate Videos Using Neural Uncertainty Priors	Jan 1, 2021	DiversityVideo Generation	—Unverified
Learning Universal Policies via Text-Guided Video Generation	Jan 31, 2023	Decision MakingImage Generation	—Unverified
Learning World Models for Interactive Video Generation	May 28, 2025	In-Context LearningRetrieval	—Unverified
Lets Play Music: Audio-driven Performance Video Generation	Nov 5, 2020	Video Generation	—Unverified
LetsTalk: Latent Diffusion Transformer for Talking Video Synthesis	Nov 24, 2024	DiversityImage Animation	—Unverified

Show:10 25 50

← PrevPage 23 of 30Next →

All datasets UCF-101 BAIR Robot Pushing Sky Time-lapse UCF-101 16 frames, 64x64, Unconditional UCF-101 16 frames, Unconditional, Single GPU LAION-400M Taichi UCF-101 16 frames, 128x128, Unconditional Kinetics-600 12 frames, 64x64 How2Sign Kinetics-600 12 frames, 128x128 Kinetics-600 48 frames, 64x64

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MCVD	FVD16	2,460	—	Unverified
2	VDM	FVD16	1,396	—	Unverified
3	TGAN-v2 (128x128)	FVD16	1,209	—	Unverified
4	MCVD (64x64)	FVD16	1,143	—	Unverified
5	MoCoGAN-HD (256x256, unconditional)	FVD16	700	—	Unverified
6	MagicVideo (256x256, text-conditional)	FVD16	699	—	Unverified
7	TATS (256x256)	FVD16	635	—	Unverified
8	FIFO-Diffusion	FVD128	596.64	—	Unverified
9	DIGAN (128x128, unconditional)	FVD16	577	—	Unverified
10	LVDM (256x256, unconditional)	FVD16	552	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN	FVD score	503	—	Unverified
2	Baseline (from LVT)	FVD score	320.9	—	Unverified
3	SVG-FP (from FVD)	FVD score	315.5	—	Unverified
4	CDNA (from FVD)	FVD score	296.5	—	Unverified
5	SV2P (from FVD)	FVD score	262.5	—	Unverified
6	SVG-LP (from vRNN)	FVD score	256.62	—	Unverified
7	WAM	FVD score	159.6	—	Unverified
8	VRNN 1L	FVD score	149.22	—	Unverified
9	SAVP (from vRNN)	FVD score	143.43	—	Unverified
10	Hier-VRNN	FVD score	143.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN-HD (128x128)	FVD 16	183.6	—	Unverified
2	TATS (128x128)	FVD 16	132.6	—	Unverified
3	Long-video GAN (256x256)	FVD 16	116.5	—	Unverified
4	DIGAN (128x128)	FVD 16	114.6	—	Unverified
5	Long-video GAN (128x128)	FVD 16	107.5	—	Unverified
6	LVDM (256x256)	FVD 16	95.2	—	Unverified
7	DDMI	FVD 16	66.25	—	Unverified
8	Latte + LeanVAE	FVD 16	49.59	—	Unverified
9	StyleSV (256x256)	FVD 16	49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Video Diffusion Model	Inception Score	57	—	Unverified
2	TGAN-ODE	Inception Score	15.2	—	Unverified
3	TGAN-F	Inception Score	13.62	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGAN-F	Inception Score	22.91	—	Unverified
2	TGANv2	Inception Score	21.45	—	Unverified
3	TGANv2-ODE	Inception Score	21.02	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Imagen original (constant=6)	CLIP R-Precision	92.12	—	Unverified
2	Imagen fully distilled (oscillate (15,1))	CLIP R-Precision	90.97	—	Unverified
3	Imagen distilled (constant=6)	CLIP R-Precision	90.88	—	Unverified
4	Imagen original (oscillate(15,1))	CLIP R-Precision	89.91	—	Unverified
5	Imagen fully distilled (constant=6)	CLIP R-Precision	89.68	—	Unverified
6	Imagen distilled (oscillate (15,1))	CLIP R-Precision	88.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DIGAN (256x256)	FVD16	156.7	—	Unverified
2	MoCoGAN-HD (128x128)	FVD16	144.7	—	Unverified
3	DIGAN (128x128)	FVD16	128.1	—	Unverified
4	LVDM (256x256)	FVD16	99	—	Unverified
5	TATS (128x128)	FVD16	94.6	—	Unverified
6	StyleSV (256x256)	FVD16	82.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGANv2 (2020)	Inception Score	28.87	—	Unverified
2	DVD-GAN	Inception Score	27.38	—	Unverified
3	VideoGPT	Inception Score	24.69	—	Unverified
4	TGANv2	Inception Score	24.34	—	Unverified
5	TGAN-F	Inception Score	22.91	—	Unverified
6	TGANv2-ODE	Inception Score	21.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FVD	31.1	—	Unverified
2	MAGVIT	FVD	9.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	INR-V	FVD16	144	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	2.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	12.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiT-XL/2 + CVAE-FT-SE	FID	8.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoAssembler (Zero-Shot, 256x256, class-conditional)	FVD16	252	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PG-SWGAN-3D	FID	404.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StyleSV	FVD16	207.2	—	Unverified