Video Generation

( Various Video Generation Tasks. Gif credit: MaGViT )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1201–1250 of 1466 papers

Title	Date	Tasks	Status
MEt3R: Measuring Multi-View Consistency in Generated Images	Jan 10, 2025	Image GenerationVideo Generation	—Unverified
MG-Gen: Single Image to Motion Graphics Generation with Layer Decomposition	Apr 3, 2025	Code GenerationImage to Video Generation	—Unverified
MicroCinema: A Divide-and-Conquer Approach for Text-to-Video Generation	Nov 30, 2023	Image GenerationText to Image Generation	—Unverified
Mimir: Improving Video Diffusion Models for Precise Text Understanding	Dec 4, 2024	DecoderReading Comprehension	—Unverified
Mind the Time: Temporally-Controlled Multi-Event Video Generation	Dec 6, 2024	Video Generation	—Unverified
MinD: Unified Visual Imagination and Control via Hierarchical World Models	Jun 23, 2025	Video GenerationVideo Prediction	—Unverified
MiniMax-Remover: Taming Bad Noise Helps Video Object Removal	May 30, 2025	Video EditingVideo Generation	—Unverified
MJ-VIDEO: Fine-Grained Benchmarking and Rewarding Video Preferences in Video Generation	Feb 3, 2025	BenchmarkingFairness	—Unverified
MobileVidFactory: Automatic Diffusion-Based Social Media Video Generation for Mobile Devices from Text	Jul 31, 2023	Video Generation	—Unverified
MoCha: Towards Movie-Grade Talking Character Synthesis	Mar 30, 2025	Video Generation	—Unverified
Modular-Cam: Modular Dynamic Camera-view Video Generation with LLM	Apr 16, 2025	Large Language ModelText-to-Video Generation	—Unverified
Mojito: Motion Trajectory and Intensity Control for Video Generation	Dec 12, 2024	Computational EfficiencyOptical Flow Estimation	—Unverified
Morpheus: Benchmarking Physical Reasoning of Video Generative Models with Real Physical Experiments	Apr 3, 2025	Physical Commonsense ReasoningVideo Generation	—Unverified
MotionAgent: Fine-grained Controllable Video Generation via Motion Field Agent	Feb 5, 2025	Image to Video GenerationMotion Generation	—Unverified
Motion-Aware Generative Frame Interpolation	Jan 7, 2025	Video Generation	—Unverified
Motion-aware Latent Diffusion Models for Video Frame Interpolation	Apr 21, 2024	Motion EstimationVideo Frame Interpolation	—Unverified
MotionBooth: Motion-Aware Customized Text-to-Video Generation	Jun 25, 2024	Text-to-Video GenerationVideo Generation	—Unverified
MotionBridge: Dynamic Video Inbetweening with Flexible Controls	Dec 17, 2024	Video EditingVideo Generation	—Unverified
MotionCanvas: Cinematic Shot Design with Controllable Image-to-Video Generation	Feb 6, 2025	Image to Video GenerationVideo Editing	—Unverified
MotionCharacter: Identity-Preserving and Motion Controllable Human Video Generation	Nov 27, 2024	AttributeVideo Generation	—Unverified
Motion Control for Enhanced Complex Action Video Generation	Nov 13, 2024	Motion GenerationVideo Generation	—Unverified
Motion-I2V: Consistent and Controllable Image-to-Video Generation with Explicit Motion Modeling	Jan 29, 2024	Image to Video GenerationVideo Generation	—Unverified
MotionMaster: Training-free Camera Motion Transfer For Video Generation	Apr 24, 2024	DisentanglementMotion Disentanglement	—Unverified
Motion Modes: What Could Happen Next?	Nov 29, 2024	DiversityObject	—Unverified
MotionPro: A Precise Motion Controller for Image-to-Video Generation	May 26, 2025	DenoisingImage to Video Generation	—Unverified
Motion Prompting: Controlling Video Generation with Motion Trajectories	Dec 3, 2024	Video Generation	—Unverified
MotionStone: Decoupled Motion Intensity Modulation with Diffusion Transformer for Image-to-Video Generation	Dec 8, 2024	Contrastive LearningImage to Video Generation	—Unverified
MotionZero:Exploiting Motion Priors for Zero-shot Text-to-Video Generation	Nov 28, 2023	DisentanglementText-to-Video Generation	—Unverified
Motion-Zero: Zero-Shot Moving Object Control Framework for Diffusion-Based Video Generation	Jan 18, 2024	DenoisingPosition	—Unverified
MoTrans: Customized Motion Transfer with Text-driven Video Diffusion Models	Dec 2, 2024	Language ModelingLanguage Modelling	—Unverified
MoVideo: Motion-Aware Video Generation with Diffusion Models	Nov 19, 2023	Image GenerationImage to Video Generation	—Unverified
MovieDreamer: Hierarchical Generation for Coherent Long Visual Sequence	Jul 23, 2024	Video Generation	—Unverified
Movie Gen: SWOT Analysis of Meta's Generative AI Foundation Model for Transforming Media Generation, Advertising, and Entertainment Industries	Dec 5, 2024	Video Generation	—Unverified
MOVi: Training-free Text-conditioned Multi-Object Video Generation	May 29, 2025	ObjectVideo Generation	—Unverified
MSC: Multi-Scale Spatio-Temporal Causal Attention for Autoregressive Video Diffusion	Dec 13, 2024	Video Generation	—Unverified
UniForm: A Unified Multi-Task Diffusion Transformer for Audio-Video Generation	Feb 6, 2025	Audio GenerationDiversity	—Unverified
UniGeo: Taming Video Diffusion for Unified Consistent Geometry Estimation	May 30, 2025	Video Generation	—Unverified
UniReal: Universal Image Generation and Editing via Learning Real-world Dynamics	Dec 10, 2024	Image GenerationVideo Generation	—Unverified
UniVG: Towards UNIfied-modal Video Generation	Jan 17, 2024	Video Generation	—Unverified
Unlearning Concepts from Text-to-Video Diffusion Models	Jul 19, 2024	Text-to-Video GenerationVideo Generation	—Unverified
Unleashing Generalization of End-to-End Autonomous Driving with Controllable Long Video Generation	Jun 3, 2024	Autonomous DrivingVideo Generation	—Unverified
Unpaired Cartoon Image Synthesis via Gated Cycle Mapping	Jan 1, 2022	Image GenerationVideo Generation	—Unverified
Unsupervised Bi-directional Flow-based Video Generation from one Snapshot	Mar 3, 2019	Video Generation	—Unverified
V3GAN: Decomposing Background, Foreground and Motion for Video Generation	Mar 26, 2022	Generative Adversarial NetworkVideo Generation	—Unverified
VACT: A Video Automatic Causal Testing System and a Benchmark	Mar 8, 2025	Large Language ModelVideo Generation	—Unverified
VAST 1.0: A Unified Framework for Controllable and Consistent Video Generation	Dec 21, 2024	Video Generation	—Unverified
VD3D: Taming Large Video Diffusion Transformers for 3D Camera Control	Jul 17, 2024	Video Generation	—Unverified
VEnhancer: Generative Space-Time Enhancement for Video Generation	Jul 10, 2024	Data AugmentationSuper-Resolution	—Unverified
V-Express: Conditional Dropout for Progressive Training of Portrait Video Generation	Jun 4, 2024	Video Generation	—Unverified
VFRTok: Variable Frame Rates Video Tokenizer with Duration-Proportional Information Assumption	May 17, 2025	DecoderPosition	—Unverified

Show:10 25 50

← PrevPage 25 of 30Next →

All datasets UCF-101 BAIR Robot Pushing Sky Time-lapse UCF-101 16 frames, 64x64, Unconditional UCF-101 16 frames, Unconditional, Single GPU LAION-400M Taichi UCF-101 16 frames, 128x128, Unconditional Kinetics-600 12 frames, 64x64 How2Sign Kinetics-600 12 frames, 128x128 Kinetics-600 48 frames, 64x64

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MCVD	FVD16	2,460	—	Unverified
2	VDM	FVD16	1,396	—	Unverified
3	TGAN-v2 (128x128)	FVD16	1,209	—	Unverified
4	MCVD (64x64)	FVD16	1,143	—	Unverified
5	MoCoGAN-HD (256x256, unconditional)	FVD16	700	—	Unverified
6	MagicVideo (256x256, text-conditional)	FVD16	699	—	Unverified
7	TATS (256x256)	FVD16	635	—	Unverified
8	FIFO-Diffusion	FVD128	596.64	—	Unverified
9	DIGAN (128x128, unconditional)	FVD16	577	—	Unverified
10	LVDM (256x256, unconditional)	FVD16	552	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN	FVD score	503	—	Unverified
2	Baseline (from LVT)	FVD score	320.9	—	Unverified
3	SVG-FP (from FVD)	FVD score	315.5	—	Unverified
4	CDNA (from FVD)	FVD score	296.5	—	Unverified
5	SV2P (from FVD)	FVD score	262.5	—	Unverified
6	SVG-LP (from vRNN)	FVD score	256.62	—	Unverified
7	WAM	FVD score	159.6	—	Unverified
8	VRNN 1L	FVD score	149.22	—	Unverified
9	SAVP (from vRNN)	FVD score	143.43	—	Unverified
10	Hier-VRNN	FVD score	143.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN-HD (128x128)	FVD 16	183.6	—	Unverified
2	TATS (128x128)	FVD 16	132.6	—	Unverified
3	Long-video GAN (256x256)	FVD 16	116.5	—	Unverified
4	DIGAN (128x128)	FVD 16	114.6	—	Unverified
5	Long-video GAN (128x128)	FVD 16	107.5	—	Unverified
6	LVDM (256x256)	FVD 16	95.2	—	Unverified
7	DDMI	FVD 16	66.25	—	Unverified
8	Latte + LeanVAE	FVD 16	49.59	—	Unverified
9	StyleSV (256x256)	FVD 16	49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Video Diffusion Model	Inception Score	57	—	Unverified
2	TGAN-ODE	Inception Score	15.2	—	Unverified
3	TGAN-F	Inception Score	13.62	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGAN-F	Inception Score	22.91	—	Unverified
2	TGANv2	Inception Score	21.45	—	Unverified
3	TGANv2-ODE	Inception Score	21.02	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Imagen original (constant=6)	CLIP R-Precision	92.12	—	Unverified
2	Imagen fully distilled (oscillate (15,1))	CLIP R-Precision	90.97	—	Unverified
3	Imagen distilled (constant=6)	CLIP R-Precision	90.88	—	Unverified
4	Imagen original (oscillate(15,1))	CLIP R-Precision	89.91	—	Unverified
5	Imagen fully distilled (constant=6)	CLIP R-Precision	89.68	—	Unverified
6	Imagen distilled (oscillate (15,1))	CLIP R-Precision	88.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DIGAN (256x256)	FVD16	156.7	—	Unverified
2	MoCoGAN-HD (128x128)	FVD16	144.7	—	Unverified
3	DIGAN (128x128)	FVD16	128.1	—	Unverified
4	LVDM (256x256)	FVD16	99	—	Unverified
5	TATS (128x128)	FVD16	94.6	—	Unverified
6	StyleSV (256x256)	FVD16	82.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGANv2 (2020)	Inception Score	28.87	—	Unverified
2	DVD-GAN	Inception Score	27.38	—	Unverified
3	VideoGPT	Inception Score	24.69	—	Unverified
4	TGANv2	Inception Score	24.34	—	Unverified
5	TGAN-F	Inception Score	22.91	—	Unverified
6	TGANv2-ODE	Inception Score	21.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FVD	31.1	—	Unverified
2	MAGVIT	FVD	9.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	INR-V	FVD16	144	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	2.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	12.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiT-XL/2 + CVAE-FT-SE	FID	8.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoAssembler (Zero-Shot, 256x256, class-conditional)	FVD16	252	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PG-SWGAN-3D	FID	404.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StyleSV	FVD16	207.2	—	Unverified