Video Generation

( Various Video Generation Tasks. Gif credit: MaGViT )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1301–1350 of 1466 papers

Title	Date	Tasks	Status
Loopy: Taming Audio-Driven Portrait Avatar with Long-Term Motion Dependency	Sep 4, 2024	Video Generation	—Unverified
LoViC: Efficient Long Video Generation with Context Compression	Jul 17, 2025	Text-to-Video GenerationVideo Generation	—Unverified
LuciBot: Automated Robot Policy Learning from Generated Videos	Mar 12, 2025	Video Generation	—Unverified
LumiSculpt: A Consistency Lighting Control Network for Video Generation	Oct 30, 2024	Video Generation	—Unverified
Lyric Video Analysis Using Text Detection and Tracking	Jun 21, 2020	ClusteringDynamic Time Warping	—Unverified
M4V: Multi-Modal Mamba for Text-to-Video Generation	Jun 12, 2025	MambaText-to-Video Generation	—Unverified
MagicAvatar: Multimodal Avatar Generation and Animation	Aug 28, 2023	Video Generation	—Unverified
MagicComp: Training-free Dual-Phase Refinement for Compositional Video Generation	Mar 18, 2025	DenoisingVideo Generation	—Unverified
MagicDrive3D: Controllable 3D Generation for Any-View Rendering in Street Scenes	May 23, 2024	3D GenerationAutonomous Driving	—Unverified
MagicDriveDiT: High-Resolution Long Video Generation for Autonomous Driving with Adaptive Control	Nov 21, 2024	Autonomous DrivingVideo Generation	—Unverified
MagicInfinite: Generating Infinite Talking Videos with Your Words and Voice	Mar 7, 2025	DenoisingPortrait Animation	—Unverified
MAGIC: Motion-Aware Generative Inference via Confidence-Guided LLM	May 22, 2025	3D GenerationVideo Generation	—Unverified
MagicMotion: Controllable Video Generation with Dense-to-Sparse Trajectory Guidance	Mar 20, 2025	Image to Video GenerationObject	—Unverified
MagicVideo: Efficient Video Generation With Latent Diffusion Models	Nov 20, 2022	GPUText-to-Video Generation	—Unverified
MagicVideo-V2: Multi-Stage High-Aesthetic Video Generation	Jan 9, 2024	MORPHVideo Generation	—Unverified
Make-An-Animation: Large-Scale Text-conditional 3D Human Motion Generation	May 16, 2023	Motion GenerationMotion Synthesis	—Unverified
Make-A-Protagonist: Generic Video Editing with An Ensemble of Experts	May 15, 2023	DenoisingVideo Editing	—Unverified
Make Pixels Dance: High-Dynamic Video Generation	Nov 18, 2023	Text-to-Video GenerationVideo Generation	—Unverified
Make-Your-Video: Customized Video Generation Using Textual and Structural Guidance	Jun 1, 2023	Image GenerationVideo Generation	—Unverified
MALT Diffusion: Memory-Augmented Latent Transformers for Any-Length Video Generation	Feb 18, 2025	Text-to-Video GenerationVideo Generation	—Unverified
ManipDreamer: Boosting Robotic Manipulation World Model with Action Tree and Visual Guidance	Apr 23, 2025	Instruction FollowingSSIM	—Unverified
ManiVideo: Generating Hand-Object Manipulation Video with Dexterous and Generalizable Grasping	Dec 18, 2024	ObjectVideo Generation	—Unverified
VideoScore: Building Automatic Metrics to Simulate Fine-grained Human Feedback for Video Generation	Jun 21, 2024	Video GenerationVideo Quality Assessment	—Unverified
MarDini: Masked Autoregressive Diffusion for Video Generation at Scale	Oct 26, 2024	Image to Video GenerationVideo Generation	—Unverified
Markov Decision Process for Video Generation	Sep 26, 2019	DiversityVideo Generation	—Unverified
Martian World Models: Controllable Video Synthesis with Physically Accurate 3D Reconstructions	Jul 10, 2025	Video Generation	—Unverified
Mask^2DiT: Dual Mask-based Diffusion Transformer for Multi-Scene Long Video Generation	Mar 25, 2025	text annotationVideo Generation	—Unverified
Mask^2DiT: Dual Mask-based Diffusion Transformer for Multi-Scene Long Video Generation	Jan 1, 2025	text annotationVideo Generation	—Unverified
MaskFlow: Discrete Flows For Flexible and Efficient Long Video Generation	Feb 16, 2025	Video Generation	—Unverified
Matten: Video Generation with Mamba-Attention	May 5, 2024	MambaVideo Generation	—Unverified
Medical Video Generation for Disease Progression Simulation	Nov 18, 2024	PrognosisVideo Generation	—Unverified
MEMO: Memory-Guided Diffusion for Expressive Talking Video Generation	Dec 5, 2024	Portrait AnimationVideo Generation	—Unverified
MEt3R: Measuring Multi-View Consistency in Generated Images	Jan 10, 2025	Image GenerationVideo Generation	—Unverified
MG-Gen: Single Image to Motion Graphics Generation with Layer Decomposition	Apr 3, 2025	Code GenerationImage to Video Generation	—Unverified
MicroCinema: A Divide-and-Conquer Approach for Text-to-Video Generation	Nov 30, 2023	Image GenerationText to Image Generation	—Unverified
Mimir: Improving Video Diffusion Models for Precise Text Understanding	Dec 4, 2024	DecoderReading Comprehension	—Unverified
Mind the Time: Temporally-Controlled Multi-Event Video Generation	Dec 6, 2024	Video Generation	—Unverified
MinD: Unified Visual Imagination and Control via Hierarchical World Models	Jun 23, 2025	Video GenerationVideo Prediction	—Unverified
MiniMax-Remover: Taming Bad Noise Helps Video Object Removal	May 30, 2025	Video EditingVideo Generation	—Unverified
MJ-VIDEO: Fine-Grained Benchmarking and Rewarding Video Preferences in Video Generation	Feb 3, 2025	BenchmarkingFairness	—Unverified
MobileVidFactory: Automatic Diffusion-Based Social Media Video Generation for Mobile Devices from Text	Jul 31, 2023	Video Generation	—Unverified
MoCha: Towards Movie-Grade Talking Character Synthesis	Mar 30, 2025	Video Generation	—Unverified
Modular-Cam: Modular Dynamic Camera-view Video Generation with LLM	Apr 16, 2025	Large Language ModelText-to-Video Generation	—Unverified
Mojito: Motion Trajectory and Intensity Control for Video Generation	Dec 12, 2024	Computational EfficiencyOptical Flow Estimation	—Unverified
Morpheus: Benchmarking Physical Reasoning of Video Generative Models with Real Physical Experiments	Apr 3, 2025	Physical Commonsense ReasoningVideo Generation	—Unverified
MotionAgent: Fine-grained Controllable Video Generation via Motion Field Agent	Feb 5, 2025	Image to Video GenerationMotion Generation	—Unverified
Motion-Aware Generative Frame Interpolation	Jan 7, 2025	Video Generation	—Unverified
Motion-aware Latent Diffusion Models for Video Frame Interpolation	Apr 21, 2024	Motion EstimationVideo Frame Interpolation	—Unverified
MotionBooth: Motion-Aware Customized Text-to-Video Generation	Jun 25, 2024	Text-to-Video GenerationVideo Generation	—Unverified
MotionBridge: Dynamic Video Inbetweening with Flexible Controls	Dec 17, 2024	Video EditingVideo Generation	—Unverified

Show:10 25 50

← PrevPage 27 of 30Next →

All datasets UCF-101 BAIR Robot Pushing Sky Time-lapse UCF-101 16 frames, 64x64, Unconditional UCF-101 16 frames, Unconditional, Single GPU LAION-400M Taichi UCF-101 16 frames, 128x128, Unconditional Kinetics-600 12 frames, 64x64 How2Sign Kinetics-600 12 frames, 128x128 Kinetics-600 48 frames, 64x64

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MCVD	FVD16	2,460	—	Unverified
2	VDM	FVD16	1,396	—	Unverified
3	TGAN-v2 (128x128)	FVD16	1,209	—	Unverified
4	MCVD (64x64)	FVD16	1,143	—	Unverified
5	MoCoGAN-HD (256x256, unconditional)	FVD16	700	—	Unverified
6	MagicVideo (256x256, text-conditional)	FVD16	699	—	Unverified
7	TATS (256x256)	FVD16	635	—	Unverified
8	FIFO-Diffusion	FVD128	596.64	—	Unverified
9	DIGAN (128x128, unconditional)	FVD16	577	—	Unverified
10	LVDM (256x256, unconditional)	FVD16	552	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN	FVD score	503	—	Unverified
2	Baseline (from LVT)	FVD score	320.9	—	Unverified
3	SVG-FP (from FVD)	FVD score	315.5	—	Unverified
4	CDNA (from FVD)	FVD score	296.5	—	Unverified
5	SV2P (from FVD)	FVD score	262.5	—	Unverified
6	SVG-LP (from vRNN)	FVD score	256.62	—	Unverified
7	WAM	FVD score	159.6	—	Unverified
8	VRNN 1L	FVD score	149.22	—	Unverified
9	SAVP (from vRNN)	FVD score	143.43	—	Unverified
10	Hier-VRNN	FVD score	143.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN-HD (128x128)	FVD 16	183.6	—	Unverified
2	TATS (128x128)	FVD 16	132.6	—	Unverified
3	Long-video GAN (256x256)	FVD 16	116.5	—	Unverified
4	DIGAN (128x128)	FVD 16	114.6	—	Unverified
5	Long-video GAN (128x128)	FVD 16	107.5	—	Unverified
6	LVDM (256x256)	FVD 16	95.2	—	Unverified
7	DDMI	FVD 16	66.25	—	Unverified
8	Latte + LeanVAE	FVD 16	49.59	—	Unverified
9	StyleSV (256x256)	FVD 16	49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Video Diffusion Model	Inception Score	57	—	Unverified
2	TGAN-ODE	Inception Score	15.2	—	Unverified
3	TGAN-F	Inception Score	13.62	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGAN-F	Inception Score	22.91	—	Unverified
2	TGANv2	Inception Score	21.45	—	Unverified
3	TGANv2-ODE	Inception Score	21.02	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Imagen original (constant=6)	CLIP R-Precision	92.12	—	Unverified
2	Imagen fully distilled (oscillate (15,1))	CLIP R-Precision	90.97	—	Unverified
3	Imagen distilled (constant=6)	CLIP R-Precision	90.88	—	Unverified
4	Imagen original (oscillate(15,1))	CLIP R-Precision	89.91	—	Unverified
5	Imagen fully distilled (constant=6)	CLIP R-Precision	89.68	—	Unverified
6	Imagen distilled (oscillate (15,1))	CLIP R-Precision	88.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DIGAN (256x256)	FVD16	156.7	—	Unverified
2	MoCoGAN-HD (128x128)	FVD16	144.7	—	Unverified
3	DIGAN (128x128)	FVD16	128.1	—	Unverified
4	LVDM (256x256)	FVD16	99	—	Unverified
5	TATS (128x128)	FVD16	94.6	—	Unverified
6	StyleSV (256x256)	FVD16	82.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGANv2 (2020)	Inception Score	28.87	—	Unverified
2	DVD-GAN	Inception Score	27.38	—	Unverified
3	VideoGPT	Inception Score	24.69	—	Unverified
4	TGANv2	Inception Score	24.34	—	Unverified
5	TGAN-F	Inception Score	22.91	—	Unverified
6	TGANv2-ODE	Inception Score	21.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FVD	31.1	—	Unverified
2	MAGVIT	FVD	9.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	INR-V	FVD16	144	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	2.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	12.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiT-XL/2 + CVAE-FT-SE	FID	8.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoAssembler (Zero-Shot, 256x256, class-conditional)	FVD16	252	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PG-SWGAN-3D	FID	404.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StyleSV	FVD16	207.2	—	Unverified