Video Generation

( Various Video Generation Tasks. Gif credit: MaGViT )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1201–1250 of 1466 papers

Title	Date	Tasks	Status
HOIGen-1M: A Large-scale Dataset for Human-Object Interaction Video Generation	Mar 31, 2025	HallucinationHuman-Object Interaction Detection	—Unverified
HOI-Swap: Swapping Objects in Videos with Hand-Object Interaction Awareness	Jun 11, 2024	ObjectVideo Editing	—Unverified
How Do the Hearts of Deep Fakes Beat? Deep Fake Source Detection via Interpreting Residuals with Biological Signals	Aug 26, 2020	Video Generation	—Unverified
How Far is Video Generation from World Model: A Physical Law Perspective	Nov 4, 2024	Video Generation	—Unverified
How I Warped Your Noise: a Temporally-Correlated Noise Prior for Diffusion Models	Apr 3, 2025	Video EditingVideo Generation	—Unverified
How Much To Guide: Revisiting Adaptive Guidance in Classifier-Free Guidance Text-to-Vision Diffusion Models	Jun 10, 2025	DenoisingVideo Generation	—Unverified
HRVGAN: High Resolution Video Generation using Spatio-Temporal GAN	Aug 17, 2020	Video GenerationVocal Bursts Intensity Prediction	—Unverified
Human4DiT: 360-degree Human Video Generation with 4D Diffusion Transformer	May 27, 2024	Video Generation	—Unverified
Human Action CLIPs: Detecting AI-generated Human Motion	Nov 30, 2024	Video Generation	—Unverified
Human-Activity AGV Quality Assessment: A Benchmark Dataset and an Objective Evaluation Metric	Nov 25, 2024	Video GenerationVideo Quality Assessment	—Unverified
HumanDiT: Pose-Guided Diffusion Transformer for Long-form Human Motion Video Generation	Feb 7, 2025	FormPose Transfer	—Unverified
HumanDreamer: Generating Controllable Human-Motion Videos via Decoupled Generation	Mar 31, 2025	Video Generation	—Unverified
Hunyuan-GameCraft: High-dynamic Interactive Game Video Generation with Hybrid History Condition	Jun 20, 2025	Temporal SequencesVideo Generation	—Unverified
Hunyuan-Game: Industrial-grade Intelligent Game Creation Model	May 20, 2025	Image GenerationImage to Video Generation	—Unverified
HunyuanVideo-HOMA: Generic Human-Object Interaction in Multimodal Driven Human Animation	Jun 10, 2025	Human AnimationHuman-Object Interaction Detection	—Unverified
HuViDPO:Enhancing Video Generation through Direct Preference Optimization for Human-Centric Alignment	Feb 2, 2025	Video Generation	—Unverified
Hybrid Video Diffusion Models with 2D Triplane and 3D Wavelet Representation	Feb 21, 2024	Video GenerationVideo Reconstruction	—Unverified
I2V3D: Controllable image-to-video generation with 3D guidance	Mar 12, 2025	3D geometryImage to Video Generation	—Unverified
I2VControl-Camera: Precise Video Camera Control with Adjustable Motion Strength	Nov 10, 2024	Video Generation	—Unverified
I2VGuard: Safeguarding Images against Misuse in Diffusion-based Image-to-Video Models	Jan 1, 2025	Adversarial AttackImage to Video Generation	—Unverified
I4VGen: Image as Free Stepping Stone for Text-to-Video Generation	Jun 4, 2024	DiversityImage Generation	—Unverified
iButter: Neural Interactive Bullet Time Generator for Human Free-viewpoint Rendering	Aug 12, 2021	NeRFVideo Generation	—Unverified
Identifying and Solving Conditional Image Leakage in Image-to-Video Diffusion Model	Jun 22, 2024	AttributeImage to Video Generation	—Unverified
iDiT-HOI: Inpainting-based Hand Object Interaction Reenactment via Video Diffusion Transformer	Jun 15, 2025	ObjectVideo Generation	—Unverified
IF-MDM: Implicit Face Motion Diffusion Model for High-Fidelity Realtime Talking Head Generation	Dec 5, 2024	DisentanglementTalking Head Generation	—Unverified
ILDiff: Generate Transparent Animated Stickers by Implicit Layout Distillation	Dec 30, 2024	Image MattingVideo Generation	—Unverified
IllumiCraft: Unified Geometry and Illumination Diffusion for Controllable Video Generation	Jun 3, 2025	3D geometryVideo Generation	—Unverified
Imagen Video: High Definition Video Generation with Diffusion Models	Oct 5, 2022	Image GenerationSuper-Resolution	—Unverified
Image-to-Video Generation via 3D Facial Dynamics	May 31, 2021	Image to Video GenerationVideo Generation	—Unverified
Imagine360: Immersive 360 Video Generation from Perspective Anchor	Dec 4, 2024	DenoisingVideo Denoising	—Unverified
Importance-Based Token Merging for Efficient Image and Video Generation	Nov 23, 2024	Image GenerationVideo Generation	—Unverified
Impossible Videos	Mar 18, 2025	counterfactualVideo Generation	—Unverified
Improving Dynamic Object Interactions in Text-to-Video Generation with AI Feedback	Dec 3, 2024	ObjectOffline RL	—Unverified
Improving the Diffusability of Autoencoders	Feb 20, 2025	DecoderImage Generation	—Unverified
Improving Video Generation with Human Feedback	Jan 23, 2025	Video Generation	—Unverified
IM-Zero: Instance-level Motion Controllable Video Generation in a Zero-shot Manner	Jan 1, 2025	Motion GenerationText-to-Video Generation	—Unverified
Individual Content and Motion Dynamics Preserved Pruning for Video Diffusion Models	Nov 27, 2024	Model CompressionVideo Generation	—Unverified
Inference Optimization of Foundation Models on AI Accelerators	Jul 12, 2024	Inference OptimizationModel Compression	—Unverified
InfinityDrive: Breaking Time Limits in Driving World Models	Dec 2, 2024	Autonomous DrivingDiversity	—Unverified
Inflation with Diffusion: Efficient Temporal Adaptation for Text-to-Video Super-Resolution	Jan 18, 2024	Super-ResolutionVideo Generation	—Unverified
InMoDeGAN: Interpretable Motion Decomposition Generative Adversarial Network for Video Generation	Jan 8, 2021	Generative Adversarial NetworkVideo Generation	—Unverified
InstanceCap: Improving Text-to-Video Generation via Instance-aware Structured Caption	Dec 12, 2024	Text-to-Video GenerationVideo Generation	—Unverified
Instructional Video Generation	Dec 5, 2024	Video Generation	—Unverified
InstructVideo: Instructing Video Diffusion Models with Human Feedback	Dec 19, 2023	Video Generation	—Unverified
Intelligent Video Editing: Incorporating Modern Talking Face Generation Algorithms in a Video Editor	Oct 16, 2021	Face GenerationTalking Face Generation	—Unverified
Intention-driven Ego-to-Exo Video Generation	Mar 14, 2024	Optical Flow EstimationStereo Matching	—Unverified
Interactive Video Generation via Domain Adaptation	May 30, 2025	AttributeDenoising	—Unverified
InterAnimate: Taming Region-aware Diffusion Model for Realistic Human Interaction Animation	Apr 15, 2025	DenoisingVideo Generation	—Unverified
InterDyn: Controllable Interactive Dynamics with Video Diffusion Models	Dec 16, 2024	Video Generation	—Unverified
InternVid: A Large-scale Video-Text Dataset for Multimodal Understanding and Generation	Jul 13, 2023	Action RecognitionContrastive Learning	—Unverified

Show:10 25 50

← PrevPage 25 of 30Next →

All datasets UCF-101 BAIR Robot Pushing Sky Time-lapse UCF-101 16 frames, 64x64, Unconditional UCF-101 16 frames, Unconditional, Single GPU LAION-400M Taichi UCF-101 16 frames, 128x128, Unconditional Kinetics-600 12 frames, 64x64 How2Sign Kinetics-600 12 frames, 128x128 Kinetics-600 48 frames, 64x64

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MCVD	FVD16	2,460	—	Unverified
2	VDM	FVD16	1,396	—	Unverified
3	TGAN-v2 (128x128)	FVD16	1,209	—	Unverified
4	MCVD (64x64)	FVD16	1,143	—	Unverified
5	MoCoGAN-HD (256x256, unconditional)	FVD16	700	—	Unverified
6	MagicVideo (256x256, text-conditional)	FVD16	699	—	Unverified
7	TATS (256x256)	FVD16	635	—	Unverified
8	FIFO-Diffusion	FVD128	596.64	—	Unverified
9	DIGAN (128x128, unconditional)	FVD16	577	—	Unverified
10	LVDM (256x256, unconditional)	FVD16	552	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN	FVD score	503	—	Unverified
2	Baseline (from LVT)	FVD score	320.9	—	Unverified
3	SVG-FP (from FVD)	FVD score	315.5	—	Unverified
4	CDNA (from FVD)	FVD score	296.5	—	Unverified
5	SV2P (from FVD)	FVD score	262.5	—	Unverified
6	SVG-LP (from vRNN)	FVD score	256.62	—	Unverified
7	WAM	FVD score	159.6	—	Unverified
8	VRNN 1L	FVD score	149.22	—	Unverified
9	SAVP (from vRNN)	FVD score	143.43	—	Unverified
10	Hier-VRNN	FVD score	143.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN-HD (128x128)	FVD 16	183.6	—	Unverified
2	TATS (128x128)	FVD 16	132.6	—	Unverified
3	Long-video GAN (256x256)	FVD 16	116.5	—	Unverified
4	DIGAN (128x128)	FVD 16	114.6	—	Unverified
5	Long-video GAN (128x128)	FVD 16	107.5	—	Unverified
6	LVDM (256x256)	FVD 16	95.2	—	Unverified
7	DDMI	FVD 16	66.25	—	Unverified
8	Latte + LeanVAE	FVD 16	49.59	—	Unverified
9	StyleSV (256x256)	FVD 16	49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Video Diffusion Model	Inception Score	57	—	Unverified
2	TGAN-ODE	Inception Score	15.2	—	Unverified
3	TGAN-F	Inception Score	13.62	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGAN-F	Inception Score	22.91	—	Unverified
2	TGANv2	Inception Score	21.45	—	Unverified
3	TGANv2-ODE	Inception Score	21.02	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Imagen original (constant=6)	CLIP R-Precision	92.12	—	Unverified
2	Imagen fully distilled (oscillate (15,1))	CLIP R-Precision	90.97	—	Unverified
3	Imagen distilled (constant=6)	CLIP R-Precision	90.88	—	Unverified
4	Imagen original (oscillate(15,1))	CLIP R-Precision	89.91	—	Unverified
5	Imagen fully distilled (constant=6)	CLIP R-Precision	89.68	—	Unverified
6	Imagen distilled (oscillate (15,1))	CLIP R-Precision	88.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DIGAN (256x256)	FVD16	156.7	—	Unverified
2	MoCoGAN-HD (128x128)	FVD16	144.7	—	Unverified
3	DIGAN (128x128)	FVD16	128.1	—	Unverified
4	LVDM (256x256)	FVD16	99	—	Unverified
5	TATS (128x128)	FVD16	94.6	—	Unverified
6	StyleSV (256x256)	FVD16	82.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGANv2 (2020)	Inception Score	28.87	—	Unverified
2	DVD-GAN	Inception Score	27.38	—	Unverified
3	VideoGPT	Inception Score	24.69	—	Unverified
4	TGANv2	Inception Score	24.34	—	Unverified
5	TGAN-F	Inception Score	22.91	—	Unverified
6	TGANv2-ODE	Inception Score	21.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FVD	31.1	—	Unverified
2	MAGVIT	FVD	9.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	INR-V	FVD16	144	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	2.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	12.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiT-XL/2 + CVAE-FT-SE	FID	8.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoAssembler (Zero-Shot, 256x256, class-conditional)	FVD16	252	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PG-SWGAN-3D	FID	404.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StyleSV	FVD16	207.2	—	Unverified