Video Generation

( Various Video Generation Tasks. Gif credit: MaGViT )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1251–1300 of 1466 papers

Title	Date	Tasks	Status
ViBe: A Text-to-Video Benchmark for Evaluating Hallucination in Large Multimodal Models	Nov 16, 2024	HallucinationVideo Generation	—Unverified
ViBiDSampler: Enhancing Video Interpolation Using Bidirectional Diffusion Sampler	Oct 8, 2024	GPUVideo Generation	—Unverified
ViDA-MAN: Visual Dialog with Digital Humans	Oct 26, 2021	speech-recognitionSpeech Recognition	—Unverified
VidCRAFT3: Camera, Object, and Lighting Control for Image-to-Video Generation	Feb 11, 2025	Image to Video GenerationObject	—Unverified
VideoAnydoor: High-fidelity Video Object Insertion with Precise Motion Control	Jan 2, 2025	Talking Head GenerationVideo Generation	—Unverified
Video as the New Language for Real-World Decision Making	Feb 27, 2024	Decision MakingIn-Context Learning	—Unverified
VideoAuteur: Towards Long Narrative Video Generation	Jan 10, 2025	Video Generation	—Unverified
Video Autoencoder: self-supervised disentanglement of static 3D structure and motion	Oct 6, 2021	Camera Pose EstimationDisentanglement	—Unverified
Video-Bench: Human-Aligned Video Generation Benchmark	Jan 1, 2025	Large Language ModelVideo Generation	—Unverified
VideoBooth: Diffusion-based Video Generation with Image Prompts	Dec 1, 2023	Video Generation	—Unverified
Video Content Swapping Using GAN	Nov 21, 2021	Data AugmentationVideo Generation	—Unverified
Video Creation by Demonstration	Dec 12, 2024	Video Generation	—Unverified
VideoDirectorGPT: Consistent Multi-scene Video Generation via LLM-Guided Planning	Sep 26, 2023	Image GenerationVideo Generation	—Unverified
VideoDPO: Omni-Preference Alignment for Video Diffusion Generation	Dec 18, 2024	Image GenerationText-to-Video Generation	—Unverified
VideoDreamer: Customized Multi-Subject Text-to-Video Generation with Disen-Mix Finetuning	Nov 2, 2023	AttributeText-to-Video Generation	—Unverified
Video Editing via Factorized Diffusion Distillation	Mar 14, 2024	Video EditingVideo Generation	—Unverified
VideoFlow: A Conditional Flow-Based Model for Stochastic Video Generation	Mar 4, 2019	Predict Future Video FramesVideo Generation	—Unverified
VideoGen: A Reference-Guided Latent Diffusion Approach for High Definition Text-to-Video Generation	Sep 1, 2023	DecoderImage Generation	—Unverified
Video Generation Beyond a Single Clip	Apr 15, 2023	Video Generation	—Unverified
Video Generation from Text Employing Latent Path Construction for Temporal Modeling	Jul 29, 2021	Text-to-Video GenerationVideo Generation	—Unverified
Video Generation with Consistency Tuning	Mar 11, 2024	Video Generation	—Unverified
Video Generation with Learned Action Prior	Jun 20, 2024	Image GenerationImage Reconstruction	—Unverified
VideoGen: Generative Modeling of Videos using VQ-VAE and Transformers	Jan 1, 2021	PositionVideo Generation	—Unverified
VideoGen-of-Thought: Step-by-step generating multi-shot video with minimal manual intervention	Mar 19, 2025	Video Generation	—Unverified
VideoGrain: Modulating Space-Time Attention for Multi-grained Video Editing	Feb 24, 2025	Video EditingVideo Generation	—Unverified
Video-Infinity: Distributed Long Video Generation	Jun 24, 2024	GPUVideo Generation	—Unverified
Video Is Worth a Thousand Images: Exploring the Latest Trends in Long Video Generation	Dec 24, 2024	Video Generation	—Unverified
VideoJAM: Joint Appearance-Motion Representations for Enhanced Motion Generation in Video Models	Feb 4, 2025	Motion Generationmotion prediction	—Unverified
Video Latent Flow Matching: Optimal Polynomial Projections for Video Interpolation and Extrapolation	Feb 1, 2025	Image GenerationVideo Generation	—Unverified
VideoLCM: Video Latent Consistency Model	Dec 14, 2023	Computational EfficiencyImage Generation	—Unverified
VideoMage: Multi-Subject and Motion Customization of Text-to-Video Diffusion Models	Mar 27, 2025	Text-to-Video GenerationVideo Generation	—Unverified
VideoMAR: Autoregressive Video Generatio with Continuous Tokens	Jun 17, 2025	GPUImage Generation	—Unverified
VideoMerge: Towards Training-free Long Video Generation	Mar 13, 2025	DenoisingVideo Generation	—Unverified
Video Motion Graphs	Mar 26, 2025	Motion InterpolationVideo Frame Interpolation	—Unverified
VideoPanda: Video Panoramic Diffusion with Multi-view Attention	Apr 15, 2025	Video Generation	—Unverified
Video Perception Models for 3D Scene Synthesis	Jun 25, 2025	3D ReconstructionImage Generation	—Unverified
VideoPhy: Evaluating Physical Commonsense for Video Generation	Jun 5, 2024	Video Generation	—Unverified
VideoPoet: A Large Language Model for Zero-Shot Video Generation	Dec 21, 2023	DecoderLanguage Modeling	—Unverified
VideoRepair: Improving Text-to-Video Generation via Misalignment Evaluation and Localized Refinement	Nov 22, 2024	Text-to-Video GenerationVideo Alignment	—Unverified
VideoRFSplat: Direct Scene-Level Text-to-3D Gaussian Splatting Generation with Flexible Pose and Multi-View Joint Modeling	Mar 20, 2025	3DGSText to 3D	—Unverified
Video Signature: In-generation Watermarking for Latent Video Diffusion Models	May 31, 2025	DecoderVideo Generation	—Unverified
Rethinking Video Super-Resolution: Towards Diffusion-Based Methods without Motion Alignment	Mar 5, 2025	AllSuper-Resolution	—Unverified
Video-T1: Test-Time Scaling for Video Generation	Mar 24, 2025	DenoisingVideo Generation	—Unverified
Video-to-Audio Generation with Fine-grained Temporal Semantics	Sep 23, 2024	Audio GenerationVideo Generation	—Unverified
Video-to-Audio Generation with Hidden Alignment	Jul 10, 2024	Audio GenerationData Augmentation	—Unverified
Video Virtual Try-on with Conditional Diffusion Transformer Inpainter	Jun 26, 2025	Video GenerationVideo Inpainting	—Unverified
VideoWorld: Exploring Knowledge Learning from Unlabeled Videos	Jan 16, 2025	Video Generation	—Unverified
VIDiff: Translating Videos via Multi-Modal Instructions with Diffusion Models	Nov 30, 2023	Semantic SegmentationVideo Editing	—Unverified
VidMan: Exploiting Implicit Dynamics from Video Diffusion Model for Effective Robot Manipulation	Nov 14, 2024	DenoisingRobot Manipulation	—Unverified
VidPanos: Generative Panoramic Videos from Casual Panning Videos	Oct 17, 2024	Image StitchingVideo Generation	—Unverified

Show:10 25 50

← PrevPage 26 of 30Next →

All datasets UCF-101 BAIR Robot Pushing Sky Time-lapse UCF-101 16 frames, 64x64, Unconditional UCF-101 16 frames, Unconditional, Single GPU LAION-400M Taichi UCF-101 16 frames, 128x128, Unconditional Kinetics-600 12 frames, 64x64 How2Sign Kinetics-600 12 frames, 128x128 Kinetics-600 48 frames, 64x64

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MCVD	FVD16	2,460	—	Unverified
2	VDM	FVD16	1,396	—	Unverified
3	TGAN-v2 (128x128)	FVD16	1,209	—	Unverified
4	MCVD (64x64)	FVD16	1,143	—	Unverified
5	MoCoGAN-HD (256x256, unconditional)	FVD16	700	—	Unverified
6	MagicVideo (256x256, text-conditional)	FVD16	699	—	Unverified
7	TATS (256x256)	FVD16	635	—	Unverified
8	FIFO-Diffusion	FVD128	596.64	—	Unverified
9	DIGAN (128x128, unconditional)	FVD16	577	—	Unverified
10	LVDM (256x256, unconditional)	FVD16	552	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN	FVD score	503	—	Unverified
2	Baseline (from LVT)	FVD score	320.9	—	Unverified
3	SVG-FP (from FVD)	FVD score	315.5	—	Unverified
4	CDNA (from FVD)	FVD score	296.5	—	Unverified
5	SV2P (from FVD)	FVD score	262.5	—	Unverified
6	SVG-LP (from vRNN)	FVD score	256.62	—	Unverified
7	WAM	FVD score	159.6	—	Unverified
8	VRNN 1L	FVD score	149.22	—	Unverified
9	SAVP (from vRNN)	FVD score	143.43	—	Unverified
10	Hier-VRNN	FVD score	143.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN-HD (128x128)	FVD 16	183.6	—	Unverified
2	TATS (128x128)	FVD 16	132.6	—	Unverified
3	Long-video GAN (256x256)	FVD 16	116.5	—	Unverified
4	DIGAN (128x128)	FVD 16	114.6	—	Unverified
5	Long-video GAN (128x128)	FVD 16	107.5	—	Unverified
6	LVDM (256x256)	FVD 16	95.2	—	Unverified
7	DDMI	FVD 16	66.25	—	Unverified
8	Latte + LeanVAE	FVD 16	49.59	—	Unverified
9	StyleSV (256x256)	FVD 16	49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Video Diffusion Model	Inception Score	57	—	Unverified
2	TGAN-ODE	Inception Score	15.2	—	Unverified
3	TGAN-F	Inception Score	13.62	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGAN-F	Inception Score	22.91	—	Unverified
2	TGANv2	Inception Score	21.45	—	Unverified
3	TGANv2-ODE	Inception Score	21.02	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Imagen original (constant=6)	CLIP R-Precision	92.12	—	Unverified
2	Imagen fully distilled (oscillate (15,1))	CLIP R-Precision	90.97	—	Unverified
3	Imagen distilled (constant=6)	CLIP R-Precision	90.88	—	Unverified
4	Imagen original (oscillate(15,1))	CLIP R-Precision	89.91	—	Unverified
5	Imagen fully distilled (constant=6)	CLIP R-Precision	89.68	—	Unverified
6	Imagen distilled (oscillate (15,1))	CLIP R-Precision	88.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DIGAN (256x256)	FVD16	156.7	—	Unverified
2	MoCoGAN-HD (128x128)	FVD16	144.7	—	Unverified
3	DIGAN (128x128)	FVD16	128.1	—	Unverified
4	LVDM (256x256)	FVD16	99	—	Unverified
5	TATS (128x128)	FVD16	94.6	—	Unverified
6	StyleSV (256x256)	FVD16	82.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGANv2 (2020)	Inception Score	28.87	—	Unverified
2	DVD-GAN	Inception Score	27.38	—	Unverified
3	VideoGPT	Inception Score	24.69	—	Unverified
4	TGANv2	Inception Score	24.34	—	Unverified
5	TGAN-F	Inception Score	22.91	—	Unverified
6	TGANv2-ODE	Inception Score	21.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FVD	31.1	—	Unverified
2	MAGVIT	FVD	9.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	INR-V	FVD16	144	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	2.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	12.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiT-XL/2 + CVAE-FT-SE	FID	8.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoAssembler (Zero-Shot, 256x256, class-conditional)	FVD16	252	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PG-SWGAN-3D	FID	404.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StyleSV	FVD16	207.2	—	Unverified