Video Generation

( Various Video Generation Tasks. Gif credit: MaGViT )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 601–650 of 1466 papers

Title	Date	Tasks	Status
Controllable Video Generation With Sparse Trajectories	Jun 1, 2018	Video GenerationVideo Prediction	—Unverified
Audio-driven Gesture Generation via Deviation Feature in the Latent Space	Mar 27, 2025	Gesture GenerationVideo Generation	—Unverified
FIFA: Unified Faithfulness Evaluation Framework for Text-to-Video and Video-to-Text Generation	Jul 9, 2025	DescriptiveText Generation	—Unverified
FFA Sora, video generation as fundus fluorescein angiography simulator	Dec 23, 2024	Privacy PreservingQuestion Answering	—Unverified
Controllable Video Generation through Global and Local Motion Dynamics	Apr 13, 2022	Video Generation	—Unverified
Controllable Video Generation by Learning the Underlying Dynamical System with Neural ODE	Mar 9, 2023	Video Generation	—Unverified
Controllable Longer Image Animation with Diffusion Models	May 27, 2024	Image Animationmotion prediction	—Unverified
FastVideoEdit: Leveraging Consistency Models for Efficient Text-to-Video Editing	Mar 10, 2024	Image GenerationText-to-Video Editing	—Unverified
Faster Image2Video Generation: A Closer Look at CLIP Image Embedding's Impact on Spatio-Temporal Cross-Attentions	Jul 27, 2024	Computational EfficiencyVideo Generation	—Unverified
Controllable Image-to-Video Translation: A Case Study on Facial Expression Generation	Aug 9, 2018	Facial expression generationImage-to-Image Translation	—Unverified
Audio-Driven Co-Speech Gesture Video Generation	Dec 5, 2022	Video Generation	—Unverified
FasterCache: Training-Free Video Diffusion Model Acceleration with High Quality	Oct 25, 2024	Video Generation	—Unverified
Fast Autoregressive Video Generation with Diagonal Decoding	Mar 18, 2025	Video Generation	—Unverified
Contrastive Video Textures	Jan 1, 2021	Contrastive LearningVideo Generation	—Unverified
AudCast: Audio-Driven Human Video Generation by Cascaded Diffusion Transformers	Mar 25, 2025	Video Generation	—Unverified
Fashion-VDM: Video Diffusion Model for Virtual Try-On	Oct 31, 2024	Video GenerationVirtual Try-on	—Unverified
Continuous-Time Video Generation via Learning Motion Dynamics with Neural ODE	Dec 21, 2021	Unconditional Video GenerationVideo Generation	—Unverified
Continuously Controllable Facial Expression Editing in Talking Face Videos	Sep 17, 2022	Image-to-Image TranslationVideo Generation	—Unverified
Align Your Gaussians: Text-to-4D with Dynamic 3D Gaussians and Composed Diffusion Models	Dec 21, 2023	Synthetic Data GenerationVideo Generation	—Unverified
ACDC: Autoregressive Coherent Multimodal Generation using Diffusion Correction	Oct 7, 2024	multimodal generationStory Generation	—Unverified
Face Consistency Benchmark for GenAI Video	May 16, 2025	Video Generation	—Unverified
Facial Expression Video Generation Based-On Spatio-temporal Convolutional GAN: FEV-GAN	Oct 20, 2022	Facial expression generationVideo Generation	—Unverified
Face Video Generation from a Single Image and Landmarks	Apr 25, 2019	Image-to-Image TranslationTranslation	—Unverified
Contextual RNN-GANs for Abstract Reasoning Diagram Generation	Sep 29, 2016	Generative Adversarial NetworkVideo Generation	—Unverified
FaceVid-1K: A Large-Scale High-Quality Multiracial Human Face Video Dataset	Sep 23, 2024	Image GenerationUnconditional Video Generation	—Unverified
FAAC: Facial Animation Generation with Anchor Frame and Conditional Control for Superior Fidelity and Editability	Dec 6, 2023	Face ModelVideo Generation	—Unverified
Contextual Gesture: Co-Speech Gesture Video Generation through Context-aware Gesture Representation	Feb 11, 2025	Gesture GenerationVideo Generation	—Unverified
Alignment is All You Need: A Training-free Augmentation Strategy for Pose-guided Video Generation	Aug 29, 2024	AllVideo Generation	—Unverified
Eye2Eye: A Simple Approach for Monocular-to-Stereo Video Synthesis	Apr 30, 2025	Disparity EstimationTransparent objects	—Unverified
Context-aware Talking Face Video Generation	Feb 28, 2024	Video GenerationVideo Synchronization	—Unverified
AtomoVideo: High Fidelity Image-to-Video Generation	Mar 4, 2024	Image GenerationImage to Video Generation	—Unverified
Exposing AI-generated Videos: A Benchmark Dataset and a Local-and-Global Temporal Defect Based Detection Method	May 7, 2024	Video Generation	—Unverified
ContentV: Efficient Training of Video Generation Models with Limited Compute	Jun 5, 2025	Image GenerationVideo Generation	—Unverified
AccidentSim: Generating Physically Realistic Vehicle Collision Videos from Real-World Accident Reports	Mar 26, 2025	Autonomous DrivingNeRF	—Unverified
Latent-Reframe: Enabling Camera Control for Video Diffusion Model without Training	Dec 8, 2024	Video Generation	—Unverified
Exploring the Interplay Between Video Generation and World Models in Autonomous Driving: A Survey	Nov 5, 2024	3D Scene ReconstructionAutonomous Driving	—Unverified
Exploring the Hyperparameter Space of Image Diffusion Models for Echocardiogram Generation	Nov 2, 2023	Video Generation	—Unverified
ATI: Any Trajectory Instruction for Controllable Video Generation	May 28, 2025	Image to Video GenerationVideo Generation	—Unverified
Explorative Inbetweening of Time and Space	Mar 21, 2024	DenoisingVideo Generation	—Unverified
Consistent Zero-shot 3D Texture Synthesis Using Geometry-aware Diffusion and Temporal Video Models	Jun 26, 2025	Texture SynthesisVideo Generation	—Unverified
Explaining Vision and Language through Graphs of Events in Space and Time	Aug 29, 2023	Graph MatchingVideo Generation	—Unverified
Every Smile is Unique: Landmark-Guided Diverse Smile Generation	Feb 6, 2018	Video Generation	—Unverified
AsymKV: Enabling 1-Bit Quantization of KV Cache with Layer-Wise Asymmetric Quantization Configurations	Oct 17, 2024	DecoderQuantization	—Unverified
3DGS-Enhancer: Enhancing Unbounded 3D Gaussian Splatting with View-consistent 2D Diffusion Priors	Oct 21, 2024	3DGSDecoder	—Unverified
Latent-Shift: Latent Diffusion with Temporal Shift for Efficient Text-to-Video Generation	Apr 17, 2023	Image GenerationSuper-Resolution	—Unverified
Every Image Listens, Every Image Dances: Music-Driven Image Animation	Jan 30, 2025	Image AnimationVideo Generation	—Unverified
Everybody Sign Now: Translating Spoken Language to Photo Realistic Sign Language Video	Nov 19, 2020	Sign Language ProductionVideo Generation	—Unverified
CoNo: Consistency Noise Injection for Tuning-free Long Video Diffusion	Jun 7, 2024	SchedulingVideo Generation	—Unverified
Event-based High Dynamic Range Image and Very High Frame Rate Video Generation using Conditional Generative Adversarial Networks	Nov 20, 2018	Video GenerationVocal Bursts Intensity Prediction	—Unverified
ASurvey: Spatiotemporal Consistency in Video Generation	Feb 25, 2025	Image GenerationVideo Generation	—Unverified

Show:10 25 50

← PrevPage 13 of 30Next →

All datasets UCF-101 BAIR Robot Pushing Sky Time-lapse UCF-101 16 frames, 64x64, Unconditional UCF-101 16 frames, Unconditional, Single GPU LAION-400M Taichi UCF-101 16 frames, 128x128, Unconditional Kinetics-600 12 frames, 64x64 How2Sign Kinetics-600 12 frames, 128x128 Kinetics-600 48 frames, 64x64

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MCVD	FVD16	2,460	—	Unverified
2	VDM	FVD16	1,396	—	Unverified
3	TGAN-v2 (128x128)	FVD16	1,209	—	Unverified
4	MCVD (64x64)	FVD16	1,143	—	Unverified
5	MoCoGAN-HD (256x256, unconditional)	FVD16	700	—	Unverified
6	MagicVideo (256x256, text-conditional)	FVD16	699	—	Unverified
7	TATS (256x256)	FVD16	635	—	Unverified
8	FIFO-Diffusion	FVD128	596.64	—	Unverified
9	DIGAN (128x128, unconditional)	FVD16	577	—	Unverified
10	LVDM (256x256, unconditional)	FVD16	552	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN	FVD score	503	—	Unverified
2	Baseline (from LVT)	FVD score	320.9	—	Unverified
3	SVG-FP (from FVD)	FVD score	315.5	—	Unverified
4	CDNA (from FVD)	FVD score	296.5	—	Unverified
5	SV2P (from FVD)	FVD score	262.5	—	Unverified
6	SVG-LP (from vRNN)	FVD score	256.62	—	Unverified
7	WAM	FVD score	159.6	—	Unverified
8	VRNN 1L	FVD score	149.22	—	Unverified
9	SAVP (from vRNN)	FVD score	143.43	—	Unverified
10	Hier-VRNN	FVD score	143.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN-HD (128x128)	FVD 16	183.6	—	Unverified
2	TATS (128x128)	FVD 16	132.6	—	Unverified
3	Long-video GAN (256x256)	FVD 16	116.5	—	Unverified
4	DIGAN (128x128)	FVD 16	114.6	—	Unverified
5	Long-video GAN (128x128)	FVD 16	107.5	—	Unverified
6	LVDM (256x256)	FVD 16	95.2	—	Unverified
7	DDMI	FVD 16	66.25	—	Unverified
8	Latte + LeanVAE	FVD 16	49.59	—	Unverified
9	StyleSV (256x256)	FVD 16	49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Video Diffusion Model	Inception Score	57	—	Unverified
2	TGAN-ODE	Inception Score	15.2	—	Unverified
3	TGAN-F	Inception Score	13.62	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGAN-F	Inception Score	22.91	—	Unverified
2	TGANv2	Inception Score	21.45	—	Unverified
3	TGANv2-ODE	Inception Score	21.02	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Imagen original (constant=6)	CLIP R-Precision	92.12	—	Unverified
2	Imagen fully distilled (oscillate (15,1))	CLIP R-Precision	90.97	—	Unverified
3	Imagen distilled (constant=6)	CLIP R-Precision	90.88	—	Unverified
4	Imagen original (oscillate(15,1))	CLIP R-Precision	89.91	—	Unverified
5	Imagen fully distilled (constant=6)	CLIP R-Precision	89.68	—	Unverified
6	Imagen distilled (oscillate (15,1))	CLIP R-Precision	88.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DIGAN (256x256)	FVD16	156.7	—	Unverified
2	MoCoGAN-HD (128x128)	FVD16	144.7	—	Unverified
3	DIGAN (128x128)	FVD16	128.1	—	Unverified
4	LVDM (256x256)	FVD16	99	—	Unverified
5	TATS (128x128)	FVD16	94.6	—	Unverified
6	StyleSV (256x256)	FVD16	82.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGANv2 (2020)	Inception Score	28.87	—	Unverified
2	DVD-GAN	Inception Score	27.38	—	Unverified
3	VideoGPT	Inception Score	24.69	—	Unverified
4	TGANv2	Inception Score	24.34	—	Unverified
5	TGAN-F	Inception Score	22.91	—	Unverified
6	TGANv2-ODE	Inception Score	21.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FVD	31.1	—	Unverified
2	MAGVIT	FVD	9.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	INR-V	FVD16	144	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	2.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	12.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiT-XL/2 + CVAE-FT-SE	FID	8.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoAssembler (Zero-Shot, 256x256, class-conditional)	FVD16	252	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PG-SWGAN-3D	FID	404.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StyleSV	FVD16	207.2	—	Unverified