Video Generation

( Various Video Generation Tasks. Gif credit: MaGViT )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 651–700 of 1466 papers

Title	Date	Tasks	Status
A Survey on Vision Autoregressive Model	Nov 13, 2024	3D GenerationBenchmarking	—Unverified
Reenact Anything: Semantic Video Motion Transfer Using Motion-Textual Inversion	Aug 1, 2024	Face ReenactmentVideo Generation	—Unverified
Evaluating Robot Policies in a World Model	May 31, 2025	modelVideo Generation	—Unverified
Conditional Video Generation Using Action-Appearance Captions	Dec 4, 2018	Optical Flow EstimationVideo Generation	—Unverified
EVA: An Embodied World Model for Future Video Anticipation	Oct 20, 2024	Language ModelingLanguage Modelling	—Unverified
EQ-TAA: Equivariant Traffic Accident Anticipation via Diffusion-Based Accident Video Synthesis	Mar 16, 2025	Accident AnticipationVideo Generation	—Unverified
Conditional MoCoGAN for Zero-Shot Video Generation	Sep 13, 2021	Generative Adversarial NetworkImage Generation	—Unverified
Enhancing Multi-Text Long Video Generation Consistency without Tuning: Time-Frequency Analysis, Prompt Alignment, and Theory	Dec 23, 2024	Video Generation	—Unverified
Enhancing Facial Consistency in Conditional Video Generation via Facial Landmark Transformation	Dec 12, 2024	Video Generation	—Unverified
A Survey on Long-Video Storytelling Generation: Architectures, Consistency, and Cinematic Quality	Jul 9, 2025	DiversityVideo Generation	—Unverified
Lyric Video Analysis Using Text Detection and Tracking	Jun 21, 2020	ClusteringDynamic Time Warping	—Unverified
MagicAvatar: Multimodal Avatar Generation and Animation	Aug 28, 2023	Video Generation	—Unverified
MagicMotion: Controllable Video Generation with Dense-to-Sparse Trajectory Guidance	Mar 20, 2025	Image to Video GenerationObject	—Unverified
Endora: Video Generation Models as Endoscopy Simulators	Mar 17, 2024	Data AugmentationVideo Generation	—Unverified
ConceptMaster: Multi-Concept Video Customization on Diffusion Transformer Models Without Test-Time Tuning	Jan 8, 2025	Text-to-Video GenerationVideo Generation	—Unverified
Enabling Visual Composition and Animation in Unsupervised Video Generation	Mar 21, 2024	Video Generation	—Unverified
Enabling Versatile Controls for Video Diffusion Models	Mar 21, 2025	Text-to-Video GenerationVideo Generation	—Unverified
A Survey on Long Video Generation: Challenges, Methods, and Prospects	Mar 25, 2024	SurveyVideo Generation	—Unverified
Emu Video: Factorizing Text-to-Video Generation by Explicit Image Conditioning	Nov 17, 2023	Text-to-Video GenerationVideo Generation	—Unverified
Dysen-VDM: Empowering Dynamics-aware Text-to-Video Diffusion with LLMs	Aug 26, 2023	In-Context LearningVideo Generation	—Unverified
COMUNI: Decomposing Common and Unique Video Signals for Diffusion-based Video Generation	Oct 2, 2024	DecoderPosition	—Unverified
EMO: Emote Portrait Alive -- Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditions	Feb 27, 2024	Video Generation	—Unverified
A Survey on Generative AI and LLM for Video Generation, Understanding, and Streaming	Jan 30, 2024	Video GenerationVideo Understanding	—Unverified
Accelerating Video Diffusion Models via Distribution Matching	Dec 8, 2024	DenoisingVideo Generation	—Unverified
EMO2: End-Effector Guided Audio-Driven Avatar Video Generation	Jan 18, 2025	Gesture GenerationVideo Generation	—Unverified
EIDT-V: Exploiting Intersections in Diffusion Trajectories for Model-Agnostic, Zero-Shot, Training-Free Text-to-Video Generation	Jan 1, 2025	Image GenerationText-to-Video Generation	—Unverified
Comprehensive Subjective and Objective Evaluation Method for Text-generated Video	Jan 15, 2025	Video Generation	—Unverified
EgoVid-5M: A Large-Scale Video-Action Dataset for Egocentric Video Generation	Nov 13, 2024	Video Generation	—Unverified
A Survey of Emerging Approaches and Advances in Video Generation	Nov 9, 2024	Image to Video GenerationLanguage Modeling	—Unverified
Efficient Video Diffusion Models via Content-Frame Motion-Latent Decomposition	Mar 21, 2024	Video Generation	—Unverified
Compositional 3D-aware Video Generation with LLM Director	Aug 31, 2024	Text-to-Video GenerationVideo Generation	—Unverified
Efficient training for future video generation based on hierarchical disentangled representation of latent variables	Jun 7, 2021	Future predictionImage Generation	—Unverified
A Survey of Defenses against AI-generated Visual Media: Detection, Disruption, and Authentication	Jul 15, 2024	FairnessImage Generation	—Unverified
Loopy: Taming Audio-Driven Portrait Avatar with Long-Term Motion Dependency	Sep 4, 2024	Video Generation	—Unverified
CompactFlowNet: Efficient Real-time Optical Flow Estimation on Mobile Devices	Dec 17, 2024	Action RecognitionMotion Estimation	—Unverified
EEG to fMRI Synthesis: Is Deep Learning a candidate?	Sep 29, 2020	Deep LearningEEG	—Unverified
Collaborative Video Diffusion: Consistent Multi-video Generation with Camera Control	May 27, 2024	Scene GenerationVideo Generation	—Unverified
Astraea: A GPU-Oriented Token-wise Acceleration Framework for Video Diffusion Transformers	Jun 5, 2025	GPUText-to-Video Generation	—Unverified
A spatiotemporal style transfer algorithm for dynamic visual stimulus generation	Mar 7, 2024	Image GenerationObject Recognition	—Unverified
EchoFlow: A Foundation Model for Cardiac Ultrasound Image and Video Generation	Mar 28, 2025	Medical Image AnalysisPrivacy Preserving	—Unverified
Echocardiography video synthesis from end diastolic semantic map via diffusion model	Oct 11, 2023	DenoisingVideo Generation	—Unverified
EasyGenNet: An Efficient Framework for Audio-Driven Gesture Video Generation Based on Diffusion Model	Apr 11, 2025	Gesture GenerationVideo Generation	—Unverified
CoGen: 3D Consistent Video Generation via Adaptive Conditioning for Autonomous Driving	Mar 28, 2025	3D GenerationAutonomous Driving	—Unverified
EasyControl: Transfer ControlNet to Video Diffusion for Controllable Generation and Interpolation	Aug 23, 2024	Image GenerationVideo Generation	—Unverified
E2VIDiff: Perceptual Events-to-Video Reconstruction using Diffusion Priors	Jul 11, 2024	Image GenerationVideo Generation	—Unverified
A Hierarchical Variational Neural Uncertainty Model for Stochastic Video Prediction	Oct 6, 2021	DiversityVideo Generation	—Unverified
Accelerating Image Generation with Sub-path Linear Approximation Model	Apr 22, 2024	DenoisingGPU	—Unverified
3D Gaussian Splatting with Normal Information for Mesh Extraction and Improved Rendering	Jan 14, 2025	Novel View SynthesisVideo Generation	—Unverified
Aquarius: A Family of Industry-Level Video Generation Models for Marketing Scenarios	May 14, 2025	MarketingVideo Generation	—Unverified
LoViC: Efficient Long Video Generation with Context Compression	Jul 17, 2025	Text-to-Video GenerationVideo Generation	—Unverified

Show:10 25 50

← PrevPage 14 of 30Next →

All datasets UCF-101 BAIR Robot Pushing Sky Time-lapse UCF-101 16 frames, 64x64, Unconditional UCF-101 16 frames, Unconditional, Single GPU LAION-400M Taichi UCF-101 16 frames, 128x128, Unconditional Kinetics-600 12 frames, 64x64 How2Sign Kinetics-600 12 frames, 128x128 Kinetics-600 48 frames, 64x64

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MCVD	FVD16	2,460	—	Unverified
2	VDM	FVD16	1,396	—	Unverified
3	TGAN-v2 (128x128)	FVD16	1,209	—	Unverified
4	MCVD (64x64)	FVD16	1,143	—	Unverified
5	MoCoGAN-HD (256x256, unconditional)	FVD16	700	—	Unverified
6	MagicVideo (256x256, text-conditional)	FVD16	699	—	Unverified
7	TATS (256x256)	FVD16	635	—	Unverified
8	FIFO-Diffusion	FVD128	596.64	—	Unverified
9	DIGAN (128x128, unconditional)	FVD16	577	—	Unverified
10	LVDM (256x256, unconditional)	FVD16	552	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN	FVD score	503	—	Unverified
2	Baseline (from LVT)	FVD score	320.9	—	Unverified
3	SVG-FP (from FVD)	FVD score	315.5	—	Unverified
4	CDNA (from FVD)	FVD score	296.5	—	Unverified
5	SV2P (from FVD)	FVD score	262.5	—	Unverified
6	SVG-LP (from vRNN)	FVD score	256.62	—	Unverified
7	WAM	FVD score	159.6	—	Unverified
8	VRNN 1L	FVD score	149.22	—	Unverified
9	SAVP (from vRNN)	FVD score	143.43	—	Unverified
10	Hier-VRNN	FVD score	143.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN-HD (128x128)	FVD 16	183.6	—	Unverified
2	TATS (128x128)	FVD 16	132.6	—	Unverified
3	Long-video GAN (256x256)	FVD 16	116.5	—	Unverified
4	DIGAN (128x128)	FVD 16	114.6	—	Unverified
5	Long-video GAN (128x128)	FVD 16	107.5	—	Unverified
6	LVDM (256x256)	FVD 16	95.2	—	Unverified
7	DDMI	FVD 16	66.25	—	Unverified
8	Latte + LeanVAE	FVD 16	49.59	—	Unverified
9	StyleSV (256x256)	FVD 16	49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Video Diffusion Model	Inception Score	57	—	Unverified
2	TGAN-ODE	Inception Score	15.2	—	Unverified
3	TGAN-F	Inception Score	13.62	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGAN-F	Inception Score	22.91	—	Unverified
2	TGANv2	Inception Score	21.45	—	Unverified
3	TGANv2-ODE	Inception Score	21.02	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Imagen original (constant=6)	CLIP R-Precision	92.12	—	Unverified
2	Imagen fully distilled (oscillate (15,1))	CLIP R-Precision	90.97	—	Unverified
3	Imagen distilled (constant=6)	CLIP R-Precision	90.88	—	Unverified
4	Imagen original (oscillate(15,1))	CLIP R-Precision	89.91	—	Unverified
5	Imagen fully distilled (constant=6)	CLIP R-Precision	89.68	—	Unverified
6	Imagen distilled (oscillate (15,1))	CLIP R-Precision	88.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DIGAN (256x256)	FVD16	156.7	—	Unverified
2	MoCoGAN-HD (128x128)	FVD16	144.7	—	Unverified
3	DIGAN (128x128)	FVD16	128.1	—	Unverified
4	LVDM (256x256)	FVD16	99	—	Unverified
5	TATS (128x128)	FVD16	94.6	—	Unverified
6	StyleSV (256x256)	FVD16	82.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGANv2 (2020)	Inception Score	28.87	—	Unverified
2	DVD-GAN	Inception Score	27.38	—	Unverified
3	VideoGPT	Inception Score	24.69	—	Unverified
4	TGANv2	Inception Score	24.34	—	Unverified
5	TGAN-F	Inception Score	22.91	—	Unverified
6	TGANv2-ODE	Inception Score	21.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FVD	31.1	—	Unverified
2	MAGVIT	FVD	9.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	INR-V	FVD16	144	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	2.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	12.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiT-XL/2 + CVAE-FT-SE	FID	8.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoAssembler (Zero-Shot, 256x256, class-conditional)	FVD16	252	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PG-SWGAN-3D	FID	404.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StyleSV	FVD16	207.2	—	Unverified