Video Generation

( Various Video Generation Tasks. Gif credit: MaGViT )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1301–1350 of 1466 papers

Title	Date	Tasks	Status
NUWA-XL: Diffusion over Diffusion for eXtremely Long Video Generation	Mar 22, 2023	Video Generation	—Unverified
Controllable Video Generation by Learning the Underlying Dynamical System with Neural ODE	Mar 9, 2023	Video Generation	—Unverified
MotionVideoGAN: A Novel Video Generator Based on the Motion Space Learned from Image Pairs	Mar 6, 2023	Motion GenerationUnconditional Video Generation	CodeCode Available
One-Shot Face Video Re-enactment using Hybrid Latent Spaces of StyleGAN2	Feb 15, 2023	AttributeDisentanglement	—Unverified
Structure and Content-Guided Video Synthesis with Diffusion Models	Feb 6, 2023	DisentanglementText-to-Video Generation	—Unverified
SceneScape: Text-Driven Consistent Scene Generation	Feb 2, 2023	Depth EstimationDepth Prediction	—Unverified
Dreamix: Video Diffusion Models are General Video Editors	Feb 2, 2023	Image AnimationImage to Video Generation	—Unverified
Learning Universal Policies via Text-Guided Video Generation	Jan 31, 2023	Decision MakingImage Generation	—Unverified
Time-Conditioned Generative Modeling of Object-Centric Representations for Video Decomposition and Prediction	Jan 21, 2023	DisentanglementGaussian Processes	CodeCode Available
Regeneration Learning: A Learning Paradigm for Data Generation	Jan 21, 2023	Image GenerationRepresentation Learning	—Unverified
Diffused Heads: Diffusion Models Beat GANs on Talking-Face Generation	Jan 6, 2023	Face GenerationTalking Face Generation	—Unverified
SIDGAN: High-Resolution Dubbed Video Generation via Shift-Invariant Learning	Jan 1, 2023	Image GenerationVideo Generation	—Unverified
Recovering Surveillance Video Using RF Cues	Dec 27, 2022	Video Generation	—Unverified
Scalable Adaptive Computation for Iterative Generation	Dec 22, 2022	Image GenerationVideo Generation	CodeCode Available
PV3D: A 3D Generative Model for Portrait Video Generation	Dec 13, 2022	Video Generation	—Unverified
Neural Cell Video Synthesis via Optical-Flow Diffusion	Dec 6, 2022	Cultural Vocal Bursts Intensity PredictionDenoising	—Unverified
Audio-Driven Co-Speech Gesture Video Generation	Dec 5, 2022	Video Generation	—Unverified
3DDesigner: Towards Photorealistic 3D Object Generation and Editing with Text-guided Diffusion Models	Nov 25, 2022	DenoisingNeRF	—Unverified
MagicVideo: Efficient Video Generation With Latent Diffusion Models	Nov 20, 2022	GPUText-to-Video Generation	—Unverified
Facial Expression Video Generation Based-On Spatio-temporal Convolutional GAN: FEV-GAN	Oct 20, 2022	Facial expression generationVideo Generation	—Unverified
DeepHS-HDRVideo: Deep High Speed High Dynamic Range Video Reconstruction	Oct 10, 2022	Optical Flow EstimationVideo Frame Interpolation	—Unverified
KP-RNN: A Deep Learning Pipeline for Human Motion Prediction and Synthesis of Performance Art	Oct 9, 2022	Human motion predictionImage-to-Image Translation	CodeCode Available
See, Plan, Predict: Language-guided Cognitive Planning with Video Prediction	Oct 7, 2022	PredictionVideo Generation	—Unverified
Text-driven Video Prediction	Oct 6, 2022	Causal InferencePrediction	—Unverified
Imagen Video: High Definition Video Generation with Diffusion Models	Oct 5, 2022	Image GenerationSuper-Resolution	—Unverified
AutoLV: Automatic Lecture Video Generator	Sep 19, 2022	Speech SynthesisTalking Head Generation	—Unverified
Continuously Controllable Facial Expression Editing in Talking Face Videos	Sep 17, 2022	Image-to-Image TranslationVideo Generation	—Unverified
StableFace: Analyzing and Improving Motion Stability for Talking Face Generation	Aug 29, 2022	Face GenerationTalking Face Generation	—Unverified
StyleTalker: One-shot Style-based Audio-driven Talking Head Video Generation	Aug 23, 2022	Talking Head GenerationVideo Generation	—Unverified
Jointly Harnessing Prior Structures and Temporal Consistency for Sign Language Video Generation	Jul 8, 2022	Image AnimationText Generation	—Unverified
Client-driven Lightweight Method to Generate Artistic Media for Feature-length Sports Videos	Jul 1, 2022	Animated GIF GenerationSports Analytics	CodeCode Available
0/1 Deep Neural Networks via Block Coordinate Descent	Jun 19, 2022	10-shot image generation	—Unverified
FlexLip: A Controllable Text-to-Lip System	Jun 7, 2022	Audio Generationtext-to-speech	—Unverified
Cascaded Video Generation for Videos In-the-Wild	Jun 1, 2022	Video Generation	—Unverified
Copy Motion From One to Another: Fake Motion Video Generation	May 3, 2022	Video Generation	—Unverified
Sound-Guided Semantic Video Generation	Apr 20, 2022	Video EditingVideo Generation	—Unverified
Dynamic Neural Textures: Generating Talking-Face Videos with Continuously Controllable Expressions	Apr 13, 2022	Video Generation	—Unverified
Controllable Video Generation through Global and Local Motion Dynamics	Apr 13, 2022	Video Generation	—Unverified
HSTR-Net: High Spatio-Temporal Resolution Video Generation For Wide Area Surveillance	Apr 9, 2022	Optical Flow EstimationReference-based Super-Resolution	CodeCode Available
V3GAN: Decomposing Background, Foreground and Motion for Video Generation	Mar 26, 2022	Generative Adversarial NetworkVideo Generation	—Unverified
Transframer: Arbitrary Frame Prediction with Generative Models	Mar 17, 2022	image-classificationImage Classification	—Unverified
DialogueNeRF: Towards Realistic Avatar Face-to-Face Conversation Video Generation	Mar 15, 2022	NeRFTalking Head Generation	—Unverified
Benchmarking Generative Latent Variable Models for Speech	Feb 22, 2022	BenchmarkingImage Generation	CodeCode Available
Autoencoding Video Latents for Adversarial Video Generation	Jan 18, 2022	Image GenerationVideo Generation	—Unverified
Audio-Driven Talking Face Video Generation with Dynamic Convolution Kernels	Jan 16, 2022	Video Generation	—Unverified
Unpaired Cartoon Image Synthesis via Gated Cycle Mapping	Jan 1, 2022	Image GenerationVideo Generation	—Unverified
Continuous-Time Video Generation via Learning Motion Dynamics with Neural ODE	Dec 21, 2021	Unconditional Video GenerationVideo Generation	—Unverified
Long Context Question Answering via Supervised Contrastive Learning	Dec 16, 2021	Contrastive LearningQuestion Answering	CodeCode Available
Layered Controllable Video Generation	Nov 24, 2021	Video Generation	—Unverified
Video Content Swapping Using GAN	Nov 21, 2021	Data AugmentationVideo Generation	—Unverified

Show:10 25 50

← PrevPage 27 of 30Next →

All datasets UCF-101 BAIR Robot Pushing Sky Time-lapse UCF-101 16 frames, 64x64, Unconditional UCF-101 16 frames, Unconditional, Single GPU LAION-400M Taichi UCF-101 16 frames, 128x128, Unconditional Kinetics-600 12 frames, 64x64 How2Sign Kinetics-600 12 frames, 128x128 Kinetics-600 48 frames, 64x64

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MCVD	FVD16	2,460	—	Unverified
2	VDM	FVD16	1,396	—	Unverified
3	TGAN-v2 (128x128)	FVD16	1,209	—	Unverified
4	MCVD (64x64)	FVD16	1,143	—	Unverified
5	MoCoGAN-HD (256x256, unconditional)	FVD16	700	—	Unverified
6	MagicVideo (256x256, text-conditional)	FVD16	699	—	Unverified
7	TATS (256x256)	FVD16	635	—	Unverified
8	FIFO-Diffusion	FVD128	596.64	—	Unverified
9	DIGAN (128x128, unconditional)	FVD16	577	—	Unverified
10	LVDM (256x256, unconditional)	FVD16	552	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN	FVD score	503	—	Unverified
2	Baseline (from LVT)	FVD score	320.9	—	Unverified
3	SVG-FP (from FVD)	FVD score	315.5	—	Unverified
4	CDNA (from FVD)	FVD score	296.5	—	Unverified
5	SV2P (from FVD)	FVD score	262.5	—	Unverified
6	SVG-LP (from vRNN)	FVD score	256.62	—	Unverified
7	WAM	FVD score	159.6	—	Unverified
8	VRNN 1L	FVD score	149.22	—	Unverified
9	SAVP (from vRNN)	FVD score	143.43	—	Unverified
10	Hier-VRNN	FVD score	143.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN-HD (128x128)	FVD 16	183.6	—	Unverified
2	TATS (128x128)	FVD 16	132.6	—	Unverified
3	Long-video GAN (256x256)	FVD 16	116.5	—	Unverified
4	DIGAN (128x128)	FVD 16	114.6	—	Unverified
5	Long-video GAN (128x128)	FVD 16	107.5	—	Unverified
6	LVDM (256x256)	FVD 16	95.2	—	Unverified
7	DDMI	FVD 16	66.25	—	Unverified
8	Latte + LeanVAE	FVD 16	49.59	—	Unverified
9	StyleSV (256x256)	FVD 16	49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Video Diffusion Model	Inception Score	57	—	Unverified
2	TGAN-ODE	Inception Score	15.2	—	Unverified
3	TGAN-F	Inception Score	13.62	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGAN-F	Inception Score	22.91	—	Unverified
2	TGANv2	Inception Score	21.45	—	Unverified
3	TGANv2-ODE	Inception Score	21.02	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Imagen original (constant=6)	CLIP R-Precision	92.12	—	Unverified
2	Imagen fully distilled (oscillate (15,1))	CLIP R-Precision	90.97	—	Unverified
3	Imagen distilled (constant=6)	CLIP R-Precision	90.88	—	Unverified
4	Imagen original (oscillate(15,1))	CLIP R-Precision	89.91	—	Unverified
5	Imagen fully distilled (constant=6)	CLIP R-Precision	89.68	—	Unverified
6	Imagen distilled (oscillate (15,1))	CLIP R-Precision	88.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DIGAN (256x256)	FVD16	156.7	—	Unverified
2	MoCoGAN-HD (128x128)	FVD16	144.7	—	Unverified
3	DIGAN (128x128)	FVD16	128.1	—	Unverified
4	LVDM (256x256)	FVD16	99	—	Unverified
5	TATS (128x128)	FVD16	94.6	—	Unverified
6	StyleSV (256x256)	FVD16	82.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGANv2 (2020)	Inception Score	28.87	—	Unverified
2	DVD-GAN	Inception Score	27.38	—	Unverified
3	VideoGPT	Inception Score	24.69	—	Unverified
4	TGANv2	Inception Score	24.34	—	Unverified
5	TGAN-F	Inception Score	22.91	—	Unverified
6	TGANv2-ODE	Inception Score	21.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FVD	31.1	—	Unverified
2	MAGVIT	FVD	9.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	INR-V	FVD16	144	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	2.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	12.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiT-XL/2 + CVAE-FT-SE	FID	8.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoAssembler (Zero-Shot, 256x256, class-conditional)	FVD16	252	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PG-SWGAN-3D	FID	404.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StyleSV	FVD16	207.2	—	Unverified