Video Generation

( Various Video Generation Tasks. Gif credit: MaGViT )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1251–1300 of 1466 papers

Title	Date	Tasks	Status	Hype
Temporally Consistent Transformers for Video Generation	Oct 5, 2022	MinecraftVideo Generation	CodeCode Available	2
Phenaki: Variable Length Video Generation From Open Domain Textual Description	Oct 5, 2022	DecoderVideo Generation	CodeCode Available	2
Imagen Video: High Definition Video Generation with Diffusion Models	Oct 5, 2022	Image GenerationSuper-Resolution	—Unverified	0
Make-A-Video: Text-to-Video Generation without Text-Video Data	Sep 29, 2022	DecoderImage Generation	CodeCode Available	1
AutoLV: Automatic Lecture Video Generator	Sep 19, 2022	Speech SynthesisTalking Head Generation	—Unverified	0
Continuously Controllable Facial Expression Editing in Talking Face Videos	Sep 17, 2022	Image-to-Image TranslationVideo Generation	—Unverified	0
Diffusion Models: A Comprehensive Survey of Methods and Applications	Sep 2, 2022	Image GenerationImage Super-Resolution	CodeCode Available	4
StableFace: Analyzing and Improving Motion Stability for Talking Face Generation	Aug 29, 2022	Face GenerationTalking Face Generation	—Unverified	0
StyleTalker: One-shot Style-based Audio-driven Talking Head Video Generation	Aug 23, 2022	Talking Head GenerationVideo Generation	—Unverified	0
StyleFaceV: Face Video Generation via Decomposing and Recomposing Pretrained StyleGAN3	Aug 16, 2022	Image GenerationVideo Generation	CodeCode Available	1
CelebV-HQ: A Large-Scale Video Facial Attributes Dataset	Jul 25, 2022	AttributeDiversity	CodeCode Available	2
NUWA-Infinity: Autoregressive over Autoregressive Generation for Infinite Visual Synthesis	Jul 20, 2022	Image OutpaintingText-to-Image Generation	CodeCode Available	4
Collaborative Neural Rendering using Anime Character Sheets	Jul 12, 2022	Image GenerationImage to 3D	CodeCode Available	2
Jointly Harnessing Prior Structures and Temporal Consistency for Sign Language Video Generation	Jul 8, 2022	Image AnimationText Generation	—Unverified	0
Client-driven Lightweight Method to Generate Artistic Media for Feature-length Sports Videos	Jul 1, 2022	Animated GIF GenerationSports Analytics	CodeCode Available	0
3D-Aware Video Generation	Jun 29, 2022	Image GenerationVideo Generation	CodeCode Available	1
0/1 Deep Neural Networks via Block Coordinate Descent	Jun 19, 2022	10-shot image generation	—Unverified	0
Diffusion Models for Video Prediction and Infilling	Jun 15, 2022	PredictionVideo Generation	CodeCode Available	1
Patch-based Object-centric Transformers for Efficient Video Generation	Jun 8, 2022	ObjectVideo Editing	CodeCode Available	1
FlexLip: A Controllable Text-to-Lip System	Jun 7, 2022	Audio Generationtext-to-speech	—Unverified	0
Generating Long Videos of Dynamic Scenes	Jun 7, 2022	MORPHVideo Generation	CodeCode Available	2
D'ARTAGNAN: Counterfactual Video Generation	Jun 3, 2022	Anatomycounterfactual	CodeCode Available	1
Cascaded Video Generation for Videos In-the-Wild	Jun 1, 2022	Video Generation	—Unverified	0
CogVideo: Large-scale Pretraining for Text-to-Video Generation via Transformers	May 29, 2022	Text-to-Video GenerationVideo Generation	CodeCode Available	6
MCVD: Masked Conditional Video Diffusion for Prediction, Generation, and Interpolation	May 19, 2022	DenoisingPrediction	CodeCode Available	2
Diverse Video Generation from a Single Video	May 11, 2022	Video Generation	CodeCode Available	1
Copy Motion From One to Another: Fake Motion Video Generation	May 3, 2022	Video Generation	—Unverified	0
Sound-Guided Semantic Video Generation	Apr 20, 2022	Video EditingVideo Generation	—Unverified	0
Dynamic Neural Textures: Generating Talking-Face Videos with Continuously Controllable Expressions	Apr 13, 2022	Video Generation	—Unverified	0
Controllable Video Generation through Global and Local Motion Dynamics	Apr 13, 2022	Video Generation	—Unverified	0
HSTR-Net: High Spatio-Temporal Resolution Video Generation For Wide Area Surveillance	Apr 9, 2022	Optical Flow EstimationReference-based Super-Resolution	CodeCode Available	0
Video Diffusion Models	Apr 7, 2022	Unconditional Video GenerationVideo Generation	CodeCode Available	2
Long Video Generation with Time-Agnostic VQGAN and Time-Sensitive Transformer	Apr 7, 2022	Video Generation	CodeCode Available	2
V3GAN: Decomposing Background, Foreground and Motion for Video Generation	Mar 26, 2022	Generative Adversarial NetworkVideo Generation	—Unverified	0
Transframer: Arbitrary Frame Prediction with Generative Models	Mar 17, 2022	image-classificationImage Classification	—Unverified	0
Diffusion Probabilistic Modeling for Video Generation	Mar 16, 2022	DenoisingImage Generation	CodeCode Available	1
DialogueNeRF: Towards Realistic Avatar Face-to-Face Conversation Video Generation	Mar 15, 2022	NeRFTalking Head Generation	—Unverified	0
Depth-Aware Generative Adversarial Network for Talking Head Video Generation	Mar 13, 2022	3D geometryGenerative Adversarial Network	CodeCode Available	2
StyleHEAT: One-Shot High-Resolution Editable Talking Face Generation via Pre-trained StyleGAN	Mar 8, 2022	Face GenerationFacial Editing	CodeCode Available	2
Show Me What and Tell Me How: Video Synthesis via Multimodal Conditioning	Mar 4, 2022	Self-LearningText Augmentation	CodeCode Available	1
Playable Environments: Video Manipulation in Space and Time	Mar 3, 2022	Video Generation	CodeCode Available	1
Benchmarking Generative Latent Variable Models for Speech	Feb 22, 2022	BenchmarkingImage Generation	CodeCode Available	0
Generating Videos with Dynamics-aware Implicit Generative Adversarial Networks	Feb 21, 2022	Generative Adversarial NetworkVideo Generation	CodeCode Available	1
Non-linear Motion Estimation for Video Frame Interpolation using Space-time Convolutions	Jan 27, 2022	Motion EstimationVideo Frame Interpolation	CodeCode Available	1
Autoencoding Video Latents for Adversarial Video Generation	Jan 18, 2022	Image GenerationVideo Generation	—Unverified	0
Audio-Driven Talking Face Video Generation with Dynamic Convolution Kernels	Jan 16, 2022	Video Generation	—Unverified	0
Unpaired Cartoon Image Synthesis via Gated Cycle Mapping	Jan 1, 2022	Image GenerationVideo Generation	—Unverified	0
StyleGAN-V: A Continuous Video Generator with the Price, Image Quality and Perks of StyleGAN2	Dec 29, 2021	Video Generation	CodeCode Available	1
Continuous-Time Video Generation via Learning Motion Dynamics with Neural ODE	Dec 21, 2021	Unconditional Video GenerationVideo Generation	—Unverified	0
Long Context Question Answering via Supervised Contrastive Learning	Dec 16, 2021	Contrastive LearningQuestion Answering	CodeCode Available	0

Show:10 25 50

← PrevPage 26 of 30Next →

All datasets UCF-101 BAIR Robot Pushing Sky Time-lapse UCF-101 16 frames, 64x64, Unconditional UCF-101 16 frames, Unconditional, Single GPU LAION-400M Taichi UCF-101 16 frames, 128x128, Unconditional Kinetics-600 12 frames, 64x64 How2Sign Kinetics-600 12 frames, 128x128 Kinetics-600 48 frames, 64x64

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MCVD	FVD16	2,460	—	Unverified
2	VDM	FVD16	1,396	—	Unverified
3	TGAN-v2 (128x128)	FVD16	1,209	—	Unverified
4	MCVD (64x64)	FVD16	1,143	—	Unverified
5	MoCoGAN-HD (256x256, unconditional)	FVD16	700	—	Unverified
6	MagicVideo (256x256, text-conditional)	FVD16	699	—	Unverified
7	TATS (256x256)	FVD16	635	—	Unverified
8	FIFO-Diffusion	FVD128	596.64	—	Unverified
9	DIGAN (128x128, unconditional)	FVD16	577	—	Unverified
10	LVDM (256x256, unconditional)	FVD16	552	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN	FVD score	503	—	Unverified
2	Baseline (from LVT)	FVD score	320.9	—	Unverified
3	SVG-FP (from FVD)	FVD score	315.5	—	Unverified
4	CDNA (from FVD)	FVD score	296.5	—	Unverified
5	SV2P (from FVD)	FVD score	262.5	—	Unverified
6	SVG-LP (from vRNN)	FVD score	256.62	—	Unverified
7	WAM	FVD score	159.6	—	Unverified
8	VRNN 1L	FVD score	149.22	—	Unverified
9	SAVP (from vRNN)	FVD score	143.43	—	Unverified
10	Hier-VRNN	FVD score	143.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN-HD (128x128)	FVD 16	183.6	—	Unverified
2	TATS (128x128)	FVD 16	132.6	—	Unverified
3	Long-video GAN (256x256)	FVD 16	116.5	—	Unverified
4	DIGAN (128x128)	FVD 16	114.6	—	Unverified
5	Long-video GAN (128x128)	FVD 16	107.5	—	Unverified
6	LVDM (256x256)	FVD 16	95.2	—	Unverified
7	DDMI	FVD 16	66.25	—	Unverified
8	Latte + LeanVAE	FVD 16	49.59	—	Unverified
9	StyleSV (256x256)	FVD 16	49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Video Diffusion Model	Inception Score	57	—	Unverified
2	TGAN-ODE	Inception Score	15.2	—	Unverified
3	TGAN-F	Inception Score	13.62	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGAN-F	Inception Score	22.91	—	Unverified
2	TGANv2	Inception Score	21.45	—	Unverified
3	TGANv2-ODE	Inception Score	21.02	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Imagen original (constant=6)	CLIP R-Precision	92.12	—	Unverified
2	Imagen fully distilled (oscillate (15,1))	CLIP R-Precision	90.97	—	Unverified
3	Imagen distilled (constant=6)	CLIP R-Precision	90.88	—	Unverified
4	Imagen original (oscillate(15,1))	CLIP R-Precision	89.91	—	Unverified
5	Imagen fully distilled (constant=6)	CLIP R-Precision	89.68	—	Unverified
6	Imagen distilled (oscillate (15,1))	CLIP R-Precision	88.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DIGAN (256x256)	FVD16	156.7	—	Unverified
2	MoCoGAN-HD (128x128)	FVD16	144.7	—	Unverified
3	DIGAN (128x128)	FVD16	128.1	—	Unverified
4	LVDM (256x256)	FVD16	99	—	Unverified
5	TATS (128x128)	FVD16	94.6	—	Unverified
6	StyleSV (256x256)	FVD16	82.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGANv2 (2020)	Inception Score	28.87	—	Unverified
2	DVD-GAN	Inception Score	27.38	—	Unverified
3	VideoGPT	Inception Score	24.69	—	Unverified
4	TGANv2	Inception Score	24.34	—	Unverified
5	TGAN-F	Inception Score	22.91	—	Unverified
6	TGANv2-ODE	Inception Score	21.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FVD	31.1	—	Unverified
2	MAGVIT	FVD	9.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	INR-V	FVD16	144	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	2.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	12.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiT-XL/2 + CVAE-FT-SE	FID	8.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoAssembler (Zero-Shot, 256x256, class-conditional)	FVD16	252	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PG-SWGAN-3D	FID	404.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StyleSV	FVD16	207.2	—	Unverified