Video Generation

( Various Video Generation Tasks. Gif credit: MaGViT )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1351–1400 of 1466 papers

Title	Date	Tasks	Status
Xp-GAN: Unsupervised Multi-object Controllable Video Generation	Nov 19, 2021	ObjectVideo Generation	—Unverified
3-D PET Image Generation with tumour masks using TGAN	Nov 2, 2021	Image GenerationImage Segmentation	CodeCode Available
Image Comes Dancing with Collaborative Parsing-Flow Video Synthesis	Oct 27, 2021	Human ParsingVideo Generation	CodeCode Available
ViDA-MAN: Visual Dialog with Digital Humans	Oct 26, 2021	speech-recognitionSpeech Recognition	—Unverified
Intelligent Video Editing: Incorporating Modern Talking Face Generation Algorithms in a Video Editor	Oct 16, 2021	Face GenerationTalking Face Generation	—Unverified
Towards Using Clothes Style Transfer for Scenario-aware Person Video Generation	Oct 14, 2021	DecoderStyle Transfer	CodeCode Available
A Hierarchical Variational Neural Uncertainty Model for Stochastic Video Prediction	Oct 6, 2021	DiversityVideo Generation	—Unverified
Video Autoencoder: self-supervised disentanglement of static 3D structure and motion	Oct 6, 2021	Camera Pose EstimationDisentanglement	—Unverified
A review of Generative Adversarial Networks (GANs) and its applications in a wide variety of disciplines -- From Medical to Remote Sensing	Oct 1, 2021	AstronomyGenerative Adversarial Network	—Unverified
Towards Generative Latent Variable Models for Speech	Sep 29, 2021	Image GenerationVideo Generation	—Unverified
Conditional MoCoGAN for Zero-Shot Video Generation	Sep 13, 2021	Generative Adversarial NetworkImage Generation	—Unverified
Simple Video Generation using Neural ODEs	Sep 7, 2021	Video Generation	—Unverified
iButter: Neural Interactive Bullet Time Generator for Human Free-viewpoint Rendering	Aug 12, 2021	NeRFVideo Generation	—Unverified
RockGPT: Reconstructing three-dimensional digital rocks from single two-dimensional slice from the perspective of video generation	Aug 5, 2021	Video Generation	—Unverified
Video Generation from Text Employing Latent Path Construction for Temporal Modeling	Jul 29, 2021	Text-to-Video GenerationVideo Generation	—Unverified
Generative Video Transformer: Can Objects be the Words?	Jul 20, 2021	GPUScene Understanding	—Unverified
Speech2Video: Cross-Modal Distillation for Speech to Video Generation	Jul 10, 2021	Generative Adversarial NetworkVideo Generation	—Unverified
Cross-View Exocentric to Egocentric Video Synthesis	Jul 7, 2021	Generative Adversarial NetworkVideo Generation	—Unverified
Hierarchical Video Prediction Using Relational Layouts for Human-Object Interactions	Jun 19, 2021	Human-Object Interaction DetectionObject	—Unverified
NWT: Towards natural audio-to-video generation with representation learning	Jun 8, 2021	DecoderRepresentation Learning	CodeCode Available
Efficient training for future video generation based on hierarchical disentangled representation of latent variables	Jun 7, 2021	Future predictionImage Generation	—Unverified
Hierarchical Video Generation for Complex Data	Jun 4, 2021	Video Generation	—Unverified
Image-to-Video Generation via 3D Facial Dynamics	May 31, 2021	Image to Video GenerationVideo Generation	—Unverified
Adaptive Appearance Rendering	Apr 24, 2021	DecoderVideo Generation	CodeCode Available
Learning Long-Term Style-Preserving Blind Video Temporal Consistency	Mar 12, 2021	Image ManipulationStyle Transfer	—Unverified
Dual-MTGAN: Stochastic and Deterministic Motion Transfer for Image-to-Video Synthesis	Feb 26, 2021	Motion GenerationVideo Generation	—Unverified
One Shot Audio to Animated Video Generation	Feb 19, 2021	Video Generation	—Unverified
Disentangled Recurrent Wasserstein Autoencoder	Jan 19, 2021	DisentanglementRepresentation Learning	—Unverified
ArrowGAN : Learning to Generate Videos by Learning Arrow of Time	Jan 11, 2021	Conditional Image GenerationImage Generation	—Unverified
InMoDeGAN: Interpretable Motion Decomposition Generative Adversarial Network for Video Generation	Jan 8, 2021	Generative Adversarial NetworkVideo Generation	—Unverified
VideoGen: Generative Modeling of Videos using VQ-VAE and Transformers	Jan 1, 2021	PositionVideo Generation	—Unverified
Contrastive Video Textures	Jan 1, 2021	Contrastive LearningVideo Generation	—Unverified
Learning to Generate Videos Using Neural Uncertainty Priors	Jan 1, 2021	DiversityVideo Generation	—Unverified
Can Everybody Sign Now? Exploring Sign Language Video Generation from 2D Poses	Dec 20, 2020	Sign Language ProductionVideo Generation	—Unverified
GlocalNet: Class-aware Long-term Human Motion Synthesis	Dec 19, 2020	Motion SynthesisPedestrian Trajectory Prediction	—Unverified
Infinite Nature: Perpetual View Generation of Natural Scenes from a Single Image	Dec 17, 2020	Image GenerationPerpetual View Generation	CodeCode Available
Multi Modal Adaptive Normalization for Audio to Video Generation	Dec 14, 2020	Optical Flow EstimationSSIM	—Unverified
Robust One Shot Audio to Video Generation	Dec 14, 2020	Generative Adversarial NetworkMarketing	—Unverified
Modular Action Concept Grounding in Semantic Video Prediction	Nov 23, 2020	Action RecognitionMixture-of-Experts	—Unverified
Stochastic Talking Face Generation Using Latent Distribution Matching	Nov 21, 2020	Face GenerationTalking Face Generation	CodeCode Available
Everybody Sign Now: Translating Spoken Language to Photo Realistic Sign Language Video	Nov 19, 2020	Sign Language ProductionVideo Generation	—Unverified
Lets Play Music: Audio-driven Performance Video Generation	Nov 5, 2020	Video Generation	—Unverified
LIFI: Towards Linguistically Informed Frame Interpolation	Oct 30, 2020	Video Generation	CodeCode Available
EEG to fMRI Synthesis: Is Deep Learning a candidate?	Sep 29, 2020	Deep LearningEEG	—Unverified
Action Concept Grounding Network for Semantically-Consistent Video Generation	Sep 28, 2020	Action Recognitionobject-detection	—Unverified
TiVGAN: Text to Image to Video Generation with Step-by-Step Evolutionary Generator	Sep 4, 2020	Generative Adversarial NetworkImage Generation	—Unverified
Pose-Guided High-Resolution Appearance Transfer via Progressive Training	Aug 27, 2020	Appearance TransferDecoder	—Unverified
How Do the Hearts of Deep Fakes Beat? Deep Fake Source Detection via Interpreting Residuals with Biological Signals	Aug 26, 2020	Video Generation	—Unverified
HRVGAN: High Resolution Video Generation using Spatio-Temporal GAN	Aug 17, 2020	Video GenerationVocal Bursts Intensity Prediction	—Unverified
Recurrent Deconvolutional Generative Adversarial Networks with Application to Text Guided Video Generation	Aug 13, 2020	Generative Adversarial NetworkVideo Classification	—Unverified

Show:10 25 50

← PrevPage 28 of 30Next →

All datasets UCF-101 BAIR Robot Pushing Sky Time-lapse UCF-101 16 frames, 64x64, Unconditional UCF-101 16 frames, Unconditional, Single GPU LAION-400M Taichi UCF-101 16 frames, 128x128, Unconditional Kinetics-600 12 frames, 64x64 How2Sign Kinetics-600 12 frames, 128x128 Kinetics-600 48 frames, 64x64

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MCVD	FVD16	2,460	—	Unverified
2	VDM	FVD16	1,396	—	Unverified
3	TGAN-v2 (128x128)	FVD16	1,209	—	Unverified
4	MCVD (64x64)	FVD16	1,143	—	Unverified
5	MoCoGAN-HD (256x256, unconditional)	FVD16	700	—	Unverified
6	MagicVideo (256x256, text-conditional)	FVD16	699	—	Unverified
7	TATS (256x256)	FVD16	635	—	Unverified
8	FIFO-Diffusion	FVD128	596.64	—	Unverified
9	DIGAN (128x128, unconditional)	FVD16	577	—	Unverified
10	LVDM (256x256, unconditional)	FVD16	552	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN	FVD score	503	—	Unverified
2	Baseline (from LVT)	FVD score	320.9	—	Unverified
3	SVG-FP (from FVD)	FVD score	315.5	—	Unverified
4	CDNA (from FVD)	FVD score	296.5	—	Unverified
5	SV2P (from FVD)	FVD score	262.5	—	Unverified
6	SVG-LP (from vRNN)	FVD score	256.62	—	Unverified
7	WAM	FVD score	159.6	—	Unverified
8	VRNN 1L	FVD score	149.22	—	Unverified
9	SAVP (from vRNN)	FVD score	143.43	—	Unverified
10	Hier-VRNN	FVD score	143.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN-HD (128x128)	FVD 16	183.6	—	Unverified
2	TATS (128x128)	FVD 16	132.6	—	Unverified
3	Long-video GAN (256x256)	FVD 16	116.5	—	Unverified
4	DIGAN (128x128)	FVD 16	114.6	—	Unverified
5	Long-video GAN (128x128)	FVD 16	107.5	—	Unverified
6	LVDM (256x256)	FVD 16	95.2	—	Unverified
7	DDMI	FVD 16	66.25	—	Unverified
8	Latte + LeanVAE	FVD 16	49.59	—	Unverified
9	StyleSV (256x256)	FVD 16	49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Video Diffusion Model	Inception Score	57	—	Unverified
2	TGAN-ODE	Inception Score	15.2	—	Unverified
3	TGAN-F	Inception Score	13.62	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGAN-F	Inception Score	22.91	—	Unverified
2	TGANv2	Inception Score	21.45	—	Unverified
3	TGANv2-ODE	Inception Score	21.02	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Imagen original (constant=6)	CLIP R-Precision	92.12	—	Unverified
2	Imagen fully distilled (oscillate (15,1))	CLIP R-Precision	90.97	—	Unverified
3	Imagen distilled (constant=6)	CLIP R-Precision	90.88	—	Unverified
4	Imagen original (oscillate(15,1))	CLIP R-Precision	89.91	—	Unverified
5	Imagen fully distilled (constant=6)	CLIP R-Precision	89.68	—	Unverified
6	Imagen distilled (oscillate (15,1))	CLIP R-Precision	88.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DIGAN (256x256)	FVD16	156.7	—	Unverified
2	MoCoGAN-HD (128x128)	FVD16	144.7	—	Unverified
3	DIGAN (128x128)	FVD16	128.1	—	Unverified
4	LVDM (256x256)	FVD16	99	—	Unverified
5	TATS (128x128)	FVD16	94.6	—	Unverified
6	StyleSV (256x256)	FVD16	82.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGANv2 (2020)	Inception Score	28.87	—	Unverified
2	DVD-GAN	Inception Score	27.38	—	Unverified
3	VideoGPT	Inception Score	24.69	—	Unverified
4	TGANv2	Inception Score	24.34	—	Unverified
5	TGAN-F	Inception Score	22.91	—	Unverified
6	TGANv2-ODE	Inception Score	21.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FVD	31.1	—	Unverified
2	MAGVIT	FVD	9.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	INR-V	FVD16	144	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	2.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	12.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiT-XL/2 + CVAE-FT-SE	FID	8.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoAssembler (Zero-Shot, 256x256, class-conditional)	FVD16	252	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PG-SWGAN-3D	FID	404.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StyleSV	FVD16	207.2	—	Unverified