Video Generation

( Various Video Generation Tasks. Gif credit: MaGViT )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1201–1250 of 1466 papers

Title	Date	Tasks	Status
Sora Generates Videos with Stunning Geometrical Consistency	Feb 27, 2024	3D ReconstructionVideo Generation	—Unverified
Customize-A-Video: One-Shot Motion Customization of Text-to-Video Diffusion Models	Feb 22, 2024	Video Generation	—Unverified
Snap Video: Scaled Spatiotemporal Transformers for Text-to-Video Synthesis	Feb 22, 2024	Image GenerationText-to-Video Generation	—Unverified
Hybrid Video Diffusion Models with 2D Triplane and 3D Wavelet Representation	Feb 21, 2024	Video GenerationVideo Reconstruction	—Unverified
VGMShield: Mitigating Misuse of Video Generative Models	Feb 20, 2024	Video Generation	CodeCode Available
Denoising Diffusion Probabilistic Models in Six Simple Steps	Feb 6, 2024	DenoisingVideo Generation	—Unverified
Direct-a-Video: Customized Video Generation with User-Directed Camera Movement and Object Motion	Feb 5, 2024	ObjectVideo Generation	—Unverified
NeuroCine: Decoding Vivid Video Sequences from Human Brain Activties	Feb 2, 2024	Contrastive LearningSSIM	—Unverified
A Survey on Generative AI and LLM for Video Generation, Understanding, and Streaming	Jan 30, 2024	Video GenerationVideo Understanding	—Unverified
Motion-I2V: Consistent and Controllable Image-to-Video Generation with Explicit Motion Modeling	Jan 29, 2024	Image to Video GenerationVideo Generation	—Unverified
Motion-Zero: Zero-Shot Moving Object Control Framework for Diffusion-Based Video Generation	Jan 18, 2024	DenoisingPosition	—Unverified
CustomVideo: Customizing Text-to-Video Generation with Multiple Subjects	Jan 18, 2024	ObjectText-to-Video Generation	—Unverified
WorldDreamer: Towards General World Models for Video Generation via Predicting Masked Tokens	Jan 18, 2024	Video EditingVideo Generation	—Unverified
Inflation with Diffusion: Efficient Temporal Adaptation for Text-to-Video Super-Resolution	Jan 18, 2024	Super-ResolutionVideo Generation	—Unverified
UniVG: Towards UNIfied-modal Video Generation	Jan 17, 2024	Video Generation	—Unverified
Towards A Better Metric for Text-to-Video Generation	Jan 15, 2024	Mixture-of-ExpertsText-to-Video Generation	—Unverified
360DVD: Controllable Panorama Video Generation with 360-Degree Video Diffusion Model	Jan 12, 2024	Video Generation	—Unverified
RAVEN: Rethinking Adversarial Video Generation with Efficient Tri-plane Networks	Jan 11, 2024	Generative Adversarial NetworkOptical Flow Estimation	—Unverified
MagicVideo-V2: Multi-Stage High-Aesthetic Video Generation	Jan 9, 2024	MORPHVideo Generation	—Unverified
Neural Rendering and Its Hardware Acceleration: A Review	Jan 6, 2024	3D ReconstructionDeep Learning	—Unverified
PromptCoT: Align Prompt Distribution via Adapted Chain-of-Thought	Jan 1, 2024	Computational EfficiencyPrompt Engineering	—Unverified
SNED: Superposition Network Architecture Search for Efficient Video Diffusion Model	Jan 1, 2024	Video Generation	—Unverified
LAMP: Learn A Motion Pattern for Few-Shot Video Generation	Jan 1, 2024	GPUImage Animation	—Unverified
DiffPerformer: Iterative Learning of Consistent Latent Guidance for Diffusion-based Human Video Generation	Jan 1, 2024	Video Generation	—Unverified
On the Content Bias in Frechet Video Distance	Jan 1, 2024	Video Generation	—Unverified
FlashVideo: A Framework for Swift Inference in Text-to-Video Generation	Dec 30, 2023	Text-to-Video GenerationVideo Generation	—Unverified
A Recipe for Scaling up Text-to-Video Generation with Text-free Videos	Dec 25, 2023	Image GenerationText to Image Generation	—Unverified
Align Your Gaussians: Text-to-4D with Dynamic 3D Gaussians and Composed Diffusion Models	Dec 21, 2023	Synthetic Data GenerationVideo Generation	—Unverified
VideoPoet: A Large Language Model for Zero-Shot Video Generation	Dec 21, 2023	DecoderLanguage Modeling	—Unverified
InstructVideo: Instructing Video Diffusion Models with Human Feedback	Dec 19, 2023	Video Generation	—Unverified
VideoLCM: Video Latent Consistency Model	Dec 14, 2023	Computational EfficiencyImage Generation	—Unverified
Photorealistic Video Generation with Diffusion Models	Dec 11, 2023	Super-ResolutionText-to-Video Generation	—Unverified
DreaMoving: A Human Video Generation Framework based on Diffusion Models	Dec 8, 2023	Video Generation	—Unverified
Hierarchical Spatio-temporal Decoupling for Text-to-Video Generation	Dec 7, 2023	Spatial ReasoningText-to-Video Generation	—Unverified
GenDeF: Learning Generative Deformation Field for Video Generation	Dec 7, 2023	DisentanglementVideo Editing	—Unverified
GenTron: Diffusion Transformers for Image and Video Generation	Dec 7, 2023	Text-to-Video GenerationVideo Generation	—Unverified
MEVG: Multi-event Video Generation with Text-to-Video Models	Dec 7, 2023	Video Generation	—Unverified
DreamVideo: Composing Your Dream Videos with Customized Subject and Motion	Dec 7, 2023	Image GenerationVideo Generation	—Unverified
NewMove: Customizing text-to-video models with novel motions	Dec 7, 2023	Text-to-Video GenerationVideo Generation	—Unverified
FAAC: Facial Animation Generation with Anchor Frame and Conditional Control for Superior Fidelity and Editability	Dec 6, 2023	Face ModelVideo Generation	—Unverified
LivePhoto: Real Image Animation with Text-guided Motion Control	Dec 5, 2023	Image AnimationText-to-Video Generation	—Unverified
Fine-grained Controllable Video Generation via Object Appearance and Context	Dec 5, 2023	Text-to-Video GenerationVideo Generation	—Unverified
DreamVideo: High-Fidelity Image-to-Video Generation with Image Retention and Text Guidance	Dec 5, 2023	Image to Video GenerationVideo Generation	—Unverified
Generative Rendering: Controllable 4D-Guided Video Generation with 2D Diffusion Models	Dec 3, 2023	Image GenerationText to Image Generation	—Unverified
VideoBooth: Diffusion-based Video Generation with Image Prompts	Dec 1, 2023	Video Generation	—Unverified
MicroCinema: A Divide-and-Conquer Approach for Text-to-Video Generation	Nov 30, 2023	Image GenerationText to Image Generation	—Unverified
VIDiff: Translating Videos via Multi-Modal Instructions with Diffusion Models	Nov 30, 2023	Semantic SegmentationVideo Editing	—Unverified
ARTV: Auto-Regressive Text-to-Video Generation with Diffusion Models	Nov 30, 2023	Text-to-Video GenerationVideo Generation	—Unverified
MotionZero:Exploiting Motion Priors for Zero-shot Text-to-Video Generation	Nov 28, 2023	DisentanglementText-to-Video Generation	—Unverified
FlowZero: Zero-Shot Text-to-Video Synthesis with LLM-Driven Dynamic Scene Syntax	Nov 27, 2023	Video Generation	—Unverified

Show:10 25 50

← PrevPage 25 of 30Next →

All datasets UCF-101 BAIR Robot Pushing Sky Time-lapse UCF-101 16 frames, 64x64, Unconditional UCF-101 16 frames, Unconditional, Single GPU LAION-400M Taichi UCF-101 16 frames, 128x128, Unconditional Kinetics-600 12 frames, 64x64 How2Sign Kinetics-600 12 frames, 128x128 Kinetics-600 48 frames, 64x64

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MCVD	FVD16	2,460	—	Unverified
2	VDM	FVD16	1,396	—	Unverified
3	TGAN-v2 (128x128)	FVD16	1,209	—	Unverified
4	MCVD (64x64)	FVD16	1,143	—	Unverified
5	MoCoGAN-HD (256x256, unconditional)	FVD16	700	—	Unverified
6	MagicVideo (256x256, text-conditional)	FVD16	699	—	Unverified
7	TATS (256x256)	FVD16	635	—	Unverified
8	FIFO-Diffusion	FVD128	596.64	—	Unverified
9	DIGAN (128x128, unconditional)	FVD16	577	—	Unverified
10	LVDM (256x256, unconditional)	FVD16	552	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN	FVD score	503	—	Unverified
2	Baseline (from LVT)	FVD score	320.9	—	Unverified
3	SVG-FP (from FVD)	FVD score	315.5	—	Unverified
4	CDNA (from FVD)	FVD score	296.5	—	Unverified
5	SV2P (from FVD)	FVD score	262.5	—	Unverified
6	SVG-LP (from vRNN)	FVD score	256.62	—	Unverified
7	WAM	FVD score	159.6	—	Unverified
8	VRNN 1L	FVD score	149.22	—	Unverified
9	SAVP (from vRNN)	FVD score	143.43	—	Unverified
10	Hier-VRNN	FVD score	143.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN-HD (128x128)	FVD 16	183.6	—	Unverified
2	TATS (128x128)	FVD 16	132.6	—	Unverified
3	Long-video GAN (256x256)	FVD 16	116.5	—	Unverified
4	DIGAN (128x128)	FVD 16	114.6	—	Unverified
5	Long-video GAN (128x128)	FVD 16	107.5	—	Unverified
6	LVDM (256x256)	FVD 16	95.2	—	Unverified
7	DDMI	FVD 16	66.25	—	Unverified
8	Latte + LeanVAE	FVD 16	49.59	—	Unverified
9	StyleSV (256x256)	FVD 16	49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Video Diffusion Model	Inception Score	57	—	Unverified
2	TGAN-ODE	Inception Score	15.2	—	Unverified
3	TGAN-F	Inception Score	13.62	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGAN-F	Inception Score	22.91	—	Unverified
2	TGANv2	Inception Score	21.45	—	Unverified
3	TGANv2-ODE	Inception Score	21.02	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Imagen original (constant=6)	CLIP R-Precision	92.12	—	Unverified
2	Imagen fully distilled (oscillate (15,1))	CLIP R-Precision	90.97	—	Unverified
3	Imagen distilled (constant=6)	CLIP R-Precision	90.88	—	Unverified
4	Imagen original (oscillate(15,1))	CLIP R-Precision	89.91	—	Unverified
5	Imagen fully distilled (constant=6)	CLIP R-Precision	89.68	—	Unverified
6	Imagen distilled (oscillate (15,1))	CLIP R-Precision	88.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DIGAN (256x256)	FVD16	156.7	—	Unverified
2	MoCoGAN-HD (128x128)	FVD16	144.7	—	Unverified
3	DIGAN (128x128)	FVD16	128.1	—	Unverified
4	LVDM (256x256)	FVD16	99	—	Unverified
5	TATS (128x128)	FVD16	94.6	—	Unverified
6	StyleSV (256x256)	FVD16	82.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGANv2 (2020)	Inception Score	28.87	—	Unverified
2	DVD-GAN	Inception Score	27.38	—	Unverified
3	VideoGPT	Inception Score	24.69	—	Unverified
4	TGANv2	Inception Score	24.34	—	Unverified
5	TGAN-F	Inception Score	22.91	—	Unverified
6	TGANv2-ODE	Inception Score	21.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FVD	31.1	—	Unverified
2	MAGVIT	FVD	9.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	INR-V	FVD16	144	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	2.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	12.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiT-XL/2 + CVAE-FT-SE	FID	8.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoAssembler (Zero-Shot, 256x256, class-conditional)	FVD16	252	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PG-SWGAN-3D	FID	404.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StyleSV	FVD16	207.2	—	Unverified