Video Generation

( Various Video Generation Tasks. Gif credit: MaGViT )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 951–1000 of 1466 papers

Title	Date	Tasks	Status
VideoRepair: Improving Text-to-Video Generation via Misalignment Evaluation and Localized Refinement	Nov 22, 2024	Text-to-Video GenerationVideo Alignment	—Unverified
Understanding World or Predicting Future? A Comprehensive Survey of World Models	Nov 21, 2024	Autonomous DrivingDecision Making	—Unverified
MagicDriveDiT: High-Resolution Long Video Generation for Autonomous Driving with Adaptive Control	Nov 21, 2024	Autonomous DrivingVideo Generation	—Unverified
TaQ-DiT: Time-aware Quantization for Diffusion Transformers	Nov 21, 2024	DenoisingModel Compression	—Unverified
What You See Is What Matters: A Novel Visual and Physics-Based Metric for Evaluating Video Generation Quality	Nov 20, 2024	Video Generation	—Unverified
Towards motion from video diffusion models	Nov 19, 2024	Video Generation	—Unverified
Automated 3D Physical Simulation of Open-world Scene with Gaussian Splatting	Nov 19, 2024	3D GenerationGPU	—Unverified
Medical Video Generation for Disease Progression Simulation	Nov 18, 2024	PrognosisVideo Generation	—Unverified
SpatialDreamer: Self-supervised Stereo Video Synthesis from Monocular Input	Nov 18, 2024	Novel View SynthesisVideo Generation	—Unverified
Teaching Video Diffusion Model with Latent Physical Phenomenon Knowledge	Nov 18, 2024	Video Generation	—Unverified
AnimateAnything: Consistent and Controllable Animation for Video Generation	Nov 16, 2024	Video Generation	—Unverified
ViBe: A Text-to-Video Benchmark for Evaluating Hallucination in Large Multimodal Models	Nov 16, 2024	HallucinationVideo Generation	—Unverified
VidMan: Exploiting Implicit Dynamics from Video Diffusion Model for Effective Robot Manipulation	Nov 14, 2024	DenoisingRobot Manipulation	—Unverified
Motion Control for Enhanced Complex Action Video Generation	Nov 13, 2024	Motion GenerationVideo Generation	—Unverified
A Survey on Vision Autoregressive Model	Nov 13, 2024	3D GenerationBenchmarking	—Unverified
EgoVid-5M: A Large-Scale Video-Action Dataset for Egocentric Video Generation	Nov 13, 2024	Video Generation	—Unverified
Artificial Intelligence for Biomedical Video Generation	Nov 12, 2024	Data AugmentationVideo Generation	CodeCode Available
I2VControl-Camera: Precise Video Camera Control with Adjustable Motion Strength	Nov 10, 2024	Video Generation	—Unverified
A Survey of Emerging Approaches and Advances in Video Generation	Nov 9, 2024	Image to Video GenerationLanguage Modeling	—Unverified
WHALE: Towards Generalizable and Scalable World Models for Embodied Decision-making	Nov 8, 2024	Decision MakingVideo Generation	—Unverified
DimensionX: Create Any 3D and 4D Scenes from a Single Image with Controllable Video Diffusion	Nov 7, 2024	3D GenerationDenoising	—Unverified
SG-I2V: Self-Guided Trajectory Control in Image-to-Video Generation	Nov 7, 2024	Image to Video GenerationVideo Generation	—Unverified
StoryAgent: Customized Storytelling Video Generation via Multi-Agent Collaboration	Nov 7, 2024	Video Generation	—Unverified
TIP-I2V: A Million-Scale Real Text and Image Prompt Dataset for Image-to-Video Generation	Nov 5, 2024	Image to Video GenerationMisinformation	—Unverified
Exploring the Interplay Between Video Generation and World Models in Autonomous Driving: A Survey	Nov 5, 2024	3D Scene ReconstructionAutonomous Driving	—Unverified
How Far is Video Generation from World Model: A Physical Law Perspective	Nov 4, 2024	Video Generation	—Unverified
Adaptive Caching for Faster Video Generation with Diffusion Transformers	Nov 4, 2024	DenoisingVideo Generation	—Unverified
Optical Flow Representation Alignment Mamba Diffusion Model for Medical Video Generation	Nov 3, 2024	MambaOptical Flow Estimation	—Unverified
Fashion-VDM: Video Diffusion Model for Virtual Try-On	Oct 31, 2024	Video GenerationVirtual Try-on	—Unverified
Stereo-Talker: Audio-driven 3D Human Synthesis with Prior-Guided Mixture-of-Experts	Oct 31, 2024	Language ModelingLanguage Modelling	—Unverified
LumiSculpt: A Consistency Lighting Control Network for Video Generation	Oct 30, 2024	Video Generation	—Unverified
SlowFast-VGen: Slow-Fast Learning for Action-Driven Long Video Generation	Oct 30, 2024	Video Generation	—Unverified
Investigating Memorization in Video Diffusion Models	Oct 29, 2024	MemorizationVideo Generation	—Unverified
ARLON: Boosting Diffusion Transformers with Autoregressive Models for Long Video Generation	Oct 27, 2024	Video Generation	—Unverified
GiVE: Guiding Visual Encoder to Perceive Overlooked Information	Oct 26, 2024	ObjectQuestion Answering	—Unverified
MarDini: Masked Autoregressive Diffusion for Video Generation at Scale	Oct 26, 2024	Image to Video GenerationVideo Generation	—Unverified
FasterCache: Training-Free Video Diffusion Model Acceleration with High Quality	Oct 25, 2024	Video Generation	—Unverified
Framer: Interactive Frame Interpolation	Oct 24, 2024	Image MorphingVideo Generation	—Unverified
VISAGE: Video Synthesis using Action Graphs for Surgery	Oct 23, 2024	Video Generation	—Unverified
WorldSimBench: Towards Video Generation Models as World Simulators	Oct 23, 2024	Autonomous DrivingRobot Manipulation	—Unverified
3DGS-Enhancer: Enhancing Unbounded 3D Gaussian Splatting with View-consistent 2D Diffusion Priors	Oct 21, 2024	3DGSDecoder	—Unverified
EVA: An Embodied World Model for Future Video Anticipation	Oct 20, 2024	Language ModelingLanguage Modelling	—Unverified
FrameBridge: Improving Image-to-Video Generation with Bridge Models	Oct 20, 2024	Image AnimationImage to Video Generation	—Unverified
Fundus to Fluorescein Angiography Video Generation as a Retinal Generative Foundation Model	Oct 17, 2024	Disease PredictionGenerative Adversarial Network	—Unverified
DriveDreamer4D: World Models Are Effective Data Machines for 4D Driving Scene Representation	Oct 17, 2024	3DGS4D reconstruction	—Unverified
AsymKV: Enabling 1-Bit Quantization of KV Cache with Layer-Wise Asymmetric Quantization Configurations	Oct 17, 2024	DecoderQuantization	—Unverified
VidPanos: Generative Panoramic Videos from Casual Panning Videos	Oct 17, 2024	Image StitchingVideo Generation	—Unverified
DreamVideo-2: Zero-Shot Subject-Driven Video Customization with Precise Motion Control	Oct 17, 2024	Video Generation	—Unverified
DragEntity: Trajectory Guided Video Generation using Entity and Positional Relationships	Oct 14, 2024	Video Generation	—Unverified
Cavia: Camera-controllable Multi-view Video Diffusion with View-Integrated Attention	Oct 14, 2024	Image to Video GenerationVideo Generation	—Unverified

Show:10 25 50

← PrevPage 20 of 30Next →

All datasets UCF-101 BAIR Robot Pushing Sky Time-lapse UCF-101 16 frames, 64x64, Unconditional UCF-101 16 frames, Unconditional, Single GPU LAION-400M Taichi UCF-101 16 frames, 128x128, Unconditional Kinetics-600 12 frames, 64x64 How2Sign Kinetics-600 12 frames, 128x128 Kinetics-600 48 frames, 64x64

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MCVD	FVD16	2,460	—	Unverified
2	VDM	FVD16	1,396	—	Unverified
3	TGAN-v2 (128x128)	FVD16	1,209	—	Unverified
4	MCVD (64x64)	FVD16	1,143	—	Unverified
5	MoCoGAN-HD (256x256, unconditional)	FVD16	700	—	Unverified
6	MagicVideo (256x256, text-conditional)	FVD16	699	—	Unverified
7	TATS (256x256)	FVD16	635	—	Unverified
8	FIFO-Diffusion	FVD128	596.64	—	Unverified
9	DIGAN (128x128, unconditional)	FVD16	577	—	Unverified
10	LVDM (256x256, unconditional)	FVD16	552	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN	FVD score	503	—	Unverified
2	Baseline (from LVT)	FVD score	320.9	—	Unverified
3	SVG-FP (from FVD)	FVD score	315.5	—	Unverified
4	CDNA (from FVD)	FVD score	296.5	—	Unverified
5	SV2P (from FVD)	FVD score	262.5	—	Unverified
6	SVG-LP (from vRNN)	FVD score	256.62	—	Unverified
7	WAM	FVD score	159.6	—	Unverified
8	VRNN 1L	FVD score	149.22	—	Unverified
9	SAVP (from vRNN)	FVD score	143.43	—	Unverified
10	Hier-VRNN	FVD score	143.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN-HD (128x128)	FVD 16	183.6	—	Unverified
2	TATS (128x128)	FVD 16	132.6	—	Unverified
3	Long-video GAN (256x256)	FVD 16	116.5	—	Unverified
4	DIGAN (128x128)	FVD 16	114.6	—	Unverified
5	Long-video GAN (128x128)	FVD 16	107.5	—	Unverified
6	LVDM (256x256)	FVD 16	95.2	—	Unverified
7	DDMI	FVD 16	66.25	—	Unverified
8	Latte + LeanVAE	FVD 16	49.59	—	Unverified
9	StyleSV (256x256)	FVD 16	49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Video Diffusion Model	Inception Score	57	—	Unverified
2	TGAN-ODE	Inception Score	15.2	—	Unverified
3	TGAN-F	Inception Score	13.62	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGAN-F	Inception Score	22.91	—	Unverified
2	TGANv2	Inception Score	21.45	—	Unverified
3	TGANv2-ODE	Inception Score	21.02	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Imagen original (constant=6)	CLIP R-Precision	92.12	—	Unverified
2	Imagen fully distilled (oscillate (15,1))	CLIP R-Precision	90.97	—	Unverified
3	Imagen distilled (constant=6)	CLIP R-Precision	90.88	—	Unverified
4	Imagen original (oscillate(15,1))	CLIP R-Precision	89.91	—	Unverified
5	Imagen fully distilled (constant=6)	CLIP R-Precision	89.68	—	Unverified
6	Imagen distilled (oscillate (15,1))	CLIP R-Precision	88.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DIGAN (256x256)	FVD16	156.7	—	Unverified
2	MoCoGAN-HD (128x128)	FVD16	144.7	—	Unverified
3	DIGAN (128x128)	FVD16	128.1	—	Unverified
4	LVDM (256x256)	FVD16	99	—	Unverified
5	TATS (128x128)	FVD16	94.6	—	Unverified
6	StyleSV (256x256)	FVD16	82.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGANv2 (2020)	Inception Score	28.87	—	Unverified
2	DVD-GAN	Inception Score	27.38	—	Unverified
3	VideoGPT	Inception Score	24.69	—	Unverified
4	TGANv2	Inception Score	24.34	—	Unverified
5	TGAN-F	Inception Score	22.91	—	Unverified
6	TGANv2-ODE	Inception Score	21.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FVD	31.1	—	Unverified
2	MAGVIT	FVD	9.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	INR-V	FVD16	144	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	2.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	12.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiT-XL/2 + CVAE-FT-SE	FID	8.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoAssembler (Zero-Shot, 256x256, class-conditional)	FVD16	252	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PG-SWGAN-3D	FID	404.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StyleSV	FVD16	207.2	—	Unverified