Video Generation

( Various Video Generation Tasks. Gif credit: MaGViT )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1151–1200 of 1466 papers

Title	Date	Tasks	Status
Exposing AI-generated Videos: A Benchmark Dataset and a Local-and-Global Temporal Defect Based Detection Method	May 7, 2024	Video Generation	—Unverified
Audio-Visual Speech Representation Expert for Enhanced Talking Face Video Generation and Evaluation	May 7, 2024	Face GenerationTalking Face Generation	—Unverified
Vidu: a Highly Consistent, Dynamic and Skilled Text-to-Video Generator with Diffusion Models	May 7, 2024	Video GenerationVideo Prediction	—Unverified
Matten: Video Generation with Mamba-Attention	May 5, 2024	MambaVideo Generation	—Unverified
Bridge to Non-Barrier Communication: Gloss-Prompted Fine-grained Cued Speech Gesture Generation with Diffusion Model	Apr 30, 2024	DescriptiveGesture Generation	—Unverified
Synthesizing Audio from Silent Video using Sequence to Sequence Modeling	Apr 25, 2024	DecoderDiversity	CodeCode Available
MotionMaster: Training-free Camera Motion Transfer For Video Generation	Apr 24, 2024	DisentanglementMotion Disentanglement	—Unverified
Accelerating Image Generation with Sub-path Linear Approximation Model	Apr 22, 2024	DenoisingGPU	—Unverified
Motion-aware Latent Diffusion Models for Video Frame Interpolation	Apr 21, 2024	Motion EstimationVideo Frame Interpolation	—Unverified
Music Consistency Models	Apr 20, 2024	Computational EfficiencyMusic Generation	—Unverified
PhysDreamer: Physics-Based Interaction with 3D Objects via Video Generation	Apr 19, 2024	motion predictionObject	—Unverified
AniClipart: Clipart Animation with Text-to-Video Priors	Apr 18, 2024	Image to Video GenerationText-to-Video Generation	—Unverified
SparseDM: Toward Sparse Efficient Diffusion Models	Apr 16, 2024	GPUVideo Generation	—Unverified
Ctrl-Adapter: An Efficient and Versatile Framework for Adapting Diverse Controls to Any Diffusion Model	Apr 15, 2024	GPUImage Generation	—Unverified
LoopAnimate: Loopable Salient Object Animation	Apr 14, 2024	GPUObject	—Unverified
Action-conditioned video data improves predictability	Apr 8, 2024	Video Generation	—Unverified
AnimateZoo: Zero-shot Video Generation of Cross-Species Animation via Subject Alignment	Apr 7, 2024	Video EditingVideo Generation	—Unverified
Grid Diffusion Models for Text-to-Video Generation	Mar 30, 2024	GPUImage Generation	—Unverified
A Review of Multi-Modal Large Language and Vision Models	Mar 28, 2024	Image CaptioningPrompt Engineering	—Unverified
Frame by Familiar Frame: Understanding Replication in Video Diffusion Models	Mar 28, 2024	Image GenerationVideo Generation	—Unverified
Annotated Biomedical Video Generation using Denoising Diffusion Probabilistic Models and Flow Fields	Mar 26, 2024	Cell SegmentationDenoising	CodeCode Available
TC4D: Trajectory-Conditioned Text-to-4D Generation	Mar 26, 2024	Scene GenerationVideo Generation	—Unverified
Tutorial on Diffusion Models for Imaging and Vision	Mar 26, 2024	Image GenerationText to Image Generation	—Unverified
A Survey on Long Video Generation: Challenges, Methods, and Prospects	Mar 25, 2024	SurveyVideo Generation	—Unverified
TRIP: Temporal Residual Learning with Image Noise Prior for Image-to-Video Diffusion Models	Mar 25, 2024	Image to Video GenerationRelational Reasoning	—Unverified
Opportunities and challenges in the application of large artificial intelligence models in radiology	Mar 24, 2024	Video Generation	—Unverified
Spectral Motion Alignment for Video Motion Transfer using Diffusion Models	Mar 22, 2024	Computational EfficiencyVideo Generation	—Unverified
Explorative Inbetweening of Time and Space	Mar 21, 2024	DenoisingVideo Generation	—Unverified
Efficient Video Diffusion Models via Content-Frame Motion-Latent Decomposition	Mar 21, 2024	Video Generation	—Unverified
Enabling Visual Composition and Animation in Unsupervised Video Generation	Mar 21, 2024	Video Generation	—Unverified
S2DM: Sector-Shaped Diffusion Models for Video Generation	Mar 20, 2024	Image GenerationOptical Flow Estimation	—Unverified
AnimateDiff-Lightning: Cross-Model Diffusion Distillation	Mar 19, 2024	modelVideo Generation	—Unverified
Endora: Video Generation Models as Endoscopy Simulators	Mar 17, 2024	Data AugmentationVideo Generation	—Unverified
Animate Your Motion: Turning Still Images into Dynamic Videos	Mar 15, 2024	SpecificityText-to-Video Generation	—Unverified
Video Editing via Factorized Diffusion Distillation	Mar 14, 2024	Video EditingVideo Generation	—Unverified
Intention-driven Ego-to-Exo Video Generation	Mar 14, 2024	Optical Flow EstimationStereo Matching	—Unverified
VLOGGER: Multimodal Diffusion for Embodied Avatar Synthesis	Mar 13, 2024	Face DetectionVideo Editing	—Unverified
AesopAgent: Agent-driven Evolutionary System on Story-to-Video Production	Mar 12, 2024	Image GenerationRAG	—Unverified
Video Generation with Consistency Tuning	Mar 11, 2024	Video Generation	—Unverified
BlazeBVD: Make Scale-Time Equalization Great Again for Blind Video Deflickering	Mar 10, 2024	Video GenerationVideo Temporal Consistency	—Unverified
WorldGPT: A Sora-Inspired Video AI Agent as Rich World Models from Text and Image Inputs	Mar 10, 2024	AI AgentVideo Generation	—Unverified
FastVideoEdit: Leveraging Consistency Models for Efficient Text-to-Video Editing	Mar 10, 2024	Image GenerationText-to-Video Editing	—Unverified
Sora as an AGI World Model? A Complete Survey on Text-to-Video Generation	Mar 8, 2024	ArticlesHallucination	—Unverified
A spatiotemporal style transfer algorithm for dynamic visual stimulus generation	Mar 7, 2024	Image GenerationObject Recognition	—Unverified
Tuning-Free Noise Rectification for High Fidelity Image-to-Video Generation	Mar 5, 2024	DenoisingImage Animation	—Unverified
AtomoVideo: High Fidelity Image-to-Video Generation	Mar 4, 2024	Image GenerationImage to Video Generation	—Unverified
Abductive Ego-View Accident Video Understanding for Safe Driving Perception	Mar 1, 2024	Objectobject-detection	—Unverified
Context-aware Talking Face Video Generation	Feb 28, 2024	Video GenerationVideo Synchronization	—Unverified
Video as the New Language for Real-World Decision Making	Feb 27, 2024	Decision MakingIn-Context Learning	—Unverified
EMO: Emote Portrait Alive -- Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditions	Feb 27, 2024	Video Generation	—Unverified

Show:10 25 50

← PrevPage 24 of 30Next →

All datasets UCF-101 BAIR Robot Pushing Sky Time-lapse UCF-101 16 frames, 64x64, Unconditional UCF-101 16 frames, Unconditional, Single GPU LAION-400M Taichi UCF-101 16 frames, 128x128, Unconditional Kinetics-600 12 frames, 64x64 How2Sign Kinetics-600 12 frames, 128x128 Kinetics-600 48 frames, 64x64

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MCVD	FVD16	2,460	—	Unverified
2	VDM	FVD16	1,396	—	Unverified
3	TGAN-v2 (128x128)	FVD16	1,209	—	Unverified
4	MCVD (64x64)	FVD16	1,143	—	Unverified
5	MoCoGAN-HD (256x256, unconditional)	FVD16	700	—	Unverified
6	MagicVideo (256x256, text-conditional)	FVD16	699	—	Unverified
7	TATS (256x256)	FVD16	635	—	Unverified
8	FIFO-Diffusion	FVD128	596.64	—	Unverified
9	DIGAN (128x128, unconditional)	FVD16	577	—	Unverified
10	LVDM (256x256, unconditional)	FVD16	552	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN	FVD score	503	—	Unverified
2	Baseline (from LVT)	FVD score	320.9	—	Unverified
3	SVG-FP (from FVD)	FVD score	315.5	—	Unverified
4	CDNA (from FVD)	FVD score	296.5	—	Unverified
5	SV2P (from FVD)	FVD score	262.5	—	Unverified
6	SVG-LP (from vRNN)	FVD score	256.62	—	Unverified
7	WAM	FVD score	159.6	—	Unverified
8	VRNN 1L	FVD score	149.22	—	Unverified
9	SAVP (from vRNN)	FVD score	143.43	—	Unverified
10	Hier-VRNN	FVD score	143.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN-HD (128x128)	FVD 16	183.6	—	Unverified
2	TATS (128x128)	FVD 16	132.6	—	Unverified
3	Long-video GAN (256x256)	FVD 16	116.5	—	Unverified
4	DIGAN (128x128)	FVD 16	114.6	—	Unverified
5	Long-video GAN (128x128)	FVD 16	107.5	—	Unverified
6	LVDM (256x256)	FVD 16	95.2	—	Unverified
7	DDMI	FVD 16	66.25	—	Unverified
8	Latte + LeanVAE	FVD 16	49.59	—	Unverified
9	StyleSV (256x256)	FVD 16	49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Video Diffusion Model	Inception Score	57	—	Unverified
2	TGAN-ODE	Inception Score	15.2	—	Unverified
3	TGAN-F	Inception Score	13.62	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGAN-F	Inception Score	22.91	—	Unverified
2	TGANv2	Inception Score	21.45	—	Unverified
3	TGANv2-ODE	Inception Score	21.02	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Imagen original (constant=6)	CLIP R-Precision	92.12	—	Unverified
2	Imagen fully distilled (oscillate (15,1))	CLIP R-Precision	90.97	—	Unverified
3	Imagen distilled (constant=6)	CLIP R-Precision	90.88	—	Unverified
4	Imagen original (oscillate(15,1))	CLIP R-Precision	89.91	—	Unverified
5	Imagen fully distilled (constant=6)	CLIP R-Precision	89.68	—	Unverified
6	Imagen distilled (oscillate (15,1))	CLIP R-Precision	88.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DIGAN (256x256)	FVD16	156.7	—	Unverified
2	MoCoGAN-HD (128x128)	FVD16	144.7	—	Unverified
3	DIGAN (128x128)	FVD16	128.1	—	Unverified
4	LVDM (256x256)	FVD16	99	—	Unverified
5	TATS (128x128)	FVD16	94.6	—	Unverified
6	StyleSV (256x256)	FVD16	82.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGANv2 (2020)	Inception Score	28.87	—	Unverified
2	DVD-GAN	Inception Score	27.38	—	Unverified
3	VideoGPT	Inception Score	24.69	—	Unverified
4	TGANv2	Inception Score	24.34	—	Unverified
5	TGAN-F	Inception Score	22.91	—	Unverified
6	TGANv2-ODE	Inception Score	21.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FVD	31.1	—	Unverified
2	MAGVIT	FVD	9.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	INR-V	FVD16	144	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	2.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	12.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiT-XL/2 + CVAE-FT-SE	FID	8.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoAssembler (Zero-Shot, 256x256, class-conditional)	FVD16	252	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PG-SWGAN-3D	FID	404.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StyleSV	FVD16	207.2	—	Unverified