Video Generation

( Various Video Generation Tasks. Gif credit: MaGViT )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 801–850 of 1466 papers

Title	Date	Tasks	Status
Audio-Driven Talking Face Video Generation with Dynamic Convolution Kernels	Jan 16, 2022	Video Generation	—Unverified
Audio-Sync Video Generation with Multi-Stream Temporal Control	Jun 9, 2025	Audio-Visual SynchronizationVideo Alignment	—Unverified
Audio-Visual Speech Representation Expert for Enhanced Talking Face Video Generation and Evaluation	May 7, 2024	Face GenerationTalking Face Generation	—Unverified
Autoencoding Video Latents for Adversarial Video Generation	Jan 18, 2022	Image GenerationVideo Generation	—Unverified
AutoLV: Automatic Lecture Video Generator	Sep 19, 2022	Speech SynthesisTalking Head Generation	—Unverified
Automated 3D Physical Simulation of Open-world Scene with Gaussian Splatting	Nov 19, 2024	3D GenerationGPU	—Unverified
AUTV: Creating Underwater Video Datasets with Pixel-wise Annotations	Mar 17, 2025	Semantic SegmentationVideo Generation	—Unverified
AvatarShield: Visual Reinforcement Learning for Human-Centric Video Forgery Detection	May 21, 2025	reinforcement-learningReinforcement Learning	—Unverified
AV-DiT: Efficient Audio-Visual Diffusion Transformer for Joint Audio and Video Generation	Jun 11, 2024	Audio GenerationVideo Generation	—Unverified
AV-Link: Temporally-Aligned Diffusion Features for Cross-Modal Audio-Video Generation	Dec 19, 2024	Video GenerationVideo Synchronization	—Unverified
Beyond Text: Implementing Multimodal Large Language Model-Powered Multi-Agent Systems Using a No-Code Platform	Jan 1, 2025	Code GenerationImage Generation	—Unverified
Beyond the Frame: Generating 360° Panoramic Videos from Perspective Videos	Apr 10, 2025	Question AnsweringVideo Generation	—Unverified
The Missing U for Efficient Diffusion Models	Oct 31, 2023	DenoisingImage Generation	—Unverified
BlazeBVD: Make Scale-Time Equalization Great Again for Blind Video Deflickering	Mar 10, 2024	Video GenerationVideo Temporal Consistency	—Unverified
BlobGEN-Vid: Compositional Text-to-Video Generation with Blob Video Representations	Jan 13, 2025	ObjectText-to-Video Generation	—Unverified
Boosting Camera Motion Control for Video Diffusion Transformers	Oct 14, 2024	Video Generation	—Unverified
Bora: Biomedical Generalist Video Generation Model	Jul 12, 2024	Cell TrackingData Augmentation	—Unverified
Brick-Diffusion: Generating Long Videos with Brick-to-Wall Denoising	Jan 6, 2025	DenoisingVideo Generation	—Unverified
BridgeIV: Bridging Customized Image and Video Generation through Test-Time Autoregressive Identity Propagation	May 11, 2025	Video Generation	—Unverified
Bridge to Non-Barrier Communication: Gloss-Prompted Fine-grained Cued Speech Gesture Generation with Diffusion Model	Apr 30, 2024	DescriptiveGesture Generation	—Unverified
BroadWay: Boost Your Text-to-Video Generation Model in a Training-free Way	Oct 8, 2024	DecoderText-to-Video Generation	—Unverified
BrokenVideos: A Benchmark Dataset for Fine-Grained Artifact Localization in AI-Generated Videos	Jun 25, 2025	Artifact DetectionBenchmarking	—Unverified
BulletGen: Improving 4D Reconstruction with Bullet-Time Generation	Jun 23, 2025	4D reconstructionDepth Estimation	—Unverified
ByTheWay: Boost Your Text-to-Video Generation Model to Higher Quality in a Training-free Way	Jan 1, 2025	Text-to-Video GenerationVideo Generation	—Unverified
CamCo: Camera-Controllable 3D-Consistent Image-to-Video Generation	Jun 4, 2024	Image to Video GenerationVideo Generation	—Unverified
CamMimic: Zero-Shot Image To Camera Motion Personalized Video Generation Using Diffusion Models	Apr 13, 2025	Video EditingVideo Generation	—Unverified
CamViG: Camera Aware Image-to-Video Generation with Multimodal Transformers	May 21, 2024	Image to Video GenerationVideo Generation	—Unverified
Can Everybody Sign Now? Exploring Sign Language Video Generation from 2D Poses	Dec 20, 2020	Sign Language ProductionVideo Generation	—Unverified
Can Text-to-Video Generation help Video-Language Alignment?	Mar 24, 2025	Text-to-Video GenerationVideo Generation	—Unverified
Can video generation replace cinematographers? Research on the cinematic language of generated video	Dec 16, 2024	Video Generation	—Unverified
Capturing Conditional Dependence via Auto-regressive Diffusion Models	Apr 30, 2025	Video Generation	—Unverified
Cascaded Video Generation for Videos In-the-Wild	Jun 1, 2022	Video Generation	—Unverified
Cavia: Camera-controllable Multi-view Video Diffusion with View-Integrated Attention	Oct 14, 2024	Image to Video GenerationVideo Generation	—Unverified
Challenger: Affordable Adversarial Driving Video Generation	May 21, 2025	Autonomous DrivingVideo Generation	—Unverified
ChatAnyone: Stylized Real-time Portrait Video Generation with Hierarchical Motion Diffusion Model	Mar 27, 2025	GPUVideo Generation	—Unverified
CINEMA: Coherent Multi-Subject Video Generation via MLLM-Based Guidance	Mar 13, 2025	Large Language ModelMultimodal Large Language Model	—Unverified
CineMaster: A 3D-Aware and Controllable Framework for Cinematic Text-to-Video Generation	Feb 12, 2025	ObjectText-to-Video Generation	—Unverified
CoGen: 3D Consistent Video Generation via Adaptive Conditioning for Autonomous Driving	Mar 28, 2025	3D GenerationAutonomous Driving	—Unverified
Collaborative Video Diffusion: Consistent Multi-video Generation with Camera Control	May 27, 2024	Scene GenerationVideo Generation	—Unverified
CompactFlowNet: Efficient Real-time Optical Flow Estimation on Mobile Devices	Dec 17, 2024	Action RecognitionMotion Estimation	—Unverified
Compositional 3D-aware Video Generation with LLM Director	Aug 31, 2024	Text-to-Video GenerationVideo Generation	—Unverified
Comprehensive Subjective and Objective Evaluation Method for Text-generated Video	Jan 15, 2025	Video Generation	—Unverified
COMUNI: Decomposing Common and Unique Video Signals for Diffusion-based Video Generation	Oct 2, 2024	DecoderPosition	—Unverified
ConceptMaster: Multi-Concept Video Customization on Diffusion Transformer Models Without Test-Time Tuning	Jan 8, 2025	Text-to-Video GenerationVideo Generation	—Unverified
Conditional MoCoGAN for Zero-Shot Video Generation	Sep 13, 2021	Generative Adversarial NetworkImage Generation	—Unverified
Conditional Video Generation Using Action-Appearance Captions	Dec 4, 2018	Optical Flow EstimationVideo Generation	—Unverified
CoNo: Consistency Noise Injection for Tuning-free Long Video Diffusion	Jun 7, 2024	SchedulingVideo Generation	—Unverified
Consistent Zero-shot 3D Texture Synthesis Using Geometry-aware Diffusion and Temporal Video Models	Jun 26, 2025	Texture SynthesisVideo Generation	—Unverified
ContentV: Efficient Training of Video Generation Models with Limited Compute	Jun 5, 2025	Image GenerationVideo Generation	—Unverified
Context-aware Talking Face Video Generation	Feb 28, 2024	Video GenerationVideo Synchronization	—Unverified

Show:10 25 50

← PrevPage 17 of 30Next →

All datasets UCF-101 BAIR Robot Pushing Sky Time-lapse UCF-101 16 frames, 64x64, Unconditional UCF-101 16 frames, Unconditional, Single GPU LAION-400M Taichi UCF-101 16 frames, 128x128, Unconditional Kinetics-600 12 frames, 64x64 How2Sign Kinetics-600 12 frames, 128x128 Kinetics-600 48 frames, 64x64

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MCVD	FVD16	2,460	—	Unverified
2	VDM	FVD16	1,396	—	Unverified
3	TGAN-v2 (128x128)	FVD16	1,209	—	Unverified
4	MCVD (64x64)	FVD16	1,143	—	Unverified
5	MoCoGAN-HD (256x256, unconditional)	FVD16	700	—	Unverified
6	MagicVideo (256x256, text-conditional)	FVD16	699	—	Unverified
7	TATS (256x256)	FVD16	635	—	Unverified
8	FIFO-Diffusion	FVD128	596.64	—	Unverified
9	DIGAN (128x128, unconditional)	FVD16	577	—	Unverified
10	LVDM (256x256, unconditional)	FVD16	552	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN	FVD score	503	—	Unverified
2	Baseline (from LVT)	FVD score	320.9	—	Unverified
3	SVG-FP (from FVD)	FVD score	315.5	—	Unverified
4	CDNA (from FVD)	FVD score	296.5	—	Unverified
5	SV2P (from FVD)	FVD score	262.5	—	Unverified
6	SVG-LP (from vRNN)	FVD score	256.62	—	Unverified
7	WAM	FVD score	159.6	—	Unverified
8	VRNN 1L	FVD score	149.22	—	Unverified
9	SAVP (from vRNN)	FVD score	143.43	—	Unverified
10	Hier-VRNN	FVD score	143.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN-HD (128x128)	FVD 16	183.6	—	Unverified
2	TATS (128x128)	FVD 16	132.6	—	Unverified
3	Long-video GAN (256x256)	FVD 16	116.5	—	Unverified
4	DIGAN (128x128)	FVD 16	114.6	—	Unverified
5	Long-video GAN (128x128)	FVD 16	107.5	—	Unverified
6	LVDM (256x256)	FVD 16	95.2	—	Unverified
7	DDMI	FVD 16	66.25	—	Unverified
8	Latte + LeanVAE	FVD 16	49.59	—	Unverified
9	StyleSV (256x256)	FVD 16	49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Video Diffusion Model	Inception Score	57	—	Unverified
2	TGAN-ODE	Inception Score	15.2	—	Unverified
3	TGAN-F	Inception Score	13.62	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGAN-F	Inception Score	22.91	—	Unverified
2	TGANv2	Inception Score	21.45	—	Unverified
3	TGANv2-ODE	Inception Score	21.02	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Imagen original (constant=6)	CLIP R-Precision	92.12	—	Unverified
2	Imagen fully distilled (oscillate (15,1))	CLIP R-Precision	90.97	—	Unverified
3	Imagen distilled (constant=6)	CLIP R-Precision	90.88	—	Unverified
4	Imagen original (oscillate(15,1))	CLIP R-Precision	89.91	—	Unverified
5	Imagen fully distilled (constant=6)	CLIP R-Precision	89.68	—	Unverified
6	Imagen distilled (oscillate (15,1))	CLIP R-Precision	88.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DIGAN (256x256)	FVD16	156.7	—	Unverified
2	MoCoGAN-HD (128x128)	FVD16	144.7	—	Unverified
3	DIGAN (128x128)	FVD16	128.1	—	Unverified
4	LVDM (256x256)	FVD16	99	—	Unverified
5	TATS (128x128)	FVD16	94.6	—	Unverified
6	StyleSV (256x256)	FVD16	82.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGANv2 (2020)	Inception Score	28.87	—	Unverified
2	DVD-GAN	Inception Score	27.38	—	Unverified
3	VideoGPT	Inception Score	24.69	—	Unverified
4	TGANv2	Inception Score	24.34	—	Unverified
5	TGAN-F	Inception Score	22.91	—	Unverified
6	TGANv2-ODE	Inception Score	21.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FVD	31.1	—	Unverified
2	MAGVIT	FVD	9.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	INR-V	FVD16	144	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	2.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	12.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiT-XL/2 + CVAE-FT-SE	FID	8.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoAssembler (Zero-Shot, 256x256, class-conditional)	FVD16	252	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PG-SWGAN-3D	FID	404.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StyleSV	FVD16	207.2	—	Unverified