Video Generation

( Various Video Generation Tasks. Gif credit: MaGViT )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1401–1450 of 1466 papers

Title	Date	Tasks	Status
Online Pseudo-average Shifting Attention(PASA) for Robust Low-precision LLM Inference: Algorithms and Numerical Analysis	Feb 26, 2025	Video Generation	—Unverified
On the Content Bias in Frechet Video Distance	Jan 1, 2024	Video Generation	—Unverified
On the Limitations of Vision-Language Models in Understanding Image Transforms	Mar 12, 2025	Question AnsweringVideo Generation	—Unverified
JOG3R: Towards 3D-Consistent Video Generators	Jan 2, 2025	Camera Pose EstimationPose Estimation	—Unverified
OpenHumanVid: A Large-Scale High-Quality Dataset for Enhancing Human-Centric Video Generation	Nov 28, 2024	Video Generation	—Unverified
OpenVid-1M: A Large-Scale High-Quality Dataset for Text-to-video Generation	Jul 2, 2024	Text-to-Video GenerationVideo Generation	—Unverified
Opportunities and challenges in the application of large artificial intelligence models in radiology	Mar 24, 2024	Video Generation	—Unverified
Optical-Flow Guided Prompt Optimization for Coherent Video Generation	Nov 23, 2024	Optical Flow EstimationVideo Generation	—Unverified
Optical Flow Representation Alignment Mamba Diffusion Model for Medical Video Generation	Nov 3, 2024	MambaOptical Flow Estimation	—Unverified
POS: A Prompts Optimization Suite for Augmenting Text-to-Video Generation	Nov 2, 2023	DenoisingPOS	—Unverified
OSM-Net: One-to-Many One-shot Talking Head Generation with Spontaneous Head Motions	Sep 28, 2023	Talking Head GenerationVideo Generation	—Unverified
OSV: One Step is Enough for High-Quality Image to Video Generation	Sep 17, 2024	Image to Video GenerationVideo Generation	—Unverified
Other Vehicle Trajectories Are Also Needed: A Driving World Model Unifies Ego-Other Vehicle Trajectories in Video Latant Space	Mar 12, 2025	Autonomous DrivingVideo Generation	—Unverified
Ouroboros-Diffusion: Exploring Consistent Content Generation in Tuning-free Long Video Diffusion	Jan 15, 2025	DenoisingVideo Denoising	—Unverified
A Unit Enhancement and Guidance Framework for Audio-Driven Avatar Video Generation	May 6, 2025	Human AnimationVideo Generation	—Unverified
PaintScene4D: Consistent 4D Scene Generation from Text Prompts	Dec 5, 2024	Scene GenerationVideo Generation	—Unverified
PanoWan: Lifting Diffusion Video Generation Models to 360° with Latitude/Longitude-aware Mechanisms	May 28, 2025	DenoisingVideo Generation	—Unverified
Parallelized Autoregressive Visual Generation	Dec 19, 2024	Video Generation	—Unverified
Parallel Multiscale Autoregressive Density Estimation	Mar 10, 2017	Conditional Image GenerationDensity Estimation	—Unverified
PAROAttention: Pattern-Aware ReOrdering for Efficient Sparse and Quantized Attention in Visual Generation Models	Jun 19, 2025	Image GenerationQuantization	—Unverified
Passive Deepfake Detection Across Multi-modalities: A Comprehensive Survey	Nov 26, 2024	DeepFake DetectionFace Swapping	—Unverified
Patch Matters: Training-free Fine-grained Image Caption Enhancement via Local Perception	Jan 1, 2025	Image CaptioningImage Generation	—Unverified
PatchVSR: Breaking Video Diffusion Resolution Limits with Patch-wise Video Super-Resolution	Jan 1, 2025	4kSuper-Resolution	—Unverified
Pathways on the Image Manifold: Image Editing via Video Generation	Nov 25, 2024	Text-based Image EditingVideo Generation	—Unverified
People are poorly equipped to detect AI-powered voice clones	Oct 3, 2024	Video Generation	—Unverified
PersonalVideo: High ID-Fidelity Video Customization without Dynamic and Semantic Degradation	Nov 26, 2024	Video Generation	—Unverified
Photorealistic Video Generation with Diffusion Models	Dec 11, 2023	Super-ResolutionText-to-Video Generation	—Unverified
PhysDreamer: Physics-Based Interaction with 3D Objects via Video Generation	Apr 19, 2024	motion predictionObject	—Unverified
PhysMotion: Physics-Grounded Dynamics From a Single Image	Nov 26, 2024	Video Generation	—Unverified
PlayerOne: Egocentric World Simulator	Jun 11, 2025	Video Generation	—Unverified
PolyVivid: Vivid Multi-Subject Video Generation with Cross-Modal Interaction and Enhancement	Jun 9, 2025	Video Generation	—Unverified
PoseCrafter: One-Shot Personalized Video Synthesis Following Flexible Pose Control	May 23, 2024	Video Generation	—Unverified
Pose-Guided Fine-Grained Sign Language Video Generation	Sep 25, 2024	Image GenerationOptical Flow Estimation	—Unverified
Pose-Guided High-Resolution Appearance Transfer via Progressive Training	Aug 27, 2020	Appearance TransferDecoder	—Unverified
Pose Guided Human Video Generation	Jul 30, 2018	Generative Adversarial Networkmotion prediction	—Unverified
PosePilot: Steering Camera Pose for Generative World Models with Self-supervised Depth	May 3, 2025	Autonomous DrivingCamera Pose Estimation	—Unverified
PoseTraj: Pose-Aware Trajectory Control in Video Diffusion	Mar 20, 2025	DisentanglementVideo Generation	—Unverified
Position: Interactive Generative Video as Next-Generation Game Engine	Mar 21, 2025	PositionVideo Generation	—Unverified
Preserve Your Own Correlation: A Noise Prior for Video Diffusion Models	May 17, 2023	Image GenerationText-to-Video Generation	—Unverified
ProFashion: Prototype-guided Fashion Video Generation with Multiple Reference Images	May 10, 2025	DenoisingVideo Generation	—Unverified
Progressive Growing of Video Tokenizers for Highly Compressed Latent Spaces	Jan 9, 2025	Video Generation	—Unverified
PromptCoT: Align Prompt Distribution via Adapted Chain-of-Thought	Jan 1, 2024	Computational EfficiencyPrompt Engineering	—Unverified
ProphetDWM: A Driving World Model for Rolling Out Future Actions and Videos	May 24, 2025	Action GenerationAutonomous Driving	—Unverified
Puppet-Master: Scaling Interactive Video Generation as a Motion Prior for Part-Level Dynamics	Aug 8, 2024	Video Generation	—Unverified
PV3D: A 3D Generative Model for Portrait Video Generation	Dec 13, 2022	Video Generation	—Unverified
Physical Informed Driving World Model	Dec 11, 2024	3D Object DetectionAutonomous Driving	—Unverified
Q-Bench-Video: Benchmarking the Video Quality Understanding of LMMs	Sep 30, 2024	BenchmarkingMultiple-choice	—Unverified
Q-Bench-Video: Benchmark the Video Quality Understanding of LMMs	Jan 1, 2025	Multiple-choiceVideo Generation	—Unverified
Qffusion: Controllable Portrait Video Editing via Quadrant-Grid Attention Learning	Jan 11, 2025	Video EditingVideo Generation	—Unverified
Qualitative Failures of Image Generation Models and Their Application in Detecting Deepfakes	Mar 29, 2023	Image GenerationVideo Generation	—Unverified

Show:10 25 50

← PrevPage 29 of 30Next →

All datasets UCF-101 BAIR Robot Pushing Sky Time-lapse UCF-101 16 frames, 64x64, Unconditional UCF-101 16 frames, Unconditional, Single GPU LAION-400M Taichi UCF-101 16 frames, 128x128, Unconditional Kinetics-600 12 frames, 64x64 How2Sign Kinetics-600 12 frames, 128x128 Kinetics-600 48 frames, 64x64

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MCVD	FVD16	2,460	—	Unverified
2	VDM	FVD16	1,396	—	Unverified
3	TGAN-v2 (128x128)	FVD16	1,209	—	Unverified
4	MCVD (64x64)	FVD16	1,143	—	Unverified
5	MoCoGAN-HD (256x256, unconditional)	FVD16	700	—	Unverified
6	MagicVideo (256x256, text-conditional)	FVD16	699	—	Unverified
7	TATS (256x256)	FVD16	635	—	Unverified
8	FIFO-Diffusion	FVD128	596.64	—	Unverified
9	DIGAN (128x128, unconditional)	FVD16	577	—	Unverified
10	LVDM (256x256, unconditional)	FVD16	552	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN	FVD score	503	—	Unverified
2	Baseline (from LVT)	FVD score	320.9	—	Unverified
3	SVG-FP (from FVD)	FVD score	315.5	—	Unverified
4	CDNA (from FVD)	FVD score	296.5	—	Unverified
5	SV2P (from FVD)	FVD score	262.5	—	Unverified
6	SVG-LP (from vRNN)	FVD score	256.62	—	Unverified
7	WAM	FVD score	159.6	—	Unverified
8	VRNN 1L	FVD score	149.22	—	Unverified
9	SAVP (from vRNN)	FVD score	143.43	—	Unverified
10	Hier-VRNN	FVD score	143.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN-HD (128x128)	FVD 16	183.6	—	Unverified
2	TATS (128x128)	FVD 16	132.6	—	Unverified
3	Long-video GAN (256x256)	FVD 16	116.5	—	Unverified
4	DIGAN (128x128)	FVD 16	114.6	—	Unverified
5	Long-video GAN (128x128)	FVD 16	107.5	—	Unverified
6	LVDM (256x256)	FVD 16	95.2	—	Unverified
7	DDMI	FVD 16	66.25	—	Unverified
8	Latte + LeanVAE	FVD 16	49.59	—	Unverified
9	StyleSV (256x256)	FVD 16	49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Video Diffusion Model	Inception Score	57	—	Unverified
2	TGAN-ODE	Inception Score	15.2	—	Unverified
3	TGAN-F	Inception Score	13.62	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGAN-F	Inception Score	22.91	—	Unverified
2	TGANv2	Inception Score	21.45	—	Unverified
3	TGANv2-ODE	Inception Score	21.02	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Imagen original (constant=6)	CLIP R-Precision	92.12	—	Unverified
2	Imagen fully distilled (oscillate (15,1))	CLIP R-Precision	90.97	—	Unverified
3	Imagen distilled (constant=6)	CLIP R-Precision	90.88	—	Unverified
4	Imagen original (oscillate(15,1))	CLIP R-Precision	89.91	—	Unverified
5	Imagen fully distilled (constant=6)	CLIP R-Precision	89.68	—	Unverified
6	Imagen distilled (oscillate (15,1))	CLIP R-Precision	88.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DIGAN (256x256)	FVD16	156.7	—	Unverified
2	MoCoGAN-HD (128x128)	FVD16	144.7	—	Unverified
3	DIGAN (128x128)	FVD16	128.1	—	Unverified
4	LVDM (256x256)	FVD16	99	—	Unverified
5	TATS (128x128)	FVD16	94.6	—	Unverified
6	StyleSV (256x256)	FVD16	82.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGANv2 (2020)	Inception Score	28.87	—	Unverified
2	DVD-GAN	Inception Score	27.38	—	Unverified
3	VideoGPT	Inception Score	24.69	—	Unverified
4	TGANv2	Inception Score	24.34	—	Unverified
5	TGAN-F	Inception Score	22.91	—	Unverified
6	TGANv2-ODE	Inception Score	21.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FVD	31.1	—	Unverified
2	MAGVIT	FVD	9.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	INR-V	FVD16	144	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	2.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	12.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiT-XL/2 + CVAE-FT-SE	FID	8.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoAssembler (Zero-Shot, 256x256, class-conditional)	FVD16	252	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PG-SWGAN-3D	FID	404.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StyleSV	FVD16	207.2	—	Unverified