Video Generation

( Various Video Generation Tasks. Gif credit: MaGViT )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1401–1450 of 1466 papers

Title	Date	Tasks	Status
Bringing a Blurry Frame Alive at High Frame-Rate with an Event Camera	Nov 26, 2018	Video Generation	CodeCode Available
Sounding Video Generator: A Unified Framework for Text-guided Sounding Video Generation	Mar 29, 2023	Audio GenerationContrastive Learning	CodeCode Available
VideoUFO: A Million-Scale User-Focused Dataset for Text-to-Video Generation	Mar 3, 2025	Text-to-Video GenerationVideo Generation	CodeCode Available
Animating Arbitrary Objects via Deep Motion Transfer	Dec 20, 2018	Image Animationmotion prediction	CodeCode Available
Scalable Adaptive Computation for Iterative Generation	Dec 22, 2022	Image GenerationVideo Generation	CodeCode Available
Video Generation from Single Semantic Label Map	Mar 11, 2019	Image GenerationImage to Video Generation	CodeCode Available
Benchmarking Generative Latent Variable Models for Speech	Feb 22, 2022	BenchmarkingImage Generation	CodeCode Available
ExVideo: Extending Video Diffusion Models via Parameter-Efficient Post-Tuning	Jun 20, 2024	GPUVideo Generation	CodeCode Available
Benchmarking Multi-dimensional AIGC Video Quality Assessment: A Dataset and Unified Model	Jul 31, 2024	BenchmarkingLarge Language Model	CodeCode Available
ImmersePro: End-to-End Stereo Video Synthesis Via Implicit Disparity Learning	Sep 30, 2024	BenchmarkingDisparity Estimation	CodeCode Available
RoboScape: Physics-informed Embodied World Model	Jun 29, 2025	3D geometryDepth Estimation	CodeCode Available
UFO: Enhancing Diffusion-Based Video Generation with a Uniform Frame Organizer	Dec 12, 2024	Video Generation	CodeCode Available
Everybody Dance Now	Aug 22, 2018	Face GenerationImage-to-Image Translation	CodeCode Available
Image Comes Dancing with Collaborative Parsing-Flow Video Synthesis	Oct 27, 2021	Human ParsingVideo Generation	CodeCode Available
TwoStreamVAN: Improving Motion Modeling in Video Generation	Dec 3, 2018	Motion GenerationVideo Generation	CodeCode Available
REGIS: Refining Generated Videos via Iterative Stylistic Redesigning	Nov 3, 2023	Text-to-Video GenerationVideo Generation	CodeCode Available
Recycle-GAN: Unsupervised Video Retargeting	Aug 15, 2018	Face to Face TranslationTranslation	CodeCode Available
HSTR-Net: High Spatio-Temporal Resolution Video Generation For Wide Area Surveillance	Apr 9, 2022	Optical Flow EstimationReference-based Super-Resolution	CodeCode Available
RecTable: Fast Modeling Tabular Data with Rectified Flow	Mar 26, 2025	Image GenerationText to Image Generation	CodeCode Available
H-MoRe: Learning Human-centric Motion Representation for Action Analysis	Apr 14, 2025	Action AnalysisAction Recognition	CodeCode Available
Real-Time Person Image Synthesis Using a Flow Matching Model	May 6, 2025	Image GenerationVideo Generation	CodeCode Available
EMOdiffhead: Continuously Emotional Control in Talking Head Generation via Diffusion	Sep 11, 2024	Portrait AnimationTalking Head Generation	CodeCode Available
High-Quality Virtual Single-Viewpoint Surgical Video: Geometric Autocalibration of Multiple Cameras in Surgical Lights	Mar 5, 2025	Video Generation	CodeCode Available
Adversarial Video Generation on Complex Datasets	Jul 15, 2019	3D Character Animation From A Single PhotoVideo Generation	CodeCode Available
Protecting Your Video Content: Disrupting Automated Video-based LLM Annotations	Mar 26, 2025	DescriptiveText-to-Video Generation	CodeCode Available
Explainable and Controllable Motion Curve Guided Cardiac Ultrasound Video Generation	Jul 31, 2024	PositionVideo Generation	CodeCode Available
Dormant: Defending against Pose-driven Human Image Animation	Sep 22, 2024	Image AnimationVideo Generation	CodeCode Available
MMDisCo: Multi-Modal Discriminator-Guided Cooperative Diffusion for Joint Audio and Video Generation	May 28, 2024	Video Generation	CodeCode Available
Hierarchical Video Generation from Orthogonal Information: Optical Flow and Texture	Nov 27, 2017	Action ClassificationAttribute	CodeCode Available
Attentive Semantic Video Generation using Captions	Aug 20, 2017	Action RecognitionStyle Transfer	CodeCode Available
DeepLandscape: Adversarial Modeling of Landscape Videos	Aug 1, 2020	Video Generation	CodeCode Available
Unsupervised Learning for Physical Interaction through Video Prediction	May 23, 2016	ObjectPrediction	CodeCode Available
Unsupervised object-centric video generation and decomposition in 3D	Jul 7, 2020	3D Object DetectionDepth Estimation	CodeCode Available
Long Context Question Answering via Supervised Contrastive Learning	Dec 16, 2021	Contrastive LearningQuestion Answering	CodeCode Available
VideoMaker: Zero-shot Customized Video Generation with the Inherent Force of Video Diffusion Models	Dec 27, 2024	Video Generation	CodeCode Available
Programmatic Video Prediction Using Large Language Models	May 20, 2025	Autonomous DrivingPrediction	CodeCode Available
CustomTTT: Motion and Appearance Customized Video Generation via Test-Time Training	Dec 20, 2024	parameter-efficient fine-tuningVideo Generation	CodeCode Available
Probabilistic Video Generation using Holistic Attribute Control	Mar 21, 2018	AttributeFuture prediction	CodeCode Available
Consistent Human Image and Video Generation with Spatially Conditioned Diffusion	Dec 19, 2024	Computational EfficiencyDenoising	CodeCode Available
Point-to-Point Video Generation	Apr 5, 2019	Image ManipulationVideo Editing	CodeCode Available
Order Matters: Shuffling Sequence Generation for Video Prediction	Jul 20, 2019	PredictionVideo Generation	CodeCode Available
NWT: Towards natural audio-to-video generation with representation learning	Jun 8, 2021	DecoderRepresentation Learning	CodeCode Available
Novel-View Human Action Synthesis	Jul 6, 2020	Novel View SynthesisVideo Generation	CodeCode Available
Neuro-Symbolic Evaluation of Text-to-Video Models using Formal Verification	Nov 22, 2024	Autonomous DrivingText-to-Video Generation	CodeCode Available
A Misleading Gallery of Fluid Motion by Generative Artificial Intelligence	May 24, 2024	Text GenerationVideo Generation	CodeCode Available
Music-oriented Dance Video Synthesis with Pose Perceptual Loss	Dec 13, 2019	Video Generation	CodeCode Available
GLOBER: Coherent Non-autoregressive Video Generation via GLOBal Guided Video DecodER	Sep 23, 2023	DecoderVideo Generation	CodeCode Available
GenRec: Unifying Video Generation and Recognition with Diffusion Models	Aug 27, 2024	Image to Video GenerationVideo Generation	CodeCode Available
VF-Eval: Evaluating Multimodal LLMs for Generating Feedback on AIGC Videos	May 29, 2025	Question AnsweringVideo Generation	CodeCode Available
ConMo: Controllable Motion Disentanglement and Recomposition for Zero-Shot Motion Transfer	Apr 3, 2025	DisentanglementMotion Disentanglement	CodeCode Available

Show:10 25 50

← PrevPage 29 of 30Next →

All datasets UCF-101 BAIR Robot Pushing Sky Time-lapse UCF-101 16 frames, 64x64, Unconditional UCF-101 16 frames, Unconditional, Single GPU LAION-400M Taichi UCF-101 16 frames, 128x128, Unconditional Kinetics-600 12 frames, 64x64 How2Sign Kinetics-600 12 frames, 128x128 Kinetics-600 48 frames, 64x64

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MCVD	FVD16	2,460	—	Unverified
2	VDM	FVD16	1,396	—	Unverified
3	TGAN-v2 (128x128)	FVD16	1,209	—	Unverified
4	MCVD (64x64)	FVD16	1,143	—	Unverified
5	MoCoGAN-HD (256x256, unconditional)	FVD16	700	—	Unverified
6	MagicVideo (256x256, text-conditional)	FVD16	699	—	Unverified
7	TATS (256x256)	FVD16	635	—	Unverified
8	FIFO-Diffusion	FVD128	596.64	—	Unverified
9	DIGAN (128x128, unconditional)	FVD16	577	—	Unverified
10	LVDM (256x256, unconditional)	FVD16	552	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN	FVD score	503	—	Unverified
2	Baseline (from LVT)	FVD score	320.9	—	Unverified
3	SVG-FP (from FVD)	FVD score	315.5	—	Unverified
4	CDNA (from FVD)	FVD score	296.5	—	Unverified
5	SV2P (from FVD)	FVD score	262.5	—	Unverified
6	SVG-LP (from vRNN)	FVD score	256.62	—	Unverified
7	WAM	FVD score	159.6	—	Unverified
8	VRNN 1L	FVD score	149.22	—	Unverified
9	SAVP (from vRNN)	FVD score	143.43	—	Unverified
10	Hier-VRNN	FVD score	143.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MoCoGAN-HD (128x128)	FVD 16	183.6	—	Unverified
2	TATS (128x128)	FVD 16	132.6	—	Unverified
3	Long-video GAN (256x256)	FVD 16	116.5	—	Unverified
4	DIGAN (128x128)	FVD 16	114.6	—	Unverified
5	Long-video GAN (128x128)	FVD 16	107.5	—	Unverified
6	LVDM (256x256)	FVD 16	95.2	—	Unverified
7	DDMI	FVD 16	66.25	—	Unverified
8	Latte + LeanVAE	FVD 16	49.59	—	Unverified
9	StyleSV (256x256)	FVD 16	49	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Video Diffusion Model	Inception Score	57	—	Unverified
2	TGAN-ODE	Inception Score	15.2	—	Unverified
3	TGAN-F	Inception Score	13.62	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGAN-F	Inception Score	22.91	—	Unverified
2	TGANv2	Inception Score	21.45	—	Unverified
3	TGANv2-ODE	Inception Score	21.02	—	Unverified
4	MoCoGAN	Inception Score	12.42	—	Unverified
5	MoCoGAN-MDP	Inception Score	11.86	—	Unverified
6	TGAN-SVC	Inception Score	11.85	—	Unverified
7	VGAN	Inception Score	8.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Imagen original (constant=6)	CLIP R-Precision	92.12	—	Unverified
2	Imagen fully distilled (oscillate (15,1))	CLIP R-Precision	90.97	—	Unverified
3	Imagen distilled (constant=6)	CLIP R-Precision	90.88	—	Unverified
4	Imagen original (oscillate(15,1))	CLIP R-Precision	89.91	—	Unverified
5	Imagen fully distilled (constant=6)	CLIP R-Precision	89.68	—	Unverified
6	Imagen distilled (oscillate (15,1))	CLIP R-Precision	88.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DIGAN (256x256)	FVD16	156.7	—	Unverified
2	MoCoGAN-HD (128x128)	FVD16	144.7	—	Unverified
3	DIGAN (128x128)	FVD16	128.1	—	Unverified
4	LVDM (256x256)	FVD16	99	—	Unverified
5	TATS (128x128)	FVD16	94.6	—	Unverified
6	StyleSV (256x256)	FVD16	82.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TGANv2 (2020)	Inception Score	28.87	—	Unverified
2	DVD-GAN	Inception Score	27.38	—	Unverified
3	VideoGPT	Inception Score	24.69	—	Unverified
4	TGANv2	Inception Score	24.34	—	Unverified
5	TGAN-F	Inception Score	22.91	—	Unverified
6	TGANv2-ODE	Inception Score	21.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FVD	31.1	—	Unverified
2	MAGVIT	FVD	9.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	INR-V	FVD16	144	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	2.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DVD-GAN	FID	12.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiT-XL/2 + CVAE-FT-SE	FID	8.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoAssembler (Zero-Shot, 256x256, class-conditional)	FVD16	252	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PG-SWGAN-3D	FID	404.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	StyleSV	FVD16	207.2	—	Unverified