Video Alignment

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 83 papers

Title	Date	Tasks	Status	Hype
CogVideoX: Text-to-Video Diffusion Models with An Expert Transformer	Aug 12, 2024	Text-to-Video GenerationVideo Alignment	CodeCode Available	11
HunyuanVideo: A Systematic Framework For Large Video Generative Models	Dec 3, 2024	Video AlignmentVideo Generation	CodeCode Available	11
HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation	May 7, 2025	Human-Domain Subject-to-VideoSingle-Domain Subject-to-Video	CodeCode Available	5
FoleyCrafter: Bring Silent Videos to Life with Lifelike and Synchronized Sounds	Jul 1, 2024	Audio GenerationVideo Alignment	CodeCode Available	4
MiraData: A Large-Scale Video Dataset with Long Durations and Structured Captions	Jul 8, 2024	Video AlignmentVideo Generation	CodeCode Available	4
T2V-Turbo-v2: Enhancing Video Generation Model Post-Training through Data, Reward, and Conditional Guidance Design	Oct 8, 2024	Video AlignmentVideo Generation	CodeCode Available	3
CoCoCo: Improving Text-Guided Video Inpainting for Better Consistency, Controllability and Compatibility	Mar 18, 2024	Image InpaintingVideo Alignment	CodeCode Available	3
Video4DGen: Enhancing Video and 4D Generation through Mutual Optimization	Apr 5, 2025	3D GenerationVideo Alignment	CodeCode Available	3
Show-1: Marrying Pixel and Latent Diffusion Models for Text-to-Video Generation	Sep 27, 2023	GPUText-to-Video Generation	CodeCode Available	3
VE-Bench: Subjective-Aligned Benchmark Suite for Text-Driven Video Editing Quality Assessment	Aug 21, 2024	Video AlignmentVideo Editing	CodeCode Available	2
Hallo4: High-Fidelity Dynamic Portrait Animation via Direct Preference Optimization and Temporal Motion Modulation	May 29, 2025	Portrait AnimationVideo Alignment	CodeCode Available	2
AIGCBench: Comprehensive Evaluation of Image-to-Video Content Generated by AI	Jan 3, 2024	Video AlignmentVideo Generation	CodeCode Available	2
Zero-Shot Video Editing Using Off-The-Shelf Image Diffusion Models	Mar 30, 2023	Video AlignmentVideo Editing	CodeCode Available	2
Time-Contrastive Networks: Self-Supervised Learning from Video	Apr 23, 2017	Metric Learningreinforcement-learning	CodeCode Available	1
Seeing the Pose in the Pixels: Learning Pose-Aware Representations in Vision Transformers	Jun 15, 2023	Action ClassificationAction Recognition	CodeCode Available	1
Subjective-Aligned Dataset and Metric for Text-to-Video Quality Assessment	Mar 18, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
Mamba-Enhanced Text-Audio-Video Alignment Network for Emotion Recognition in Conversations	Sep 8, 2024	Emotion RecognitionMamba	CodeCode Available	1
LOVE: Benchmarking and Evaluating Text-to-Video Generation and Video-to-Text Interpretation	May 17, 2025	BenchmarkingQuestion Answering	CodeCode Available	1
Frame-wise Action Representations for Long Videos via Sequence Contrastive Learning	Mar 28, 2022	Action ClassificationContrastive Learning	CodeCode Available	1
DiscoVLA: Discrepancy Reduction in Vision, Language, and Alignment for Parameter-Efficient Video-Text Retrieval	Jun 10, 2025	Image CaptioningRetrieval	CodeCode Available	1
Learning a Grammar Inducer from Massive Uncurated Instructional Videos	Oct 22, 2022	Language AcquisitionVideo Alignment	CodeCode Available	1
EvalCrafter: Benchmarking and Evaluating Large Video Generation Models	Oct 17, 2023	BenchmarkingLanguage Modelling	CodeCode Available	1
Inference-Time Text-to-Video Alignment with Diffusion Latent Beam Search	Jan 31, 2025	DenoisingVideo Alignment	CodeCode Available	1
Learning Viewpoint-Agnostic Visual Representations by Recovering Tokens in 3D Space	Jun 23, 2022	Action Recognitionimage-classification	CodeCode Available	1
SafeSora: Towards Safety Alignment of Text2Video Generation via a Human Preference Dataset	Jun 20, 2024	Safety AlignmentText-to-Video Generation	CodeCode Available	1

Show:10 25 50

← PrevPage 1 of 4Next →

No leaderboard results yet.