Text-to-Video Generation

Ma grand-mère m’a raconté que quand elle était étudiante, elle avait un petit-ami. À l’âge de 18 ans, il a dû partir pour le service militaire, elle ne l’a pas attendu et elle a épousé quelqu’un d’autre. Quand ma grand-mère avait 58-59 ans, un homme (son premier amour) lui a envoyé une demande d’amis sur un réseau social, ils ont commencé à parler... En moins de six mois, ils ont décidé de se voir. Le trajet en train a duré deux jours et ils se sont finalement rencontrés. Cela fait maintenant deux ans qu’ils habitent ensemble et qu’ils nous rendent visite de temps en temps. Je réalise maintenant que leur amour l’un envers l’autre n’a jamais cessé.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 201 papers

Title	Date	Tasks	Status
Make-An-Animation: Large-Scale Text-conditional 3D Human Motion Generation	May 16, 2023	Motion GenerationMotion Synthesis	—Unverified
EIDT-V: Exploiting Intersections in Diffusion Trajectories for Model-Agnostic, Zero-Shot, Training-Free Text-to-Video Generation	Jan 1, 2025	Image GenerationText-to-Video Generation	—Unverified
We'll Fix it in Post: Improving Text-to-Video Generation with Neuro-Symbolic Feedback	Apr 24, 2025	Text-to-Video GenerationVideo Generation	—Unverified
Make Pixels Dance: High-Dynamic Video Generation	Nov 18, 2023	Text-to-Video GenerationVideo Generation	—Unverified
MALT Diffusion: Memory-Augmented Latent Transformers for Any-Length Video Generation	Feb 18, 2025	Text-to-Video GenerationVideo Generation	—Unverified
MicroCinema: A Divide-and-Conquer Approach for Text-to-Video Generation	Nov 30, 2023	Image GenerationText to Image Generation	—Unverified
VideoGen: A Reference-Guided Latent Diffusion Approach for High Definition Text-to-Video Generation	Sep 1, 2023	DecoderImage Generation	—Unverified
DyST-XL: Dynamic Layout Planning and Content Control for Compositional Text-to-Video Generation	Apr 21, 2025	AttributeDenoising	—Unverified
Modular-Cam: Modular Dynamic Camera-view Video Generation with LLM	Apr 16, 2025	Large Language ModelText-to-Video Generation	—Unverified
Mojito: Motion Trajectory and Intensity Control for Video Generation	Dec 12, 2024	Computational EfficiencyOptical Flow Estimation	—Unverified
Dual-Stream Diffusion Net for Text-to-Video Generation	Aug 16, 2023	Text-to-Video GenerationVideo Generation	—Unverified
MotionBooth: Motion-Aware Customized Text-to-Video Generation	Jun 25, 2024	Text-to-Video GenerationVideo Generation	—Unverified
DualReal: Adaptive Joint Training for Lossless Identity-Motion Fusion in Video Customization	May 4, 2025	DenoisingText-to-Video Generation	—Unverified
Video Generation from Text Employing Latent Path Construction for Temporal Modeling	Jul 29, 2021	Text-to-Video GenerationVideo Generation	—Unverified
MotionMaster: Training-free Camera Motion Transfer For Video Generation	Apr 24, 2024	DisentanglementMotion Disentanglement	—Unverified
MotionZero:Exploiting Motion Priors for Zero-shot Text-to-Video Generation	Nov 28, 2023	DisentanglementText-to-Video Generation	—Unverified
Animate Your Motion: Turning Still Images into Dynamic Videos	Mar 15, 2024	SpecificityText-to-Video Generation	—Unverified
Multi-Shot Character Consistency for Text-to-Video Generation	Dec 10, 2024	Text-to-Video GenerationVideo Generation	—Unverified
VideoMage: Multi-Subject and Motion Customization of Text-to-Video Diffusion Models	Mar 27, 2025	Text-to-Video GenerationVideo Generation	—Unverified
DreamRunner: Fine-Grained Storytelling Video Generation with Retrieval-Augmented Motion Adaptation	Nov 25, 2024	Large Language ModelMotion Planning	—Unverified
DisenStudio: Customized Multi-subject Text-to-Video Generation with Disentangled Spatial Control	May 21, 2024	AttributeMotion Generation	—Unverified
VidGen-1M: A Large-Scale Dataset for Text-to-video Generation	Aug 5, 2024	Text-to-Video GenerationVideo Generation	—Unverified
CustomVideo: Customizing Text-to-Video Generation with Multiple Subjects	Jan 18, 2024	ObjectText-to-Video Generation	—Unverified
OpenVid-1M: A Large-Scale High-Quality Dataset for Text-to-video Generation	Jul 2, 2024	Text-to-Video GenerationVideo Generation	—Unverified
POS: A Prompts Optimization Suite for Augmenting Text-to-Video Generation	Nov 2, 2023	DenoisingPOS	—Unverified
Patch Matters: Training-free Fine-grained Image Caption Enhancement via Local Perception	Jan 1, 2025	Image CaptioningImage Generation	—Unverified
VideoPoet: A Large Language Model for Zero-Shot Video Generation	Dec 21, 2023	DecoderLanguage Modeling	—Unverified
Photorealistic Video Generation with Diffusion Models	Dec 11, 2023	Super-ResolutionText-to-Video Generation	—Unverified
NewMove: Customizing text-to-video models with novel motions	Dec 7, 2023	Text-to-Video GenerationVideo Generation	—Unverified
Preserve Your Own Correlation: A Noise Prior for Video Diffusion Models	May 17, 2023	Image GenerationText-to-Video Generation	—Unverified
CPA: Camera-pose-awareness Diffusion Transformer for Video Generation	Dec 2, 2024	Text-to-Video GenerationVideo Generation	—Unverified
RelaCtrl: Relevance-Guided Efficient Control for Diffusion Transformers	Feb 20, 2025	Text-to-Video GenerationVideo Generation	—Unverified
Resource-Efficient Motion Control for Video Generation via Dynamic Mask Guidance	Mar 24, 2025	Text-to-Video GenerationVideo Editing	—Unverified
VideoRepair: Improving Text-to-Video Generation via Misalignment Evaluation and Localized Refinement	Nov 22, 2024	Text-to-Video GenerationVideo Alignment	—Unverified
RichSpace: Enriching Text-to-Video Prompt Space via Text Embedding Interpolation	Jan 17, 2025	Text-to-Video GenerationVideo Generation	—Unverified
S2DM: Sector-Shaped Diffusion Models for Video Generation	Mar 20, 2024	Image GenerationOptical Flow Estimation	—Unverified
Safe-Sora: Safe Text-to-Video Generation via Graphical Watermarking	May 19, 2025	Image GenerationMamba	—Unverified
AniClipart: Clipart Animation with Text-to-Video Priors	Apr 18, 2024	Image to Video GenerationText-to-Video Generation	—Unverified
ConceptMaster: Multi-Concept Video Customization on Diffusion Transformer Models Without Test-Time Tuning	Jan 8, 2025	Text-to-Video GenerationVideo Generation	—Unverified
Video-to-Audio Generation with Hidden Alignment	Jul 10, 2024	Audio GenerationData Augmentation	—Unverified
Snap Video: Scaled Spatiotemporal Transformers for Text-to-Video Synthesis	Feb 22, 2024	Image GenerationText-to-Video Generation	—Unverified
Sora as an AGI World Model? A Complete Survey on Text-to-Video Generation	Mar 8, 2024	ArticlesHallucination	—Unverified
STDD: Spatio-Temporal Dual Diffusion for Video Generation	Jan 1, 2025	Text-to-Video GenerationVideo Generation	—Unverified
Compositional 3D-aware Video Generation with LLM Director	Aug 31, 2024	Text-to-Video GenerationVideo Generation	—Unverified
Structure and Content-Guided Video Synthesis with Diffusion Models	Feb 6, 2023	DisentanglementText-to-Video Generation	—Unverified
CineMaster: A 3D-Aware and Controllable Framework for Cinematic Text-to-Video Generation	Feb 12, 2025	ObjectText-to-Video Generation	—Unverified
Can Text-to-Video Generation help Video-Language Alignment?	Mar 24, 2025	Text-to-Video GenerationVideo Generation	—Unverified
T2VPhysBench: A First-Principles Benchmark for Physical Consistency in Text-to-Video Generation	May 1, 2025	counterfactualInstruction Following	—Unverified
T2VTextBench: A Human Evaluation Benchmark for Textual Control in Video Generation Models	May 8, 2025	Instruction FollowingText-to-Video Generation	—Unverified
Technical Report: Competition Solution For Modelscope-Sora	Sep 24, 2024	Text-to-Video GenerationVideo Description	—Unverified

Show:10 25 50

← PrevPage 3 of 5Next →

All datasets MSR-VTT UCF-101 EvalCrafter Text-to-Video (ECTV) Dataset Something-Something V2 Kinetics WebVid

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MagicVideo	FVD	998	—	Unverified
2	VideoComposer	FVD	580	—	Unverified
3	ModelScopeT2V	FVD	550	—	Unverified
4	Show-1	FVD	538	—	Unverified
5	TF-T2V	FVD	441	—	Unverified
6	HiGen	FVD	406	—	Unverified
7	PixelDance	FVD	381	—	Unverified
8	VideoPoet	FVD	213	—	Unverified
9	Video-LaVIT	FVD	188.36	—	Unverified
10	Snap Video (288×288)	FVD	110.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MagicVideo (Zero-shot, 256x256)	FVD16	699	—	Unverified
2	Video LDM (Zero-shot, 320x512)	FVD16	550.61	—	Unverified
3	LAVIE (Zero-shot, 320x512)	FVD16	526.3	—	Unverified
4	PYoCo (Zero-shot, 64x64)	FVD16	355.19	—	Unverified
5	VideoPoet	FVD16	355	—	Unverified
6	Lumiere (Zero-shot, 1024x1024)	FVD16	332.49	—	Unverified
7	Snap Video (Zero-shot, 288×288)	FVD16	260.1	—	Unverified
8	W.A.L.T 3B	FVD16	258.1	—	Unverified
9	PixelDance (Zero-shot, 256x256)	FVD16	242.82	—	Unverified
10	Snap Video (Zero-shot, 512x288)	FVD16	200.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoCrafter2	Visual Quality	54.82	—	Unverified
2	Show-1	Visual Quality	53.74	—	Unverified
3	VideoCrafter1	Visual Quality	53.08	—	Unverified
4	Lavie	Visual Quality	52.83	—	Unverified
5	ModelScope	Visual Quality	52.47	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MAGVIT	FVD	79.1	—	Unverified
2	MAGVIT	FVD	28.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	NUWA (128×128)	Accuracy	77.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VideoFactory	FVD	292.35	—	Unverified