SOTAVerified|Agents Browse Leaderboard About Blog

Talking Face Generation

Talking face generation aims to synthesize a sequence of face images that correspond to given speech semantics

( Image credit: Talking Face Generation by Adversarially Disentangled Audio-Visual Representation )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 110 papers

Title	Date	Tasks	Status
SegTalker: Segmentation-based Talking Face Generation with Mask-guided Local Editing	Sep 5, 2024	Face GenerationFacial Editing	—Unverified
Sonic: Shifting Focus to Global Audio Perception in Portrait Animation	Nov 25, 2024	Face GenerationPortrait Animation	—Unverified
StableFace: Analyzing and Improving Motion Stability for Talking Face Generation	Aug 29, 2022	Face GenerationTalking Face Generation	—Unverified
Style2Talker: High-Resolution Talking Head Generation with Emotion Style and Art Style	Mar 11, 2024	Face GenerationTalking Face Generation	—Unverified
StyleTalk++: A Unified Framework for Controlling the Speaking Styles of Talking Heads	Sep 14, 2024	Face GenerationTalking Face Generation	—Unverified
Superior and Pragmatic Talking Face Generation with Teacher-Student Framework	Mar 26, 2024	Face GenerationTalking Face Generation	—Unverified
SwapTalk: Audio-Driven Talking Face Generation with One-Shot Customization in Latent Space	May 9, 2024	Face GenerationFace Swapping	—Unverified
SyncTalkFace: Talking Face Generation with Precise Lip-Syncing via Audio-Lip Memory	Nov 2, 2022	Audio-Visual SynchronizationFace Generation	—Unverified
Taiwanese-Accented Mandarin and English Multi-Speaker Talking-Face Synthesis System	Nov 1, 2022	Face GenerationSpeech Synthesis	—Unverified
Talking Face Generation with Multilingual TTS	May 13, 2022	Face GenerationTalking Face Generation	—Unverified
That's What I Said: Fully-Controllable Talking Face Generation	Apr 6, 2023	Face GenerationNavigate	—Unverified
ToonTalker: Cross-Domain Face Reenactment	Aug 24, 2023	Face GenerationFace Reenactment	—Unverified
UniFLG: Unified Facial Landmark Generator from Text or Speech	Feb 28, 2023	DecoderFace Generation	—Unverified
UniSync: A Unified Framework for Audio-Visual Synchronization	Mar 20, 2025	Audio-Visual SynchronizationContrastive Learning	—Unverified
VAST: Vivify Your Talking Avatar via Zero-Shot Expressive Facial Style Transfer	Aug 9, 2023	DecoderFace Generation	—Unverified
VectorTalker: SVG Talking Face Generation with Progressive Vectorisation	Dec 18, 2023	Face GenerationImage Reconstruction	—Unverified
VQTalker: Towards Multilingual Talking Avatars through Facial Motion Tokenization	Dec 13, 2024	Face GenerationMotion Generation	—Unverified
MimicTalk: Mimicking a personalized and expressive 3D talking face in minutes	Oct 9, 2024	Face GenerationNeRF	—Unverified
An Audio-Visual Attention Based Multimodal Network for Fake Talking Face Videos Detection	Mar 10, 2022	Decision MakingFace Detection	—Unverified
Attention-Based Lip Audio-Visual Synthesis for Talking Face Generation in the Wild	Mar 8, 2022	Face GenerationTalking Face Generation	—Unverified
Audio-Driven Talking Face Generation with Diverse yet Realistic Facial Animations	Apr 18, 2023	Face GenerationTalking Face Generation	—Unverified
Audio-Visual Speech Representation Expert for Enhanced Talking Face Video Generation and Evaluation	May 7, 2024	Face GenerationTalking Face Generation	—Unverified
A Unified Compression Framework for Efficient Speech-Driven Talking-Face Generation	Apr 2, 2023	Face GenerationKnowledge Distillation	—Unverified
AVI-Talking: Learning Audio-Visual Instructions for Expressive 3D Talking Face Generation	Feb 25, 2024	Face GenerationHallucination	—Unverified
CP-EB: Talking Face Generation with Controllable Pose and Eye Blinking Embedding	Nov 15, 2023	Face GenerationTalking Face Generation	—Unverified

Show:10 25 50

← PrevPage 3 of 5Next →

All datasets CREMA-D LRW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	EmoGen	EmoAcc	83.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LipGAN	LMD	0.6	—	Unverified