Talking Face Generation

Talking face generation aims to synthesize a sequence of face images that correspond to given speech semantics

( Image credit: Talking Face Generation by Adversarially Disentangled Audio-Visual Representation )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 110 papers

Title	Date	Tasks	Status
SegTalker: Segmentation-based Talking Face Generation with Mask-guided Local Editing	Sep 5, 2024	Face GenerationFacial Editing	—Unverified
Sonic: Shifting Focus to Global Audio Perception in Portrait Animation	Nov 25, 2024	Face GenerationPortrait Animation	—Unverified
StableFace: Analyzing and Improving Motion Stability for Talking Face Generation	Aug 29, 2022	Face GenerationTalking Face Generation	—Unverified
Style2Talker: High-Resolution Talking Head Generation with Emotion Style and Art Style	Mar 11, 2024	Face GenerationTalking Face Generation	—Unverified
StyleTalk++: A Unified Framework for Controlling the Speaking Styles of Talking Heads	Sep 14, 2024	Face GenerationTalking Face Generation	—Unverified
Superior and Pragmatic Talking Face Generation with Teacher-Student Framework	Mar 26, 2024	Face GenerationTalking Face Generation	—Unverified
SwapTalk: Audio-Driven Talking Face Generation with One-Shot Customization in Latent Space	May 9, 2024	Face GenerationFace Swapping	—Unverified
SyncTalkFace: Talking Face Generation with Precise Lip-Syncing via Audio-Lip Memory	Nov 2, 2022	Audio-Visual SynchronizationFace Generation	—Unverified
Taiwanese-Accented Mandarin and English Multi-Speaker Talking-Face Synthesis System	Nov 1, 2022	Face GenerationSpeech Synthesis	—Unverified
Talking Face Generation with Multilingual TTS	May 13, 2022	Face GenerationTalking Face Generation	—Unverified
That's What I Said: Fully-Controllable Talking Face Generation	Apr 6, 2023	Face GenerationNavigate	—Unverified
ToonTalker: Cross-Domain Face Reenactment	Aug 24, 2023	Face GenerationFace Reenactment	—Unverified
UniFLG: Unified Facial Landmark Generator from Text or Speech	Feb 28, 2023	DecoderFace Generation	—Unverified
UniSync: A Unified Framework for Audio-Visual Synchronization	Mar 20, 2025	Audio-Visual SynchronizationContrastive Learning	—Unverified
VAST: Vivify Your Talking Avatar via Zero-Shot Expressive Facial Style Transfer	Aug 9, 2023	DecoderFace Generation	—Unverified
VectorTalker: SVG Talking Face Generation with Progressive Vectorisation	Dec 18, 2023	Face GenerationImage Reconstruction	—Unverified
VQTalker: Towards Multilingual Talking Avatars through Facial Motion Tokenization	Dec 13, 2024	Face GenerationMotion Generation	—Unverified
MimicTalk: Mimicking a personalized and expressive 3D talking face in minutes	Oct 9, 2024	Face GenerationNeRF	—Unverified
An Audio-Visual Attention Based Multimodal Network for Fake Talking Face Videos Detection	Mar 10, 2022	Decision MakingFace Detection	—Unverified
Attention-Based Lip Audio-Visual Synthesis for Talking Face Generation in the Wild	Mar 8, 2022	Face GenerationTalking Face Generation	—Unverified
Audio-Driven Talking Face Generation with Diverse yet Realistic Facial Animations	Apr 18, 2023	Face GenerationTalking Face Generation	—Unverified
Audio-Visual Speech Representation Expert for Enhanced Talking Face Video Generation and Evaluation	May 7, 2024	Face GenerationTalking Face Generation	—Unverified
A Unified Compression Framework for Efficient Speech-Driven Talking-Face Generation	Apr 2, 2023	Face GenerationKnowledge Distillation	—Unverified
AVI-Talking: Learning Audio-Visual Instructions for Expressive 3D Talking Face Generation	Feb 25, 2024	Face GenerationHallucination	—Unverified
CP-EB: Talking Face Generation with Controllable Pose and Eye Blinking Embedding	Nov 15, 2023	Face GenerationTalking Face Generation	—Unverified
CPNet: Exploiting CLIP-based Attention Condenser and Probability Map Guidance for High-fidelity Talking Face Generation	May 23, 2023	Face GenerationTalking Face Generation	—Unverified
Cut Inner Layers: A Structured Pruning Strategy for Efficient U-Net GANs	Jun 29, 2022	Face GenerationImage-to-Image Translation	—Unverified
DAE-Talker: High Fidelity Speech-Driven Talking Face Generation with Diffusion Autoencoder	Mar 30, 2023	DecoderFace Generation	—Unverified
Diffused Heads: Diffusion Models Beat GANs on Talking-Face Generation	Jan 6, 2023	Face GenerationTalking Face Generation	—Unverified
DisentTalk: Cross-lingual Talking Face Generation via Semantic Disentangled Diffusion Model	Mar 24, 2025	DisentanglementFace Generation	—Unverified
DREAM-Talk: Diffusion-based Realistic Emotional Audio-driven Method for Single Image Talking Face Generation	Dec 21, 2023	Face GenerationTalking Face Generation	—Unverified
EAMM: One-Shot Emotional Talking Face via Audio-Based Emotion-Aware Motion Model	May 30, 2022	Face GenerationTalking Face Generation	—Unverified
EMMN: Emotional Motion Memory Network for Audio-driven Emotional Talking Face Generation	Jan 1, 2023	Face GenerationTalking Face Generation	—Unverified
EmoSpeaker: One-shot Fine-grained Emotion-Controlled Talking Face Generation	Feb 2, 2024	AttributeFace Generation	—Unverified
EmoTalker: Emotionally Editable Talking Face Generation via Diffusion Model	Jan 16, 2024	DenoisingFace Generation	—Unverified
Emotional Conversation: Empowering Talking Faces with Cohesive Expression, Gaze and Pose Generation	Jun 12, 2024	Face GenerationSelf-Supervised Learning	—Unverified
Emotional Talking Faces: Making Videos More Expressive and Realistic	Dec 13, 2022	Face GenerationTalking Face Generation	—Unverified
Emotion-Controllable Generalized Talking Face Generation	May 2, 2022	Face GenerationOptical Flow Estimation	—Unverified
Exploring Phonetic Context-Aware Lip-Sync For Talking Face Generation	May 31, 2023	Face GenerationTalking Face Generation	—Unverified
Faces that Speak: Jointly Synthesising Talking Face and Speech from Text	May 16, 2024	Code GenerationFace Generation	—Unverified
FlowVQTalker: High-Quality Emotional Talking Face Generation through Normalizing Flow and Quantization	Mar 11, 2024	Face GenerationQuantization	—Unverified
FT2TF: First-Person Statement Text-To-Talking Face Generation	Dec 9, 2023	Face GenerationTalking Face Generation	—Unverified
FTFDNet: Learning to Detect Talking Face Video Manipulation with Tri-Modality Interaction	Jul 8, 2023	Face DetectionFace Generation	—Unverified
G4G:A Generic Framework for High Fidelity Talking Face Generation with Fine-grained Intra-modal Alignment	Feb 28, 2024	Face GenerationTalking Face Generation	—Unverified
GeneFace++: Generalized and Stable Real-Time Audio-Driven 3D Talking Face Generation	May 1, 2023	Face Generationmotion prediction	—Unverified
GLCF: A Global-Local Multimodal Coherence Analysis Framework for Talking Face Generation Detection	Dec 18, 2024	DeepFake DetectionFace Generation	—Unverified
GSTalker: Real-time Audio-Driven Talking Face Generation via Deformable Gaussian Splatting	Apr 29, 2024	Face GenerationNeRF	—Unverified
Hierarchical Cross-Modal Talking Face Generation With Dynamic Pixel-Wise Loss	Jun 1, 2019	Face GenerationTalking Face Generation	—Unverified
High-fidelity and Lip-synced Talking Face Synthesis via Landmark-based Diffusion Model	Aug 10, 2024	Face GenerationTalking Face Generation	—Unverified
High-fidelity Generalized Emotional Talking Face Generation with Multi-modal Emotion Space Learning	May 4, 2023	Face GenerationTalking Face Generation	—Unverified

Show:10 25 50

← PrevPage 2 of 3Next →

All datasets CREMA-D LRW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	EmoGen	EmoAcc	83.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LipGAN	LMD	0.6	—	Unverified