Talking Face Generation

Talking face generation aims to synthesize a sequence of face images that correspond to given speech semantics

( Image credit: Talking Face Generation by Adversarially Disentangled Audio-Visual Representation )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 110 papers

Title	Date	Tasks	Status	Hype
DisentTalk: Cross-lingual Talking Face Generation via Semantic Disentangled Diffusion Model	Mar 24, 2025	DisentanglementFace Generation	—Unverified	0
UniSync: A Unified Framework for Audio-Visual Synchronization	Mar 20, 2025	Audio-Visual SynchronizationContrastive Learning	—Unverified	0
PC-Talk: Precise Facial Animation Control for Audio-Driven Talking Face Generation	Mar 18, 2025	Face GenerationTalking Face Generation	—Unverified	0
Playmate: Flexible Control of Portrait Animation via 3D-Implicit Space Guided Diffusion	Feb 11, 2025	AttributeDisentanglement	—Unverified	0
JoyGen: Audio-Driven 3D Depth-Aware Talking-Face Video Editing	Jan 3, 2025	3D ReconstructionFace Generation	CodeCode Available	3
Joint Co-Speech Gesture and Expressive Talking Face Generation using Diffusion with Adapters	Dec 18, 2024	Face GenerationTalking Face Generation	CodeCode Available	1
GLCF: A Global-Local Multimodal Coherence Analysis Framework for Talking Face Generation Detection	Dec 18, 2024	DeepFake DetectionFace Generation	—Unverified	0
VQTalker: Towards Multilingual Talking Avatars through Facial Motion Tokenization	Dec 13, 2024	Face GenerationMotion Generation	—Unverified	0
PortraitTalk: Towards Customizable One-Shot Audio-to-Talking Face Generation	Dec 10, 2024	Face GenerationTalking Face Generation	—Unverified	0
Sonic: Shifting Focus to Global Audio Perception in Portrait Animation	Nov 25, 2024	Face GenerationPortrait Animation	—Unverified	0
MimicTalk: Mimicking a personalized and expressive 3D talking face in minutes	Oct 9, 2024	Face GenerationNeRF	—Unverified	0
JEAN: Joint Expression and Audio-guided NeRF-based Talking Face Generation	Sep 18, 2024	Contrastive LearningFace Generation	—Unverified	0
StyleTalk++: A Unified Framework for Controlling the Speaking Styles of Talking Heads	Sep 14, 2024	Face GenerationTalking Face Generation	—Unverified	0
KAN-Based Fusion of Dual-Domain for Audio-Driven Facial Landmarks Generation	Sep 9, 2024	Face GenerationSpeech to Facial Landmark	CodeCode Available	1
SegTalker: Segmentation-based Talking Face Generation with Mask-guided Local Editing	Sep 5, 2024	Face GenerationFacial Editing	—Unverified	0
High-fidelity and Lip-synced Talking Face Synthesis via Landmark-based Diffusion Model	Aug 10, 2024	Face GenerationTalking Face Generation	—Unverified	0
Emotional Conversation: Empowering Talking Faces with Cohesive Expression, Gaze and Pose Generation	Jun 12, 2024	Face GenerationSelf-Supervised Learning	—Unverified	0
Controllable Talking Face Generation by Implicit Facial Keypoints Editing	Jun 5, 2024	Face GenerationTalking Face Generation	CodeCode Available	1
OpFlowTalker: Realistic and Natural Talking Face Generation via Optical Flow Guidance	May 23, 2024	Face GenerationImage Generation	—Unverified	0
Faces that Speak: Jointly Synthesising Talking Face and Speech from Text	May 16, 2024	Code GenerationFace Generation	—Unverified	0
SPEAK: Speech-Driven Pose and Emotion-Adjustable Talking Head Generation	May 12, 2024	DisentanglementFace Generation	—Unverified	0
SwapTalk: Audio-Driven Talking Face Generation with One-Shot Customization in Latent Space	May 9, 2024	Face GenerationFace Swapping	—Unverified	0
Audio-Visual Speech Representation Expert for Enhanced Talking Face Video Generation and Evaluation	May 7, 2024	Face GenerationTalking Face Generation	—Unverified	0
GSTalker: Real-time Audio-Driven Talking Face Generation via Deformable Gaussian Splatting	Apr 29, 2024	Face GenerationNeRF	—Unverified	0
Superior and Pragmatic Talking Face Generation with Teacher-Student Framework	Mar 26, 2024	Face GenerationTalking Face Generation	—Unverified	0
Deepfake Generation and Detection: A Benchmark and Survey	Mar 26, 2024	AttributeFace Generation	CodeCode Available	4
Style2Talker: High-Resolution Talking Head Generation with Emotion Style and Art Style	Mar 11, 2024	Face GenerationTalking Face Generation	—Unverified	0
FlowVQTalker: High-Quality Emotional Talking Face Generation through Normalizing Flow and Quantization	Mar 11, 2024	Face GenerationQuantization	—Unverified	0
G4G:A Generic Framework for High Fidelity Talking Face Generation with Fine-grained Intra-modal Alignment	Feb 28, 2024	Face GenerationTalking Face Generation	—Unverified	0
AVI-Talking: Learning Audio-Visual Instructions for Expressive 3D Talking Face Generation	Feb 25, 2024	Face GenerationHallucination	—Unverified	0
EmoSpeaker: One-shot Fine-grained Emotion-Controlled Talking Face Generation	Feb 2, 2024	AttributeFace Generation	—Unverified	0
Real3D-Portrait: One-shot Realistic 3D Talking Portrait Synthesis	Jan 16, 2024	3D ReconstructionFace Generation	CodeCode Available	5
EmoTalker: Emotionally Editable Talking Face Generation via Diffusion Model	Jan 16, 2024	DenoisingFace Generation	—Unverified	0
DREAM-Talk: Diffusion-based Realistic Emotional Audio-driven Method for Single Image Talking Face Generation	Dec 21, 2023	Face GenerationTalking Face Generation	—Unverified	0
VectorTalker: SVG Talking Face Generation with Progressive Vectorisation	Dec 18, 2023	Face GenerationImage Reconstruction	—Unverified	0
GSmoothFace: Generalized Smooth Talking Face Generation via Fine Grained 3D Face Guidance	Dec 12, 2023	Face GenerationFace Model	CodeCode Available	0
Neural Text to Articulate Talk: Deep Text to Audiovisual Speech Synthesis achieving both Auditory and Photo-realism	Dec 11, 2023	Face GenerationLip Reading	CodeCode Available	1
FT2TF: First-Person Statement Text-To-Talking Face Generation	Dec 9, 2023	Face GenerationTalking Face Generation	—Unverified	0
SyncTalk: The Devil is in the Synchronization for Talking Head Synthesis	Nov 29, 2023	NeRFTalking Face Generation	CodeCode Available	3
CP-EB: Talking Face Generation with Controllable Pose and Eye Blinking Embedding	Nov 15, 2023	Face GenerationTalking Face Generation	—Unverified	0
DiffDub: Person-generic Visual Dubbing Using Inpainting Renderer with Diffusion Auto-encoder	Nov 3, 2023	Talking Face GenerationTalking Head Generation	CodeCode Available	1
HyperLips: Hyper Control Lips with High Resolution Decoder for Talking Face Generation	Oct 9, 2023	DecoderFace Generation	CodeCode Available	2
HDTR-Net: A Real-Time High-Definition Teeth Restoration Network for Arbitrary Talking Face Generation Methods	Sep 14, 2023	Face GenerationSuper-Resolution	CodeCode Available	1
ToonTalker: Cross-Domain Face Reenactment	Aug 24, 2023	Face GenerationFace Reenactment	—Unverified	0
VAST: Vivify Your Talking Avatar via Zero-Shot Expressive Facial Style Transfer	Aug 9, 2023	DecoderFace Generation	—Unverified	0
Audio-driven Talking Face Generation with Stabilized Synchronization Loss	Jul 18, 2023	Audio-Visual SynchronizationFace Generation	—Unverified	0
FTFDNet: Learning to Detect Talking Face Video Manipulation with Tri-Modality Interaction	Jul 8, 2023	Face DetectionFace Generation	—Unverified	0
Instruct-NeuralTalker: Editing Audio-Driven Talking Radiance Fields with Instructions	Jun 19, 2023	Face GenerationTalking Face Generation	—Unverified	0
Exploring Phonetic Context-Aware Lip-Sync For Talking Face Generation	May 31, 2023	Face GenerationTalking Face Generation	—Unverified	0
CPNet: Exploiting CLIP-based Attention Condenser and Probability Map Guidance for High-fidelity Talking Face Generation	May 23, 2023	Face GenerationTalking Face Generation	—Unverified	0

Show:10 25 50

← PrevPage 1 of 3Next →

All datasets CREMA-D LRW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	EmoGen	EmoAcc	83.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LipGAN	LMD	0.6	—	Unverified