Talking Face Generation

Talking face generation aims to synthesize a sequence of face images that correspond to given speech semantics

( Image credit: Talking Face Generation by Adversarially Disentangled Audio-Visual Representation )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 110 papers

Title	Date	Tasks	Status	Hype
Real3D-Portrait: One-shot Realistic 3D Talking Portrait Synthesis	Jan 16, 2024	3D ReconstructionFace Generation	CodeCode Available	5
Deepfake Generation and Detection: A Benchmark and Survey	Mar 26, 2024	AttributeFace Generation	CodeCode Available	4
GeneFace: Generalized and High-Fidelity Audio-Driven 3D Talking Face Synthesis	Jan 31, 2023	Face GenerationLip Reading	CodeCode Available	4
JoyGen: Audio-Driven 3D Depth-Aware Talking-Face Video Editing	Jan 3, 2025	3D ReconstructionFace Generation	CodeCode Available	3
SyncTalk: The Devil is in the Synchronization for Talking Head Synthesis	Nov 29, 2023	NeRFTalking Face Generation	CodeCode Available	3
DINet: Deformation Inpainting Network for Realistic Face Visually Dubbing on High Resolution Video	Mar 7, 2023	DecoderFace Dubbing	CodeCode Available	3
A Lip Sync Expert Is All You Need for Speech to Lip Generation In The Wild	Aug 23, 2020	AllMORPH	CodeCode Available	3
HyperLips: Hyper Control Lips with High Resolution Decoder for Talking Face Generation	Oct 9, 2023	DecoderFace Generation	CodeCode Available	2
Identity-Preserving Talking Face Generation with Landmark and Appearance Priors	May 15, 2023	Face GenerationTalking Face Generation	CodeCode Available	2
Seeing What You Said: Talking Face Generation Guided by a Lip Reading Expert	Mar 29, 2023	Contrastive LearningFace Generation	CodeCode Available	2
Emotionally Enhanced Talking Face Generation	Mar 21, 2023	Face GenerationTalking Face Generation	CodeCode Available	2
DPE: Disentanglement of Pose and Expression for General Video Portrait Editing	Jan 16, 2023	DisentanglementFace Generation	CodeCode Available	2
StyleTalk: One-shot Talking Head Generation with Controllable Speaking Styles	Jan 3, 2023	DecoderFace Generation	CodeCode Available	2
Real-time Neural Radiance Talking Portrait Synthesis via Audio-spatial Decomposition	Nov 22, 2022	NeRFTalking Face Generation	CodeCode Available	2
Learning Dynamic Facial Radiance Fields for Few-Shot Talking Head Synthesis	Jul 24, 2022	3D geometryNeRF	CodeCode Available	2
StyleHEAT: One-Shot High-Resolution Editable Talking Face Generation via Pre-trained StyleGAN	Mar 8, 2022	Face GenerationFacial Editing	CodeCode Available	2
Live Speech Portraits: Real-Time Photorealistic Talking-Head Animation	Sep 22, 2021	Image-to-Image TranslationTalking Face Generation	CodeCode Available	2
MakeItTalk: Speaker-Aware Talking-Head Animation	Apr 27, 2020	Talking Face GenerationTalking Head Generation	CodeCode Available	2
Joint Co-Speech Gesture and Expressive Talking Face Generation using Diffusion with Adapters	Dec 18, 2024	Face GenerationTalking Face Generation	CodeCode Available	1
KAN-Based Fusion of Dual-Domain for Audio-Driven Facial Landmarks Generation	Sep 9, 2024	Face GenerationSpeech to Facial Landmark	CodeCode Available	1
Controllable Talking Face Generation by Implicit Facial Keypoints Editing	Jun 5, 2024	Face GenerationTalking Face Generation	CodeCode Available	1
Neural Text to Articulate Talk: Deep Text to Audiovisual Speech Synthesis achieving both Auditory and Photo-realism	Dec 11, 2023	Face GenerationLip Reading	CodeCode Available	1
DiffDub: Person-generic Visual Dubbing Using Inpainting Renderer with Diffusion Auto-encoder	Nov 3, 2023	Talking Face GenerationTalking Head Generation	CodeCode Available	1
HDTR-Net: A Real-Time High-Definition Teeth Restoration Network for Arbitrary Talking Face Generation Methods	Sep 14, 2023	Face GenerationSuper-Resolution	CodeCode Available	1
FNeVR: Neural Volume Rendering for Face Animation	Sep 21, 2022	Talking Face Generation	CodeCode Available	1
Merkel Podcast Corpus: A Multimodal Dataset Compiled from 16 Years of Angela Merkel’s Weekly Video Podcasts	Jun 1, 2022	Face DetectionFace Generation	CodeCode Available	1
Merkel Podcast Corpus: A Multimodal Dataset Compiled from 16 Years of Angela Merkel's Weekly Video Podcasts	May 24, 2022	Face DetectionFace Generation	CodeCode Available	1
FACIAL: Synthesizing Dynamic Talking Face with Implicit Attribute Learning	Aug 18, 2021	3D Face AnimationAttribute	CodeCode Available	1
Parallel and High-Fidelity Text-to-Lip Generation	Jul 14, 2021	Face GenerationTalking Face Generation	CodeCode Available	1
Txt2Vid: Ultra-Low Bitrate Compression of Talking-Head Videos via Text	Jun 26, 2021	Talking Face GenerationTalking Head Generation	CodeCode Available	1
Flow-Guided One-Shot Talking Face Generation With a High-Resolution Audio-Visual Dataset	Jun 19, 2021	Face GenerationTalking Face Generation	CodeCode Available	1
Text2Video: Text-driven Talking-head Video Synthesis with Personalized Phoneme-Pose Dictionary	Apr 29, 2021	Face GenerationGenerative Adversarial Network	CodeCode Available	1
Pose-Controllable Talking Face Generation by Implicitly Modularized Audio-Visual Representation	Apr 22, 2021	Face GenerationTalking Face Generation	CodeCode Available	1
Speech Driven Talking Face Generation from a Single Image and an Emotion Condition	Aug 8, 2020	Emotion RecognitionFace Generation	CodeCode Available	1
MEAD: A Large-scale Audio-visual Dataset for Emotional Talking-face Generation	Aug 1, 2020	Face GenerationTalking Face Generation	CodeCode Available	1
DisentTalk: Cross-lingual Talking Face Generation via Semantic Disentangled Diffusion Model	Mar 24, 2025	DisentanglementFace Generation	—Unverified	0
UniSync: A Unified Framework for Audio-Visual Synchronization	Mar 20, 2025	Audio-Visual SynchronizationContrastive Learning	—Unverified	0
PC-Talk: Precise Facial Animation Control for Audio-Driven Talking Face Generation	Mar 18, 2025	Face GenerationTalking Face Generation	—Unverified	0
Playmate: Flexible Control of Portrait Animation via 3D-Implicit Space Guided Diffusion	Feb 11, 2025	AttributeDisentanglement	—Unverified	0
GLCF: A Global-Local Multimodal Coherence Analysis Framework for Talking Face Generation Detection	Dec 18, 2024	DeepFake DetectionFace Generation	—Unverified	0
VQTalker: Towards Multilingual Talking Avatars through Facial Motion Tokenization	Dec 13, 2024	Face GenerationMotion Generation	—Unverified	0
PortraitTalk: Towards Customizable One-Shot Audio-to-Talking Face Generation	Dec 10, 2024	Face GenerationTalking Face Generation	—Unverified	0
Sonic: Shifting Focus to Global Audio Perception in Portrait Animation	Nov 25, 2024	Face GenerationPortrait Animation	—Unverified	0
MimicTalk: Mimicking a personalized and expressive 3D talking face in minutes	Oct 9, 2024	Face GenerationNeRF	—Unverified	0
JEAN: Joint Expression and Audio-guided NeRF-based Talking Face Generation	Sep 18, 2024	Contrastive LearningFace Generation	—Unverified	0
StyleTalk++: A Unified Framework for Controlling the Speaking Styles of Talking Heads	Sep 14, 2024	Face GenerationTalking Face Generation	—Unverified	0
SegTalker: Segmentation-based Talking Face Generation with Mask-guided Local Editing	Sep 5, 2024	Face GenerationFacial Editing	—Unverified	0
High-fidelity and Lip-synced Talking Face Synthesis via Landmark-based Diffusion Model	Aug 10, 2024	Face GenerationTalking Face Generation	—Unverified	0
Emotional Conversation: Empowering Talking Faces with Cohesive Expression, Gaze and Pose Generation	Jun 12, 2024	Face GenerationSelf-Supervised Learning	—Unverified	0
OpFlowTalker: Realistic and Natural Talking Face Generation via Optical Flow Guidance	May 23, 2024	Face GenerationImage Generation	—Unverified	0

Show:10 25 50

← PrevPage 1 of 3Next →

All datasets CREMA-D LRW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	EmoGen	EmoAcc	83.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LipGAN	LMD	0.6	—	Unverified