Talking Face Generation

Talking face generation aims to synthesize a sequence of face images that correspond to given speech semantics

( Image credit: Talking Face Generation by Adversarially Disentangled Audio-Visual Representation )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 110 papers

Title	Date	Tasks	Status	Hype	Score
Real3D-Portrait: One-shot Realistic 3D Talking Portrait Synthesis	Jan 16, 2024	3D ReconstructionFace Generation	CodeCode Available	5	5
GeneFace: Generalized and High-Fidelity Audio-Driven 3D Talking Face Synthesis	Jan 31, 2023	Face GenerationLip Reading	CodeCode Available	4	5
Deepfake Generation and Detection: A Benchmark and Survey	Mar 26, 2024	AttributeFace Generation	CodeCode Available	4	5
A Lip Sync Expert Is All You Need for Speech to Lip Generation In The Wild	Aug 23, 2020	AllMORPH	CodeCode Available	3	5
DINet: Deformation Inpainting Network for Realistic Face Visually Dubbing on High Resolution Video	Mar 7, 2023	DecoderFace Dubbing	CodeCode Available	3	5
SyncTalk: The Devil is in the Synchronization for Talking Head Synthesis	Nov 29, 2023	NeRFTalking Face Generation	CodeCode Available	3	5
JoyGen: Audio-Driven 3D Depth-Aware Talking-Face Video Editing	Jan 3, 2025	3D ReconstructionFace Generation	CodeCode Available	3	5
Emotionally Enhanced Talking Face Generation	Mar 21, 2023	Face GenerationTalking Face Generation	CodeCode Available	2	5
DPE: Disentanglement of Pose and Expression for General Video Portrait Editing	Jan 16, 2023	DisentanglementFace Generation	CodeCode Available	2	5
Learning Dynamic Facial Radiance Fields for Few-Shot Talking Head Synthesis	Jul 24, 2022	3D geometryNeRF	CodeCode Available	2	5
StyleTalk: One-shot Talking Head Generation with Controllable Speaking Styles	Jan 3, 2023	DecoderFace Generation	CodeCode Available	2	5
StyleHEAT: One-Shot High-Resolution Editable Talking Face Generation via Pre-trained StyleGAN	Mar 8, 2022	Face GenerationFacial Editing	CodeCode Available	2	5
Seeing What You Said: Talking Face Generation Guided by a Lip Reading Expert	Mar 29, 2023	Contrastive LearningFace Generation	CodeCode Available	2	5
Real-time Neural Radiance Talking Portrait Synthesis via Audio-spatial Decomposition	Nov 22, 2022	NeRFTalking Face Generation	CodeCode Available	2	5
HyperLips: Hyper Control Lips with High Resolution Decoder for Talking Face Generation	Oct 9, 2023	DecoderFace Generation	CodeCode Available	2	5
Identity-Preserving Talking Face Generation with Landmark and Appearance Priors	May 15, 2023	Face GenerationTalking Face Generation	CodeCode Available	2	5
MakeItTalk: Speaker-Aware Talking-Head Animation	Apr 27, 2020	Talking Face GenerationTalking Head Generation	CodeCode Available	2	5
Live Speech Portraits: Real-Time Photorealistic Talking-Head Animation	Sep 22, 2021	Image-to-Image TranslationTalking Face Generation	CodeCode Available	2	5
Txt2Vid: Ultra-Low Bitrate Compression of Talking-Head Videos via Text	Jun 26, 2021	Talking Face GenerationTalking Head Generation	CodeCode Available	1	5
HDTR-Net: A Real-Time High-Definition Teeth Restoration Network for Arbitrary Talking Face Generation Methods	Sep 14, 2023	Face GenerationSuper-Resolution	CodeCode Available	1	5
Parallel and High-Fidelity Text-to-Lip Generation	Jul 14, 2021	Face GenerationTalking Face Generation	CodeCode Available	1	5
Speech Driven Talking Face Generation from a Single Image and an Emotion Condition	Aug 8, 2020	Emotion RecognitionFace Generation	CodeCode Available	1	5
Text2Video: Text-driven Talking-head Video Synthesis with Personalized Phoneme-Pose Dictionary	Apr 29, 2021	Face GenerationGenerative Adversarial Network	CodeCode Available	1	5
Pose-Controllable Talking Face Generation by Implicitly Modularized Audio-Visual Representation	Apr 22, 2021	Face GenerationTalking Face Generation	CodeCode Available	1	5
Neural Text to Articulate Talk: Deep Text to Audiovisual Speech Synthesis achieving both Auditory and Photo-realism	Dec 11, 2023	Face GenerationLip Reading	CodeCode Available	1	5
Controllable Talking Face Generation by Implicit Facial Keypoints Editing	Jun 5, 2024	Face GenerationTalking Face Generation	CodeCode Available	1	5
Merkel Podcast Corpus: A Multimodal Dataset Compiled from 16 Years of Angela Merkel’s Weekly Video Podcasts	Jun 1, 2022	Face DetectionFace Generation	CodeCode Available	1	5
Merkel Podcast Corpus: A Multimodal Dataset Compiled from 16 Years of Angela Merkel's Weekly Video Podcasts	May 24, 2022	Face DetectionFace Generation	CodeCode Available	1	5
MEAD: A Large-scale Audio-visual Dataset for Emotional Talking-face Generation	Aug 1, 2020	Face GenerationTalking Face Generation	CodeCode Available	1	5
KAN-Based Fusion of Dual-Domain for Audio-Driven Facial Landmarks Generation	Sep 9, 2024	Face GenerationSpeech to Facial Landmark	CodeCode Available	1	5
Joint Co-Speech Gesture and Expressive Talking Face Generation using Diffusion with Adapters	Dec 18, 2024	Face GenerationTalking Face Generation	CodeCode Available	1	5
FNeVR: Neural Volume Rendering for Face Animation	Sep 21, 2022	Talking Face Generation	CodeCode Available	1	5
DiffDub: Person-generic Visual Dubbing Using Inpainting Renderer with Diffusion Auto-encoder	Nov 3, 2023	Talking Face GenerationTalking Head Generation	CodeCode Available	1	5
Flow-Guided One-Shot Talking Face Generation With a High-Resolution Audio-Visual Dataset	Jun 19, 2021	Face GenerationTalking Face Generation	CodeCode Available	1	5
FACIAL: Synthesizing Dynamic Talking Face with Implicit Attribute Learning	Aug 18, 2021	3D Face AnimationAttribute	CodeCode Available	1	5
Talking Face Generation by Adversarially Disentangled Audio-Visual Representation	Jul 20, 2018	Face GenerationLip Reading	CodeCode Available	0	5
Talking Face Generation by Conditional Recurrent Adversarial Network	Apr 13, 2018	Constrained Lip-synchronizationFace Generation	CodeCode Available	0	5
Stochastic Talking Face Generation Using Latent Distribution Matching	Nov 21, 2020	Face GenerationTalking Face Generation	CodeCode Available	0	5
Neural Voice Puppetry: Audio-driven Facial Reenactment	Dec 11, 2019	Face ModelNeural Rendering	CodeCode Available	0	5
GSmoothFace: Generalized Smooth Talking Face Generation via Fine Grained 3D Face Guidance	Dec 12, 2023	Face GenerationFace Model	CodeCode Available	0	5
Capture, Learning, and Synthesis of 3D Speaking Styles	May 8, 2019	3D Face AnimationTalking Face Generation	CodeCode Available	0	5
ReenactGAN: Learning to Reenact Faces via Boundary Transfer	Jul 29, 2018	DecoderFace Reenactment	CodeCode Available	0	5
AD-NeRF: Audio Driven Neural Radiance Fields for Talking Head Synthesis	Mar 20, 2021	NeRFTalking Face Generation	CodeCode Available	0	5
Exploring Phonetic Context-Aware Lip-Sync For Talking Face Generation	May 31, 2023	Face GenerationTalking Face Generation	—Unverified	0	0
Emotion-Controllable Generalized Talking Face Generation	May 2, 2022	Face GenerationOptical Flow Estimation	—Unverified	0	0
DAE-Talker: High Fidelity Speech-Driven Talking Face Generation with Diffusion Autoencoder	Mar 30, 2023	DecoderFace Generation	—Unverified	0	0
Emotional Talking Faces: Making Videos More Expressive and Realistic	Dec 13, 2022	Face GenerationTalking Face Generation	—Unverified	0	0
Cut Inner Layers: A Structured Pruning Strategy for Efficient U-Net GANs	Jun 29, 2022	Face GenerationImage-to-Image Translation	—Unverified	0	0
Audio-Visual Speech Representation Expert for Enhanced Talking Face Video Generation and Evaluation	May 7, 2024	Face GenerationTalking Face Generation	—Unverified	0	0
Emotional Conversation: Empowering Talking Faces with Cohesive Expression, Gaze and Pose Generation	Jun 12, 2024	Face GenerationSelf-Supervised Learning	—Unverified	0	0

Show:10 25 50

← PrevPage 1 of 3Next →

All datasets CREMA-D LRW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	EmoGen	EmoAcc	83.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LipGAN	LMD	0.6	—	Unverified