Talking Face Generation

Talking face generation aims to synthesize a sequence of face images that correspond to given speech semantics

( Image credit: Talking Face Generation by Adversarially Disentangled Audio-Visual Representation )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 110 papers

Title	Date	Tasks	Status	Hype
Real3D-Portrait: One-shot Realistic 3D Talking Portrait Synthesis	Jan 16, 2024	3D ReconstructionFace Generation	CodeCode Available	5
Deepfake Generation and Detection: A Benchmark and Survey	Mar 26, 2024	AttributeFace Generation	CodeCode Available	4
GeneFace: Generalized and High-Fidelity Audio-Driven 3D Talking Face Synthesis	Jan 31, 2023	Face GenerationLip Reading	CodeCode Available	4
A Lip Sync Expert Is All You Need for Speech to Lip Generation In The Wild	Aug 23, 2020	AllMORPH	CodeCode Available	3
DINet: Deformation Inpainting Network for Realistic Face Visually Dubbing on High Resolution Video	Mar 7, 2023	DecoderFace Dubbing	CodeCode Available	3
JoyGen: Audio-Driven 3D Depth-Aware Talking-Face Video Editing	Jan 3, 2025	3D ReconstructionFace Generation	CodeCode Available	3
SyncTalk: The Devil is in the Synchronization for Talking Head Synthesis	Nov 29, 2023	NeRFTalking Face Generation	CodeCode Available	3
DPE: Disentanglement of Pose and Expression for General Video Portrait Editing	Jan 16, 2023	DisentanglementFace Generation	CodeCode Available	2
StyleTalk: One-shot Talking Head Generation with Controllable Speaking Styles	Jan 3, 2023	DecoderFace Generation	CodeCode Available	2
Seeing What You Said: Talking Face Generation Guided by a Lip Reading Expert	Mar 29, 2023	Contrastive LearningFace Generation	CodeCode Available	2
Real-time Neural Radiance Talking Portrait Synthesis via Audio-spatial Decomposition	Nov 22, 2022	NeRFTalking Face Generation	CodeCode Available	2
HyperLips: Hyper Control Lips with High Resolution Decoder for Talking Face Generation	Oct 9, 2023	DecoderFace Generation	CodeCode Available	2
Emotionally Enhanced Talking Face Generation	Mar 21, 2023	Face GenerationTalking Face Generation	CodeCode Available	2
Live Speech Portraits: Real-Time Photorealistic Talking-Head Animation	Sep 22, 2021	Image-to-Image TranslationTalking Face Generation	CodeCode Available	2
MakeItTalk: Speaker-Aware Talking-Head Animation	Apr 27, 2020	Talking Face GenerationTalking Head Generation	CodeCode Available	2
Learning Dynamic Facial Radiance Fields for Few-Shot Talking Head Synthesis	Jul 24, 2022	3D geometryNeRF	CodeCode Available	2
Identity-Preserving Talking Face Generation with Landmark and Appearance Priors	May 15, 2023	Face GenerationTalking Face Generation	CodeCode Available	2
StyleHEAT: One-Shot High-Resolution Editable Talking Face Generation via Pre-trained StyleGAN	Mar 8, 2022	Face GenerationFacial Editing	CodeCode Available	2
Txt2Vid: Ultra-Low Bitrate Compression of Talking-Head Videos via Text	Jun 26, 2021	Talking Face GenerationTalking Head Generation	CodeCode Available	1
Parallel and High-Fidelity Text-to-Lip Generation	Jul 14, 2021	Face GenerationTalking Face Generation	CodeCode Available	1
KAN-Based Fusion of Dual-Domain for Audio-Driven Facial Landmarks Generation	Sep 9, 2024	Face GenerationSpeech to Facial Landmark	CodeCode Available	1
Speech Driven Talking Face Generation from a Single Image and an Emotion Condition	Aug 8, 2020	Emotion RecognitionFace Generation	CodeCode Available	1
HDTR-Net: A Real-Time High-Definition Teeth Restoration Network for Arbitrary Talking Face Generation Methods	Sep 14, 2023	Face GenerationSuper-Resolution	CodeCode Available	1
Controllable Talking Face Generation by Implicit Facial Keypoints Editing	Jun 5, 2024	Face GenerationTalking Face Generation	CodeCode Available	1
Neural Text to Articulate Talk: Deep Text to Audiovisual Speech Synthesis achieving both Auditory and Photo-realism	Dec 11, 2023	Face GenerationLip Reading	CodeCode Available	1
Pose-Controllable Talking Face Generation by Implicitly Modularized Audio-Visual Representation	Apr 22, 2021	Face GenerationTalking Face Generation	CodeCode Available	1
Merkel Podcast Corpus: A Multimodal Dataset Compiled from 16 Years of Angela Merkel’s Weekly Video Podcasts	Jun 1, 2022	Face DetectionFace Generation	CodeCode Available	1
FNeVR: Neural Volume Rendering for Face Animation	Sep 21, 2022	Talking Face Generation	CodeCode Available	1
MEAD: A Large-scale Audio-visual Dataset for Emotional Talking-face Generation	Aug 1, 2020	Face GenerationTalking Face Generation	CodeCode Available	1
Flow-Guided One-Shot Talking Face Generation With a High-Resolution Audio-Visual Dataset	Jun 19, 2021	Face GenerationTalking Face Generation	CodeCode Available	1
Joint Co-Speech Gesture and Expressive Talking Face Generation using Diffusion with Adapters	Dec 18, 2024	Face GenerationTalking Face Generation	CodeCode Available	1
FACIAL: Synthesizing Dynamic Talking Face with Implicit Attribute Learning	Aug 18, 2021	3D Face AnimationAttribute	CodeCode Available	1
Merkel Podcast Corpus: A Multimodal Dataset Compiled from 16 Years of Angela Merkel's Weekly Video Podcasts	May 24, 2022	Face DetectionFace Generation	CodeCode Available	1
DiffDub: Person-generic Visual Dubbing Using Inpainting Renderer with Diffusion Auto-encoder	Nov 3, 2023	Talking Face GenerationTalking Head Generation	CodeCode Available	1
Text2Video: Text-driven Talking-head Video Synthesis with Personalized Phoneme-Pose Dictionary	Apr 29, 2021	Face GenerationGenerative Adversarial Network	CodeCode Available	1
Exploring Phonetic Context-Aware Lip-Sync For Talking Face Generation	May 31, 2023	Face GenerationTalking Face Generation	—Unverified	0
Emotion-Controllable Generalized Talking Face Generation	May 2, 2022	Face GenerationOptical Flow Estimation	—Unverified	0
DAE-Talker: High Fidelity Speech-Driven Talking Face Generation with Diffusion Autoencoder	Mar 30, 2023	DecoderFace Generation	—Unverified	0
Emotional Talking Faces: Making Videos More Expressive and Realistic	Dec 13, 2022	Face GenerationTalking Face Generation	—Unverified	0
Cut Inner Layers: A Structured Pruning Strategy for Efficient U-Net GANs	Jun 29, 2022	Face GenerationImage-to-Image Translation	—Unverified	0
Audio-Visual Speech Representation Expert for Enhanced Talking Face Video Generation and Evaluation	May 7, 2024	Face GenerationTalking Face Generation	—Unverified	0
Emotional Conversation: Empowering Talking Faces with Cohesive Expression, Gaze and Pose Generation	Jun 12, 2024	Face GenerationSelf-Supervised Learning	—Unverified	0
EmoTalker: Emotionally Editable Talking Face Generation via Diffusion Model	Jan 16, 2024	DenoisingFace Generation	—Unverified	0
CPNet: Exploiting CLIP-based Attention Condenser and Probability Map Guidance for High-fidelity Talking Face Generation	May 23, 2023	Face GenerationTalking Face Generation	—Unverified	0
EmoSpeaker: One-shot Fine-grained Emotion-Controlled Talking Face Generation	Feb 2, 2024	AttributeFace Generation	—Unverified	0
Arbitrary Talking Face Generation via Attentional Audio-Visual Coherence Learning	Dec 17, 2018	Face GenerationTalking Face Generation	—Unverified	0
High-fidelity Generalized Emotional Talking Face Generation with Multi-modal Emotion Space Learning	May 4, 2023	Face GenerationTalking Face Generation	—Unverified	0
EMMN: Emotional Motion Memory Network for Audio-driven Emotional Talking Face Generation	Jan 1, 2023	Face GenerationTalking Face Generation	—Unverified	0
CP-EB: Talking Face Generation with Controllable Pose and Eye Blinking Embedding	Nov 15, 2023	Face GenerationTalking Face Generation	—Unverified	0
Audio-Driven Talking Face Generation with Diverse yet Realistic Facial Animations	Apr 18, 2023	Face GenerationTalking Face Generation	—Unverified	0

Show:10 25 50

← PrevPage 1 of 3Next →

All datasets CREMA-D LRW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	EmoGen	EmoAcc	83.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LipGAN	LMD	0.6	—	Unverified