Talking Face Generation

Talking face generation aims to synthesize a sequence of face images that correspond to given speech semantics

( Image credit: Talking Face Generation by Adversarially Disentangled Audio-Visual Representation )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 110 papers

Title	Date	Tasks	Status	Hype
Identity-Preserving Talking Face Generation with Landmark and Appearance Priors	May 15, 2023	Face GenerationTalking Face Generation	CodeCode Available	2
High-fidelity Generalized Emotional Talking Face Generation with Multi-modal Emotion Space Learning	May 4, 2023	Face GenerationTalking Face Generation	—Unverified	0
Multimodal-driven Talking Face Generation via a Unified Diffusion-based Generator	May 4, 2023	DenoisingFace Generation	—Unverified	0
GeneFace++: Generalized and Stable Real-Time Audio-Driven 3D Talking Face Generation	May 1, 2023	Face Generationmotion prediction	—Unverified	0
Audio-Driven Talking Face Generation with Diverse yet Realistic Facial Animations	Apr 18, 2023	Face GenerationTalking Face Generation	—Unverified	0
That's What I Said: Fully-Controllable Talking Face Generation	Apr 6, 2023	Face GenerationNavigate	—Unverified	0
A Unified Compression Framework for Efficient Speech-Driven Talking-Face Generation	Apr 2, 2023	Face GenerationKnowledge Distillation	—Unverified	0
DAE-Talker: High Fidelity Speech-Driven Talking Face Generation with Diffusion Autoencoder	Mar 30, 2023	DecoderFace Generation	—Unverified	0
Seeing What You Said: Talking Face Generation Guided by a Lip Reading Expert	Mar 29, 2023	Contrastive LearningFace Generation	CodeCode Available	2
Emotionally Enhanced Talking Face Generation	Mar 21, 2023	Face GenerationTalking Face Generation	CodeCode Available	2
DINet: Deformation Inpainting Network for Realistic Face Visually Dubbing on High Resolution Video	Mar 7, 2023	DecoderFace Dubbing	CodeCode Available	3
UniFLG: Unified Facial Landmark Generator from Text or Speech	Feb 28, 2023	DecoderFace Generation	—Unverified	0
GeneFace: Generalized and High-Fidelity Audio-Driven 3D Talking Face Synthesis	Jan 31, 2023	Face GenerationLip Reading	CodeCode Available	4
DPE: Disentanglement of Pose and Expression for General Video Portrait Editing	Jan 16, 2023	DisentanglementFace Generation	CodeCode Available	2
Diffused Heads: Diffusion Models Beat GANs on Talking-Face Generation	Jan 6, 2023	Face GenerationTalking Face Generation	—Unverified	0
StyleTalk: One-shot Talking Head Generation with Controllable Speaking Styles	Jan 3, 2023	DecoderFace Generation	CodeCode Available	2
EMMN: Emotional Motion Memory Network for Audio-driven Emotional Talking Face Generation	Jan 1, 2023	Face GenerationTalking Face Generation	—Unverified	0
LipFormer: High-Fidelity and Generalizable Talking Face Generation With a Pre-Learned Facial Codebook	Jan 1, 2023	Face GenerationTalking Face Generation	—Unverified	0
Emotional Talking Faces: Making Videos More Expressive and Realistic	Dec 13, 2022	Face GenerationTalking Face Generation	—Unverified	0
Memories are One-to-Many Mapping Alleviators in Talking Face Generation	Dec 9, 2022	Face GenerationNeural Rendering	—Unverified	0
Real-time Neural Radiance Talking Portrait Synthesis via Audio-spatial Decomposition	Nov 22, 2022	NeRFTalking Face Generation	CodeCode Available	2
SyncTalkFace: Talking Face Generation with Precise Lip-Syncing via Audio-Lip Memory	Nov 2, 2022	Audio-Visual SynchronizationFace Generation	—Unverified	0
Taiwanese-Accented Mandarin and English Multi-Speaker Talking-Face Synthesis System	Nov 1, 2022	Face GenerationSpeech Synthesis	—Unverified	0
FNeVR: Neural Volume Rendering for Face Animation	Sep 21, 2022	Talking Face Generation	CodeCode Available	1
StableFace: Analyzing and Improving Motion Stability for Talking Face Generation	Aug 29, 2022	Face GenerationTalking Face Generation	—Unverified	0
Learning Dynamic Facial Radiance Fields for Few-Shot Talking Head Synthesis	Jul 24, 2022	3D geometryNeRF	CodeCode Available	2
Cut Inner Layers: A Structured Pruning Strategy for Efficient U-Net GANs	Jun 29, 2022	Face GenerationImage-to-Image Translation	—Unverified	0
Merkel Podcast Corpus: A Multimodal Dataset Compiled from 16 Years of Angela Merkel’s Weekly Video Podcasts	Jun 1, 2022	Face DetectionFace Generation	CodeCode Available	1
EAMM: One-Shot Emotional Talking Face via Audio-Based Emotion-Aware Motion Model	May 30, 2022	Face GenerationTalking Face Generation	—Unverified	0
One-Shot Face Reenactment on Megapixels	May 26, 2022	Face GenerationFace Reenactment	—Unverified	0
Merkel Podcast Corpus: A Multimodal Dataset Compiled from 16 Years of Angela Merkel's Weekly Video Podcasts	May 24, 2022	Face DetectionFace Generation	CodeCode Available	1
Talking Face Generation with Multilingual TTS	May 13, 2022	Face GenerationTalking Face Generation	—Unverified	0
Emotion-Controllable Generalized Talking Face Generation	May 2, 2022	Face GenerationOptical Flow Estimation	—Unverified	0
An Audio-Visual Attention Based Multimodal Network for Fake Talking Face Videos Detection	Mar 10, 2022	Decision MakingFace Detection	—Unverified	0
Attention-Based Lip Audio-Visual Synthesis for Talking Face Generation in the Wild	Mar 8, 2022	Face GenerationTalking Face Generation	—Unverified	0
StyleHEAT: One-Shot High-Resolution Editable Talking Face Generation via Pre-trained StyleGAN	Mar 8, 2022	Face GenerationFacial Editing	CodeCode Available	2
One-shot Talking Face Generation from Single-speaker Audio-Visual Correlation Learning	Dec 6, 2021	Face GenerationTalking Face Generation	—Unverified	0
Intelligent Video Editing: Incorporating Modern Talking Face Generation Algorithms in a Video Editor	Oct 16, 2021	Face GenerationTalking Face Generation	—Unverified	0
Live Speech Portraits: Real-Time Photorealistic Talking-Head Animation	Sep 22, 2021	Image-to-Image TranslationTalking Face Generation	CodeCode Available	2
FACIAL: Synthesizing Dynamic Talking Face with Implicit Attribute Learning	Aug 18, 2021	3D Face AnimationAttribute	CodeCode Available	1
Parallel and High-Fidelity Text-to-Lip Generation	Jul 14, 2021	Face GenerationTalking Face Generation	CodeCode Available	1
Txt2Vid: Ultra-Low Bitrate Compression of Talking-Head Videos via Text	Jun 26, 2021	Talking Face GenerationTalking Head Generation	CodeCode Available	1
Flow-Guided One-Shot Talking Face Generation With a High-Resolution Audio-Visual Dataset	Jun 19, 2021	Face GenerationTalking Face Generation	CodeCode Available	1
Text2Video: Text-driven Talking-head Video Synthesis with Personalized Phoneme-Pose Dictionary	Apr 29, 2021	Face GenerationGenerative Adversarial Network	CodeCode Available	1
3D-TalkEmo: Learning to Synthesize 3D Emotional Talking Head	Apr 25, 2021	3D Face ReconstructionFace Reconstruction	—Unverified	0
Pose-Controllable Talking Face Generation by Implicitly Modularized Audio-Visual Representation	Apr 22, 2021	Face GenerationTalking Face Generation	CodeCode Available	1
AD-NeRF: Audio Driven Neural Radiance Fields for Talking Head Synthesis	Mar 20, 2021	NeRFTalking Face Generation	CodeCode Available	0
Stochastic Talking Face Generation Using Latent Distribution Matching	Nov 21, 2020	Face GenerationTalking Face Generation	CodeCode Available	0
A Lip Sync Expert Is All You Need for Speech to Lip Generation In The Wild	Aug 23, 2020	AllMORPH	CodeCode Available	3
Speech Driven Talking Face Generation from a Single Image and an Emotion Condition	Aug 8, 2020	Emotion RecognitionFace Generation	CodeCode Available	1

Show:10 25 50

← PrevPage 2 of 3Next →

All datasets CREMA-D LRW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	EmoGen	EmoAcc	83.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LipGAN	LMD	0.6	—	Unverified