Talking Head Generation

Talking head generation is the task of generating a talking face from a set of images of a person.

( Image credit: Few-Shot Adversarial Learning of Realistic Neural Talking Head Models )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–100 of 119 papers

Title	Date	Tasks	Status
Dimitra: Audio-driven Diffusion model for Expressive Talking Head Generation	Feb 24, 2025	Talking Head Generation	—Unverified
DreamHead: Learning Spatial-Temporal Correspondence via Hierarchical Diffusion for Audio-driven Talking Head Synthesis	Sep 16, 2024	Talking Head Generation	—Unverified
Dual Audio-Centric Modality Coupling for Talking Head Generation	Mar 26, 2025	NeRFTalking Head Generation	—Unverified
DualTalk: Dual-Speaker Interaction for 3D Talking Head Conversations	May 23, 2025	Talking Head Generation	—Unverified
EDTalk: Efficient Disentanglement for Emotional Talking Head Synthesis	Apr 2, 2024	DisentanglementTalking Head Generation	—Unverified
Embedded Representation Learning Network for Animating Styled Video Portrait	Apr 29, 2024	NeRFRepresentation Learning	—Unverified
Emotional Talking Head Generation based on Memory-Sharing and Attention-Augmented Networks	Jun 6, 2023	Talking Head Generation	—Unverified
EmotiveTalk: Expressive Talking Head Generation through Audio Information Decoupling and Emotional Video Diffusion	Nov 23, 2024	Talking Head Generation	—Unverified
Expressive Talking Head Generation With Granular Audio-Visual Control	Jan 1, 2022	Talking Head Generation	—Unverified
FD2Talk: Towards Generalized Talking Head Generation with Facial Decoupled Diffusion Model	Aug 18, 2024	Talking Head Generation	—Unverified
FONT: Flow-guided One-shot Talking Head Generation with Natural Head Motions	Mar 31, 2023	DiversityPose Prediction	—Unverified
From Pixels to Portraits: A Comprehensive Survey of Talking Head Generation Techniques and Applications	Aug 30, 2023	NeRFSurvey	—Unverified
Hierarchical Semantic Perceptual Listener Head Video Generation: A High-performance Pipeline	Jul 19, 2023	DecoderTalking Head Generation	—Unverified
High-Fidelity and Freely Controllable Talking Head Video Generation	Apr 20, 2023	Face ModelTalking Head Generation	—Unverified
IF-MDM: Implicit Face Motion Diffusion Model for High-Fidelity Realtime Talking Head Generation	Dec 5, 2024	DisentanglementTalking Head Generation	—Unverified
Interactive Conversational Head Generation	Jul 5, 2023	SentenceTalking Head Generation	—Unverified
KeySync: A Robust Approach for Leakage-free Lip Synchronization in High Resolution	May 1, 2025	Talking Head Generation	—Unverified
LaDTalk: Latent Denoising for Synthesizing Talking Head Videos with High Frequency Details	Oct 1, 2024	DenoisingTalking Head Generation	—Unverified
LaughTalk: Expressive 3D Talking Head Generation with Laughter	Nov 2, 2023	Talking Head Generation	—Unverified
Learning Frame-Wise Emotion Intensity for Audio-Driven Talking-Head Generation	Sep 29, 2024	Talking Head Generation	—Unverified
LES-Talker: Fine-Grained Emotion Editing for Talking Head Generation in Linear Emotion Space	Nov 14, 2024	Talking Head Generation	—Unverified
SPEAK: Speech-Driven Pose and Emotion-Adjustable Talking Head Generation	May 12, 2024	DisentanglementFace Generation	—Unverified
MEDTalk: Multimodal Controlled 3D Facial Animation with Dynamic Emotions by Disentangled Embedding	Jul 8, 2025	DiversityTalking Head Generation	—Unverified
MultiTalk: Enhancing 3D Talking Head Generation Across Languages with Multilingual Video Dataset	Jun 20, 2024	Talking Head Generation	—Unverified
NeRFFaceSpeech: One-shot Audio-driven 3D Talking Head Synthesis via Generative Prior	May 9, 2024	Face ModelNeRF	—Unverified

Show:10 25 50

← PrevPage 4 of 5Next →

All datasets VoxCeleb2 - 1-shot learning VoxCeleb1 - 1-shot learning VoxCeleb1 - 32-shot learning VoxCeleb1 - 8-shot learning VoxCeleb2 - 8-shot learning 100 sleep nights of 8 caregivers VoxCeleb2 - 32-shot learning

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Few-shot Adversarial Model	FID	48.5	—	Unverified
2	CainGAN	FID	35	—	Unverified
3	Fast Bi-layer Avatars (medium size)	CSIM	0.65	—	Unverified
4	First Order Motion Model (medium size)	CSIM	0.64	—	Unverified
5	Few-shot Vid-to-vid (medium size)	CSIM	0.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	X2Face	FID	45.8	—	Unverified
2	Few-shot Adversarial Model	FID	43	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	X2Face	FID	56.5	—	Unverified
2	Few-shot Adversarial Model	FID	29.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	X2Face	FID	51.5	—	Unverified
2	Few-shot Adversarial Model	FID	38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Few-shot Adversarial Model	FID	42.2	—	Unverified
2	CainGAN	FID	24.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Ashok	10%	12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Few-shot Adversarial Model	FID	30.6	—	Unverified