Talking Head Generation

Talking head generation is the task of generating a talking face from a set of images of a person.

( Image credit: Few-Shot Adversarial Learning of Realistic Neural Talking Head Models )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 119 papers

Title	Date	Tasks	Status
Perceptually Accurate 3D Talking Head Generation: New Definitions, Speech-Mesh Representation, and Evaluation Metrics	Mar 26, 2025	Talking Head Generation	—Unverified
Dual Audio-Centric Modality Coupling for Talking Head Generation	Mar 26, 2025	NeRFTalking Head Generation	—Unverified
Teller: Real-Time Streaming Audio-Driven Portrait Animation with Autoregressive Motion Generation	Mar 24, 2025	Motion GenerationPortrait Animation	—Unverified
Dimitra: Audio-driven Diffusion model for Expressive Talking Head Generation	Feb 24, 2025	Talking Head Generation	—Unverified
VideoAnydoor: High-fidelity Video Object Insertion with Precise Motion Control	Jan 2, 2025	Talking Head GenerationVideo Generation	—Unverified
UniAvatar: Taming Lifelike Audio-Driven Talking Head Generation with Comprehensive Motion and Lighting Control	Dec 26, 2024	DiversityTalking Head Generation	—Unverified
VQTalker: Towards Multilingual Talking Avatars through Facial Motion Tokenization	Dec 13, 2024	Face GenerationMotion Generation	—Unverified
IF-MDM: Implicit Face Motion Diffusion Model for High-Fidelity Realtime Talking Head Generation	Dec 5, 2024	DisentanglementTalking Head Generation	—Unverified
ConsistentAvatar: Learning to Diffuse Fully Consistent Talking Head Avatar with Temporal Guidance	Nov 23, 2024	Image Generationsingle-image-generation	—Unverified
EmotiveTalk: Expressive Talking Head Generation through Audio Information Decoupling and Emotional Video Diffusion	Nov 23, 2024	Talking Head Generation	—Unverified
LES-Talker: Fine-Grained Emotion Editing for Talking Head Generation in Linear Emotion Space	Nov 14, 2024	Talking Head Generation	—Unverified
EmoGene: Audio-Driven Emotional 3D Talking-Head Generation	Oct 7, 2024	NeRFTalking Head Generation	—Unverified
LaDTalk: Latent Denoising for Synthesizing Talking Head Videos with High Frequency Details	Oct 1, 2024	DenoisingTalking Head Generation	—Unverified
Learning Frame-Wise Emotion Intensity for Audio-Driven Talking-Head Generation	Sep 29, 2024	Talking Head Generation	—Unverified
DreamHead: Learning Spatial-Temporal Correspondence via Hierarchical Diffusion for Audio-driven Talking Head Synthesis	Sep 16, 2024	Talking Head Generation	—Unverified
EMOdiffhead: Continuously Emotional Control in Talking Head Generation via Diffusion	Sep 11, 2024	Portrait AnimationTalking Head Generation	CodeCode Available
DiffTED: One-shot Audio-driven TED Talk Video Generation with Diffusion-based Co-speech Gestures	Sep 11, 2024	DiversityTalking Head Generation	—Unverified
SVP: Style-Enhanced Vivid Portrait Talking Head Diffusion Model	Sep 5, 2024	DiversityTalking Head Generation	—Unverified
PoseTalk: Text-and-Audio-based Pose Control and Motion Refinement for One-Shot Talking Head Generation	Sep 4, 2024	Pose PredictionRhythm	—Unverified
FD2Talk: Towards Generalized Talking Head Generation with Facial Decoupled Diffusion Model	Aug 18, 2024	Talking Head Generation	—Unverified
Landmark-guided Diffusion Model for High-fidelity and Temporally Coherent Talking Head Generation	Aug 3, 2024	DenoisingTalking Head Generation	—Unverified
GLDiTalker: Speech-Driven 3D Facial Animation with Graph Latent Diffusion Transformer	Aug 3, 2024	DiversityTalking Head Generation	—Unverified
MultiTalk: Enhancing 3D Talking Head Generation Across Languages with Multilingual Video Dataset	Jun 20, 2024	Talking Head Generation	—Unverified
NLDF: Neural Light Dynamic Fields for Efficient 3D Talking Head Generation	Jun 17, 2024	Knowledge DistillationNeRF	—Unverified
SPEAK: Speech-Driven Pose and Emotion-Adjustable Talking Head Generation	May 12, 2024	DisentanglementFace Generation	—Unverified
NeRFFaceSpeech: One-shot Audio-driven 3D Talking Head Synthesis via Generative Prior	May 9, 2024	Face ModelNeRF	—Unverified
Embedded Representation Learning Network for Animating Styled Video Portrait	Apr 29, 2024	NeRFRepresentation Learning	—Unverified
EDTalk: Efficient Disentanglement for Emotional Talking Head Synthesis	Apr 2, 2024	DisentanglementTalking Head Generation	—Unverified
Style2Talker: High-Resolution Talking Head Generation with Emotion Style and Art Style	Mar 11, 2024	Face GenerationTalking Face Generation	—Unverified
VectorTalker: SVG Talking Face Generation with Progressive Vectorisation	Dec 18, 2023	Face GenerationImage Reconstruction	—Unverified
AE-NeRF: Audio Enhanced Neural Radiance Field for Few Shot Talking Head Synthesis	Dec 18, 2023	Face GenerationNeRF	—Unverified
PMMTalk: Speech-Driven 3D Facial Animation from Complementary Pseudo Multi-modal Features	Dec 5, 2023	cross-modal alignmentDecoder	—Unverified
VividTalk: One-Shot Audio-Driven Talking Head Generation Based on 3D Hybrid Prior	Dec 4, 2023	Talking Head Generation	—Unverified
LaughTalk: Expressive 3D Talking Head Generation with Laughter	Nov 2, 2023	Talking Head Generation	—Unverified
OSM-Net: One-to-Many One-shot Talking Head Generation with Spontaneous Head Motions	Sep 28, 2023	Talking Head GenerationVideo Generation	—Unverified
RADIO: Reference-Agnostic Dubbing Video Synthesis	Sep 5, 2023	DecoderTalking Head Generation	—Unverified
From Pixels to Portraits: A Comprehensive Survey of Talking Head Generation Techniques and Applications	Aug 30, 2023	NeRFSurvey	—Unverified
Text-to-Video: a Two-stage Framework for Zero-shot Identity-agnostic Talking-head Generation	Aug 12, 2023	Talking Head Generationtext-to-speech	CodeCode Available
Hierarchical Semantic Perceptual Listener Head Video Generation: A High-performance Pipeline	Jul 19, 2023	DecoderTalking Head Generation	—Unverified
Interactive Conversational Head Generation	Jul 5, 2023	SentenceTalking Head Generation	—Unverified
A Comprehensive Multi-scale Approach for Speech and Dynamics Synchrony in Talking Head Generation	Jul 4, 2023	Talking Head Generation	CodeCode Available
Emotional Talking Head Generation based on Memory-Sharing and Attention-Augmented Networks	Jun 6, 2023	Talking Head Generation	—Unverified
High-Fidelity and Freely Controllable Talking Head Video Generation	Apr 20, 2023	Face ModelTalking Head Generation	—Unverified
One-Shot High-Fidelity Talking-Head Synthesis with Deformable Neural Radiance Field	Apr 11, 2023	NeRFNeural Rendering	—Unverified
TalkCLIP: Talking Head Generation with Text-Guided Expressive Speaking Styles	Apr 1, 2023	2D Semantic Segmentation task 3 (25 classes)Talking Head Generation	—Unverified
FONT: Flow-guided One-shot Talking Head Generation with Natural Head Motions	Mar 31, 2023	DiversityPose Prediction	—Unverified
OPT: One-shot Pose-Controllable Talking Head Generation	Feb 16, 2023	DisentanglementTalking Head Generation	—Unverified
Talking Head Generation with Probabilistic Audio-to-Visual Diffusion Priors	Dec 7, 2022	Talking Head Generation	—Unverified
Compressing Video Calls using Synthetic Talking Heads	Oct 7, 2022	Face ReenactmentTalking Head Generation	—Unverified
AutoLV: Automatic Lecture Video Generator	Sep 19, 2022	Speech SynthesisTalking Head Generation	—Unverified

Show:10 25 50

← PrevPage 2 of 3Next →

All datasets VoxCeleb2 - 1-shot learning VoxCeleb1 - 1-shot learning VoxCeleb1 - 32-shot learning VoxCeleb1 - 8-shot learning VoxCeleb2 - 8-shot learning 100 sleep nights of 8 caregivers VoxCeleb2 - 32-shot learning

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Few-shot Adversarial Model	FID	48.5	—	Unverified
2	CainGAN	FID	35	—	Unverified
3	Fast Bi-layer Avatars (medium size)	CSIM	0.65	—	Unverified
4	First Order Motion Model (medium size)	CSIM	0.64	—	Unverified
5	Few-shot Vid-to-vid (medium size)	CSIM	0.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	X2Face	FID	45.8	—	Unverified
2	Few-shot Adversarial Model	FID	43	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	X2Face	FID	56.5	—	Unverified
2	Few-shot Adversarial Model	FID	29.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	X2Face	FID	51.5	—	Unverified
2	Few-shot Adversarial Model	FID	38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Few-shot Adversarial Model	FID	42.2	—	Unverified
2	CainGAN	FID	24.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Ashok	10%	12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Few-shot Adversarial Model	FID	30.6	—	Unverified