Talking Face Generation

Talking face generation aims to synthesize a sequence of face images that correspond to given speech semantics

( Image credit: Talking Face Generation by Adversarially Disentangled Audio-Visual Representation )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 110 papers

Title	Date	Tasks	Status
Faces that Speak: Jointly Synthesising Talking Face and Speech from Text	May 16, 2024	Code GenerationFace Generation	—Unverified
SPEAK: Speech-Driven Pose and Emotion-Adjustable Talking Head Generation	May 12, 2024	DisentanglementFace Generation	—Unverified
SwapTalk: Audio-Driven Talking Face Generation with One-Shot Customization in Latent Space	May 9, 2024	Face GenerationFace Swapping	—Unverified
Audio-Visual Speech Representation Expert for Enhanced Talking Face Video Generation and Evaluation	May 7, 2024	Face GenerationTalking Face Generation	—Unverified
GSTalker: Real-time Audio-Driven Talking Face Generation via Deformable Gaussian Splatting	Apr 29, 2024	Face GenerationNeRF	—Unverified
Superior and Pragmatic Talking Face Generation with Teacher-Student Framework	Mar 26, 2024	Face GenerationTalking Face Generation	—Unverified
FlowVQTalker: High-Quality Emotional Talking Face Generation through Normalizing Flow and Quantization	Mar 11, 2024	Face GenerationQuantization	—Unverified
Style2Talker: High-Resolution Talking Head Generation with Emotion Style and Art Style	Mar 11, 2024	Face GenerationTalking Face Generation	—Unverified
G4G:A Generic Framework for High Fidelity Talking Face Generation with Fine-grained Intra-modal Alignment	Feb 28, 2024	Face GenerationTalking Face Generation	—Unverified
AVI-Talking: Learning Audio-Visual Instructions for Expressive 3D Talking Face Generation	Feb 25, 2024	Face GenerationHallucination	—Unverified
EmoSpeaker: One-shot Fine-grained Emotion-Controlled Talking Face Generation	Feb 2, 2024	AttributeFace Generation	—Unverified
EmoTalker: Emotionally Editable Talking Face Generation via Diffusion Model	Jan 16, 2024	DenoisingFace Generation	—Unverified
DREAM-Talk: Diffusion-based Realistic Emotional Audio-driven Method for Single Image Talking Face Generation	Dec 21, 2023	Face GenerationTalking Face Generation	—Unverified
VectorTalker: SVG Talking Face Generation with Progressive Vectorisation	Dec 18, 2023	Face GenerationImage Reconstruction	—Unverified
GSmoothFace: Generalized Smooth Talking Face Generation via Fine Grained 3D Face Guidance	Dec 12, 2023	Face GenerationFace Model	CodeCode Available
FT2TF: First-Person Statement Text-To-Talking Face Generation	Dec 9, 2023	Face GenerationTalking Face Generation	—Unverified
CP-EB: Talking Face Generation with Controllable Pose and Eye Blinking Embedding	Nov 15, 2023	Face GenerationTalking Face Generation	—Unverified
ToonTalker: Cross-Domain Face Reenactment	Aug 24, 2023	Face GenerationFace Reenactment	—Unverified
VAST: Vivify Your Talking Avatar via Zero-Shot Expressive Facial Style Transfer	Aug 9, 2023	DecoderFace Generation	—Unverified
Audio-driven Talking Face Generation with Stabilized Synchronization Loss	Jul 18, 2023	Audio-Visual SynchronizationFace Generation	—Unverified
FTFDNet: Learning to Detect Talking Face Video Manipulation with Tri-Modality Interaction	Jul 8, 2023	Face DetectionFace Generation	—Unverified
Instruct-NeuralTalker: Editing Audio-Driven Talking Radiance Fields with Instructions	Jun 19, 2023	Face GenerationTalking Face Generation	—Unverified
Exploring Phonetic Context-Aware Lip-Sync For Talking Face Generation	May 31, 2023	Face GenerationTalking Face Generation	—Unverified
CPNet: Exploiting CLIP-based Attention Condenser and Probability Map Guidance for High-fidelity Talking Face Generation	May 23, 2023	Face GenerationTalking Face Generation	—Unverified
High-fidelity Generalized Emotional Talking Face Generation with Multi-modal Emotion Space Learning	May 4, 2023	Face GenerationTalking Face Generation	—Unverified
Multimodal-driven Talking Face Generation via a Unified Diffusion-based Generator	May 4, 2023	DenoisingFace Generation	—Unverified
GeneFace++: Generalized and Stable Real-Time Audio-Driven 3D Talking Face Generation	May 1, 2023	Face Generationmotion prediction	—Unverified
Audio-Driven Talking Face Generation with Diverse yet Realistic Facial Animations	Apr 18, 2023	Face GenerationTalking Face Generation	—Unverified
That's What I Said: Fully-Controllable Talking Face Generation	Apr 6, 2023	Face GenerationNavigate	—Unverified
A Unified Compression Framework for Efficient Speech-Driven Talking-Face Generation	Apr 2, 2023	Face GenerationKnowledge Distillation	—Unverified
DAE-Talker: High Fidelity Speech-Driven Talking Face Generation with Diffusion Autoencoder	Mar 30, 2023	DecoderFace Generation	—Unverified
UniFLG: Unified Facial Landmark Generator from Text or Speech	Feb 28, 2023	DecoderFace Generation	—Unverified
Diffused Heads: Diffusion Models Beat GANs on Talking-Face Generation	Jan 6, 2023	Face GenerationTalking Face Generation	—Unverified
EMMN: Emotional Motion Memory Network for Audio-driven Emotional Talking Face Generation	Jan 1, 2023	Face GenerationTalking Face Generation	—Unverified
LipFormer: High-Fidelity and Generalizable Talking Face Generation With a Pre-Learned Facial Codebook	Jan 1, 2023	Face GenerationTalking Face Generation	—Unverified
Emotional Talking Faces: Making Videos More Expressive and Realistic	Dec 13, 2022	Face GenerationTalking Face Generation	—Unverified
Memories are One-to-Many Mapping Alleviators in Talking Face Generation	Dec 9, 2022	Face GenerationNeural Rendering	—Unverified
SyncTalkFace: Talking Face Generation with Precise Lip-Syncing via Audio-Lip Memory	Nov 2, 2022	Audio-Visual SynchronizationFace Generation	—Unverified
Taiwanese-Accented Mandarin and English Multi-Speaker Talking-Face Synthesis System	Nov 1, 2022	Face GenerationSpeech Synthesis	—Unverified
StableFace: Analyzing and Improving Motion Stability for Talking Face Generation	Aug 29, 2022	Face GenerationTalking Face Generation	—Unverified
Cut Inner Layers: A Structured Pruning Strategy for Efficient U-Net GANs	Jun 29, 2022	Face GenerationImage-to-Image Translation	—Unverified
EAMM: One-Shot Emotional Talking Face via Audio-Based Emotion-Aware Motion Model	May 30, 2022	Face GenerationTalking Face Generation	—Unverified
One-Shot Face Reenactment on Megapixels	May 26, 2022	Face GenerationFace Reenactment	—Unverified
Talking Face Generation with Multilingual TTS	May 13, 2022	Face GenerationTalking Face Generation	—Unverified
Emotion-Controllable Generalized Talking Face Generation	May 2, 2022	Face GenerationOptical Flow Estimation	—Unverified
An Audio-Visual Attention Based Multimodal Network for Fake Talking Face Videos Detection	Mar 10, 2022	Decision MakingFace Detection	—Unverified
Attention-Based Lip Audio-Visual Synthesis for Talking Face Generation in the Wild	Mar 8, 2022	Face GenerationTalking Face Generation	—Unverified
One-shot Talking Face Generation from Single-speaker Audio-Visual Correlation Learning	Dec 6, 2021	Face GenerationTalking Face Generation	—Unverified
Intelligent Video Editing: Incorporating Modern Talking Face Generation Algorithms in a Video Editor	Oct 16, 2021	Face GenerationTalking Face Generation	—Unverified
3D-TalkEmo: Learning to Synthesize 3D Emotional Talking Head	Apr 25, 2021	3D Face ReconstructionFace Reconstruction	—Unverified

Show:10 25 50

← PrevPage 2 of 3Next →

All datasets CREMA-D LRW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	EmoGen	EmoAcc	83.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LipGAN	LMD	0.6	—	Unverified