Target Speaker Extraction

Extract the dialogue content of the specified target in a multi-person dialogue.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 55 papers

Title	Date	Tasks	Status	Hype
Incorporating Linguistic Constraints from External Knowledge Source for Audio-Visual Target Speech Extraction	Jun 11, 2025	Speech ExtractionTarget Speaker Extraction	—Unverified	0
M3ANet: Multi-scale and Multi-Modal Alignment Network for Brain-Assisted Target Speaker Extraction	May 31, 2025	Contrastive LearningEEG	CodeCode Available	0
FlowTSE: Target Speaker Extraction with Flow Matching	May 20, 2025	Target Speaker Extraction	—Unverified	0
Listen to Extract: Onset-Prompted Target Speaker Extraction	May 8, 2025	Target Speaker Extraction	—Unverified	0
LauraTSE: Target Speaker Extraction using Auto-Regressive Decoder-Only Language Models	Apr 10, 2025	DecoderLanguage Modeling	CodeCode Available	1
C^2AV-TSE: Context and Confidence-aware Audio Visual Target Speaker Extraction	Apr 1, 2025	Target Speaker Extraction	—Unverified	0
Target Speaker Extraction through Comparing Noisy Positive and Negative Audio Enrollments	Feb 23, 2025	Target Speaker Extraction	—Unverified	0
Metis: A Foundation Speech Generation Model with Masked Generative Pre-training	Feb 5, 2025	Self-Supervised LearningSpeech Enhancement	CodeCode Available	9
AnyEnhance: A Unified Generative Model with Prompt-Guidance and Self-Critic for Voice Enhancement	Jan 26, 2025	DenoisingIn-Context Learning	—Unverified	0
Universal Speaker Embedding Free Target Speaker Extraction and Personal Voice Activity Detection	Jan 7, 2025	Action DetectionActivity Detection	—Unverified	0
MoMuSE: Momentum Multi-modal Target Speaker Extraction for Real-time Scenarios with Impaired Visual Cues	Dec 11, 2024	Target Speaker Extraction	—Unverified	0
Multi-Level Speaker Representation for Target Speaker Extraction	Oct 21, 2024	Target Speaker Extraction	CodeCode Available	3
STCON System for the CHiME-8 Challenge	Oct 17, 2024	Data AugmentationSpeech Separation	—Unverified	0
Wanna hear your voice? A sample is all we need!	Oct 1, 2024	AllSpeech Separation	—Unverified	0
Two-stage Framework for Robust Speech Emotion Recognition Using Target Speaker Extraction in Human Speech Noise Conditions	Sep 29, 2024	Emotion RecognitionSpeech Emotion Recognition	—Unverified	0
Generative Speech Foundation Model Pretraining for High-Quality Speech Extraction and Restoration	Sep 24, 2024	Bandwidth ExtensionDenoising	—Unverified	0
WeSep: A Scalable and Flexible Toolkit Towards Generalizable Target Speaker Extraction	Sep 24, 2024	Managementspeech-recognition	CodeCode Available	3
TSELM: Target Speaker Extraction using Discrete Tokens and Language Models	Sep 12, 2024	Audio GenerationTarget Speaker Extraction	CodeCode Available	2
USEF-TSE: Universal Speaker Embedding Free Target Speaker Extraction	Sep 4, 2024	Speaker RecognitionSpeech Separation	CodeCode Available	1
Spectron: Target Speaker Extraction using Conditional Transformer with Adversarial Refinement	Sep 2, 2024	Target Speaker Extraction	CodeCode Available	0
Overview of Speaker Modeling and Its Applications: From the Lens of Deep Speaker Representation Learning	Jul 21, 2024	Representation LearningSelf-Supervised Learning	—Unverified	0
SpeakerBeam-SS: Real-time Target Speaker Extraction with Lightweight Conv-TasNet and State Space Modeling	Jul 1, 2024	Target Speaker Extraction	—Unverified	0
Binaural Selective Attention Model for Target Speaker Extraction	Jun 18, 2024	modelTarget Speaker Extraction	—Unverified	0
AV-CrossNet: an Audiovisual Complex Spectral Mapping Network for Speech Separation By Leveraging Narrow- and Cross-Band Modeling	Jun 17, 2024	Speaker SeparationSpeech Enhancement	CodeCode Available	1
Target Speaker Extraction with Curriculum Learning	Jun 12, 2024	Target Speaker Extraction	—Unverified	0

Show:10 25 50

← PrevPage 1 of 3Next →

No leaderboard results yet.