Target Speaker Extraction

Extract the dialogue content of the specified target in a multi-person dialogue.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 55 papers

Title	Date	Tasks	Status
Speaker-conditioning Single-channel Target Speaker Extraction using Conformer-based Architectures	May 27, 2022	Target Speaker Extraction	—Unverified
SpeechX: Neural Codec Language Model as a Versatile Speech Transformer	Aug 14, 2023	Language ModelingLanguage Modelling	—Unverified
STCON System for the CHiME-8 Challenge	Oct 17, 2024	Data AugmentationSpeech Separation	—Unverified
Target Speaker Extraction by Directly Exploiting Contextual Information in the Time-Frequency Domain	Feb 27, 2024	Target Speaker Extraction	—Unverified
Target Speaker Extraction through Comparing Noisy Positive and Negative Audio Enrollments	Feb 23, 2025	Target Speaker Extraction	—Unverified
Target Speaker Extraction with Curriculum Learning	Jun 12, 2024	Target Speaker Extraction	—Unverified
The Multimodal Information Based Speech Processing (MISP) 2023 Challenge: Audio-Visual Target Speaker Extraction	Sep 15, 2023	Audio-Visual Speech Recognitionspeech-recognition	—Unverified
Two-stage Framework for Robust Speech Emotion Recognition Using Target Speaker Extraction in Human Speech Noise Conditions	Sep 29, 2024	Emotion RecognitionSpeech Emotion Recognition	—Unverified
Universal Speaker Embedding Free Target Speaker Extraction and Personal Voice Activity Detection	Jan 7, 2025	Action DetectionActivity Detection	—Unverified
Wanna hear your voice? A sample is all we need!	Oct 1, 2024	AllSpeech Separation	—Unverified
Overview of Speaker Modeling and Its Applications: From the Lens of Deep Speaker Representation Learning	Jul 21, 2024	Representation LearningSelf-Supervised Learning	—Unverified
AnyEnhance: A Unified Generative Model with Prompt-Guidance and Self-Critic for Voice Enhancement	Jan 26, 2025	DenoisingIn-Context Learning	—Unverified
A Single Speech Enhancement Model Unifying Dereverberation, Denoising, Speaker Counting, Separation, and Extraction	Oct 12, 2023	DenoisingSpeech Enhancement	—Unverified
Beamformer-Guided Target Speaker Extraction	Mar 15, 2023	Target Speaker Extraction	—Unverified
Binaural Selective Attention Model for Target Speaker Extraction	Jun 18, 2024	modelTarget Speaker Extraction	—Unverified
C^2AV-TSE: Context and Confidence-aware Audio Visual Target Speaker Extraction	Apr 1, 2025	Target Speaker Extraction	—Unverified
Coarse-to-Fine Recursive Speech Separation for Unknown Number of Speakers	Mar 30, 2022	Speech SeparationTarget Speaker Extraction	—Unverified
Conditional Diffusion Model for Target Speaker Extraction	Oct 7, 2023	modelTarget Speaker Extraction	—Unverified
Enhancing Real-World Active Speaker Detection with Multi-Modal Extraction Pre-Training	Apr 1, 2024	Active Speaker DetectionAudio-Visual Active Speaker Detection	—Unverified
ExARN: self-attending RNN for target speaker extraction	Dec 2, 2022	Speaker IdentificationTarget Speaker Extraction	—Unverified
Exploiting spatial information with the informed complex-valued spatial autoencoder for target speaker extraction	Oct 27, 2022	PositionTarget Speaker Extraction	—Unverified
FlowTSE: Target Speaker Extraction with Flow Matching	May 20, 2025	Target Speaker Extraction	—Unverified
Improving Target Speaker Extraction with Sparse LDA-transformed Speaker Embeddings	Jan 16, 2023	Speaker VerificationSpeech Separation	—Unverified
Incorporating Linguistic Constraints from External Knowledge Source for Audio-Visual Target Speech Extraction	Jun 11, 2025	Speech ExtractionTarget Speaker Extraction	—Unverified
Listening to Multi-talker Conversations: Modular and End-to-end Perspectives	Feb 14, 2024	GPUspeaker-diarization	—Unverified

Show:10 25 50

← PrevPage 2 of 3Next →

No leaderboard results yet.