SOTAVerified|Agents Browse Leaderboard About Blog

Target Speaker Extraction

Extract the dialogue content of the specified target in a multi-person dialogue.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–10 of 55 papers

Title	Date	Tasks	Status	Hype
Metis: A Foundation Speech Generation Model with Masked Generative Pre-training	Feb 5, 2025	Self-Supervised LearningSpeech Enhancement	CodeCode Available	9
Multi-Level Speaker Representation for Target Speaker Extraction	Oct 21, 2024	Target Speaker Extraction	CodeCode Available	3
WeSep: A Scalable and Flexible Toolkit Towards Generalizable Target Speaker Extraction	Sep 24, 2024	Managementspeech-recognition	CodeCode Available	3
TSELM: Target Speaker Extraction using Discrete Tokens and Language Models	Sep 12, 2024	Audio GenerationTarget Speaker Extraction	CodeCode Available	2
LauraTSE: Target Speaker Extraction using Auto-Regressive Decoder-Only Language Models	Apr 10, 2025	DecoderLanguage Modeling	CodeCode Available	1
USEF-TSE: Universal Speaker Embedding Free Target Speaker Extraction	Sep 4, 2024	Speaker RecognitionSpeech Separation	CodeCode Available	1
AV-CrossNet: an Audiovisual Complex Spectral Mapping Network for Speech Separation By Leveraging Narrow- and Cross-Band Modeling	Jun 17, 2024	Speaker SeparationSpeech Enhancement	CodeCode Available	1
Audio-Visual Target Speaker Extraction with Reverse Selective Auditory Attention	Apr 29, 2024	Target Speaker Extraction	CodeCode Available	1
Typing to Listen at the Cocktail Party: Text-Guided Target Speaker Extraction	Oct 11, 2023	Language ModellingLarge Language Model	CodeCode Available	1
RTFS-Net: Recurrent Time-Frequency Modelling for Efficient Audio-Visual Speech Separation	Sep 29, 2023	Audio-Visual Speech Recognitionspeech-recognition	CodeCode Available	1

Show:10 25 50

← PrevPage 1 of 6Next →

No leaderboard results yet.