SOTAVerified|Agents Browse Leaderboard About

Target Speaker Extraction

Extract the dialogue content of the specified target in a multi-person dialogue.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–10 of 55 papers

Title	Date	Tasks	Status	Hype	Score
Metis: A Foundation Speech Generation Model with Masked Generative Pre-training	Feb 5, 2025	Self-Supervised LearningSpeech Enhancement	CodeCode Available	9	5
Multi-Level Speaker Representation for Target Speaker Extraction	Oct 21, 2024	Target Speaker Extraction	CodeCode Available	3	5
WeSep: A Scalable and Flexible Toolkit Towards Generalizable Target Speaker Extraction	Sep 24, 2024	Managementspeech-recognition	CodeCode Available	3	5
TSELM: Target Speaker Extraction using Discrete Tokens and Language Models	Sep 12, 2024	Audio GenerationTarget Speaker Extraction	CodeCode Available	2	5
AV-CrossNet: an Audiovisual Complex Spectral Mapping Network for Speech Separation By Leveraging Narrow- and Cross-Band Modeling	Jun 17, 2024	Speaker SeparationSpeech Enhancement	CodeCode Available	1	5
L-SpEx: Localized Target Speaker Extraction	Feb 21, 2022	Target Speaker Extraction	CodeCode Available	1	5
Muse: Multi-modal target speaker extraction with visual cues	Oct 15, 2020	Target Speaker Extraction	CodeCode Available	1	5
Audio-Visual Target Speaker Extraction with Reverse Selective Auditory Attention	Apr 29, 2024	Target Speaker Extraction	CodeCode Available	1	5
GPU-accelerated Guided Source Separation for Meeting Transcription	Dec 10, 2022	blind source separationCPU	CodeCode Available	1	5
A Hybrid Continuity Loss to Reduce Over-Suppression for Time-domain Target Speaker Extraction	Mar 31, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1	5

Show:10 25 50

← PrevPage 1 of 6Next →

No leaderboard results yet.