Target Speaker Extraction

Extract the dialogue content of the specified target in a multi-person dialogue.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 55 papers

Title	Date	Tasks	Status
STCON System for the CHiME-8 Challenge	Oct 17, 2024	Data AugmentationSpeech Separation	—Unverified
Wanna hear your voice? A sample is all we need!	Oct 1, 2024	AllSpeech Separation	—Unverified
Two-stage Framework for Robust Speech Emotion Recognition Using Target Speaker Extraction in Human Speech Noise Conditions	Sep 29, 2024	Emotion RecognitionSpeech Emotion Recognition	—Unverified
Generative Speech Foundation Model Pretraining for High-Quality Speech Extraction and Restoration	Sep 24, 2024	Bandwidth ExtensionDenoising	—Unverified
Spectron: Target Speaker Extraction using Conditional Transformer with Adversarial Refinement	Sep 2, 2024	Target Speaker Extraction	CodeCode Available
Overview of Speaker Modeling and Its Applications: From the Lens of Deep Speaker Representation Learning	Jul 21, 2024	Representation LearningSelf-Supervised Learning	—Unverified
SpeakerBeam-SS: Real-time Target Speaker Extraction with Lightweight Conv-TasNet and State Space Modeling	Jul 1, 2024	Target Speaker Extraction	—Unverified
Binaural Selective Attention Model for Target Speaker Extraction	Jun 18, 2024	modelTarget Speaker Extraction	—Unverified
Target Speaker Extraction with Curriculum Learning	Jun 12, 2024	Target Speaker Extraction	—Unverified
Enhancing Real-World Active Speaker Detection with Multi-Modal Extraction Pre-Training	Apr 1, 2024	Active Speaker DetectionAudio-Visual Active Speaker Detection	—Unverified
Target Speaker Extraction by Directly Exploiting Contextual Information in the Time-Frequency Domain	Feb 27, 2024	Target Speaker Extraction	—Unverified
Listening to Multi-talker Conversations: Modular and End-to-end Perspectives	Feb 14, 2024	GPUspeaker-diarization	—Unverified
A Single Speech Enhancement Model Unifying Dereverberation, Denoising, Speaker Counting, Separation, and Extraction	Oct 12, 2023	DenoisingSpeech Enhancement	—Unverified
Conditional Diffusion Model for Target Speaker Extraction	Oct 7, 2023	modelTarget Speaker Extraction	—Unverified
The Multimodal Information Based Speech Processing (MISP) 2023 Challenge: Audio-Visual Target Speaker Extraction	Sep 15, 2023	Audio-Visual Speech Recognitionspeech-recognition	—Unverified
SpeechX: Neural Codec Language Model as a Versatile Speech Transformer	Aug 14, 2023	Language ModelingLanguage Modelling	—Unverified
Beamformer-Guided Target Speaker Extraction	Mar 15, 2023	Target Speaker Extraction	—Unverified
Multi-Channel Target Speaker Extraction with Refinement: The WavLab Submission to the Second Clarity Enhancement Challenge	Feb 15, 2023	Speaker SeparationSpeech Enhancement	—Unverified
Improving Target Speaker Extraction with Sparse LDA-transformed Speaker Embeddings	Jan 16, 2023	Speaker VerificationSpeech Separation	—Unverified
ExARN: self-attending RNN for target speaker extraction	Dec 2, 2022	Speaker IdentificationTarget Speaker Extraction	—Unverified
Adapting self-supervised models to multi-talker speech recognition using speaker embeddings	Nov 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ImagineNET: Target Speaker Extraction with Intermittent Visual Cue through Embedding Inpainting	Oct 31, 2022	Target Speaker Extraction	CodeCode Available
Exploiting spatial information with the informed complex-valued spatial autoencoder for target speaker extraction	Oct 27, 2022	PositionTarget Speaker Extraction	—Unverified
Semi-supervised Time Domain Target Speaker Extraction with Attention	Jun 18, 2022	Target Speaker Extraction	—Unverified
Speaker-conditioning Single-channel Target Speaker Extraction using Conformer-based Architectures	May 27, 2022	Target Speaker Extraction	—Unverified

Show:10 25 50

← PrevPage 2 of 3Next →

No leaderboard results yet.