Target Speaker Extraction

Extract the dialogue content of the specified target in a multi-person dialogue.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 55 papers

Title	Date	Tasks	Status	Hype
Audio-Visual Target Speaker Extraction with Reverse Selective Auditory Attention	Apr 29, 2024	Target Speaker Extraction	CodeCode Available	1
Enhancing Real-World Active Speaker Detection with Multi-Modal Extraction Pre-Training	Apr 1, 2024	Active Speaker DetectionAudio-Visual Active Speaker Detection	—Unverified	0
Target Speaker Extraction by Directly Exploiting Contextual Information in the Time-Frequency Domain	Feb 27, 2024	Target Speaker Extraction	—Unverified	0
Listening to Multi-talker Conversations: Modular and End-to-end Perspectives	Feb 14, 2024	GPUspeaker-diarization	—Unverified	0
A Single Speech Enhancement Model Unifying Dereverberation, Denoising, Speaker Counting, Separation, and Extraction	Oct 12, 2023	DenoisingSpeech Enhancement	—Unverified	0
Typing to Listen at the Cocktail Party: Text-Guided Target Speaker Extraction	Oct 11, 2023	Language ModellingLarge Language Model	CodeCode Available	1
Conditional Diffusion Model for Target Speaker Extraction	Oct 7, 2023	modelTarget Speaker Extraction	—Unverified	0
RTFS-Net: Recurrent Time-Frequency Modelling for Efficient Audio-Visual Speech Separation	Sep 29, 2023	Audio-Visual Speech Recognitionspeech-recognition	CodeCode Available	1
The Multimodal Information Based Speech Processing (MISP) 2023 Challenge: Audio-Visual Target Speaker Extraction	Sep 15, 2023	Audio-Visual Speech Recognitionspeech-recognition	—Unverified	0
SpeechX: Neural Codec Language Model as a Versatile Speech Transformer	Aug 14, 2023	Language ModelingLanguage Modelling	—Unverified	0
Beamformer-Guided Target Speaker Extraction	Mar 15, 2023	Target Speaker Extraction	—Unverified	0
Multi-Channel Target Speaker Extraction with Refinement: The WavLab Submission to the Second Clarity Enhancement Challenge	Feb 15, 2023	Speaker SeparationSpeech Enhancement	—Unverified	0
Improving Target Speaker Extraction with Sparse LDA-transformed Speaker Embeddings	Jan 16, 2023	Speaker VerificationSpeech Separation	—Unverified	0
GPU-accelerated Guided Source Separation for Meeting Transcription	Dec 10, 2022	blind source separationCPU	CodeCode Available	1
ExARN: self-attending RNN for target speaker extraction	Dec 2, 2022	Speaker IdentificationTarget Speaker Extraction	—Unverified	0
Adapting self-supervised models to multi-talker speech recognition using speaker embeddings	Nov 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
ImagineNET: Target Speaker Extraction with Intermittent Visual Cue through Embedding Inpainting	Oct 31, 2022	Target Speaker Extraction	CodeCode Available	0
Exploiting spatial information with the informed complex-valued spatial autoencoder for target speaker extraction	Oct 27, 2022	PositionTarget Speaker Extraction	—Unverified	0
Semi-supervised Time Domain Target Speaker Extraction with Attention	Jun 18, 2022	Target Speaker Extraction	—Unverified	0
Speaker-conditioning Single-channel Target Speaker Extraction using Conformer-based Architectures	May 27, 2022	Target Speaker Extraction	—Unverified	0
A Hybrid Continuity Loss to Reduce Over-Suppression for Time-domain Target Speaker Extraction	Mar 31, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Coarse-to-Fine Recursive Speech Separation for Unknown Number of Speakers	Mar 30, 2022	Speech SeparationTarget Speaker Extraction	—Unverified	0
L-SpEx: Localized Target Speaker Extraction	Feb 21, 2022	Target Speaker Extraction	CodeCode Available	1
New Insights on Target Speaker Extraction	Feb 1, 2022	Speaker SeparationTarget Speaker Extraction	—Unverified	0
Selective Listening by Synchronizing Speech with Lips	Jun 14, 2021	Lip ReadingTarget Speaker Extraction	CodeCode Available	1

Show:10 25 50

← PrevPage 2 of 3Next →

No leaderboard results yet.