Speaker Identification

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 248 papers

Title	Date	Tasks	Status	Hype
Learning Audio-Visual Dereverberation	Jun 14, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
MPC-BERT: A Pre-Trained Language Model for Multi-Party Conversation Understanding	Jun 3, 2021	Conversational Response SelectionLanguage Modeling	CodeCode Available	1
Supervised Speech Representation Learning for Parkinson's Disease Classification	Jun 1, 2021	ClassificationRepresentation Learning	CodeCode Available	1
Speech Resynthesis from Discrete Disentangled Self-Supervised Representations	Apr 1, 2021	DisentanglementRepresentation Learning	CodeCode Available	1
Blind Speech Separation and Dereverberation using Neural Beamforming	Mar 24, 2021	Speaker IdentificationSpeaker Separation	CodeCode Available	1
A Modulation-Domain Loss for Neural-Network-based Real-time Speech Enhancement	Feb 15, 2021	Speaker IdentificationSpeech Denoising	CodeCode Available	1
Deep Discriminative Feature Learning for Accent Recognition	Nov 25, 2020	Face RecognitionSpeaker Identification	CodeCode Available	1
FoolHD: Fooling speaker identification by Highly imperceptible adversarial Disturbances	Nov 17, 2020	Adversarial AttackSpeaker Identification	CodeCode Available	1
Minimum Bayes Risk Training for End-to-End Speaker-Attributed ASR	Nov 3, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Sum-Product Networks for Robust Automatic Speaker Identification	Aug 13, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Investigation of End-To-End Speaker-Attributed ASR for Continuous Multi-Talker Recordings	Aug 11, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
AutoSpeech: Neural Architecture Search for Speaker Recognition	May 7, 2020	image-classificationImage Classification	CodeCode Available	1
Meta-Learning for Short Utterance Speaker Recognition with Imbalance Length Pairs	Apr 6, 2020	Meta-LearningSpeaker Identification	CodeCode Available	1
AM-MobileNet1D: A Portable Model for Speaker Recognition	Mar 31, 2020	Deep Learningmodel	CodeCode Available	1
Speech2Phone: A Novel and Efficient Method for Training Speaker Recognition Models	Feb 25, 2020	Speaker IdentificationSpeaker Recognition	CodeCode Available	1
Improving speaker discrimination of target speech extraction with time-domain SpeakerBeam	Jan 23, 2020	Speaker IdentificationSpeech Extraction	CodeCode Available	1
Generative Pre-Training for Speech with Autoregressive Predictive Coding	Oct 23, 2019	Representation LearningSpeaker Identification	CodeCode Available	1
Learning Speaker Representations with Mutual Information	Dec 1, 2018	SentenceSpeaker Identification	CodeCode Available	1
Speaker Recognition from Raw Waveform with SincNet	Jul 29, 2018	Speaker IdentificationSpeaker Recognition	CodeCode Available	1
CoLMbo: Speaker Language Model for Descriptive Profiling	Jun 11, 2025	DescriptiveLanguage Modeling	CodeCode Available	0
Rhythm Features for Speaker Identification	Jun 7, 2025	Deep LearningRhythm	—Unverified	0
French Listening Tests for the Assessment of Intelligibility, Quality, and Identity of Body-Conducted Speech Enhancement	Jun 4, 2025	Bandwidth ExtensionSpeaker Identification	—Unverified	0
Speech Unlearning	Jun 1, 2025	Adversarial RobustnessKeyword Spotting	—Unverified	0
Pretraining Multi-Speaker Identification for Neural Speaker Diarization	May 30, 2025	speaker-diarizationSpeaker Diarization	—Unverified	0
REWIND: Speech Time Reversal for Enhancing Speaker Representations in Diffusion-based Voice Conversion	May 27, 2025	DisentanglementSpeaker Identification	—Unverified	0

Show:10 25 50

← PrevPage 2 of 10Next →

All datasets VoxCeleb1 EVI en-GB EVI fr-FR EVI pl-PL

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MSM-MAE	Top-1 (%)	96.6	—	Unverified
2	M2D/0.6	Top-1 (%)	96.5	—	Unverified
3	M2D/0.7	Top-1 (%)	96.3	—	Unverified
4	M2D ratio=0.6	Top-1 (%)	94.8	—	Unverified
5	AudioMAE (local)	Top-1 (%)	94.8	—	Unverified
6	ATST Base (ours)	Top-1 (%)	94.3	—	Unverified
7	AudioMAE (global)	Top-1 (%)	94.1	—	Unverified
8	AutoSpeech (N=8,C=128)	Top-1 (%)	87.66	—	Unverified
9	SSAST-FRAME	Top-1 (%)	80.8	—	Unverified
10	SSAMBA	Top-1 (%)	70.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Fuzzy Retrieval	Top-1 (%)	67.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Fuzzy Retrieval	Top-1 (%)	80.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Fuzzy Retrieval	Top-1 (%)	95.13	—	Unverified