Speaker Recognition

Speaker Recognition is the process of identifying or confirming the identity of a person given his speech segments.

Source: Margin Matters: Towards More Discriminative Deep Neural Network Embeddings for Speaker Recognition

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 435 papers

Title	Date	Tasks	Status
Building and Evaluation of a Real Room Impulse Response Dataset	May 30, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
BUT System Description to VoxCeleb Speaker Recognition Challenge 2019	Oct 16, 2019	Speaker Recognition	—Unverified
BUT VOiCES 2019 System Description	Jul 13, 2019	Speaker Recognition	—Unverified
Call My Net 2: A New Resource for Speaker Recognition	May 1, 2020	Speaker Recognition	—Unverified
Can We Use Speaker Recognition Technology to Attack Itself? Enhancing Mimicry Attacks Using Automatic Target Speaker Selection	Nov 9, 2018	Speaker RecognitionSpeaker Verification	—Unverified
CEC: A Noisy Label Detection Method for Speaker Recognition	Jun 19, 2024	Speaker RecognitionSpeaker Verification	—Unverified
Centroid-based deep metric learning for speaker recognition	Feb 6, 2019	Few-Shot Image ClassificationFew-Shot Learning	—Unverified
Challenging margin-based speaker embedding extractors by using the variational information bottleneck	Jun 18, 2024	Speaker Recognition	—Unverified
Channel adversarial training for cross-channel text-independent speaker recognition	Feb 25, 2019	Domain AdaptationSpeaker Recognition	—Unverified
The xx205 System for the VoxCeleb Speaker Recognition Challenge 2020	Oct 31, 2020	Speaker Recognition	—Unverified
They are wearing a mask! Identification of Subjects Wearing a Surgical Mask from their Speech by means of x-vectors and Fisher Vectors	Aug 23, 2020	Speaker Recognition	—Unverified
THUEE system description for NIST 2019 SRE CTS Challenge	Dec 25, 2019	Speaker Recognition	—Unverified
THUEE system description for NIST 2020 SRE CTS challenge	Oct 12, 2022	Speaker Recognition	—Unverified
Tied Hidden Factors in Neural Networks for End-to-End Speaker Recognition	Dec 27, 2018	Speaker RecognitionSpeaker Verification	—Unverified
TIMIT Speaker Profiling: A Comparison of Multi-task learning and Single-task learning Approaches	Apr 18, 2024	Age EstimationClassification	—Unverified
Tongji University Undergraduate Team for the VoxCeleb Speaker Recognition Challenge2020	Oct 20, 2020	Data AugmentationDenoising	—Unverified
To Reverse the Gradient or Not: An Empirical Comparison of Adversarial and Multi-task Learning in Speech Recognition	Dec 9, 2018	Multi-Task LearningSpeaker Recognition	—Unverified
Towards End-to-End Private Automatic Speaker Recognition	Jun 23, 2022	Privacy PreservingSpeaker Recognition	—Unverified
Late Audio-Visual Fusion for In-The-Wild Speaker Diarization	Nov 2, 2022	speaker-diarizationSpeaker Diarization	—Unverified
Towards Relevance and Sequence Modeling in Language Recognition	Apr 2, 2020	Language IdentificationSpeaker Recognition	—Unverified
Transforming the Embeddings: A Lightweight Technique for Speech Emotion Recognition Tasks	May 29, 2023	Emotion RecognitionSpeaker Recognition	—Unverified
Triplet Based Embedding Distance and Similarity Learning for Text-independent Speaker Verification	Aug 6, 2019	Speaker RecognitionSpeaker Verification	—Unverified
Understanding Contrastive Learning Through the Lens of Margins	Jun 20, 2023	Contrastive LearningRepresentation Learning	—Unverified
UNISOUND System for VoxCeleb Speaker Recognition Challenge 2023	Aug 24, 2023	Speaker Recognition	—Unverified
Universal speaker recognition encoders for different speech segments duration	Oct 28, 2022	Speaker RecognitionSpeaker Verification	—Unverified
UniX-Encoder: A Universal X-Channel Speech Encoder for Ad-Hoc Microphone Array Speech Processing	Oct 25, 2023	speaker-diarizationSpeaker Diarization	—Unverified
Unsupervised Adaptation of SPLDA	Nov 20, 2015	speaker-diarizationSpeaker Diarization	—Unverified
Unsupervised Learning of Disentangled Speech Content and Style Representation	Oct 24, 2020	DecoderSpeaker Recognition	—Unverified
以二維共振峰分布建立語者音色模型及其在語者驗證上之應用 (Using 2D Formant Distribution to Build Speaker Models and Its Application in Speaker Verification) [In Chinese]	Oct 1, 2014	Speaker RecognitionSpeaker Verification	—Unverified
UTD-CRSS Systems for 2016 NIST Speaker Recognition Evaluation	Oct 24, 2016	ClusteringDimensionality Reduction	—Unverified
Utterance partitioning for speaker recognition: an experimental review and analysis with new findings under GMM-SVM framework	May 25, 2021	Speaker Recognition	—Unverified
VAE-based regularization for deep speaker embedding	Apr 7, 2019	Speaker Recognition	—Unverified
Variational Autoencoders with implicit priors for short-duration text-independent speaker verification	Oct 22, 2018	Speaker RecognitionSpeaker Verification	—Unverified
Visual Speech Recognition	Sep 3, 2014	Audio-Visual Speech RecognitionLip Reading	—Unverified
Voice Conversion Augmentation for Speaker Recognition on Defective Datasets	Apr 1, 2024	Speaker RecognitionVoice Conversion	—Unverified
Voice Morphing: Two Identities in One Voice	Sep 5, 2023	MORPHSpeaker Recognition	—Unverified
Voice Quality and Pitch Features in Transformer-Based Speech Recognition	Dec 21, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Voxceleb-ESP: preliminary experiments detecting Spanish celebrities from their voices	Dec 20, 2023	Speaker IdentificationSpeaker Recognition	—Unverified
VoxBlink: A Large Scale Speaker Verification Dataset on Camera	Aug 14, 2023	Speaker RecognitionSpeaker Verification	—Unverified
VoxSRC 2019: The first VoxCeleb Speaker Recognition Challenge	Dec 5, 2019	Speaker Recognition	—Unverified
VoxSRC 2020: The Second VoxCeleb Speaker Recognition Challenge	Dec 12, 2020	Speaker Recognition	—Unverified
VoxVietnam: a Large-Scale Multi-Genre Dataset for Vietnamese Speaker Recognition	Dec 31, 2024	DiversitySpeaker Recognition	—Unverified
VoxWatch: An open-set speaker recognition benchmark on VoxCeleb	Jun 30, 2023	Speaker IdentificationSpeaker Recognition	—Unverified
Vulnerability of Automatic Identity Recognition to Audio-Visual Deepfakes	Nov 29, 2023	Face RecognitionFace Swapping	—Unverified
WeCanTalk: A New Multi-language, Multi-modal Resource for Speaker Recognition	Jun 1, 2022	Speaker Recognition	—Unverified
We Need Variations in Speech Generation: Sub-center Modelling for Speaker Embeddings	Jul 5, 2024	Speaker RecognitionSpeech Synthesis	—Unverified
What do End-to-End Speech Models Learn about Speaker, Language and Channel Information? A Layer-wise and Neuron-level Analysis	Jul 1, 2021	Decision MakingDialect Identification	—Unverified
Who is Authentic Speaker	Apr 30, 2024	Speaker RecognitionVoice Conversion	—Unverified
Why does Self-Supervised Learning for Speech Recognition Benefit Speaker Recognition?	Apr 27, 2022	Self-Supervised LearningSpeaker Recognition	—Unverified
Xi-Vector Embedding for Speaker Recognition	Aug 12, 2021	Speaker Recognition	—Unverified

Show:10 25 50

← PrevPage 6 of 9Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	w2v2-aam	EER	1.88	—	Unverified
2	WavLM+ECAPA-TDNN	EER	0.39	—	Unverified