Speaker Verification

Speaker verification is the verifying the identity of a person from characteristics of the voice.

( Image credit: Contrastive-Predictive-Coding-PyTorch )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 746 papers

Title	Date	Tasks	Status	Hype
PaddleSpeech: An Easy-to-Use All-in-One Speech Toolkit	May 20, 2022	AllAutomatic Speech Recognition (ASR)	CodeCode Available	6
VoxBlink2: A 100K+ Speaker Recognition Corpus and the Open-Set Speaker-Identification Benchmark	Jul 16, 2024	DiversitySpeaker Identification	CodeCode Available	5
Magnitude-aware Probabilistic Speaker Embeddings	Feb 28, 2022	Out-of-Distribution DetectionSpeaker Verification	CodeCode Available	3
Pushing the limits of raw waveform speaker recognition	Mar 16, 2022	Self-Supervised LearningSpeaker Recognition	CodeCode Available	3
Ludwig: a type-based declarative deep learning toolbox	Sep 17, 2019	DecoderDeep Learning	CodeCode Available	3
ESPnet-SPK: full pipeline speaker embedding toolkit with reproducible recipes, self-supervised front-ends, and off-the-shelf models	Jan 30, 2024	Self-Supervised LearningSpeaker Recognition	CodeCode Available	3
SALMONN: Towards Generic Hearing Abilities for Large Language Models	Oct 20, 2023	Audio captioningAutomatic Speech Recognition	CodeCode Available	3
Golden Gemini is All You Need: Finding the Sweet Spots for Speaker Verification	Dec 6, 2023	AllSpeaker Verification	CodeCode Available	3
Towards A Unified Conformer Structure: from ASR to ASV Task	Nov 14, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	2
Singer Identity Representation Learning using Self-Supervised Techniques	Jan 10, 2024	Domain GeneralizationRepresentation Learning	CodeCode Available	2
Learning Lip-Based Audio-Visual Speaker Embeddings with AV-HuBERT	May 15, 2022	Representation LearningSpeaker Verification	CodeCode Available	2
u-HuBERT: Unified Mixed-Modal Speech Pretraining And Zero-Shot Transfer to Unlabeled Modality	Jul 14, 2022	Speaker Verificationspeech-recognition	CodeCode Available	2
Crossed-Time Delay Neural Network for Speaker Recognition	May 31, 2020	Speaker RecognitionSpeaker Verification	CodeCode Available	1
A^3T: Alignment-Aware Acoustic and Text Pretraining for Speech Synthesis and Editing	Mar 18, 2022	Representation LearningSpeaker Verification	CodeCode Available	1
Cross-modal Audio-visual Co-learning for Text-independent Speaker Verification	Feb 22, 2023	Speaker VerificationText-Independent Speaker Verification	CodeCode Available	1
Channel-wise Gated Res2Net: Towards Robust Detection of Synthetic Speech Attacks	Jul 19, 2021	Speaker Verification	CodeCode Available	1
Bts-e: Audio deepfake detection using breathing-talking-silence encoder	May 5, 2023	Audio Deepfake DetectionDeepFake Detection	CodeCode Available	1
Cross-Age Speaker Verification: Learning Age-Invariant Speaker Embeddings	Jul 13, 2022	Age EstimationSpeaker Verification	CodeCode Available	1
Cross-modal information fusion for voice spoofing detection	Feb 1, 2023	Automatic Speech Recognitionfake voice detection	CodeCode Available	1
Attention Back-end for Automatic Speaker Verification with Multiple Enrollment Utterances	Apr 4, 2021	Speaker Verification	CodeCode Available	1
Attack on practical speaker verification system using universal adversarial perturbations	May 19, 2021	Real-World Adversarial AttackRoom Impulse Response (RIR)	CodeCode Available	1
Audio Spoofing Verification using Deep Convolutional Neural Networks by Transfer Learning	Aug 8, 2020	Speaker VerificationTransfer Learning	CodeCode Available	1
Backdoor Attack against Speaker Verification	Oct 22, 2020	Backdoor AttackClustering	CodeCode Available	1
Bias in Automated Speaker Recognition	Jan 24, 2022	BIG-bench Machine LearningFace Recognition	CodeCode Available	1
ASVspoof 2019: Future Horizons in Spoofed and Fake Audio Detection	Apr 14, 2019	Speaker Verification	CodeCode Available	1

Show:10 25 50

← PrevPage 1 of 30Next →

All datasets VoxCeleb VoxCeleb1 CALLHOME CN-CELEB ASVspoof 2019 - LA VibraVox (forehead accelerometer)VibraVox (headset microphone)VibraVox (rigid in-ear microphone)VibraVox (soft in-ear microphone)VibraVox (temple vibration pickup)VibraVox (throat microphone)VoxCeleb2

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Multi Task SSL	EER	1.98	—	Unverified
2	ReDimNet-B0-LM (1.0M)	EER	1.16	—	Unverified
3	TitanNet -S	EER	1.15	—	Unverified
4	ReDimNet-B0-LM-ASNorm (1.0M)	EER	1.07	—	Unverified
5	SpeechNAS	EER	1.02	—	Unverified
6	ReDimNet-B1-LM (2.2M)	EER	0.85	—	Unverified
7	TitanNet -M	EER	0.81	—	Unverified
8	ReDimNet-B1-LM-ASNorm (2.2M)	EER	0.73	—	Unverified
9	TitanNet -L	EER	0.68	—	Unverified
10	ReDimNet-B2-SF2-LM (4.7M)	EER	0.57	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Fine-tuned HuBERT Large	EER	2.36	—	Unverified
2	ReDimNet-B0-LM (1.0M)	EER	1.16	—	Unverified
3	ReDimNet-B0-LM-ASNorm (1.0M)	EER	1.07	—	Unverified
4	SpeechNAS	EER	1.02	—	Unverified
5	ReDimNet-B1-LM (2.2M)	EER	0.85	—	Unverified
6	ReDimNet-B1-LM-ASNorm (2.2M)	EER	0.73	—	Unverified
7	ReDimNet-B2-SF2-LM (4.7M)	EER	0.57	—	Unverified
8	ReDimNet-B2-SF2-LM-ASNorm (4.7M)	EER	0.52	—	Unverified
9	ReDimNet-B4-LM (6.3M)	EER	0.51	—	Unverified
10	ReDimNet-B3-LM (3.0M)	EER	0.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GE2E	Cosine EER	3.55	—	Unverified
2		Cosine EER	2.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ResNet with Attention Backend	EER	10.77	—	Unverified
2	X-Vectors with Attention Backend	EER	10.12	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ECAPA-TDNN	minDCF	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ECAPA2	Test EER	0.01	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ECAPA2	Test EER	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ECAPA2	Test EER	0.03	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ECAPA2	Test EER	0.02	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ECAPA2	Test EER	0.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ECAPA2	Test EER	0.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ResNet-50	EER	100	—	Unverified