Speaker Recognition

Speaker Recognition is the process of identifying or confirming the identity of a person given his speech segments.

Source: Margin Matters: Towards More Discriminative Deep Neural Network Embeddings for Speaker Recognition

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 435 papers

Title	Date	Tasks	Status	Hype
Speaker Characterization by means of Attention Pooling	May 7, 2024	Emotion RecognitionSpeaker Recognition	—Unverified	0
Who is Authentic Speaker	Apr 30, 2024	Speaker RecognitionVoice Conversion	—Unverified	0
Certification of Speaker Recognition Models to Additive Perturbations	Apr 29, 2024	Few-Shot LearningSpeaker Recognition	CodeCode Available	0
Artificial Neural Networks to Recognize Speakers Division from Continuous Bengali Speech	Apr 18, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
TIMIT Speaker Profiling: A Comparison of Multi-task learning and Single-task learning Approaches	Apr 18, 2024	Age EstimationClassification	—Unverified	0
Voice Conversion Augmentation for Speaker Recognition on Defective Datasets	Apr 1, 2024	Speaker RecognitionVoice Conversion	—Unverified	0
3D-Speaker-Toolkit: An Open-Source Toolkit for Multimodal Speaker Verification and Diarization	Mar 29, 2024	Self-Supervised Learningspeaker-diarization	—Unverified	0
Asymmetric and trial-dependent modeling: the contribution of LIA to SdSV Challenge Task 2	Mar 28, 2024	Speaker RecognitionSpeaker Verification	—Unverified	0
Cosine Scoring with Uncertainty for Neural Speaker Embedding	Mar 11, 2024	Speaker Recognition	—Unverified	0
ESPnet-SPK: full pipeline speaker embedding toolkit with reproducible recipes, self-supervised front-ends, and off-the-shelf models	Jan 30, 2024	Self-Supervised LearningSpeaker Recognition	CodeCode Available	3
Post-Training Embedding Alignment for Decoupling Enrollment and Runtime Speaker Recognition Models	Jan 23, 2024	Speaker IdentificationSpeaker Recognition	—Unverified	0
Voxceleb-ESP: preliminary experiments detecting Spanish celebrities from their voices	Dec 20, 2023	Speaker IdentificationSpeaker Recognition	—Unverified	0
Vulnerability of Automatic Identity Recognition to Audio-Visual Deepfakes	Nov 29, 2023	Face RecognitionFace Swapping	—Unverified	0
Phonetic-aware speaker embedding for far-field speaker verification	Nov 27, 2023	Speaker RecognitionSpeaker Verification	—Unverified	0
Parrot-Trained Adversarial Examples: Pushing the Practicality of Black-Box Audio Attacks against Speaker Recognition Models	Nov 13, 2023	SentenceSpeaker Recognition	—Unverified	0
Personalizing Keyword Spotting with Speaker Information	Nov 6, 2023	Keyword SpottingSpeaker Recognition	—Unverified	0
Detecting Agreement in Multi-party Conversational AI	Nov 6, 2023	Speaker Recognition	—Unverified	0
Deep Neural Networks for Automatic Speaker Recognition Do Not Learn Supra-Segmental Temporal Features	Nov 1, 2023	Speaker Recognition	—Unverified	0
UniX-Encoder: A Universal X-Channel Speech Encoder for Ad-Hoc Microphone Array Speech Processing	Oct 25, 2023	speaker-diarizationSpeaker Diarization	—Unverified	0
Take the aTrain. Introducing an Interface for the Accessible Transcription of Interviews	Oct 18, 2023	CPUGPU	CodeCode Available	3
Privacy-oriented manipulation of speaker representations	Oct 10, 2023	Speaker RecognitionSpeech Synthesis	—Unverified	0
Thech. Report: Genuinization of Speech waveform PMF for speaker detection spoofing and countermeasures	Oct 9, 2023	Speaker Recognition	—Unverified	0
Disentangling Voice and Content with Self-Supervision for Speaker Recognition	Oct 2, 2023	DisentanglementSpeaker Recognition	—Unverified	0
Leveraging In-the-Wild Data for Effective Self-Supervised Pretraining in Speaker Recognition	Sep 21, 2023	Speaker Recognition	CodeCode Available	3
SLMIA-SR: Speaker-Level Membership Inference Attacks against Speaker Recognition Systems	Sep 14, 2023	Feature EngineeringInference Attack	CodeCode Available	0
Voice Morphing: Two Identities in One Voice	Sep 5, 2023	MORPHSpeaker Recognition	—Unverified	0
UNISOUND System for VoxCeleb Speaker Recognition Challenge 2023	Aug 24, 2023	Speaker Recognition	—Unverified	0
The DKU-MSXF Speaker Verification System for the VoxCeleb Speaker Recognition Challenge 2023	Aug 17, 2023	Domain AdaptationSemi-supervised Domain Adaptation	—Unverified	0
Graph Neural Network Backend for Speaker Recognition	Aug 17, 2023	Graph Neural NetworkSpeaker Recognition	—Unverified	0
The ID R&D VoxCeleb Speaker Recognition Challenge 2023 System Description	Aug 16, 2023	Self-Supervised LearningSpeaker Recognition	—Unverified	0
ChinaTelecom System Description to VoxCeleb Speaker Recognition Challenge 2023	Aug 16, 2023	Speaker Recognition	—Unverified	0
GIST-AiTeR Speaker Diarization System for VoxCeleb Speaker Recognition Challenge (VoxSRC) 2023	Aug 15, 2023	speaker-diarizationSpeaker Diarization	—Unverified	0
The DKU-MSXF Diarization System for the VoxCeleb Speaker Recognition Challenge 2023	Aug 15, 2023	Action DetectionActivity Detection	—Unverified	0
VoxBlink: A Large Scale Speaker Verification Dataset on Camera	Aug 14, 2023	Speaker RecognitionSpeaker Verification	—Unverified	0
On-Device Speaker Anonymization of Acoustic Embeddings for ASR based onFlexible Location Gradient Reversal Layer	Jul 25, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Exploring the Integration of Speech Separation and Recognition with Self-Supervised Learning Representation	Jul 23, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Facial Landmark Detection Evaluation on MOBIO Database	Jul 6, 2023	3D Face ReconstructionFace Alignment	—Unverified	0
VoxWatch: An open-set speaker recognition benchmark on VoxCeleb	Jun 30, 2023	Speaker IdentificationSpeaker Recognition	—Unverified	0
Understanding Contrastive Learning Through the Lens of Margins	Jun 20, 2023	Contrastive LearningRepresentation Learning	—Unverified	0
SpeechGLUE: How Well Can Self-Supervised Speech Models Capture Linguistic Knowledge?	Jun 14, 2023	Natural Language UnderstandingSelf-Supervised Learning	CodeCode Available	1
Meta-Learning Framework for End-to-End Imposter Identification in Unseen Speaker Recognition	Jun 1, 2023	Meta-LearningSpeaker Identification	—Unverified	0
STT4SG-350: A Speech Corpus for All Swiss German Dialect Regions	May 30, 2023	AllAutomatic Speech Recognition	—Unverified	0
Transforming the Embeddings: A Lightweight Technique for Speech Emotion Recognition Tasks	May 29, 2023	Emotion RecognitionSpeaker Recognition	—Unverified	0
Ordered and Binary Speaker Embedding	May 25, 2023	ClusteringRetrieval	—Unverified	0
Generalized domain adaptation framework for parametric back-end in speaker recognition	May 24, 2023	Domain AdaptationSpeaker Recognition	—Unverified	0
Can Self-Supervised Neural Representations Pre-Trained on Human Speech distinguish Animal Callers?	May 23, 2023	Caller DetectionSelf-Supervised Learning	CodeCode Available	0
QFA2SR: Query-Free Adversarial Transfer Attacks to Speaker Recognition Systems	May 23, 2023	Speaker Recognition	—Unverified	0
Vocal Style Factorization for Effective Speaker Recognition in Affective Scenarios	May 13, 2023	Speaker Recognition	CodeCode Available	0
A Comparative Study of Pre-trained Speech and Audio Embeddings for Speech Emotion Recognition	Apr 22, 2023	Emotion RecognitionSpeaker Recognition	—Unverified	0
The Graph feature fusion technique for speaker recognition based on wav2vec2.0 framework	Mar 19, 2023	Graph AttentionGraph Neural Network	—Unverified	0

Show:10 25 50

← PrevPage 2 of 9Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	w2v2-aam	EER	1.88	—	Unverified
2	WavLM+ECAPA-TDNN	EER	0.39	—	Unverified