Speaker Recognition

Speaker Recognition is the process of identifying or confirming the identity of a person given his speech segments.

Source: Margin Matters: Towards More Discriminative Deep Neural Network Embeddings for Speaker Recognition

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 435 papers

Title	Date	Tasks	Status
Speaker and Language Change Detection using Wav2vec2 and Whisper	Feb 18, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Masking Kernel for Learning Energy-Efficient Representations for Speaker Recognition and Mobile Health	Feb 8, 2023	Speaker Recognition	CodeCode Available
Audio Representation Learning by Distilling Video as Privileged Information	Feb 6, 2023	Emotion RecognitionKnowledge Distillation	—Unverified
Leveraging Speaker Embeddings with Adversarial Multi-task Learning for Age Group Classification	Jan 22, 2023	Domain AdaptationMulti-Task Learning	—Unverified
A Multi-Purpose Audio-Visual Corpus for Multi-Modal Persian Speech Recognition: the Arman-AV Dataset	Jan 21, 2023	Audio-Visual Speech RecognitionAutomatic Speech Recognition	—Unverified
The Newsbridge -Telecom SudParis VoxCeleb Speaker Recognition Challenge 2022 System Description	Jan 17, 2023	Action DetectionActivity Detection	—Unverified
Introducing Model Inversion Attacks on Automatic Speaker Recognition	Jan 9, 2023	modelSpeaker Recognition	—Unverified
SLUE Phase-2: A Benchmark Suite of Diverse Spoken Language Understanding Tasks	Dec 20, 2022	Dialog Act ClassificationQuestion Answering	—Unverified
Probing Deep Speaker Embeddings for Speaker-related Tasks	Dec 14, 2022	Speaker RecognitionSpeaker Verification	—Unverified
A Novel Speech Feature Fusion Algorithm for Text-Independent Speaker Recognition	Dec 1, 2022	Speaker RecognitionText-Independent Speaker Recognition	—Unverified
Inconsistency Ranking-based Noisy Label Detection for High-quality Data	Dec 1, 2022	Metric LearningSpeaker Recognition	CodeCode Available
A new Speech Feature Fusion method with cross gate parallel CNN for Speaker Recognition	Nov 24, 2022	Speaker Recognition	—Unverified
Multi-source Domain Adaptation for Text-independent Forensic Speaker Recognition	Nov 17, 2022	Domain AdaptationSpeaker Recognition	—Unverified
Is Style All You Need? Dependencies Between Emotion and GST-based Speaker Recognition	Nov 15, 2022	AllEmotion Classification	CodeCode Available
Late Audio-Visual Fusion for In-The-Wild Speaker Diarization	Nov 2, 2022	speaker-diarizationSpeaker Diarization	—Unverified
I4U System Description for NIST SRE'20 CTS Challenge	Nov 2, 2022	Speaker Recognition	—Unverified
Disentangled representation learning for multilingual speaker recognition	Nov 1, 2022	DisentanglementMetric Learning	—Unverified
Universal speaker recognition encoders for different speech segments duration	Oct 28, 2022	Speaker RecognitionSpeaker Verification	—Unverified
Self-Supervised Training of Speaker Encoder with Multi-Modal Diverse Positive Pairs	Oct 27, 2022	Contrastive LearningSelf-Supervised Learning	—Unverified
Improving Speech Representation Learning via Speech-level and Phoneme-level Masking Approach	Oct 25, 2022	Representation LearningSpeaker Recognition	—Unverified
Large-scale learning of generalised representations for speaker recognition	Oct 20, 2022	Inductive BiasSpeaker Recognition	—Unverified
Risk of re-identification for shared clinical speech recordings	Oct 18, 2022	Speaker Recognition	CodeCode Available
SUPERB @ SLT 2022: Challenge on Generalization and Efficiency of Self-Supervised Speech Representation Learning	Oct 16, 2022	Audio GenerationRepresentation Learning	—Unverified
THUEE system description for NIST 2020 SRE CTS challenge	Oct 12, 2022	Speaker Recognition	—Unverified
The DKU-DukeECE Diarization System for the VoxCeleb Speaker Recognition Challenge 2022	Oct 4, 2022	Action DetectionActivity Detection	—Unverified
The Kriston AI System for the VoxCeleb Speaker Recognition Challenge 2022	Sep 23, 2022	Action DetectionActivity Detection	—Unverified
The SpeakIn System Description for CNSRC2022	Sep 22, 2022	RetrievalSpeaker Recognition	—Unverified
The ReturnZero System for VoxCeleb Speaker Recognition Challenge 2022	Sep 21, 2022	Speaker RecognitionSpeaker Verification	—Unverified
GIST-AiTeR System for the Diarization Task of the 2022 VoxCeleb Speaker Recognition Challenge	Sep 21, 2022	Action DetectionActivity Detection	—Unverified
The Royalflush System for VoxCeleb Speaker Recognition Challenge 2022	Sep 19, 2022	ClusteringDomain Adaptation	—Unverified
A Benchmark for Understanding and Generating Dialogue between Characters in Stories	Sep 18, 2022	Dialogue GenerationSpeaker Recognition	—Unverified
Disentangled Speaker Representation Learning via Mutual Information Minimization	Aug 17, 2022	DisentanglementRepresentation Learning	—Unverified
Attention and DCT based Global Context Modeling for Text-independent Speaker Recognition	Aug 4, 2022	Speaker RecognitionSpeaker Verification	—Unverified
Perception-Aware Attack: Creating Adversarial Music via Reverse-Engineering Human Perception	Jul 26, 2022	Adversarial AttackSpeaker Recognition	—Unverified
Graph-based Multi-View Fusion and Local Adaptation: Mitigating Within-Household Confusability for Speaker Identification	Jul 8, 2022	FairnessSpeaker Identification	—Unverified
A Hierarchical Speaker Representation Framework for One-shot Singing Voice Conversion	Jun 28, 2022	Speaker RecognitionVoice Conversion	—Unverified
Towards End-to-End Private Automatic Speaker Recognition	Jun 23, 2022	Privacy PreservingSpeaker Recognition	—Unverified
AS2T: Arbitrary Source-To-Target Adversarial Attack on Speaker Recognition Systems	Jun 7, 2022	Adversarial AttackSpeaker Recognition	—Unverified
WeCanTalk: A New Multi-language, Multi-modal Resource for Speaker Recognition	Jun 1, 2022	Speaker Recognition	—Unverified
Far-Field Speaker Recognition Benchmark Derived From The DiPCo Corpus	Jun 1, 2022	DenoisingSpeaker Recognition	—Unverified
Dynamic Recognition of Speakers for Consent Management by Contrastive Embedding Replay	May 17, 2022	Contrastive LearningInductive Bias	—Unverified
Baselines and Protocols for Household Speaker Recognition	Apr 30, 2022	Speaker Recognition	CodeCode Available
Why does Self-Supervised Learning for Speech Recognition Benefit Speaker Recognition?	Apr 27, 2022	Self-Supervised LearningSpeaker Recognition	—Unverified
Graph Convolutional Network Based Semi-Supervised Learning on Multi-Speaker Meeting Data	Apr 25, 2022	ClusteringSpeaker Recognition	—Unverified
The 2021 NIST Speaker Recognition Evaluation	Apr 21, 2022	Data AugmentationFace Recognition	—Unverified
The NIST CTS Speaker Recognition Challenge	Apr 21, 2022	Data AugmentationSpeaker Recognition	—Unverified
Disentangled Speech Representation Learning Based on Factorized Hierarchical Variational Autoencoder with Self-Supervised Objective	Apr 5, 2022	DisentanglementRepresentation Learning	—Unverified
Robust Speaker Recognition with Transformers Using wav2vec 2.0	Mar 28, 2022	Data AugmentationRepresentation Learning	—Unverified
Curriculum learning for self-supervised speaker verification	Mar 28, 2022	Self-Supervised LearningSpeaker Recognition	—Unverified
To train or not to train adversarially: A study of bias mitigation strategies for speaker recognition	Mar 17, 2022	Face RecognitionFairness	CodeCode Available

Show:10 25 50

← PrevPage 4 of 9Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	w2v2-aam	EER	1.88	—	Unverified
2	WavLM+ECAPA-TDNN	EER	0.39	—	Unverified