Speaker Identification

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 248 papers

Title	Date	Tasks	Status	Hype
Hypothesis Stitcher for End-to-End Speaker-attributed ASR on Long-form Multi-talker Recordings	Jan 6, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
A Study of Few-Shot Audio Classification	Dec 2, 2020	Audio ClassificationBIG-bench Machine Learning	—Unverified	0
Deep Discriminative Feature Learning for Accent Recognition	Nov 25, 2020	Face RecognitionSpeaker Identification	CodeCode Available	1
How Far Are We from Robust Voice Conversion: A Survey	Nov 24, 2020	Speaker IdentificationSurvey	—Unverified	0
FoolHD: Fooling speaker identification by Highly imperceptible adversarial Disturbances	Nov 17, 2020	Adversarial AttackSpeaker Identification	CodeCode Available	1
Multi-Modal Emotion Detection with Transfer Learning	Nov 13, 2020	Speaker IdentificationTransfer Learning	—Unverified	0
Minimum Bayes Risk Training for End-to-End Speaker-Attributed ASR	Nov 3, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
T-vectors: Weakly Supervised Speaker Identification Using Hierarchical Transformer Model	Oct 29, 2020	Speaker Identification	—Unverified	0
Compositional embedding models for speaker identification and diarization with simultaneous speech from 2+ speakers	Oct 22, 2020	speaker-diarizationSpeaker Diarization	CodeCode Available	0
Contrastive Learning of General-Purpose Audio Representations	Oct 21, 2020	CoLAContrastive Learning	CodeCode Available	0
A Lightweight Speaker Recognition System Using Timbre Properties	Oct 12, 2020	GPUSpeaker Identification	—Unverified	0
Remarks on Optimal Scores for Speaker Recognition	Oct 10, 2020	Speaker IdentificationSpeaker Recognition	—Unverified	0
Sum-Product Networks for Robust Automatic Speaker Identification	Aug 13, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Investigation of End-To-End Speaker-Attributed ASR for Continuous Multi-Talker Recordings	Aug 11, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
SoK: The Faults in our ASRs: An Overview of Attacks against Automatic Speech Recognition and Speaker Identification Systems	Jul 13, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Joint Speaker Counting, Speech Recognition, and Speaker Identification for Overlapped Speech of Any Number of Speakers	Jun 19, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Integrated Replay Spoofing-aware Text-independent Speaker Verification	Jun 10, 2020	Multi-Task LearningSpeaker Identification	—Unverified	0
audino: A Modern Annotation Tool for Audio and Speech	Jun 9, 2020	Action DetectionActivity Detection	CodeCode Available	2
Speaker and Posture Classification using Instantaneous Intraspeech Breathing Features	May 25, 2020	Action DetectionActivity Detection	—Unverified	0
Identify Speakers in Cocktail Parties with End-to-End Attention	May 22, 2020	Speaker IdentificationSpeech Separation	CodeCode Available	0
Audio ALBERT: A Lite BERT for Self-supervised Learning of Audio Representation	May 18, 2020	Self-Supervised LearningSpeaker Identification	CodeCode Available	0
Weakly Supervised Training of Hierarchical Attention Networks for Speaker Identification	May 15, 2020	Speaker Identification	—Unverified	0
AutoSpeech: Neural Architecture Search for Speaker Recognition	May 7, 2020	image-classificationImage Classification	CodeCode Available	1
Speaker Recognition in Bengali Language from Nonlinear Features	Apr 15, 2020	Speaker IdentificationSpeaker Recognition	—Unverified	0
Meta-Learning for Short Utterance Speaker Recognition with Imbalance Length Pairs	Apr 6, 2020	Meta-LearningSpeaker Identification	CodeCode Available	1
AM-MobileNet1D: A Portable Model for Speaker Recognition	Mar 31, 2020	Deep Learningmodel	CodeCode Available	1
End-to-end Recurrent Denoising Autoencoder Embeddings for Speaker Identification	Mar 13, 2020	Data AugmentationDenoising	—Unverified	0
Deep Neural Networks for Automatic Speech Processing: A Survey from Large Corpora to Limited Data	Mar 9, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Speaker Identification using EEG	Mar 7, 2020	EEGElectroencephalogram (EEG)	—Unverified	0
Multi-Task Learning with Auxiliary Speaker Identification for Conversational Emotion Recognition	Mar 3, 2020	Emotion Recognition in ConversationMulti-Task Learning	—Unverified	0
Speech2Phone: A Novel and Efficient Method for Training Speaker Recognition Models	Feb 25, 2020	Speaker IdentificationSpeaker Recognition	CodeCode Available	1
Speech Enhancement using Self-Adaptation and Multi-Head Self-Attention	Feb 14, 2020	Multi-Task LearningSpeaker Identification	—Unverified	0
Improving speaker discrimination of target speech extraction with time-domain SpeakerBeam	Jan 23, 2020	Speaker IdentificationSpeech Extraction	CodeCode Available	1
Robust Speaker Recognition Using Speech Enhancement And Attention Model	Jan 14, 2020	Speaker IdentificationSpeaker Recognition	—Unverified	0
Supervised Speaker Embedding De-Mixing in Two-Speaker Environment	Jan 14, 2020	Speaker IdentificationVocal Bursts Valence Prediction	—Unverified	0
The Deterministic plus Stochastic Model of the Residual Signal and its Applications	Dec 29, 2019	Speaker IdentificationSpeech Synthesis	—Unverified	0
Advances in Online Audio-Visual Meeting Transcription	Dec 10, 2019	Sound Source Localizationspeaker-diarization	—Unverified	0
Privacy-Preserving Adversarial Representation Learning in ASR: Reality or Illusion?	Nov 12, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Supervised Initialization of LSTM Networks for Fundamental Frequency Detection in Noisy Speech Signals	Nov 11, 2019	Speaker Identification	—Unverified	0
Reducing audio membership inference attack accuracy to chance: 4 defenses	Oct 31, 2019	Inference AttackMembership Inference Attack	—Unverified	0
Adaptive blind audio source extraction supervised by dominant speaker identification using x-vectors	Oct 25, 2019	Speaker Identification	—Unverified	0
Delving into VoxCeleb: environment invariant speaker recognition	Oct 24, 2019	Speaker IdentificationSpeaker Recognition	—Unverified	0
Generative Pre-Training for Speech with Autoregressive Predictive Coding	Oct 23, 2019	Representation LearningSpeaker Identification	CodeCode Available	1
Word-level Embeddings for Cross-Task Transfer Learning in Speech Processing	Oct 22, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
H-VECTORS: Utterance-level Speaker Embedding Using A Hierarchical Attention Model	Oct 17, 2019	Speaker Identification	—Unverified	0
Latent space representation for multi-target speaker detection and identification with a sparse dataset using Triplet neural networks	Oct 1, 2019	Speaker IdentificationSpeaker Recognition	CodeCode Available	0
Emirati-Accented Speaker Identification in Stressful Talking Conditions	Sep 28, 2019	Speaker Identification	—Unverified	0
Improving Noise Robustness In Speaker Identification Using A Two-Stage Attention Model	Sep 24, 2019	Speaker IdentificationSpeaker Recognition	—Unverified	0
Cosine similarity-based adversarial process	Jul 1, 2019	Speaker Identification	—Unverified	0
Large-Scale Speaker Diarization of Radio Broadcast Archives	Jun 19, 2019	speaker-diarizationSpeaker Diarization	—Unverified	0

Show:10 25 50

← PrevPage 4 of 5Next →

All datasets VoxCeleb1 EVI en-GB EVI fr-FR EVI pl-PL

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MSM-MAE	Top-1 (%)	96.6	—	Unverified
2	M2D/0.6	Top-1 (%)	96.5	—	Unverified
3	M2D/0.7	Top-1 (%)	96.3	—	Unverified
4	M2D ratio=0.6	Top-1 (%)	94.8	—	Unverified
5	AudioMAE (local)	Top-1 (%)	94.8	—	Unverified
6	ATST Base (ours)	Top-1 (%)	94.3	—	Unverified
7	AudioMAE (global)	Top-1 (%)	94.1	—	Unverified
8	AutoSpeech (N=8,C=128)	Top-1 (%)	87.66	—	Unverified
9	SSAST-FRAME	Top-1 (%)	80.8	—	Unverified
10	SSAMBA	Top-1 (%)	70.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Fuzzy Retrieval	Top-1 (%)	67.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Fuzzy Retrieval	Top-1 (%)	80.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Fuzzy Retrieval	Top-1 (%)	95.13	—	Unverified