Speaker Identification

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–175 of 248 papers

Title	Date	Tasks	Status
Streaming Multi-talker Speech Recognition with Joint Speaker Identification	Apr 5, 2021	Speaker Identificationspeech-recognition	—Unverified
Supervised Initialization of LSTM Networks for Fundamental Frequency Detection in Noisy Speech Signals	Nov 11, 2019	Speaker Identification	—Unverified
Many-to-Many Voice Conversion with Out-of-Dataset Speaker Support	Apr 30, 2019	Speaker IdentificationVoice Conversion	—Unverified
Symmetric Saliency-based Adversarial Attack To Speaker Identification	Oct 30, 2022	Adversarial AttackDecoder	—Unverified
Test-Time Training for Speech	Sep 19, 2023	parameter-efficient fine-tuningSpeaker Identification	—Unverified
Text-based Speaker Identification on Multiparty Dialogues Using Multi-document Convolutional Neural Networks	Jul 1, 2017	Speaker IdentificationSpeech Recognition	—Unverified
Text Independent Speaker Identification System for Access Control	Sep 26, 2022	Speaker Identification	—Unverified
The Deterministic plus Stochastic Model of the Residual Signal and its Applications	Dec 29, 2019	Speaker IdentificationSpeech Synthesis	—Unverified
The DIRHA simulated corpus	May 1, 2014	Dialogue ManagementDistant Speech Recognition	—Unverified
The exploitation of Multiple Feature Extraction Techniques for Speaker Identification in Emotional States under Disguised Voices	Dec 15, 2021	Speaker IdentificationVoice Conversion	—Unverified
SoK: The Faults in our ASRs: An Overview of Attacks against Automatic Speech Recognition and Speaker Identification Systems	Jul 13, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The RATS Collection: Supporting HLT Research with Degraded Audio Data	May 1, 2014	Action DetectionActivity Detection	—Unverified
TIMIT Speaker Profiling: A Comparison of Multi-task learning and Single-task learning Approaches	Apr 18, 2024	Age EstimationClassification	—Unverified
Towards Advanced Speech Signal Processing: A Statistical Perspective on Convolution-Based Architectures and its Applications	Nov 20, 2024	Emotion RecognitionSpeaker Identification	—Unverified
Transcribe-to-Diarize: Neural Speaker Diarization for Unlimited Number of Speakers using End-to-End Speaker-Attributed ASR	Oct 7, 2021	Action DetectionActivity Detection	—Unverified
Triplet loss based embeddings for forensic speaker identification in Spanish	Feb 24, 2021	Speaker IdentificationTriplet	—Unverified
T-vectors: Weakly Supervised Speaker Identification Using Hierarchical Transformer Model	Oct 29, 2020	Speaker Identification	—Unverified
Understanding Self-Supervised Learning of Speech Representation via Invariance and Redundancy Reduction	Sep 7, 2023	Keyword SpottingSelf-Supervised Learning	—Unverified
Unraveling Adversarial Examples against Speaker Identification -- Techniques for Attack Detection and Victim Model Classification	Feb 29, 2024	Adversarial AttackClassification	—Unverified
VAST: A Corpus of Video Annotation for Speech Technologies	May 1, 2018	Action DetectionLanguage Identification	—Unverified
VFHQ: A High-Quality Dataset and Benchmark for Video Face Super-Resolution	May 6, 2022	BenchmarkingSpeaker Identification	—Unverified
Voice Privacy with Smart Digital Assistants in Educational Settings	Mar 24, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Voxceleb-ESP: preliminary experiments detecting Spanish celebrities from their voices	Dec 20, 2023	Speaker IdentificationSpeaker Recognition	—Unverified
VoxWatch: An open-set speaker recognition benchmark on VoxCeleb	Jun 30, 2023	Speaker IdentificationSpeaker Recognition	—Unverified
WaBERT: A Low-resource End-to-end Model for Spoken Language Understanding and Speech-to-BERT Alignment	Apr 22, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 7 of 10Next →

All datasets VoxCeleb1 EVI en-GB EVI fr-FR EVI pl-PL

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MSM-MAE	Top-1 (%)	96.6	—	Unverified
2	M2D/0.6	Top-1 (%)	96.5	—	Unverified
3	M2D/0.7	Top-1 (%)	96.3	—	Unverified
4	M2D ratio=0.6	Top-1 (%)	94.8	—	Unverified
5	AudioMAE (local)	Top-1 (%)	94.8	—	Unverified
6	ATST Base (ours)	Top-1 (%)	94.3	—	Unverified
7	AudioMAE (global)	Top-1 (%)	94.1	—	Unverified
8	AutoSpeech (N=8,C=128)	Top-1 (%)	87.66	—	Unverified
9	SSAST-FRAME	Top-1 (%)	80.8	—	Unverified
10	SSAMBA	Top-1 (%)	70.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Fuzzy Retrieval	Top-1 (%)	67.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Fuzzy Retrieval	Top-1 (%)	80.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Fuzzy Retrieval	Top-1 (%)	95.13	—	Unverified