Speaker Identification

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 176–200 of 248 papers

Title	Date	Tasks	Status
Weakly Supervised Training of Hierarchical Attention Networks for Speaker Identification	May 15, 2020	Speaker Identification	—Unverified
Weakly Supervised Training of Speaker Identification Models	Jun 22, 2018	speaker-diarizationSpeaker Diarization	—Unverified
Supervised Speaker Embedding De-Mixing in Two-Speaker Environment	Jan 14, 2020	Speaker IdentificationVocal Bursts Valence Prediction	—Unverified
A Closer Look at Wav2Vec2 Embeddings for On-Device Single-Channel Speech Enhancement	Mar 3, 2024	Automatic Speech RecognitionKeyword Spotting	—Unverified
Adaptive blind audio source extraction supervised by dominant speaker identification using x-vectors	Oct 25, 2019	Speaker Identification	—Unverified
Advanced accent/dialect identification and accentedness assessment with multi-embedding models and automatic speech recognition	Oct 17, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Advanced Rich Transcription System for Estonian Speech	Jan 11, 2019	Speaker Identification	—Unverified
Advances in Online Audio-Visual Meeting Transcription	Dec 10, 2019	Sound Source Localizationspeaker-diarization	—Unverified
AdvEst: Adversarial Perturbation Estimation to Classify and Detect Adversarial Attacks against Speaker Identification	Apr 8, 2022	Representation LearningSpeaker Identification	—Unverified
A Joint Model for Quotation Attribution and Coreference Resolution	Apr 1, 2014	coreference-resolutionCoreference Resolution	—Unverified
A Lightweight Speaker Recognition System Using Timbre Properties	Oct 12, 2020	GPUSpeaker Identification	—Unverified
A Multi Level Data Fusion Approach for Speaker Identification on Telephone Speech	Jun 27, 2014	Speaker Identification	—Unverified
A Novel Minimum Divergence Approach to Robust Speaker Identification	Dec 16, 2015	General ClassificationSpeaker Identification	—Unverified
An Unsupervised Speaker Clustering Technique based on SOM and I-vectors for Speech Recognition Systems	Apr 1, 2017	Automatic Speech Recognition (ASR)Clustering	—Unverified
基於聽覺感知模型之類神經網路及其在語者識別上之應用 (Two-stage Attentional Auditory Model Inspired Neural Network and Its Application to Speaker Identification) [In Chinese]	Nov 1, 2017	Speaker Identification	—Unverified
A Preliminary Exploration with GPT-4o Voice Mode	Feb 14, 2025	Age ClassificationAudio Deepfake Detection	—Unverified
A Real-time Speaker Diarization System Based on Spatial Spectrum	Jul 20, 2021	speaker-diarizationSpeaker Diarization	—Unverified
A Study of Acoustic Features in Arabic Speaker Identification under Noisy Environmental Conditions	Oct 23, 2021	Speaker Identification	—Unverified
A Study of Few-Shot Audio Classification	Dec 2, 2020	Audio ClassificationBIG-bench Machine Learning	—Unverified
A Survey on Paralinguistics in Tamil Speech Processing	Apr 1, 2021	Emotion RecognitionSpeaker Identification	—Unverified
A Toolkit for Joint Speaker Diarization and Identification with Application to Speaker-Attributed ASR	Sep 9, 2024	Automatic Speech Recognitionspeaker-diarization	—Unverified
A user study to compare two conversational assistants designed for people with hearing impairments	Jun 1, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Target Speech Extraction: Independent Vector Extraction Guided by Supervised Speaker Identification	Nov 5, 2021	Speaker IdentificationSpeech Extraction	—Unverified
Can Musical Emotion Be Quantified With Neural Jitter Or Shimmer? A Novel EEG Based Study With Hindustani Classical Music	Apr 29, 2017	EEGElectroencephalogram (EEG)	—Unverified
CASA-Based Speaker Identification Using Cascaded GMM-CNN Classifier in Noisy and Emotional Talking Conditions	Feb 11, 2021	Emotion RecognitionSpeaker Identification	—Unverified

Show:10 25 50

← PrevPage 8 of 10Next →

All datasets VoxCeleb1 EVI en-GB EVI fr-FR EVI pl-PL

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MSM-MAE	Top-1 (%)	96.6	—	Unverified
2	M2D/0.6	Top-1 (%)	96.5	—	Unverified
3	M2D/0.7	Top-1 (%)	96.3	—	Unverified
4	M2D ratio=0.6	Top-1 (%)	94.8	—	Unverified
5	AudioMAE (local)	Top-1 (%)	94.8	—	Unverified
6	ATST Base (ours)	Top-1 (%)	94.3	—	Unverified
7	AudioMAE (global)	Top-1 (%)	94.1	—	Unverified
8	AutoSpeech (N=8,C=128)	Top-1 (%)	87.66	—	Unverified
9	SSAST-FRAME	Top-1 (%)	80.8	—	Unverified
10	SSAMBA	Top-1 (%)	70.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Fuzzy Retrieval	Top-1 (%)	67.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Fuzzy Retrieval	Top-1 (%)	80.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Fuzzy Retrieval	Top-1 (%)	95.13	—	Unverified