Speaker Identification

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 248 papers

Title	Date	Tasks	Status
Invited Talk: IBM Cognitive Computing - An NLP Renaissance!	Oct 1, 2014	Machine TranslationQuestion Answering	—Unverified
Deep versus Wide: An Analysis of Student Architectures for Task-Agnostic Knowledge Distillation of Self-Supervised Speech Models	Jul 14, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Deep Neural Networks for Automatic Speech Processing: A Survey from Large Corpora to Limited Data	Mar 9, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Advanced Rich Transcription System for Estonian Speech	Jan 11, 2019	Speaker Identification	—Unverified
Integrated Replay Spoofing-aware Text-independent Speaker Verification	Jun 10, 2020	Multi-Task LearningSpeaker Identification	—Unverified
Discrimination between Similar Languages, Varieties and Dialects using CNN- and LSTM-based Deep Neural Networks	Dec 1, 2016	Dialect IdentificationInformation Retrieval	—Unverified
DASB -- Discrete Audio and Speech Benchmark	Jun 20, 2024	BenchmarkingEmotion Recognition	—Unverified
Effect of utterance duration and phonetic content on speaker identification using second-order statistical methods	Feb 26, 2024	Speaker Identification	—Unverified
Efficiency-oriented approaches for self-supervised speech representation learning	Dec 18, 2023	Automatic Speech RecognitionRepresentation Learning	—Unverified
Emirati-Accented Speaker Identification in Stressful Talking Conditions	Sep 28, 2019	Speaker Identification	—Unverified
Curie: A method for protecting SVM Classifier from Poisoning Attack	Jun 5, 2016	BIG-bench Machine LearningSpeaker Identification	—Unverified
A Toolkit for Joint Speaker Diarization and Identification with Application to Speaker-Attributed ASR	Sep 9, 2024	Automatic Speech Recognitionspeaker-diarization	—Unverified
Cross-Lingual Speaker Identification from Weak Local Evidence	Jan 16, 2022	Language ModelingLanguage Modelling	—Unverified
H-VECTORS: Utterance-level Speaker Embedding Using A Hierarchical Attention Model	Oct 17, 2019	Speaker Identification	—Unverified
HPP-Voice: A Large-Scale Evaluation of Speech Embeddings for Multi-Phenotypic Classification	May 22, 2025	speaker-diarizationSpeaker Diarization	—Unverified
A Survey on Paralinguistics in Tamil Speech Processing	Apr 1, 2021	Emotion RecognitionSpeaker Identification	—Unverified
Joint Speaker Counting, Speech Recognition, and Speaker Identification for Overlapped Speech of Any Number of Speakers	Jun 19, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Cosine similarity-based adversarial process	Jul 1, 2019	Speaker Identification	—Unverified
A Study of Few-Shot Audio Classification	Dec 2, 2020	Audio ClassificationBIG-bench Machine Learning	—Unverified
A Lightweight Speaker Recognition System Using Timbre Properties	Oct 12, 2020	GPUSpeaker Identification	—Unverified
Computing with Hypervectors for Efficient Speaker Identification	Aug 28, 2022	CPUQuantization	—Unverified
Computer-assisted Speaker Diarization: How to Evaluate Human Corrections	May 1, 2018	Active LearningFace Recognition	—Unverified
A Study of Acoustic Features in Arabic Speaker Identification under Noisy Environmental Conditions	Oct 23, 2021	Speaker Identification	—Unverified
Advanced accent/dialect identification and accentedness assessment with multi-embedding models and automatic speech recognition	Oct 17, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
From Dialect Gaps to Identity Maps: Tackling Variability in Speaker Verification	Apr 21, 2025	Data AugmentationSpeaker Identification	—Unverified
Improved Relation Networks for End-to-End Speaker Verification and Identification	Mar 31, 2022	Meta-LearningRelation	—Unverified
Comparison of Multiple Features and Modeling Methods for Text-dependent Speaker Verification	Jul 14, 2017	Speaker IdentificationSpeaker Recognition	—Unverified
A Real-time Speaker Diarization System Based on Spatial Spectrum	Jul 20, 2021	speaker-diarizationSpeaker Diarization	—Unverified
French Listening Tests for the Assessment of Intelligibility, Quality, and Identity of Body-Conducted Speech Enhancement	Jun 4, 2025	Bandwidth ExtensionSpeaker Identification	—Unverified
Comparison of Gender- and Speaker-adaptive Emotion Recognition	May 1, 2014	AttributeEmotion Classification	—Unverified
iEmoTTS: Toward Robust Cross-Speaker Emotion Transfer and Control for Speech Synthesis based on Disentanglement between Prosody and Timbre	Jun 29, 2022	DisentanglementSpeaker Identification	—Unverified
From Benedict Cumberbatch to Sherlock Holmes: Character Identification in TV series without a Script	Jan 31, 2018	Speaker Identification	—Unverified
Improving Noise Robustness In Speaker Identification Using A Two-Stage Attention Model	Sep 24, 2019	Speaker IdentificationSpeaker Recognition	—Unverified
From Speaker Identification to Affective Analysis: A Multi-Step System for Analyzing Children's Stories	Apr 1, 2014	Age EstimationSpeaker Identification	—Unverified
Fusion of Embeddings Networks for Robust Combination of Text Dependent and Independent Speaker Recognition	Jun 18, 2021	Speaker IdentificationSpeaker Recognition	—Unverified
A Joint Model for Quotation Attribution and Coreference Resolution	Apr 1, 2014	coreference-resolutionCoreference Resolution	—Unverified
Improving Speaker Identification for Shared Devices by Adapting Embeddings to Speaker Subsets	Sep 6, 2021	Speaker Identification	—Unverified
Few-Shot Speaker Identification Using Lightweight Prototypical Network with Feature Grouping and Interaction	May 31, 2023	Speaker Identification	—Unverified
Graph-based Label Propagation for Semi-Supervised Speaker Identification	Jun 15, 2021	Speaker IdentificationSpeaker Recognition	—Unverified
Graph-based Multi-View Fusion and Local Adaptation: Mitigating Within-Household Confusability for Speaker Identification	Jul 8, 2022	FairnessSpeaker Identification	—Unverified
HiSSNet: Sound Event Detection and Speaker Identification via Hierarchical Prototypical Networks for Low-Resource Headphones	Mar 13, 2023	Event DetectionSound Event Detection	—Unverified
Histogram Transform-based Speaker Identification	Aug 2, 2018	Speaker Identification	—Unverified
How Far Are We from Robust Voice Conversion: A Survey	Nov 24, 2020	Speaker IdentificationSurvey	—Unverified
How Redundant Is the Transformer Stack in Speech Representation Models?	Sep 10, 2024	Knowledge DistillationSpeaker Identification	—Unverified
Few-Shot Speaker Identification Using Depthwise Separable Convolutional Network with Channel Attention	Apr 24, 2022	Audio ClassificationFew-Shot Learning	—Unverified
Face Recognition with Machine Learning in OpenCV_ Fusion of the results with the Localization Data of an Acoustic Camera for Speaker Identification	Jul 4, 2017	Face ModelFace Recognition	—Unverified
Hypothesis Stitcher for End-to-End Speaker-attributed ASR on Long-form Multi-talker Recordings	Jan 6, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Identification of Speakers in Novels	Aug 1, 2013	Speaker Identification	—Unverified
Identifying Source Speakers for Voice Conversion based Spoofing Attacks on Speaker Verification Systems	Jun 18, 2022	Speaker IdentificationSpeaker Verification	—Unverified
A Preliminary Exploration with GPT-4o Voice Mode	Feb 14, 2025	Age ClassificationAudio Deepfake Detection	—Unverified

Show:10 25 50

← PrevPage 2 of 5Next →

All datasets VoxCeleb1 EVI en-GB EVI fr-FR EVI pl-PL

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MSM-MAE	Top-1 (%)	96.6	—	Unverified
2	M2D/0.6	Top-1 (%)	96.5	—	Unverified
3	M2D/0.7	Top-1 (%)	96.3	—	Unverified
4	M2D ratio=0.6	Top-1 (%)	94.8	—	Unverified
5	AudioMAE (local)	Top-1 (%)	94.8	—	Unverified
6	ATST Base (ours)	Top-1 (%)	94.3	—	Unverified
7	AudioMAE (global)	Top-1 (%)	94.1	—	Unverified
8	AutoSpeech (N=8,C=128)	Top-1 (%)	87.66	—	Unverified
9	SSAST-FRAME	Top-1 (%)	80.8	—	Unverified
10	SSAMBA	Top-1 (%)	70.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Fuzzy Retrieval	Top-1 (%)	67.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Fuzzy Retrieval	Top-1 (%)	80.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Fuzzy Retrieval	Top-1 (%)	95.13	—	Unverified