Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1301–1350 of 3012 papers

Title	Date	Tasks	Status
Classification of Closely Related Sub-dialects of Arabic Using Support-Vector Machines	May 1, 2018	Automatic Speech Recognition (ASR)General Classification	—Unverified
Generative error correction for code-switching speech recognition using large language models	Oct 17, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
German-Arabic Speech-to-Speech Translation for Psychiatric Diagnosis	Dec 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Gesture-Aware Zero-Shot Speech Recognition for Patients with Language Disorders	Feb 18, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Environment-aware Reconfigurable Noise Suppression	Jan 29, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Entity resolution for noisy ASR transcripts	Nov 1, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Blockwise Streaming Transformer for Spoken Language Understanding and Simultaneous Speech Translation	Apr 19, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Entity Linking for Spoken Language	May 1, 2015	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Ensemble knowledge distillation of self-supervised speech models	Feb 24, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Google USM: Scaling Automatic Speech Recognition Beyond 100 Languages	Mar 2, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Blind Signal Dereverberation for Machine Speech Recognition	Sep 30, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
An Investigation on Applying Acoustic Feature Conversion to ASR of Adult and Child Speech	May 25, 2022	AttributeAutomatic Speech Recognition	—Unverified
A Complementary Joint Training Approach Using Unpaired Speech and Text for Low-Resource Automatic Speech Recognition	Apr 5, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Graph based manifold regularized deep neural networks for automatic speech recognition	Jun 19, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Ensemble Chinese End-to-End Spoken Language Understanding for Abnormal Event Detection from audio stream	Oct 19, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Graph Meets LLM: A Novel Approach to Collaborative Filtering for Robust Conversational Understanding	May 23, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Enriching ASR Lattices with POS Tags for Dependency Parsing	Sep 1, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
AfriNames: Most ASR models "butcher" African Names	Jun 1, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Blind and neural network-guided convolutional beamformer for joint denoising, dereverberation, and source separation	Aug 4, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Guided contrastive self-supervised pre-training for automatic speech recognition	Oct 22, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Guiding CTC Posterior Spike Timings for Improved Posterior Fusion and Knowledge Distillation	Apr 17, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
CNN-based MultiChannel End-to-End Speech Recognition for everyday home environments	Nov 7, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Hallucination of speech recognition errors with sequence to sequence learning	Mar 23, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Hallucinations in Neural Automatic Speech Recognition: Identifying Errors and Hallucinatory Models	Jan 3, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Hard Sample Mining for the Improved Retraining of Automatic Speech Recognition	Apr 17, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Hard-Synth: Synthesizing Diverse Hard Samples for ASR using Zero-Shot TTS and LLM	Nov 20, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Enhancing Unsupervised Speech Recognition with Diffusion GANs	Mar 23, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Harnessing Transfer Learning from Swahili: Advancing Solutions for Comorian Dialects	Dec 9, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
HASP: A High-Performance Adaptive Mobile Security Enhancement Against Malicious Speech Recognition	Sep 4, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Head-synchronous Decoding for Transformer-based Streaming ASR	Apr 26, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Hear "No Evil", See "Kenansville": Efficient and Transferable Black-Box Attacks on Speech Recognition and Voice Identification Systems	Oct 11, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Hear No Evil: Towards Adversarial Robustness of Automatic Speech Recognition via Multi-Task Learning	Apr 5, 2022	Adversarial AttackAdversarial Robustness	—Unverified
HebDB: a Weakly Supervised Dataset for Hebrew Speech Processing	Jul 10, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
HENT-SRT: Hierarchical Efficient Neural Transducer with Self-Distillation for Joint Speech Recognition and Translation	Jun 2, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
HESITA(te) in Portuguese	May 1, 2014	Acoustic ModellingAutomatic Speech Recognition	—Unverified
Heterogeneous Language Model Optimization in Automatic Speech Recognition	Nov 16, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Heterogeneous Reservoir Computing Models for Persian Speech Recognition	May 25, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Hey ASR System! Why Aren't You More Inclusive? Automatic Speech Recognition Systems' Bias and Proposed Bias Mitigation Techniques. A Literature Review	Nov 17, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Hierarchical Conditional End-to-End ASR with CTC and Multi-Granular Subword Units	Oct 8, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Hierarchical Cross-Modality Knowledge Transfer with Sinkhorn Attention for CTC-based ASR	Sep 28, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Hierarchical Multi Task Learning With CTC	Jul 18, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Hierarchical Sequence to Sequence Voice Conversion with Limited Data	Jul 15, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Enhancing Speech Large Language Models with Prompt-Aware Mixture of Audio Encoders	Feb 21, 2025	Audio captioningAutomatic Speech Recognition	—Unverified
Hierarchical Transformer-based Large-Context End-to-end ASR with Large-Context Knowledge Distillation	Feb 16, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
High-Accuracy and Low-Latency Speech Recognition with Two-Head Contextual Layer Trajectory LSTM Model	Mar 17, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Highland Puebla Nahuatl Speech Translation Corpus for Endangered Language Documentation	Jun 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
High-precision medical speech recognition through synthetic data and semantic correction: UNITED-MEDASR	Nov 24, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
High-precision Voice Search Query Correction via Retrievable Speech-text Embedings	Jan 8, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Hindi-English Code-Switching Speech Corpus	Sep 24, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Blending LSTMs into CNNs	Nov 19, 2015	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 27 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified