Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2301–2350 of 3012 papers

Title	Date	Tasks	Status
Understanding Shared Speech-Text Representations	Apr 27, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Understanding the Role of Self Attention for Efficient Speech Recognition	Sep 29, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Understanding Zero-shot Rare Word Recognition Improvements Through LLM Integration	Feb 22, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unified Autoregressive Modeling for Joint End-to-End Multi-Talker Overlapped Speech Recognition and Speaker Attribute Estimation	Jul 4, 2021	Age EstimationAttribute	—Unverified
Unified End-to-End Speech Recognition and Endpointing for Fast and Efficient Speech Systems	Nov 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unified Modeling of Multi-Domain Multi-Device ASR Systems	May 13, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unified Modeling of Multi-Talker Overlapped Speech Recognition and Diarization with a Sidecar Separator	May 25, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unifying Streaming and Non-streaming Zipformer-based ASR	Jun 17, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unintended Memorization in Large ASR Models, and How to Mitigate It	Oct 18, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Universal-2-TF: Robust All-Neural Text Formatting for ASR	Jan 10, 2025	AllAutomatic Speech Recognition	—Unverified
Universal Adversarial Perturbations for Speech Recognition Systems	May 9, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Dual-mode ASR: Unify and Improve Streaming ASR with Full-context Modeling	Oct 12, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
UniverSLU: Universal Spoken Language Understanding for Diverse Tasks with Natural Language Instructions	Oct 4, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unmanned Aerial Vehicle Control Through Domain-based Automatic Speech Recognition	Sep 9, 2020	Action RecognitionAutomatic Speech Recognition	—Unverified
Unsupervised Active Learning: Optimizing Labeling Cost-Effectiveness for Automatic Speech Recognition	Aug 28, 2023	Active LearningAutomatic Speech Recognition	—Unverified
Unsupervised Adaptation with Domain Separation Networks for Robust Speech Recognition	Nov 21, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Adaptation with Interpretable Disentangled Representations for Distant Conversational Speech Recognition	Jun 13, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised and Efficient Vocabulary Expansion for Recurrent Neural Network Language Models in ASR	Jun 27, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised ASR via Cross-Lingual Pseudo-Labeling	May 19, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Automatic Speech Recognition: A Review	Jun 9, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Cross-Domain Singing Voice Conversion	Aug 6, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Cross-Modal Alignment of Speech and Text Embedding Spaces	May 18, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised data selection for Speech Recognition with contrastive loss ratios	Jul 25, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Data Selection via Discrete Speech Representation for ASR	Apr 5, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Domain Adaptation for Robust Speech Recognition via Variational Autoencoder-Based Data Augmentation	Jul 19, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Domain Adaptation for Speech Recognition via Uncertainty Driven Self-Training	Nov 26, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised domain adaptation for speech recognition with unsupervised error correction	Sep 24, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Domain Adaptation in Speech Recognition using Phonetic Features	Aug 4, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Domain Adaptation Schemes for Building ASR in Low-resource Languages	Sep 12, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Domain Discovery using Latent Dirichlet Allocation for Acoustic Modelling in Speech Recognition	Sep 8, 2015	Acoustic ModellingAutomatic Speech Recognition	—Unverified
Unsupervised Fine-Tuning Data Selection for ASR Using Self-Supervised Speech Models	Dec 3, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Method for Improving Arabic Speech Recognition Systems	Nov 1, 2017	Arabic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Model-based speaker adaptation of end-to-end lattice-free MMI model for speech recognition	Nov 17, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised morph segmentation and statistical language models for vocabulary expansion	Aug 1, 2016	Automatic Speech Recognition (ASR)Language Modeling	—Unverified
Unsupervised Pattern Discovery from Thematic Speech Archives Based on Multilingual Bottleneck Features	Nov 3, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised pre-training for sequence to sequence speech recognition	Oct 28, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Rhythm and Voice Conversion of Dysarthric to Healthy Speech for ASR	Jan 17, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Speaker Adaptation using Attention-based Speaker Memory for End-to-End ASR	Feb 14, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Speech Enhancement Based on Multichannel NMF-Informed Beamforming for Noise-Robust Automatic Speech Recognition	Mar 22, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Stemming based Language Model for Telugu Broadcast News Transcription	Aug 10, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unveiling Biases while Embracing Sustainability: Assessing the Dual Challenges of Automatic Speech Recognition Systems	Mar 2, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Updating Only Encoders Prevents Catastrophic Forgetting of End-to-End ASR Models	Jul 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Useful Blunders: Can Automated Speech Recognition Errors Improve Downstream Dementia Classification?	Jan 10, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Use of Knowledge Graph in Rescoring the N-Best List in Automatic Speech Recognition	May 22, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
User-friendly automatic transcription of low-resource languages: Plugging ESPnet into Elpis	Dec 15, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Using Ambiguity Detection to Streamline Linguistic Annotation	Dec 1, 2016	Automatic Speech Recognition (ASR)Machine Translation	—Unverified
Using Automatic Speech Recognition in Spoken Corpus Curation	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Using English Acoustic Models for Hindi Automatic Speech Recognition	Dec 1, 2012	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Using heterogeneity in semi-supervised transcription hypotheses to improve code-switched speech recognition	Jun 14, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Using Kaldi for Automatic Speech Recognition of Conversational Austrian German	Jan 16, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 47 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified