Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1801–1850 of 3012 papers

Title	Date	Tasks	Status
Unsupervised Automatic Speech Recognition: A Review	Jun 9, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Cross-Domain Singing Voice Conversion	Aug 6, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Cross-Modal Alignment of Speech and Text Embedding Spaces	May 18, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised data selection for Speech Recognition with contrastive loss ratios	Jul 25, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Data Selection via Discrete Speech Representation for ASR	Apr 5, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Domain Adaptation for Robust Speech Recognition via Variational Autoencoder-Based Data Augmentation	Jul 19, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Domain Adaptation for Speech Recognition via Uncertainty Driven Self-Training	Nov 26, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised domain adaptation for speech recognition with unsupervised error correction	Sep 24, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Domain Adaptation in Speech Recognition using Phonetic Features	Aug 4, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Domain Adaptation Schemes for Building ASR in Low-resource Languages	Sep 12, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Domain Discovery using Latent Dirichlet Allocation for Acoustic Modelling in Speech Recognition	Sep 8, 2015	Acoustic ModellingAutomatic Speech Recognition	—Unverified
Unsupervised Fine-Tuning Data Selection for ASR Using Self-Supervised Speech Models	Dec 3, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Method for Improving Arabic Speech Recognition Systems	Nov 1, 2017	Arabic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Model-based speaker adaptation of end-to-end lattice-free MMI model for speech recognition	Nov 17, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised morph segmentation and statistical language models for vocabulary expansion	Aug 1, 2016	Automatic Speech Recognition (ASR)Language Modeling	—Unverified
Unsupervised Pattern Discovery from Thematic Speech Archives Based on Multilingual Bottleneck Features	Nov 3, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised pre-training for sequence to sequence speech recognition	Oct 28, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Rhythm and Voice Conversion of Dysarthric to Healthy Speech for ASR	Jan 17, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Speaker Adaptation using Attention-based Speaker Memory for End-to-End ASR	Feb 14, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Speech Enhancement Based on Multichannel NMF-Informed Beamforming for Noise-Robust Automatic Speech Recognition	Mar 22, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Stemming based Language Model for Telugu Broadcast News Transcription	Aug 10, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unveiling Biases while Embracing Sustainability: Assessing the Dual Challenges of Automatic Speech Recognition Systems	Mar 2, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Updating Only Encoders Prevents Catastrophic Forgetting of End-to-End ASR Models	Jul 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Useful Blunders: Can Automated Speech Recognition Errors Improve Downstream Dementia Classification?	Jan 10, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Use of Knowledge Graph in Rescoring the N-Best List in Automatic Speech Recognition	May 22, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
User-friendly automatic transcription of low-resource languages: Plugging ESPnet into Elpis	Dec 15, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Using Ambiguity Detection to Streamline Linguistic Annotation	Dec 1, 2016	Automatic Speech Recognition (ASR)Machine Translation	—Unverified
Using Automatic Speech Recognition in Spoken Corpus Curation	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Using English Acoustic Models for Hindi Automatic Speech Recognition	Dec 1, 2012	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Using heterogeneity in semi-supervised transcription hypotheses to improve code-switched speech recognition	Jun 14, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Using Kaldi for Automatic Speech Recognition of Conversational Austrian German	Jan 16, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Using Large Language Model for End-to-End Chinese ASR and NER	Jan 21, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Using multiple ASR hypotheses to boost i18n NLU performance	Dec 7, 2020	Abstractive Text SummarizationAutomatic Speech Recognition	—Unverified
Using multi-task learning to improve the performance of acoustic-to-word and conventional hybrid models	Feb 2, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Using Related Languages to Enhance Statistical Language Models	Jun 1, 2016	Automatic Speech Recognition (ASR)Domain Adaptation	—Unverified
Using Spoken Word Posterior Features in Neural Machine Translation	Oct 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Using Synthetic Audio to Improve The Recognition of Out-Of-Vocabulary Words in End-To-End ASR Systems	Nov 23, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Using Text Injection to Improve Recognition of Personal Identifiers in Speech	Aug 14, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Using the TED Talks to Evaluate Spoken Post-editing of Machine Translation	May 1, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
USM-Lite: Quantization and Sparsity Aware Fine-tuning for Speech Recognition with Universal Speech Models	Dec 13, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Utterance Intent Classification of a Spoken Dialogue System with Efficiently Untied Recursive Autoencoders	Aug 1, 2017	Automatic Speech Recognition (ASR)Classification	—Unverified
Utterance-level neural confidence measure for end-to-end children speech recognition	Sep 16, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Utterance-Wise Meeting Transcription System Using Asynchronous Distributed Microphones	Jul 31, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
V2S attack: building DNN-based voice conversion from automatic speaker verification	Aug 5, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
VAD-free Streaming Hybrid CTC/Attention ASR for Unsegmented Recording	Jul 15, 2021	Action DetectionActivity Detection	—Unverified
VADOI:Voice-Activity-Detection Overlapping Inference For End-to-end Long-form Speech Recognition	Feb 22, 2022	Action DetectionActivity Detection	—Unverified
VAIS ASR: Building a conversational speech recognition system using language model combination	Oct 12, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
VAKTA-SETU: A Speech-to-Speech Machine Translation Service in Select Indic Languages	May 21, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ValSub: Subsampling Validation Data to Mitigate Forgetting during ASR Personalization	Mar 12, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
VarArray Meets t-SOT: Advancing the State of the Art of Streaming Distant Conversational Speech Recognition	Sep 12, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 37 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified