Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1976–2000 of 3012 papers

Title	Date	Tasks	Status
Learning Word-Level Confidence For Subword End-to-End ASR	Mar 11, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Learning Word-Like Units from Joint Audio-Visual Analysis	Jan 25, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Leave No Knowledge Behind During Knowledge Distillation: Towards Practical and Effective Knowledge Distillation for Code-Switching ASR Using Realistic Data	Jul 15, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Lecture Translator - Speech translation framework for simultaneous lecture translation	Jun 1, 2016	Automatic Speech Recognition (ASR)Machine Translation	—Unverified
LegoNN: Building Modular Encoder-Decoder Models	Jun 7, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Less Is More: Improved RNN-T Decoding Using Limited Label Context and Path Merging	Dec 12, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
LESS: Large Language Model Enhanced Semi-Supervised Learning for Speech Foundational Models	Jun 5, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Leveraging Acoustic Contextual Representation by Audio-textual Cross-modal Learning for Conversational ASR	Jul 3, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Leveraging Data Collection and Unsupervised Learning for Code-switched Tunisian Arabic Automatic Speech Recognition	Sep 20, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Leveraging Domain Features for Detecting Adversarial Attacks Against Deep Speech Recognition in Noise	Nov 3, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Leveraging End-to-End ASR for Endangered Language Documentation: An Empirical Study on Yoloxóchitl Mixtec	Jan 26, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Leveraging End-to-End ASR for Endangered Language Documentation: An Empirical Study on Yol\'oxochitl Mixtec	Apr 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Leveraging End-to-End Speech Recognition with Neural Architecture Search	Dec 11, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Leveraging Large Language Models for Exploiting ASR Uncertainty	Sep 9, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Leveraging Large Text Corpora for End-to-End Speech Summarization	Mar 2, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Harnessing Indirect Training Data for End-to-End Automatic Speech Translation: Tricks of the Trade	Sep 14, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Leveraging Pre-trained Language Model for Speech Sentiment Analysis	Jun 11, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Leveraging Prompt Learning and Pause Encoding for Alzheimer's Disease Detection	Dec 9, 2024	Alzheimer's Disease DetectionAutomatic Speech Recognition	—Unverified
Leveraging Redundancy in Multiple Audio Signals for Far-Field Speech Recognition	Mar 1, 2023	Acoustic echo cancellationAutomatic Speech Recognition	—Unverified
Leveraging supplementary text data to kick-start automatic speech recognition system development with limited transcriptions	Feb 9, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Leveraging Timestamp Information for Serialized Joint Streaming Recognition and Translation	Oct 23, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Leveraging Weakly Supervised Data to Improve End-to-End Speech-to-Text Translation	Nov 5, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
LeVoice ASR Systems for the ISCSLP 2022 Intelligent Cockpit Speech Recognition Challenge	Oct 14, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Lexical Speaker Error Correction: Leveraging Language Models for Speaker Diarization Error Correction	Jun 15, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Lexicon and Attention based Handwritten Text Recognition System	Sep 11, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 80 of 121Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified