Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2001–2050 of 3012 papers

Title	Date	Tasks	Status
Lightly Supervised Quality Estimation	Dec 1, 2016	Automatic Speech Recognition (ASR)Machine Translation	—Unverified
Lightweight and Robust Multi-Channel End-to-End Speech Recognition with Spherical Harmonic Transform	Jun 13, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Lightweight End-to-End Speech Recognition from Raw Audio Data Using Sinc-Convolutions	Oct 15, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Lightweight Prompt Biasing for Contextualized End-to-End ASR Systems	Jun 6, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Lightweight Target-Speaker-Based Overlap Transcription for Practical Streaming ASR	Jun 25, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Linguistic-Enhanced Transformer with CTC Embedding for Speech Recognition	Oct 25, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
LinTO Audio and Textual Datasets to Train and Evaluate Automatic Speech Recognition in Tunisian Arabic Dialect	Apr 3, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
LinTO Platform: A Smart Open Voice Assistant for Business Environments	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
LipDiffuser: Lip-to-Speech Generation with Conditional Diffusion Models	May 16, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Listen Again and Choose the Right Answer: A New Paradigm for Automatic Speech Recognition with Large Language Models	May 16, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Listening Comprehension over Argumentative Content	Oct 1, 2018	Automatic Speech Recognition (ASR)Machine Reading Comprehension	—Unverified
Listening while Speaking: Speech Chain by Deep Learning	Jul 16, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Listen with Intent: Improving Speech Recognition with Audio-to-Intent Front-End	May 14, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
LiSTra, Automatic Speech Translation: English to Lingala case study	May 16, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
LiSTra Automatic Speech Translation: English to Lingala Case Study	Jun 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
LiteVSR: Efficient Visual Speech Recognition by Learning from Speech Representations of Unlabeled Data	Dec 15, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
LiveCC: Learning Video LLM with Streaming Speech Transcription at Scale	Jan 1, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
LLM-based phoneme-to-grapheme for phoneme-based speech recognition	Jun 5, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
LM-SPT: LM-Aligned Semantic Distillation for Speech Tokenization	Jun 20, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Local Feature or Mel Frequency Cepstral Coefficients - Which One is Better for MLN-Based Bangla Speech Recognition?	Oct 5, 2013	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Locality enhanced dynamic biasing and sampling strategies for contextual ASR	Jan 23, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Local Monotonic Attention Mechanism for End-to-End Speech and Language Processing	May 23, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Lombard Effect for Bilingual Speakers in Cantonese and English: importance of spectro-temporal features	Apr 14, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
LongFNT: Long-form Speech Recognition with Factorized Neural Transducer	Nov 17, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Incorporating VAD into ASR System by Multi-task Learning	Mar 2, 2021	Action DetectionActivity Detection	—Unverified
Lookahead When It Matters: Adaptive Non-causal Transformers for Streaming Neural Transducers	May 7, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Looking Enhances Listening: Recovering Missing Speech Using Images	Feb 13, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Loquacious Set: 25,000 Hours of Transcribed and Diverse English Speech Recognition Data for Research and Commercial Use	May 27, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
LoRA-Whisper: Parameter-Efficient and Extensible Multilingual ASR	Jun 7, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Loss Landscape Dependent Self-Adjusting Learning Rates in Decentralized Stochastic Gradient Descent	Dec 2, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Loss Prediction: End-to-End Active Learning Approach For Speech Recognition	Jul 9, 2021	Active LearningAutomatic Speech Recognition	—Unverified
Lost in Transcription, Found in Distribution Shift: Demystifying Hallucination in Speech Foundation Models	Feb 18, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Lost in Transcription: Identifying and Quantifying the Accuracy Biases of Automatic Speech Recognition Systems Against Disfluent Speech	May 10, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Low Latency ASR for Simultaneous Speech Translation	Mar 22, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Low-rank Gradient Approximation For Memory-Efficient On-device Training of Deep Neural Network	Jan 24, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Low-Resource Domain Adaptation for Speech LLMs via Text-Only Fine-Tuning	Jun 6, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Low-Resourced Speech Recognition for Iu Mien Language via Weakly-Supervised Phoneme-based Multilingual Pre-training	Jul 18, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Low Resource German ASR with Untranscribed Data Spoken by Non-native Children -- INTERSPEECH 2021 Shared Task SPAPL System	Jun 18, 2021	Acoustic ModellingAutomatic Speech Recognition	—Unverified
Low-Resource Machine Transliteration Using Recurrent Neural Networks of Asian Languages	Jul 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
LRSpeech: Extremely Low-Resource Speech Synthesis and Recognition	Aug 9, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
SHARP: An Adaptable, Energy-Efficient Accelerator for Recurrent Neural Network	Nov 4, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
LUPET: Incorporating Hierarchical Information Path into Multilingual ASR	Jan 8, 2024	Acoustic Unit DiscoveryAutomatic Speech Recognition	—Unverified
LV-CTC: Non-autoregressive ASR with CTC and latent variable models	Mar 28, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Lyrics-to-Audio Alignment by Unsupervised Discovery of Repetitive Patterns in Vowel Acoustics	Jan 21, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Machine Speech Chain with One-shot Speaker Adaptation	Mar 28, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
MADI: Inter-domain Matching and Intra-domain Discrimination for Cross-domain Speech Recognition	Feb 22, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Magic dust for cross-lingual adaptation of monolingual wav2vec-2.0	Oct 7, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Mai Ho'omāuna i ka 'Ai: Language Models Improve Automatic Speech Recognition in Hawaiian	Apr 3, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Make More of Your Data: Minimal Effort Data Augmentation for Automatic Speech Recognition and Translation	Oct 27, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Malayalam Speech Corpus: Design and Development for Dravidian Language	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 41 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified