Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1151–1175 of 3012 papers

Title	Date	Tasks	Status
Bridging Speech and Textual Pre-trained Models with Unsupervised ASR	Nov 6, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Evaluation of Off-the-shelf Speech Recognizers Across Diverse Dialogue Domains	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Evaluation of Off-the-shelf Speech Recognizers on Different Accents in a Dialogue Domain	Jun 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Evaluation of real-time transcriptions using end-to-end ASR models	Sep 9, 2024	Action DetectionActivity Detection	—Unverified
Everyone deserves their voice to be heard: Analyzing Predictive Gender Bias in ASR Models Applied to Dutch Speech Data	Nov 14, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Everything Can Be Described in Words: A Simple Unified Multi-Modal Framework with Semantic and Temporal Alignment	Mar 12, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Evolutionary optimization of contexts for phonetic correction in speech recognition systems	Feb 23, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Equivalence of Segmental and Neural Transducer Modeling: A Proof of Concept	Apr 13, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
E-PUR: An Energy-Efficient Processing Unit for Recurrent Neural Networks	Nov 20, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
BLSTM-Based Confidence Estimation for End-to-End Speech Recognition	Dec 22, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bridging the Modality Gap: Softly Discretizing Audio Representation for LLM-based Automatic Speech Recognition	Jun 6, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Exploiting Beam Search Confidence for Energy-Efficient Speech Recognition	Jan 22, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Exploiting Cross Domain Acoustic-to-articulatory Inverted Features For Disordered Speech Recognition	Mar 19, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Exploiting Cross-domain And Cross-Lingual Ultrasound Tongue Imaging Features For Elderly And Dysarthric Speech Recognition	Jun 15, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
An Investigative Study of Multi-Modal Cross-Lingual Retrieval	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Exploiting Cross-Lingual Speaker and Phonetic Diversity for Unsupervised Subword Modeling	Aug 9, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Exploiting Nontrivial Connectivity for Automatic Speech Recognition	Nov 28, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Exploiting Pre-Trained ASR Models for Alzheimer's Disease Recognition Through Spontaneous Speech	Oct 4, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Exploiting semi-supervised training through a dropout regularization in end-to-end speech recognition	Aug 8, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Exploiting Sentence and Context Representations in Deep Neural Models for Spoken Language Understanding	Oct 13, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Environment-aware Reconfigurable Noise Suppression	Jan 29, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Exploiting the large-scale German Broadcast Corpus to boost the Fraunhofer IAIS Speech Recognition System	May 1, 2014	Acoustic ModellingAutomatic Speech Recognition	—Unverified
Exploration of Adapter for Noise Robust Automatic Speech Recognition	Feb 28, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Exploration of End-to-End ASR for OpenSTT -- Russian Open Speech-to-Text Dataset	Jun 15, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Entity resolution for noisy ASR transcripts	Nov 1, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 47 of 121Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified