Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2826–2850 of 3012 papers

Title	Date	Tasks	Status
Topic Identification for Speech without ASR	Mar 22, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Joint Learning of Correlated Sequence Labelling Tasks Using Bidirectional Recurrent Neural Networks	Mar 14, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
DECCA Repurposed: Detecting transcription inconsistencies without an orthographic standard	Mar 1, 2017	Automatic Speech Recognition (ASR)Speech Recognition	—Unverified
Residual Convolutional CTC Networks for Automatic Speech Recognition	Feb 24, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
On the Relevance of Auditory-Based Gabor Features for Deep Learning in Automatic Speech Recognition	Feb 14, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Towards speech-to-text translation without speech recognition	Feb 13, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Structural Analysis of Hindi Phonetics and A Method for Extraction of Phonetically Rich Sentences from a Very Large Hindi Text Corpus	Jan 30, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Learning Word-Like Units from Joint Audio-Visual Analysis	Jan 25, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Lyrics-to-Audio Alignment by Unsupervised Discovery of Repetitive Patterns in Vowel Acoustics	Jan 21, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Auxiliary Multimodal LSTM for Audio-visual Speech Recognition and Lipreading	Jan 16, 2017	Audio-Visual Speech RecognitionAutomatic Speech Recognition	—Unverified
End-to-End ASR-free Keyword Search from Speech	Jan 13, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-task Learning Of Deep Neural Networks For Audio Visual Automatic Speech Recognition	Jan 10, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Towards End-to-End Speech Recognition with Deep Convolutional Neural Networks	Jan 10, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Evaluating Low-Level Speech Features Against Human Perceptual Data	Jan 1, 2017	Automatic Speech Recognition (ASR)Representation Learning	—Unverified
Recurrent Deep Stacking Networks for Speech Recognition	Dec 14, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Incorporating Language Level Information into Acoustic Models	Dec 14, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Evaluating Automatic Speech Recognition Systems in Comparison With Human Perception Results Using Distinctive Feature Measures	Dec 13, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Towards better decoding and language model integration in sequence to sequence models	Dec 8, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Audio Segmentation for Robust Real-Time Speech Recognition Based on Neural Networks	Dec 1, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
The IWSLT 2016 Evaluation Campaign	Dec 1, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
RACAI Entry for the IWSLT 2016 Shared Task	Dec 1, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
使用字典學習法於強健性語音辨識 (The Use of Dictionary Learning Approach for Robustness Speech Recognition) [In Chinese]	Dec 1, 2016	Automatic Speech Recognition (ASR)Dictionary Learning	—Unverified
Bayesian Language Model based on Mixture of Segmental Contexts for Spontaneous Utterances with Unexpected Words	Dec 1, 2016	Automatic Speech Recognition (ASR)Language Modeling	—Unverified
Dialogue Act Classification in Domain-Independent Conversations Using a Deep Recurrent Neural Network	Dec 1, 2016	Automatic Speech Recognition (ASR)Dialogue Act Classification	—Unverified
Automatic Syllabification for Manipuri language	Dec 1, 2016	Automatic Speech Recognition (ASR)Segmentation	—Unverified

Show:10 25 50

← PrevPage 114 of 121Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified