Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2801–2850 of 3012 papers

Title	Date	Tasks	Status
Modelling prosodic structure using Artificial Neural Networks	Jun 13, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
End-to-end neural networks for subvocal speech recognition	Jun 11, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Advances in Joint CTC-Attention based End-to-End Speech Recognition with a Deep CNN Encoder and RNN-LM	Jun 8, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Deep Learning for Environmentally Robust Speech Recognition: An Overview of Recent Developments	May 30, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR error management for improving spoken language understanding	May 26, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Anti-spoofing Methods for Automatic SpeakerVerification System	May 24, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Local Monotonic Attention Mechanism for End-to-End Speech and Language Processing	May 23, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Use of Knowledge Graph in Rescoring the N-Best List in Automatic Speech Recognition	May 22, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Generative Model of a Pronunciation Lexicon for Hindi	May 6, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
M\'alr\'omur: A Manually Verified Corpus of Recorded Icelandic Speech	May 1, 2017	Automatic Speech Recognition (ASR)Speech Recognition	—Unverified
Speech-Based Visual Question Answering	May 1, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Acoustic Model Compression with MAP adaptation	May 1, 2017	Automatic Speech Recognition (ASR)model	—Unverified
Towards Estimating the Upper Bound of Visual-Speech Recognition: The Visual Lip-Reading Feasibility Database	Apr 26, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Automatic Viseme Vocabulary Construction to Enhance Continuous Lip-reading	Apr 26, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The SUMMA Platform Prototype	Apr 1, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Hierarchical Neural Model for Learning Sequences of Dialogue Acts	Apr 1, 2017	Automatic Speech Recognition (ASR)Machine Translation	—Unverified
Real-Time Keyword Extraction from Conversations	Apr 1, 2017	Automatic Speech Recognition (ASR)Keyword Extraction	—Unverified
``Oh, I've Heard That Before'': Modelling Own-Dialect Bias After Perceptual Learning by Weighting Training Data	Apr 1, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
An Unsupervised Speaker Clustering Technique based on SOM and I-vectors for Speech Recognition Systems	Apr 1, 2017	Automatic Speech Recognition (ASR)Clustering	—Unverified
Gender and Dialect Bias in YouTube's Automatic Captions	Apr 1, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Identifying dialects with textual and acoustic cues	Apr 1, 2017	Automatic Speech Recognition (ASR)Speech Recognition	—Unverified
An enhanced automatic speech recognition system for Arabic	Apr 1, 2017	Arabic Speech RecognitionAutomatic Speech Recognition	—Unverified
A Code-Switching Corpus of Turkish-German Conversations	Apr 1, 2017	Automatic Speech Recognition (ASR)Language Identification	—Unverified
CASSANDRA: A multipurpose configurable voice-enabled human-computer-interface	Apr 1, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Learning Similarity Functions for Pronunciation Variations	Mar 28, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Topic Identification for Speech without ASR	Mar 22, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Direct Acoustics-to-Word Models for English Conversational Speech Recognition	Mar 22, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Recognizing Multi-talker Speech with Permutation Invariant Training	Mar 22, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Joint Learning of Correlated Sequence Labelling Tasks Using Bidirectional Recurrent Neural Networks	Mar 14, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
DECCA Repurposed: Detecting transcription inconsistencies without an orthographic standard	Mar 1, 2017	Automatic Speech Recognition (ASR)Speech Recognition	—Unverified
Residual Convolutional CTC Networks for Automatic Speech Recognition	Feb 24, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
On the Relevance of Auditory-Based Gabor Features for Deep Learning in Automatic Speech Recognition	Feb 14, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Towards speech-to-text translation without speech recognition	Feb 13, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Structural Analysis of Hindi Phonetics and A Method for Extraction of Phonetically Rich Sentences from a Very Large Hindi Text Corpus	Jan 30, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Learning Word-Like Units from Joint Audio-Visual Analysis	Jan 25, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Lyrics-to-Audio Alignment by Unsupervised Discovery of Repetitive Patterns in Vowel Acoustics	Jan 21, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Auxiliary Multimodal LSTM for Audio-visual Speech Recognition and Lipreading	Jan 16, 2017	Audio-Visual Speech RecognitionAutomatic Speech Recognition	—Unverified
End-to-End ASR-free Keyword Search from Speech	Jan 13, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Towards End-to-End Speech Recognition with Deep Convolutional Neural Networks	Jan 10, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Multi-task Learning Of Deep Neural Networks For Audio Visual Automatic Speech Recognition	Jan 10, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Evaluating Low-Level Speech Features Against Human Perceptual Data	Jan 1, 2017	Automatic Speech Recognition (ASR)Representation Learning	—Unverified
Recurrent Deep Stacking Networks for Speech Recognition	Dec 14, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Incorporating Language Level Information into Acoustic Models	Dec 14, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Evaluating Automatic Speech Recognition Systems in Comparison With Human Perception Results Using Distinctive Feature Measures	Dec 13, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Towards better decoding and language model integration in sequence to sequence models	Dec 8, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
使用字典學習法於強健性語音辨識 (The Use of Dictionary Learning Approach for Robustness Speech Recognition) [In Chinese]	Dec 1, 2016	Automatic Speech Recognition (ASR)Dictionary Learning	—Unverified
Automatic Speech Recognition Errors as a Predictor of L2 Listening Difficulties	Dec 1, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Audio Segmentation for Robust Real-Time Speech Recognition Based on Neural Networks	Dec 1, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Automatic Syllabification for Manipuri language	Dec 1, 2016	Automatic Speech Recognition (ASR)Segmentation	—Unverified
Lightly Supervised Quality Estimation	Dec 1, 2016	Automatic Speech Recognition (ASR)Machine Translation	—Unverified

Show:10 25 50

← PrevPage 57 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified