Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2801–2825 of 3012 papers

Title	Date	Tasks	Status
Advances in Joint CTC-Attention based End-to-End Speech Recognition with a Deep CNN Encoder and RNN-LM	Jun 8, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Deep Learning for Environmentally Robust Speech Recognition: An Overview of Recent Developments	May 30, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR error management for improving spoken language understanding	May 26, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Anti-spoofing Methods for Automatic SpeakerVerification System	May 24, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Local Monotonic Attention Mechanism for End-to-End Speech and Language Processing	May 23, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Use of Knowledge Graph in Rescoring the N-Best List in Automatic Speech Recognition	May 22, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Generative Model of a Pronunciation Lexicon for Hindi	May 6, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
M\'alr\'omur: A Manually Verified Corpus of Recorded Icelandic Speech	May 1, 2017	Automatic Speech Recognition (ASR)Speech Recognition	—Unverified
Acoustic Model Compression with MAP adaptation	May 1, 2017	Automatic Speech Recognition (ASR)model	—Unverified
Speech-Based Visual Question Answering	May 1, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Towards Estimating the Upper Bound of Visual-Speech Recognition: The Visual Lip-Reading Feasibility Database	Apr 26, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Automatic Viseme Vocabulary Construction to Enhance Continuous Lip-reading	Apr 26, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
An enhanced automatic speech recognition system for Arabic	Apr 1, 2017	Arabic Speech RecognitionAutomatic Speech Recognition	—Unverified
An Unsupervised Speaker Clustering Technique based on SOM and I-vectors for Speech Recognition Systems	Apr 1, 2017	Automatic Speech Recognition (ASR)Clustering	—Unverified
A Code-Switching Corpus of Turkish-German Conversations	Apr 1, 2017	Automatic Speech Recognition (ASR)Language Identification	—Unverified
``Oh, I've Heard That Before'': Modelling Own-Dialect Bias After Perceptual Learning by Weighting Training Data	Apr 1, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Identifying dialects with textual and acoustic cues	Apr 1, 2017	Automatic Speech Recognition (ASR)Speech Recognition	—Unverified
Gender and Dialect Bias in YouTube's Automatic Captions	Apr 1, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The SUMMA Platform Prototype	Apr 1, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
CASSANDRA: A multipurpose configurable voice-enabled human-computer-interface	Apr 1, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Real-Time Keyword Extraction from Conversations	Apr 1, 2017	Automatic Speech Recognition (ASR)Keyword Extraction	—Unverified
A Hierarchical Neural Model for Learning Sequences of Dialogue Acts	Apr 1, 2017	Automatic Speech Recognition (ASR)Machine Translation	—Unverified
Learning Similarity Functions for Pronunciation Variations	Mar 28, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Direct Acoustics-to-Word Models for English Conversational Speech Recognition	Mar 22, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Recognizing Multi-talker Speech with Permutation Invariant Training	Mar 22, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 113 of 121Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified