Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2551–2575 of 3012 papers

Title	Date	Tasks	Status	Hype
Stream attention-based multi-array end-to-end speech recognition	Nov 12, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Reinforcement Learning Based Speech Enhancement for Robust Speech Recognition	Nov 10, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Improving End-to-end Speech Recognition with Pronunciation-assisted Sub-word Modeling	Nov 10, 2018	Automatic Speech Recognition (ASR)speech-recognition	—Unverified	0
Multimodal Grounding for Sequence-to-Sequence Speech Recognition	Nov 9, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Confusion2Vec: Towards Enriching Vector Space Word Representations with Representational Ambiguities	Nov 8, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
CNN-based MultiChannel End-to-End Speech Recognition for everyday home environments	Nov 7, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Analysis of Multilingual Sequence-to-Sequence speech recognition systems	Nov 7, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Bidirectional Quaternion Long-Short Term Memory Recurrent Neural Networks for Speech Recognition	Nov 6, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Discriminative training of RNNLMs with the average word error criterion	Nov 6, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
When CTC Training Meets Acoustic Landmarks	Nov 5, 2018	Automatic Speech Recognition (ASR)Speech Recognition	—Unverified	0
End-to-End Monaural Multi-speaker ASR System without Pretraining	Nov 5, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Leveraging Weakly Supervised Data to Improve End-to-End Speech-to-Text Translation	Nov 5, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Adversarial Black-Box Attacks on Automatic Speech Recognition Systems using Multi-Objective Evolutionary Optimization	Nov 4, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Improving the Robustness of Speech Translation	Nov 2, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Cycle-consistency training for end-to-end speech recognition	Nov 2, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Training Neural Speech Recognition Systems with Synthetic Speech Augmentation	Nov 2, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Adversarial Training of End-to-end Speech Recognition Using a Criticizing Language Model	Nov 2, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Introspection for convolutional automatic speech recognition	Nov 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Sisyphus, a Workflow Manager Designed for Machine Translation and Automatic Speech Recognition	Nov 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
How2: A Large-scale Dataset for Multimodal Language Understanding	Nov 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Tropical Modeling of Weighted Transducer Algorithms on Graphs	Nov 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
End-to-End Feedback Loss in Speech Chain Framework via Straight-Through Estimator	Oct 31, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Towards End-to-End Code-Switching Speech Recognition	Oct 31, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Towards End-to-end Automatic Code-Switching Speech Recognition	Oct 30, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Bi-Directional Lattice Recurrent Neural Networks for Confidence Estimation	Oct 30, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0

Show:10 25 50

← PrevPage 103 of 121Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified