Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2326–2350 of 3012 papers

Title	Date	Tasks	Status
Low-rank Gradient Approximation For Memory-Efficient On-device Training of Deep Neural Network	Jan 24, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Semi-supervised ASR by End-to-end Self-training	Jan 24, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
TLT-school: a Corpus of Non Native Children Speech	Jan 22, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sequence Labeling Approach to the Task of Sentence Boundary Detection	Jan 20, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Transformer-based Online CTC/attention End-to-End Speech Recognition Architecture	Jan 15, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving Spoken Language Understanding By Exploiting ASR N-best Hypotheses	Jan 11, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving Dysarthric Speech Intelligibility Using Cycle-consistent Adversarial Training	Jan 10, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Open Challenge for Correcting Errors of Speech Recognition Systems	Jan 9, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Streaming automatic speech recognition with the transformer model	Jan 8, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Audio-visual Recognition of Overlapped speech for the LRS2 dataset	Jan 6, 2020	Audio-Visual Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Investigation and Analysis of Hyper and Hypo neuron pruning to selectively update neurons during Unsupervised Adaptation	Jan 6, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Speaker-aware speech-transformer	Jan 2, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Deep Representation Learning in Speech Processing: Challenges, Recent Advances, and Future Trends	Jan 2, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Attention based on-device streaming speech recognition with large speech corpus	Jan 2, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
EEG based Continuous Speech Recognition using Transformers	Dec 31, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
power-law nonlinearity with maximally uniform distribution criterion for improved neural network training in automatic speech recognition	Dec 22, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Statistical Testing on ASR Performance via Blockwise Bootstrap	Dec 19, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Generating Synthetic Audio Data for Attention-Based Speech Recognition Systems	Dec 19, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Role of non-linear data processing on speech recognition task in the framework of reservoir computing	Dec 19, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Cycle-GAN Approach to Model Natural Perturbations in Speech for ASR Applications	Dec 18, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Continuous Speech Recognition using EEG and Video	Dec 16, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Synchronous Speech Recognition and Speech-to-Text Translation with Interactive Decoding	Dec 16, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
On Neural Phone Recognition of Mixed-Source ECoG Signals	Dec 12, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Leveraging End-to-End Speech Recognition with Neural Architecture Search	Dec 11, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
SpecAugment on Large Scale Datasets	Dec 11, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 94 of 121Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified