Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1851–1900 of 3012 papers

Title	Date	Tasks	Status
Leveraging Pre-trained Language Model for Speech Sentiment Analysis	Jun 11, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving RNN-T ASR Performance with Date-Time and Location Awareness	Jun 11, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
TASK AWARE MULTI-TASK LEARNING FOR SPEECH TO TEXT TASKS	Jun 10, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
PARP: Prune, Adjust and Re-Prune for Self-Supervised Speech Recognition	Jun 10, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Comparative Study on Neural Architectures and Training Methods for Japanese Speech Recognition	Jun 9, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Automatic Speech Recognition: A Review	Jun 9, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sequential End-to-End Intent and Slot Label Classification and Localization	Jun 8, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Data Augmentation Methods for End-to-end Speech Recognition on Distant-Talk Scenarios	Jun 7, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Human Listening and Live Captioning: Multi-Task Training for Speech Enhancement	Jun 5, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Do You Listen with One or Two Microphones? A Unified ASR Model for Single and Multi-Channel Audio	Jun 4, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Semantic-WER: A Unified Metric for the Evaluation of ASR Transcript for End Usability	Jun 3, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Should We Always Separate?: Switching Between Enhanced and Observed Signals for Overlapping Speech Recognition	Jun 2, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving low-resource ASR performance with untranscribed out-of-domain data	Jun 2, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Dual Script E2E framework for Multilingual and Code-Switching ASR	Jun 2, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Evaluating Automatic Speech Recognition Quality and Its Impact on Counselor Utterance Coding	Jun 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Neural Acoustic Echo Canceller Optimized Using An Automatic Speech Recognizer And Large Scale Synthetic Data	Jun 1, 2021	Acoustic echo cancellationAutomatic Speech Recognition	—Unverified
End-to-end ASR to jointly predict transcriptions and linguistic annotations	Jun 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Highland Puebla Nahuatl Speech Translation Corpus for Endangered Language Documentation	Jun 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Developing ASR for Indonesian-English Bilingual Language Teaching	Jun 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
End-to-End Automatic Speech Recognition: Its Impact on the Workflowin Documenting Yoloxóchitl Mixtec	Jun 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Towards One Model to Rule All: Multilingual Strategy for Dialectal Code-Switching Arabic ASR	May 31, 2021	AllAutomatic Speech Recognition	—Unverified
Training Speech Enhancement Systems with Noisy Speech Datasets	May 26, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Mondegreen: A Post-Processing Solution to Speech Recognition Error Correction for Voice Search Queries	May 20, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
LiSTra, Automatic Speech Translation: English to Lingala case study	May 16, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Streaming Transformer for Hardware Efficient Voice Trigger Detection and False Trigger Mitigation	May 14, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Listen with Intent: Improving Speech Recognition with Audio-to-Intent Front-End	May 14, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Exploring CTC Based End-to-End Techniques for Myanmar Speech Recognition	May 13, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Stacked Acoustic-and-Textual Encoding: Integrating the Pre-trained Models into Speech Translation Encoders	May 12, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
StutterNet: Stuttering Detection Using Time Delay Neural Network	May 12, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Speech2Slot: An End-to-End Knowledge-based Slot Filling from Speech	May 10, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
English Accent Accuracy Analysis in a State-of-the-Art Automatic Speech Recognition System	May 9, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
FastCorrect: Fast Error Correction with Edit Alignment for Automatic Speech Recognition	May 9, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Robustness of end-to-end Automatic Speech Recognition Models -- A Case Study using Mozilla DeepSpeech	May 8, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Latency-Controlled Neural Architecture Search for Streaming Speech Recognition	May 8, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Accent Recognition with Hybrid Phonetic Features	May 5, 2021	Audio ClassificationAutomatic Speech Recognition	—Unverified
Spectral modification for recognition of children’s speech undermismatched conditions	May 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Personalized Keyphrase Detection using Speaker and Environment Information	Apr 28, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-Task Learning for End-to-End ASR Word and Utterance Confidence with Deletion Prediction	Apr 26, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Semantic Data Augmentation for End-to-End Mandarin Speech Recognition	Apr 26, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Head-synchronous Decoding for Transformer-based Streaming ASR	Apr 26, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Quantization of Deep Neural Networks for Accurate Edge Computing	Apr 25, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bridging the gap between streaming and non-streaming ASR systems bydistilling ensembles of CTC and RNN-T models	Apr 25, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Pre-training for Spoken Language Understanding with Joint Textual and Phonetic Representation Learning	Apr 21, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Discriminative Self-training for Punctuation Prediction	Apr 21, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Disfluency Detection with Unlabeled Data and Small BERT Models	Apr 21, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
On Sampling-Based Training Criteria for Neural Language Modeling	Apr 21, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Scene-aware Far-field Automatic Speech Recognition	Apr 21, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Label-Synchronous Speech-to-Text Alignment for ASR Using Forward and Backward Transformers	Apr 21, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Accented Speech Recognition: A Survey	Apr 21, 2021	Accented Speech RecognitionAutomatic Speech Recognition	—Unverified
On the Impact of Word Error Rate on Acoustic-Linguistic Speech Emotion Recognition: An Update for the Deep Learning Era	Apr 20, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 38 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified