Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1301–1350 of 3012 papers

Title	Date	Tasks	Status
Improving Hypernasality Estimation with Automatic Speech Recognition in Cleft Palate Speech	Aug 10, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Thai Wav2Vec2.0 with CommonVoice V8	Aug 9, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Large vocabulary speech recognition for languages of Africa: multilingual modeling and self-supervised learning	Aug 5, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Automatic Speech Recognition in German: A Detailed Error Analysis	Aug 3, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Adversarial Attacks on ASR Systems: An Overview	Aug 3, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Global Performance Disparities Between English-Language Accents in Automatic Speech Recognition	Aug 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multiple-hypothesis RNN-T Loss for Unsupervised Fine-tuning and Self-training of Neural Transducer	Jul 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Domain Specific Wav2vec 2.0 Fine-tuning For The SE&R 2022 Challenge	Jul 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Pronunciation-aware unique character encoding for RNN Transducer-based Mandarin speech recognition	Jul 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Thutmose Tagger: Single-pass neural model for Inverse Text Normalization	Jul 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Subword Dictionary Learning and Segmentation Techniques for Automatic Speech Recognition in Tamil and Kannada	Jul 27, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Knowledge-driven Subword Grammar Modeling for Automatic Speech Recognition in Tamil and Kannada	Jul 27, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised data selection for Speech Recognition with contrastive loss ratios	Jul 25, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Learning a Dual-Mode Speech Recognition Model via Self-Pruning	Jul 25, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR Error Detection via Audio-Transcript entailment	Jul 22, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving Data Driven Inverse Text Normalization using Data Augmentation	Jul 20, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
When Is TTS Augmentation Through a Pivot Language Useful?	Jul 20, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
ILASR: Privacy-Preserving Incremental Learning for Automatic Speech Recognition at Production Scale	Jul 19, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ESPnet-SE++: Speech Enhancement for Robust Speech Recognition, Translation, and Understanding	Jul 19, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
End-to-End Spoken Language Understanding: Performance analyses of a voice command task in a low resource setting	Jul 17, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Reducing Geographic Disparities in Automatic Speech Recognition via Elastic Weight Consolidation	Jul 16, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Direction-Aware Joint Adaptation of Neural Speech Enhancement and Recognition in Real Multiparty Conversational Environments	Jul 15, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Deep versus Wide: An Analysis of Student Architectures for Task-Agnostic Knowledge Distillation of Self-Supervised Speech Models	Jul 14, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Data Augmentation for Low-Resource Quechua ASR Improvement	Jul 14, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Huqariq: A Multilingual Speech Corpus of Native Languages of Peru for Speech Recognition	Jul 12, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
End-to-end speech recognition modeling from de-identified data	Jul 12, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
pMCT: Patched Multi-Condition Training for Robust Speech Recognition	Jul 11, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Online Continual Learning of End-to-End Speech Recognition Models	Jul 11, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Speaker Anonymization with Phonetic Intermediate Representations	Jul 11, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Investigating the Impact of Cross-lingual Acoustic-Phonetic Similarities on Multilingual Speech Recognition	Jul 7, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
End-to-end Speech-to-Punctuated-Text Recognition	Jul 7, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving Streaming End-to-End ASR on Transformer-based Causal Models with Encoder States Revision Strategies	Jul 6, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Compute Cost Amortized Transformer for Streaming ASR	Jul 5, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Vietnamese Capitalization and Punctuation Recovery Models	Jul 4, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Leveraging Acoustic Contextual Representation by Audio-textual Cross-modal Learning for Conversational ASR	Jul 3, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Tree-constrained Pointer Generator with Graph Neural Network Encodings for Contextual Speech Recognition	Jul 2, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving Transformer-based Conversational ASR by Inter-Sentential Attention Mechanism	Jul 2, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Activity focused Speech Recognition of Preschool Children in Early Childhood Classrooms	Jul 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving Low-Resource Speech Recognition with Pretrained Speech Models: Continued Pretraining vs. Semi-Supervised Training	Jul 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Updating Only Encoders Prevents Catastrophic Forgetting of End-to-End ASR Models	Jul 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Non-Autoregressive Chinese ASR Error Correction with Phonological Training	Jul 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Exploring the Effect of Dialect Mismatched Language Models in Telugu Automatic Speech Recognition	Jul 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
BehancePR: A Punctuation Restoration Dataset for Livestreaming Video Transcript	Jul 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
FeaRLESS: Feature Refinement Loss for Ensembling Self-Supervised Learning Features in Robust End-to-end Speech Recognition	Jun 30, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Space-Efficient Representation of Entity-centric Query Language Models	Jun 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The THUEE System Description for the IARPA OpenASR21 Challenge	Jun 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
STOP: A dataset for Spoken Task Oriented Semantic Parsing	Jun 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bengali Common Voice Speech Dataset for Automatic Speech Recognition	Jun 28, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
TALCS: An Open-Source Mandarin-English Code-Switching Corpus and a Speech Recognition Baseline	Jun 27, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Challenges and Opportunities in Multi-device Speech Processing	Jun 27, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 27 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified