Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1151–1200 of 3012 papers

Title	Date	Tasks	Status	Hype
Improving Mandarin Speech Recogntion with Block-augmented Transformer	Jul 24, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
ASR Error Detection via Audio-Transcript entailment	Jul 22, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Transfer Learning of wav2vec 2.0 for Automatic Lyric Transcription	Jul 20, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
When Is TTS Augmentation Through a Pivot Language Useful?	Jul 20, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Improving Data Driven Inverse Text Normalization using Data Augmentation	Jul 20, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
ESPnet-SE++: Speech Enhancement for Robust Speech Recognition, Translation, and Understanding	Jul 19, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
ILASR: Privacy-Preserving Incremental Learning for Automatic Speech Recognition at Production Scale	Jul 19, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
End-to-End Spoken Language Understanding: Performance analyses of a voice command task in a low resource setting	Jul 17, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Reducing Geographic Disparities in Automatic Speech Recognition via Elastic Weight Consolidation	Jul 16, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Direction-Aware Joint Adaptation of Neural Speech Enhancement and Recognition in Real Multiparty Conversational Environments	Jul 15, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Deep versus Wide: An Analysis of Student Architectures for Task-Agnostic Knowledge Distillation of Self-Supervised Speech Models	Jul 14, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Data Augmentation for Low-Resource Quechua ASR Improvement	Jul 14, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
MM-ALT: A Multimodal Automatic Lyric Transcription System	Jul 13, 2022	Action DetectionActivity Detection	CodeCode Available	1
Huqariq: A Multilingual Speech Corpus of Native Languages of Peru for Speech Recognition	Jul 12, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
End-to-end speech recognition modeling from de-identified data	Jul 12, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Online Continual Learning of End-to-End Speech Recognition Models	Jul 11, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Speaker Anonymization with Phonetic Intermediate Representations	Jul 11, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
pMCT: Patched Multi-Condition Training for Robust Speech Recognition	Jul 11, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Investigating the Impact of Cross-lingual Acoustic-Phonetic Similarities on Multilingual Speech Recognition	Jul 7, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
End-to-end Speech-to-Punctuated-Text Recognition	Jul 7, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Improving Streaming End-to-End ASR on Transformer-based Causal Models with Encoder States Revision Strategies	Jul 6, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Compute Cost Amortized Transformer for Streaming ASR	Jul 5, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Vietnamese Capitalization and Punctuation Recovery Models	Jul 4, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Leveraging Acoustic Contextual Representation by Audio-textual Cross-modal Learning for Conversational ASR	Jul 3, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Improving Transformer-based Conversational ASR by Inter-Sentential Attention Mechanism	Jul 2, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Tree-constrained Pointer Generator with Graph Neural Network Encodings for Contextual Speech Recognition	Jul 2, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Exploring the Effect of Dialect Mismatched Language Models in Telugu Automatic Speech Recognition	Jul 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Non-Autoregressive Chinese ASR Error Correction with Phonological Training	Jul 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
BehancePR: A Punctuation Restoration Dataset for Livestreaming Video Transcript	Jul 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Activity focused Speech Recognition of Preschool Children in Early Childhood Classrooms	Jul 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Improving Low-Resource Speech Recognition with Pretrained Speech Models: Continued Pretraining vs. Semi-Supervised Training	Jul 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Updating Only Encoders Prevents Catastrophic Forgetting of End-to-End ASR Models	Jul 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
FeaRLESS: Feature Refinement Loss for Ensembling Self-Supervised Learning Features in Robust End-to-end Speech Recognition	Jun 30, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
STOP: A dataset for Spoken Task Oriented Semantic Parsing	Jun 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
The THUEE System Description for the IARPA OpenASR21 Challenge	Jun 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Space-Efficient Representation of Entity-centric Query Language Models	Jun 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Bengali Common Voice Speech Dataset for Automatic Speech Recognition	Jun 28, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Challenges and Opportunities in Multi-device Speech Processing	Jun 27, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
TALCS: An Open-Source Mandarin-English Code-Switching Corpus and a Speech Recognition Baseline	Jun 27, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Improving the Training Recipe for a Robust Conformer-based Hybrid Model	Jun 26, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Meta Auxiliary Learning for Low-resource Spoken Language Understanding	Jun 26, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Annotated Speech Corpus for Low Resource Indian Languages: Awadhi, Bhojpuri, Braj and Magahi	Jun 26, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
On Comparison of Encoders for Attention based End to End Speech Recognition in Standalone and Rescoring Mode	Jun 26, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Distilling a Pretrained Language Model to a Multilingual ASR Model	Jun 25, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
TEVR: Improving Speech Recognition by Token Entropy Variance Reduction	Jun 25, 2022	Automatic Speech Recognition (ASR)Language Modeling	CodeCode Available	2
Confidence Score Based Conformer Speaker Adaptation for Speech Recognition	Jun 24, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Two-pass Decoding and Cross-adaptation Based System Combination of End-to-end Conformer and Hybrid TDNN ASR Systems	Jun 23, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
A Simple Baseline for Domain Adaptation in End to End ASR Systems Using Synthetic Data	Jun 22, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
A Systematic Comparison of Phonetic Aware Techniques for Speech Enhancement	Jun 22, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Supervision-Guided Codebooks for Masked Prediction in Speech Pre-training	Jun 21, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0

Show:10 25 50

← PrevPage 24 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified