Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 901–925 of 3012 papers

Title	Date	Tasks	Status
Text-Only Domain Adaptation for End-to-End Speech Recognition through Down-Sampling Acoustic Representation	Sep 4, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Learning Speech Representation From Contrastive Token-Acoustic Pretraining	Sep 1, 2023	Audio ClassificationAutomatic Speech Recognition	—Unverified
Contextual Biasing of Named-Entities with Large Language Models	Sep 1, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Knowledge Distillation from Non-streaming to Streaming ASR Encoder using Auxiliary Non-streaming Layer	Aug 31, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASTER: Automatic Speech Recognition System Accessibility Testing for Stutterers	Aug 30, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Active Learning: Optimizing Labeling Cost-Effectiveness for Automatic Speech Recognition	Aug 28, 2023	Active LearningAutomatic Speech Recognition	—Unverified
Decoupled Structure for Improved Adaptability of End-to-End Models	Aug 25, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Small and Fast BERT for Chinese Medical Punctuation Restoration	Aug 24, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Convoifilter: A case study of doing cocktail party speech recognition	Aug 22, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
TokenSplit: Using Discrete Speech Representations for Direct, Refined, and Transcript-Conditioned Speech Separation and Recognition	Aug 21, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Indonesian Automatic Speech Recognition with XLSR-53	Aug 20, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bayes Risk Transducer: Transducer with Controllable Alignment Prediction	Aug 19, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Radio2Text: Streaming Speech Recognition Using mmWave Radio Signals	Aug 16, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Accurate synthesis of Dysarthric Speech for ASR data augmentation	Aug 16, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
End-to-End Open Vocabulary Keyword Search With Multilingual Neural Representations	Aug 15, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Improving CTC-AED model with integrated-CTC and auxiliary loss regularization	Aug 15, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Integrating Emotion Recognition with Speech Recognition and Speaker Diarisation for Conversations	Aug 14, 2023	Action DetectionActivity Detection	CodeCode Available
Using Text Injection to Improve Recognition of Personal Identifiers in Speech	Aug 14, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Text Injection for Capitalization and Turn-Taking Prediction in Speech Models	Aug 14, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bilingual Streaming ASR with Grapheme units and Auxiliary Monolingual Loss	Aug 11, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Novel Self-training Approach for Low-resource Speech Recognition	Aug 10, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Comparative Analysis of the wav2vec 2.0 Feature Extractor	Aug 8, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Boosting Chinese ASR Error Correction with Dynamic Error Scaling Mechanism	Aug 7, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ApproBiVT: Lead ASR Models to Generalize Better Using Approximated Bias-Variance Tradeoff Guided Early Stopping and Checkpoint Averaging	Aug 5, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Cascaded Cross-Modal Transformer for Request and Complaint Detection	Jul 27, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 37 of 121Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified