Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1701–1725 of 3012 papers

Title	Date	Tasks	Status	Hype
On Prosody Modeling for ASR+TTS based Voice Conversion	Jul 20, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Sequence Model with Self-Adaptive Sliding Window for Efficient Spoken Document Segmentation	Jul 20, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Token-Level Supervised Contrastive Learning for Punctuation Restoration	Jul 19, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
A baseline model for computationally inexpensive speech recognition for Kazakh using the Coqui STT framework	Jul 19, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
STRODE: Stochastic Boundary Ordinary Differential Equation	Jul 17, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
A Comparison of Methods for OOV-word Recognition on a New Public Dataset	Jul 16, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
VAD-free Streaming Hybrid CTC/Attention ASR for Unsegmented Recording	Jul 15, 2021	Action DetectionActivity Detection	—Unverified	0
Multi-task Learning with Cross Attention for Keyword Spotting	Jul 15, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Zero-shot Speech Translation	Jul 13, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
A Configurable Multilingual Model is All You Need to Recognize All Languages	Jul 13, 2021	AllAutomatic Speech Recognition	—Unverified	0
The IWSLT 2021 BUT Speech Translation Systems	Jul 13, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Perceptual-based deep-learning denoiser as a defense against adversarial attacks on ASR systems	Jul 12, 2021	Adversarial RobustnessAutomatic Speech Recognition	—Unverified	0
Layer-wise Analysis of a Self-supervised Speech Representation Model	Jul 10, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Loss Prediction: End-to-End Active Learning Approach For Speech Recognition	Jul 9, 2021	Active LearningAutomatic Speech Recognition	—Unverified	0
On lattice-free boosted MMI training of HMM and CTC-based full-context ASR models	Jul 9, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Noisy Training Improves E2E ASR for the Edge	Jul 9, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Improved Language Identification Through Cross-Lingual Self-Supervised Learning	Jul 8, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
End-to-End Rich Transcription-Style Automatic Speech Recognition with Semi-Supervised Learning	Jul 7, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Advancing CTC-CRF Based End-to-End Speech Recognition with Wordpieces and Conformers	Jul 7, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
A Comparative Study of Modular and Joint Approaches for Speaker-Attributed ASR on Monaural Long-Form Audio	Jul 6, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Instant One-Shot Word-Learning for Context-Specific Neural Sequence-to-Sequence Speech Recognition	Jul 5, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Investigation of Practical Aspects of Single Channel Speech Separation for ASR	Jul 5, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Cross-Modal Transformer-Based Neural Correction Models for Automatic Speech Recognition	Jul 4, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Unified Autoregressive Modeling for Joint End-to-End Multi-Talker Overlapped Speech Recognition and Speaker Attribute Estimation	Jul 4, 2021	Age EstimationAttribute	—Unverified	0
TENET: A Time-reversal Enhancement Network for Noise-robust ASR	Jul 4, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1

Show:10 25 50

← PrevPage 69 of 121Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified