Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 876–900 of 3012 papers

Title	Date	Tasks	Status
Fine-tuning Strategies for Faster Inference using Speech Self-Supervised Models: A Comparative Study	Mar 12, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Transcription free filler word detection with Neural semi-CRFs	Mar 11, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
MIXPGD: Hybrid Adversarial Training for Speech Recognition Systems	Mar 10, 2023	Adversarial AttackAutomatic Speech Recognition	—Unverified
Clinical BERTScore: An Improved Measure of Automatic Speech Recognition Performance in Clinical Settings	Mar 10, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
wav2vec and its current potential to Automatic Speech Recognition in German for the usage in Digital History: A comparative assessment of available ASR-technologies for the use in cultural heritage contexts	Mar 6, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
End-to-End Speech Recognition: A Survey	Mar 3, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Leveraging Large Text Corpora for End-to-End Speech Summarization	Mar 2, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Google USM: Scaling Automatic Speech Recognition Beyond 100 Languages	Mar 2, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Leveraging Redundancy in Multiple Audio Signals for Far-Field Speech Recognition	Mar 1, 2023	Acoustic echo cancellationAutomatic Speech Recognition	—Unverified
N-best T5: Robust ASR Error Correction using Multiple Input Hypotheses and Constrained Decoding Space	Mar 1, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Language-Universal Adapter Learning with Knowledge Distillation for End-to-End Multilingual Speech Recognition	Feb 28, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Deep Visual Forced Alignment: Learning to Align Transcription with Talking Face Video	Feb 27, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Diacritic Recognition Performance in Arabic ASR	Feb 27, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
MoLE : Mixture of Language Experts for Multi-Lingual Automatic Speech Recognition	Feb 27, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving Medical Speech-to-Text Accuracy with Vision-Language Pre-training Model	Feb 27, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Comparison of Speech Data Augmentation Methods Using S3PRL Toolkit	Feb 27, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multimodal Speech Recognition for Language-Guided Embodied Agents	Feb 27, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
A low latency attention module for streaming self-supervised speech representation learning	Feb 27, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Text-only domain adaptation for end-to-end ASR using integrated text-to-mel-spectrogram generator	Feb 27, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Speech Corpora Divergence Based Unsupervised Data Selection for ASR	Feb 26, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Efficient Ensemble for Multimodal Punctuation Restoration using Time-Delay Neural Network	Feb 26, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Factual Consistency Oriented Speech Recognition	Feb 24, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Ensemble knowledge distillation of self-supervised speech models	Feb 24, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving Massively Multilingual ASR With Auxiliary CTC Objectives	Feb 24, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Evaluating Automatic Speech Recognition in an Incremental Setting	Feb 23, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 36 of 121Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified