Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2051–2100 of 3012 papers

Title	Date	Tasks	Status
Spoken Grammar Assessment Using LLM	Oct 2, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Spoken Language Translation for Polish	Nov 24, 2015	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
SpokesBiz -- an Open Corpus of Conversational Polish	Dec 19, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
SRU++: Pioneering Fast Recurrence with Attention for Speech Recognition	Oct 11, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
SSHR: Leveraging Self-supervised Hierarchical Representations for Multilingual Automatic Speech Recognition	Sep 29, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
SSNCSE_NLP@LT-EDI-ACL2022: Speech Recognition for Vulnerable Individuals in Tamil using pre-trained XLSR models	May 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Stabilising and accelerating light gated recurrent units for automatic speech recognition	Feb 16, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
StableEmit: Selection Probability Discount for Reducing Emission Latency of Streaming Monotonic Attention ASR	Jul 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
StableQuant: Layer Adaptive Post-Training Quantization for Speech Foundation Models	Apr 21, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Stacked Acoustic-and-Textual Encoding: Integrating the Pre-trained Models into Speech Translation Encoders	May 12, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
StarGAN-VC+ASR: StarGAN-based Non-Parallel Voice Conversion Regularized by Automatic Speech Recognition	Aug 10, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Start-Before-End and End-to-End: Neural Speech Translation by AppTek and RWTH Aachen University	Jul 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Statistical Beamformer Exploiting Non-stationarity and Sparsity with Spatially Constrained ICA for Robust Speech Recognition	Jun 13, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Statistical Testing on ASR Performance via Blockwise Bootstrap	Dec 19, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
STC Speaker Recognition Systems for the VOiCES From a Distance Challenge	Apr 12, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
STC speaker recognition systems for the NIST SRE 2021	Nov 3, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
STOP: A dataset for Spoken Task Oriented Semantic Parsing	Jun 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Stream attention-based multi-array end-to-end speech recognition	Nov 12, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Streaming Attention-Based Models with Augmented Memory for End-to-End Speech Recognition	Nov 3, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Streaming Audio-Visual Speech Recognition with Alignment Regularization	Nov 3, 2022	Audio-Visual Speech RecognitionAutomatic Speech Recognition	—Unverified
Streaming automatic speech recognition with the transformer model	Jan 8, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Streaming End-to-End ASR based on Blockwise Non-Autoregressive Models	Jul 20, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Streaming End-to-End Multilingual Speech Recognition with Joint Language Identification	Sep 13, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Streaming Target-Speaker ASR with Neural Transducer	Sep 9, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Streaming, fast and accurate on-device Inverse Text Normalization for Automatic Speech Recognition	Nov 7, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Streaming Models for Joint Speech Recognition and Translation	Jan 22, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Streaming Noise Context Aware Enhancement For Automatic Speech Recognition in Multi-Talker Environments	May 17, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Streaming Punctuation: A Novel Punctuation Technique Leveraging Bidirectional Context for Continuous Speech Recognition	Jan 10, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Streaming Punctuation for Long-form Dictation with Transformers	Oct 11, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Streaming Simultaneous Speech Translation with Augmented Memory Transformer	Oct 30, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Streaming Speech-to-Confusion Network Speech Recognition	Jun 2, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Streaming Transformer ASR with Blockwise Synchronous Inference	Jun 25, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Streaming Transformer for Hardware Efficient Voice Trigger Detection and False Trigger Mitigation	May 14, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Streaming Voice Conversion Via Intermediate Bottleneck Features And Non-streaming Teacher Guidance	Oct 27, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Streaming Voice Query Recognition using Causal Convolutional Recurrent Neural Networks	Dec 19, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
StreamVoice+: Evolving into End-to-end Streaming Zero-shot Voice Conversion	Aug 5, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Structural Analysis of Hindi Phonetics and A Method for Extraction of Phonetically Rich Sentences from a Very Large Hindi Text Corpus	Jan 30, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Structured Dialogue Policy with Graph Neural Networks	Aug 1, 2018	Automatic Speech Recognition (ASR)Decision Making	—Unverified
Structured State Space Decoder for Speech Recognition and Synthesis	Oct 31, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
STT4SG-350: A Speech Corpus for All Swiss German Dialect Regions	May 30, 2023	AllAutomatic Speech Recognition	—Unverified
Student achievement and French sentence repetition test scores	May 1, 2014	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Studying the Similarity of COVID-19 Sounds based on Correlation Analysis of MFCC	Oct 17, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Study of Indian English Pronunciation Variabilities relative to Received Pronunciation	Apr 13, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
StutterNet: Stuttering Detection Using Time Delay Neural Network	May 12, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Stutter-TTS: Controlled Synthesis and Improved Recognition of Stuttered Speech	Nov 4, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Style-Talker: Finetuning Audio Language Model and Style-Based Text-to-Speech Model for Fast Spoken Dialogue Generation	Aug 13, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sub-8-bit quantization for on-device speech recognition: a regularization-free approach	Oct 17, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Subword Dictionary Learning and Segmentation Techniques for Automatic Speech Recognition in Tamil and Kannada	Jul 27, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sub-word Level Lip Reading With Visual Attention	Oct 14, 2021	Audio-Visual Active Speaker DetectionAutomatic Speech Recognition	—Unverified
Subword Regularization: An Analysis of Scalability and Generalization for End-to-End Automatic Speech Recognition	Aug 10, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 42 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified