Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2501–2550 of 3012 papers

Title	Date	Tasks	Status
Semantic Distance: A New Metric for ASR Performance Analysis Towards Spoken Language Understanding	Apr 5, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Semantic Language Model for Tunisian Dialect	Sep 1, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Semantic VAD: Low-Latency Voice Activity Detection for Speech Interaction	May 21, 2023	Action DetectionActivity Detection	—Unverified
Semantic-WER: A Unified Metric for the Evaluation of ASR Transcript for End Usability	Jun 3, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Semi-Autoregressive Streaming ASR With Label Context	Sep 19, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Semi-supervised acoustic modelling for five-lingual code-switched ASR using automatically-segmented soap opera speech	Apr 8, 2020	Acoustic ModellingAction Detection	—Unverified
Semi-supervised acoustic model training for speech with code-switching	Oct 23, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Semi-supervised ASR by End-to-end Self-training	Jan 24, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Semi-supervised Learning for Code-Switching ASR with Large Language Model Filter	Jul 5, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Semi-supervised Learning with Sparse Autoencoders in Phone Classification	Oct 3, 2016	Acoustic ModellingAutomatic Speech Recognition	—Unverified
Semi-Supervised Speech Recognition via Graph-based Temporal Classification	Oct 29, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sentence Boundary Augmentation For Neural Machine Translation Robustness	Oct 21, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sentence segmentation of aphasic speech	May 1, 2015	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sentiment Analysis using Imperfect Views from Spoken Language and Acoustic Modalities	Jul 1, 2018	Automatic Speech Recognition (ASR)General Classification	—Unverified
Sentiment-Aware Automatic Speech Recognition pre-training for enhanced Speech Emotion Recognition	Jan 27, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
SepALM: Audio Language Models Are Error Correctors for Robust Speech Separation	May 6, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sequence-level Confidence Classifier for ASR Utterance Accuracy and Application to Acoustic Models	Jun 30, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sequence-level self-learning with multiple hypotheses	Dec 10, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sequence Model with Self-Adaptive Sliding Window for Efficient Spoken Document Segmentation	Jul 20, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sequence-to-Sequence ASR Optimization via Reinforcement Learning	Oct 30, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sequence-to-sequence Automatic Speech Recognition with Word Embedding Regularization and Fused Decoding	Oct 28, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sequence-to-Sequence Learning via Attention Transfer for Incremental Speech Recognition	Nov 4, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sequence-to-sequence models in peer-to-peer learning: A practical application	May 2, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sequence Transduction with Graph-based Supervision	Nov 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sequential Editing for Lifelong Training of Speech Recognition Models	Jun 25, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sequential End-to-End Intent and Slot Label Classification and Localization	Jun 8, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
SSCFormer: Push the Limit of Chunk-wise Conformer for Streaming ASR Using Sequentially Sampled Chunks and Chunked Causal Convolution	Nov 21, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Serialized Speech Information Guidance with Overlapped Encoding Separation for Multi-Speaker Automatic Speech Recognition	Sep 1, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Server-side Rescoring of Spoken Entity-centric Knowledge Queries for Virtual Assistants	Nov 2, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
SHEF-LIUM-NN: Sentence level Quality Estimation with Neural Network Features	Aug 1, 2016	Automatic Speech Recognition (ASR)Feature Engineering	—Unverified
使用生成對抗網路於強健式自動語音辨識的應用(Exploiting Generative Adversarial Network for Robustness Automatic Speech Recognition)	Oct 1, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Short-Term Word-Learning in a Dynamically Changing Environment	Mar 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Should We Always Separate?: Switching Between Enhanced and Observed Signals for Overlapping Speech Recognition	Jun 2, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Shouted Speech Compensation for Speaker Verification Robust to Vocal Effort Conditions	Aug 6, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ShrinkML: End-to-End ASR Model Compression Using Reinforcement Learning	Jul 8, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Signer-independent Fingerspelling Recognition with Deep Neural Network Adaptation	Feb 13, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Silent Speech Interfaces for Speech Restoration: A Review	Sep 4, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
(SimPhon Speech Test): A Data-Driven Method for In Silico Design and Validation of a Phonetically Balanced Speech Test	Jun 13, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Simple yet Effective Code-Switching Language Identification with Multitask Pre-Training and Transfer Learning	May 31, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Simulating ASR errors for training SLU systems	May 1, 2018	Automatic Speech Recognition (ASR)Data Augmentation	—Unverified
Simulating realistic speech overlaps improves multi-talker ASR	Oct 27, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
SimulSpeech: End-to-End Simultaneous Speech to Text Translation	Jul 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Simultaneous Speech Recognition and Speaker Diarization for Monaural Dialogue Recordings with Target-Speaker Acoustic Models	Sep 17, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Simultaneous Speech-to-Speech Translation System with Neural Incremental ASR, MT, and TTS	Nov 10, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Singing voice conversion with non-parallel data	Mar 11, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Single-Channel Multi-talker Speech Recognition with Permutation Invariant Training	Jul 19, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sisyphus, a Workflow Manager Designed for Machine Translation and Automatic Speech Recognition	Nov 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
SlideAVSR: A Dataset of Paper Explanation Videos for Audio-Visual Speech Recognition	Jan 18, 2024	Audio-Visual Speech RecognitionAutomatic Speech Recognition	—Unverified
SlimIPL: Language-Model-Free Iterative Pseudo-Labeling	Oct 22, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
SmarTerp: A CAI System to Support Simultaneous Interpreters in Real-Time	Jul 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 51 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified