Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 801–850 of 3012 papers

Title	Date	Tasks	Status
CTC-Assisted LLM-Based Contextual ASR	Nov 10, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
CTC-DRO: Robust Optimization for Reducing Language Disparities in Speech Recognition	Feb 3, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A review of on-device fully neural end-to-end automatic speech recognition algorithms	Dec 14, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
CTC Variations Through New WFST Topologies	Oct 6, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Cumulative Adaptation for BLSTM Acoustic Models	Jun 14, 2019	Acoustic ModellingAutomatic Speech Recognition	—Unverified
CUNI Neural ASR with Phoneme-Level Intermediate Step for -Native at IWSLT 2020	Jul 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Customizing Speech Recognition Model with Large Language Model Feedback	Jun 5, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Cycle-consistency training for end-to-end speech recognition	Nov 2, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Cycle-Consistent GAN Front-End to Improve ASR Robustness to Perturbed Speech	Oct 22, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Cascaded Models With Cyclic Feedback For Direct Speech Translation	Oct 21, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Cascaded encoders for unifying streaming and non-streaming ASR	Oct 27, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Damage Control During Domain Adaptation for Transducer Based Automatic Speech Recognition	Oct 6, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Accented Speech Recognition: A Survey	Apr 21, 2021	Accented Speech RecognitionAutomatic Speech Recognition	—Unverified
Deploying self-supervised learning in the wild for hybrid automatic speech recognition	May 17, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Data Augmentation for End-to-end Code-switching Speech Recognition	Nov 4, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Data Augmentation for End-to-End Speech Translation: FBK@IWSLT ‘19	Nov 1, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Data Augmentation for Low-Resource Quechua ASR Improvement	Jul 14, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Data Augmentation for Training Dialog Models Robust to Speech Recognition Errors	Jun 10, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Data Augmentation Methods for End-to-end Speech Recognition on Distant-Talk Scenarios	Jun 7, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Audio-visual multi-channel speech separation, dereverberation and recognition	Apr 5, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Data Augmentation with Locally-time Reversed Speech for Automatic Speech Recognition	Oct 9, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving Speech Emotion Recognition with Unsupervised Speaking Style Transfer	Nov 16, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Deploying Technology to Save Endangered Languages	Aug 23, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Data-Driven Pronunciation Modeling of Swiss German Dialectal Speech for Automatic Speech Recognition	May 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Data Efficient Direct Speech-to-Text Translation with Modality Agnostic Meta-Learning	Nov 11, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Amharic-English Speech Translation in Tourism Domain	Sep 1, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Data-selective Transfer Learning for Multi-Domain Speech Recognition	Sep 8, 2015	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
DCF-DS: Deep Cascade Fusion of Diarization and Separation for Speech Recognition under Realistic Single-Channel Conditions	Nov 11, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
DCTX-Conformer: Dynamic context carry-over for low latency unified streaming and non-streaming Conformer ASR	Jun 13, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
DECCA Repurposed: Detecting transcription inconsistencies without an orthographic standard	Mar 1, 2017	Automatic Speech Recognition (ASR)Speech Recognition	—Unverified
Cascaded Cross-Modal Transformer for Request and Complaint Detection	Jul 27, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Decoder-only Architecture for Speech Recognition with CTC Prompts and Text Data Augmentation	Sep 16, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Decoder-only Architecture for Streaming End-to-end Speech Recognition	Jun 23, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Decoupled Federated Learning for ASR with Non-IID Data	Jun 18, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Decoupled Structure for Improved Adaptability of End-to-End Models	Aug 25, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Decoupling Pronunciation and Language for End-to-end Code-switching Automatic Speech Recognition	Oct 28, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Decoupling recognition and transcription in Mandarin ASR	Aug 2, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Are Transformers in Pre-trained LM A Good ASR Encoder? An Empirical Study	Sep 26, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Deep CLAS: Deep Contextual Listen, Attend and Spell	Sep 26, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
DeepCon: An End-to-End Multilingual Toolkit for Automatic Minuting of Multi-Party Dialogues	Sep 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Deep context: end-to-end contextual speech recognition	Aug 7, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Adversarial Speaker Disentanglement Using Unannotated External Data for Self-supervised Representation Based Voice Conversion	May 16, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Deep Graph Random Process for Relational-Thinking-Based Speech Recognition	Jul 4, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Deep Learning Based Dereverberation of Temporal Envelopesfor Robust Speech Recognition	Aug 7, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Deep Learning based Multi-Source Localization with Source Splitting and its Effectiveness in Multi-Talker Speech Recognition	Feb 16, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Unified Cascaded Encoder ASR Model for Dynamic Model Sizes	Apr 13, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Deep Learning for Dialogue Systems	Aug 1, 2018	Automatic Speech Recognition (ASR)Deep Learning	—Unverified
Deep Learning for Environmentally Robust Speech Recognition: An Overview of Recent Developments	May 30, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Deep Multimodal Learning for Audio-Visual Speech Recognition	Jan 22, 2015	Audio-Visual Speech RecognitionAutomatic Speech Recognition	—Unverified
Cascaded CNN-resBiLSTM-CTC: An End-to-End Acoustic Model For Speech Recognition	Oct 29, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 17 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified