Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1751–1800 of 3012 papers

Title	Date	Tasks	Status
Transformer ASR with Contextual Block Processing	Oct 16, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Transformer-based ASR Incorporating Time-reduction Layer and Fine-tuning with Self-Knowledge Distillation	Mar 17, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Transformer-based Automatic Speech Recognition of Formal and Colloquial Czech in MALACH Project	Jun 15, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Transformer-based Model for ASR N-Best Rescoring and Rewriting	Jun 12, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Transformer-based Online CTC/attention End-to-End Speech Recognition Architecture	Jan 15, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Transformer-based Streaming ASR with Cumulative Attention	Mar 11, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Transformer-Based Video Front-Ends for Audio-Visual Speech Recognition for Single and Multi-Person Video	Jan 25, 2022	Audio-Visual Speech RecognitionAutomatic Speech Recognition	—Unverified
Transformer-Transducers for Code-Switched Speech Recognition	Nov 30, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Transformer with Bidirectional Decoder for Speech Recognition	Aug 11, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Transforming NLU with Babylon: A Case Study in Development of Real-time, Edge-Efficient, Multi-Intent Translation System for Automated Drive-Thru Ordering	Nov 22, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Transliteration Better than Translation? Answering Code-mixed Questions over a Knowledge Base	Jul 1, 2018	Automatic Speech Recognition (ASR)Information Retrieval	—Unverified
TranUSR: Phoneme-to-word Transcoder Based Unified Speech Representation Learning for Cross-lingual Speech Recognition	May 23, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Tree-constrained Pointer Generator for End-to-end Contextual Speech Recognition	Sep 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Tree-constrained Pointer Generator with Graph Neural Network Encodings for Contextual Speech Recognition	Jul 2, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Tropical Modeling of Weighted Transducer Algorithms on Graphs	Nov 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
TRScore: A Novel GPT-based Readability Scorer for ASR Segmentation and Punctuation model evaluation and selection	Oct 27, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
t-SOT FNT: Streaming Multi-talker ASR with Text-only Domain Adaptation Capability	Sep 15, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
TTS Skins: Speaker Conversion via ASR	Apr 18, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
TUKE-BNews-SK: Slovak Broadcast News Corpus Construction and Evaluation	May 1, 2014	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Tutorial Proposal: End-to-End Speech Translation	Apr 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Two Front-Ends, One Model : Fusing Heterogeneous Speech Features for Low Resource ASR with Multilingual Pre-Training	Nov 16, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Two-pass Decoding and Cross-adaptation Based System Combination of End-to-end Conformer and Hybrid TDNN ASR Systems	Jun 23, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Two-Stage Augmentation and Adaptive CTC Fusion for Improved Robustness of Multi-Stream End-to-End ASR	Feb 5, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Two-Staged Acoustic Modeling Adaption for Robust Speech Recognition by the Example of German Oral History Interviews	Aug 19, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Multi-level Acoustic Feature Extraction Framework for Transformer Based End-to-End Speech Recognition	Aug 18, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
U2++ MoE: Scaling 4.7x parameters with minimal impact on RTF	Apr 25, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
UCorrect: An Unsupervised Framework for Automatic Speech Recognition Error Correction	Jan 11, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
UFO2: A unified pre-training framework for online and offline speech recognition	Oct 26, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
UME: Upcycling Mixture-of-Experts for Scalable and Efficient Automatic Speech Recognition	Dec 23, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
UML: A Universal Monolingual Output Layer for Multilingual ASR	Feb 22, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Understanding Semantics from Speech Through Pre-training	Sep 24, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Understanding Shared Speech-Text Representations	Apr 27, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Understanding the Role of Self Attention for Efficient Speech Recognition	Sep 29, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Understanding Zero-shot Rare Word Recognition Improvements Through LLM Integration	Feb 22, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unified Autoregressive Modeling for Joint End-to-End Multi-Talker Overlapped Speech Recognition and Speaker Attribute Estimation	Jul 4, 2021	Age EstimationAttribute	—Unverified
Unified End-to-End Speech Recognition and Endpointing for Fast and Efficient Speech Systems	Nov 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unified Modeling of Multi-Domain Multi-Device ASR Systems	May 13, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unified Modeling of Multi-Talker Overlapped Speech Recognition and Diarization with a Sidecar Separator	May 25, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unifying Streaming and Non-streaming Zipformer-based ASR	Jun 17, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unintended Memorization in Large ASR Models, and How to Mitigate It	Oct 18, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Universal-2-TF: Robust All-Neural Text Formatting for ASR	Jan 10, 2025	AllAutomatic Speech Recognition	—Unverified
Universal Adversarial Perturbations for Speech Recognition Systems	May 9, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Dual-mode ASR: Unify and Improve Streaming ASR with Full-context Modeling	Oct 12, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
UniverSLU: Universal Spoken Language Understanding for Diverse Tasks with Natural Language Instructions	Oct 4, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unmanned Aerial Vehicle Control Through Domain-based Automatic Speech Recognition	Sep 9, 2020	Action RecognitionAutomatic Speech Recognition	—Unverified
Unsupervised Active Learning: Optimizing Labeling Cost-Effectiveness for Automatic Speech Recognition	Aug 28, 2023	Active LearningAutomatic Speech Recognition	—Unverified
Unsupervised Adaptation with Domain Separation Networks for Robust Speech Recognition	Nov 21, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Adaptation with Interpretable Disentangled Representations for Distant Conversational Speech Recognition	Jun 13, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised and Efficient Vocabulary Expansion for Recurrent Neural Network Language Models in ASR	Jun 27, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised ASR via Cross-Lingual Pseudo-Labeling	May 19, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 36 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified