Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2851–2900 of 3012 papers

Title	Date	Tasks	Status
Bayesian Learning of LF-MMI Trained Time Delay Neural Networks for Speech Recognition	Dec 8, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bayes Risk Transducer: Transducer with Controllable Alignment Prediction	Aug 19, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
BayesSpeech: A Bayesian Transformer Network for Automatic Speech Recognition	Jan 16, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
BBS-KWS:The Mandarin Keyword Spotting System Won the Video Keyword Wakeup Challenge	Dec 3, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
BCN2BRNO: ASR System Fusion for Albayzin 2020 Speech to Text Challenge	Jan 29, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
BEA-Base: A Benchmark for ASR of Spontaneous Hungarian	Feb 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
BEA-Base: A Benchmark for ASR of Spontaneous Hungarian	Jun 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
'Beach' to 'Bitch': Inadvertent Unsafe Transcription of Kids' Content on YouTube	Feb 17, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
BECTRA: Transducer-based End-to-End ASR with BERT-Enhanced Encoder	Nov 2, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Benchmarking Automatic Speech Recognition coupled LLM Modules for Medical Diagnostics	Feb 18, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Benchmarking Evaluation Metrics for Code-Switching Automatic Speech Recognition	Nov 22, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Benchmarking Foundation Speech and Language Models for Alzheimer's Disease and Related Dementia Detection from Spontaneous Speech	Jun 9, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Benchmarking Japanese Speech Recognition on ASR-LLM Setups with Multi-Pass Augmented Generative Error Correction	Aug 29, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Benchmarking LF-MMI, CTC and RNN-T Criteria for Streaming ASR	Nov 9, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Benchmarking Rotary Position Embeddings for Automatic Speech Recognition	Jan 10, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bengali Common Voice Speech Dataset for Automatic Speech Recognition	Jun 28, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Best of Both Worlds: Multi-task Audio-Visual Automatic Speech Recognition and Active Speaker Detection	May 10, 2022	Active Speaker DetectionAutomatic Speech Recognition	—Unverified
Best of Both Worlds: Robust Accented Speech Recognition with Adversarial Transfer Learning	Mar 10, 2021	Accented Speech RecognitionAutomatic Speech Recognition	—Unverified
Better Pseudo-labeling with Multi-ASR Fusion and Error Correction by SpeechLLM	Jun 5, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Better Transcription of UK Supreme Court Hearings	Nov 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Beyond Binary: Multiclass Paraphasia Detection with Generative Pretrained Transformers and End-to-End Models	Jul 16, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Beyond Manual Transcripts: The Potential of Automated Speech Recognition Errors in Improving Alzheimer's Disease Detection	May 26, 2025	Alzheimer's Disease DetectionAutomatic Speech Recognition	—Unverified
Beyond Universal Transformer: block reusing with adaptor in Transformer for automatic speech recognition	Mar 23, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bi-APC: Bidirectional Autoregressive Predictive Coding for Unsupervised Pre-training and Its Application to Children's ASR	Feb 12, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Biased Self-supervised learning for ASR	Nov 4, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bi-directional Context-Enhanced Speech Large Language Models for Multilingual Conversational ASR	Jun 16, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bidirectional Representations for Low Resource Spoken Language Understanding	Nov 24, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
BigSSL: Exploring the Frontier of Large-Scale Semi-Supervised Learning for Automatic Speech Recognition	Sep 27, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bilingual End-to-End ASR with Byte-Level Subwords	May 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bilingual Streaming ASR with Grapheme units and Auxiliary Monolingual Loss	Aug 11, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Binarized LSTM Language Model	Jun 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Catch Me If You Can: Blackbox Adversarial Attacks on Automatic Speech Recognition using Frequency Masking	Dec 3, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Blending LLMs into Cascaded Speech Translation: KIT's Offline Speech Translation System for IWSLT 2024	Jun 24, 2024	Action DetectionActivity Detection	—Unverified
Blending LSTMs into CNNs	Nov 19, 2015	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Blind and neural network-guided convolutional beamformer for joint denoising, dereverberation, and source separation	Aug 4, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Blind Signal Dereverberation for Machine Speech Recognition	Sep 30, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Blockwise Streaming Transformer for Spoken Language Understanding and Simultaneous Speech Translation	Apr 19, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
BLSTM-Based Confidence Estimation for End-to-End Speech Recognition	Dec 22, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Boosting Chinese ASR Error Correction with Dynamic Error Scaling Mechanism	Aug 7, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Boosting Code-Switching ASR with Mixture of Experts Enhanced Speech-Conditioned LLM	Sep 24, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Boosting End-to-End Multilingual Phoneme Recognition through Exploiting Universal Speech Attributes Constraints	Sep 16, 2023	AttributeAutomatic Speech Recognition	—Unverified
Boosting Noise Robustness of Acoustic Model via Deep Adversarial Training	May 2, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Boosting Norwegian Automatic Speech Recognition	Jul 4, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Boosting Punctuation Restoration with Data Generation and Reinforcement Learning	Jul 24, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Boosting the Transferability of Audio Adversarial Examples with Acoustic Representation Optimization	Mar 25, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bootstrap an end-to-end ASR system by multilingual training, transfer learning, text-to-text mapping and synthetic audio	Nov 25, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Brain Signals to Rescue Aphasia, Apraxia and Dysarthria Speech Recognition	Feb 28, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Breaking the Data Barrier: Towards Robust Speech Translation via Adversarial Stability Training	Sep 25, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Breaking the Transcription Bottleneck: Fine-tuning ASR Models for Extremely Low-Resource Fieldwork Languages	Jun 20, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Handling Trade-Offs in Speech Separation with Sparsely-Gated Mixture of Experts	Nov 11, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 58 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified