Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1601–1650 of 3012 papers

Title	Date	Tasks	Status
Multitask Learning for Adaptive Quality Estimation of Automatically Transcribed Utterances	May 1, 2015	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-Task Learning for End-to-End ASR Word and Utterance Confidence with Deletion Prediction	Apr 26, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multitask Learning for Low Resource Spoken Language Understanding	Nov 24, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-task Learning Of Deep Neural Networks For Audio Visual Automatic Speech Recognition	Jan 10, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-task Learning of Spoken Language Understanding by Integrating N-Best Hypotheses with Hierarchical Attention	Dec 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-task Learning with Cross Attention for Keyword Spotting	Jul 15, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-task RNN-T with Semantic Decoder for Streamable Spoken Language Understanding	Apr 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-Task Self-Supervised Pre-Training for Music Classification	Feb 5, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-Temporal Lip-Audio Memory for Visual Speech Recognition	May 8, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-turn RNN-T for streaming recognition of multi-party speech	Dec 19, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-user VoiceFilter-Lite via Attentive Speaker Embedding	Jul 2, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-view Attention-based Speech Enhancement Model for Noise-robust Automatic Speech Recognition	Sep 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-view Frequency LSTM: An Efficient Frontend for Automatic Speech Recognition	Jun 30, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
MuST-C: a Multilingual Speech Translation Corpus	Jun 1, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Mutually-Constrained Monotonic Multihead Attention for Online ASR	Mar 26, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
NAS-Bench-ASR: Reproducible Neural Architecture Search for Speech Recognition	Jan 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Natural Language Interactions in Autonomous Vehicles: Intent Detection and Slot Filling from Passenger Utterances	Apr 23, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
N-best T5: Robust ASR Error Correction using Multiple Input Hypotheses and Constrained Decoding Space	Mar 1, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
NeMo: a toolkit for building AI applications using Neural Modules	Sep 14, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
NEST-RQ: Next Token Prediction for Speech Self-Supervised Pre-Training	Sep 13, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Neural Architecture Search For LF-MMI Trained Time Delay Neural Networks	Jul 17, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Neural Kalman Filtering for Speech Enhancement	Jul 28, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Neural Machine Translation for Multilingual Grapheme-to-Phoneme Conversion	Jun 25, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Neural model robustness for skill routing in large-scale conversational AI systems: A design choice exploration	Mar 4, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Neural Morphological Analysis: Encoding-Decoding Canonical Segments	Nov 1, 2016	Automatic Speech Recognition (ASR)Keyword Spotting	—Unverified
Neural Network Architectures for Arabic Dialect Identification	Aug 1, 2018	Automatic Speech Recognition (ASR)Dialect Identification	—Unverified
Neural Network-Based Modeling of Phonetic Durations	Sep 6, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Neural Network Language Modeling with Letter-based Features and Importance Sampling	Apr 15, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Neural Speech Translation at AppTek	Oct 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Neural Transducer Training: Reduced Memory Consumption with Sample-wise Computation	Nov 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Neural Zero-Inflated Quality Estimation Model For Automatic Speech Recognition System	Oct 3, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Neuro-SERKET: Development of Integrative Cognitive System through the Composition of Deep Probabilistic Generative Models	Oct 20, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
New Baseline in Automatic Speech Recognition for Northern S\'ami	Jan 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Nexus: An Omni-Perceptive And -Interactive Model for Language, Audio, And Vision	Feb 26, 2025	Audio SynthesisAutomatic Speech Recognition	—Unverified
NGPU-LM: GPU-Accelerated N-Gram Language Model for Context-Biasing in Greedy ASR Decoding	May 28, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Noise Flooding for Detecting Audio Adversarial Examples Against Automatic Speech Recognition	Dec 25, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Noise Masking Attacks and Defenses for Pretrained Speech Models	Apr 2, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Noise Robust IOA/CAS Speech Separation and Recognition System For The Third 'CHIME' Challenge	Sep 21, 2015	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Noisy Training Improves E2E ASR for the Edge	Jul 9, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Non-Autoregressive Chinese ASR Error Correction with Phonological Training	Jul 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Non-autoregressive End-to-end Approaches for Joint Automatic Speech Recognition and Spoken Language Understanding	Apr 21, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Non-Autoregressive Transformer ASR with CTC-Enhanced Decoder Input	Oct 28, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Listen and Fill in the Missing Letters: Non-Autoregressive Transformer for Speech Recognition	Nov 10, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Non-autoregressive Transformer-based End-to-end ASR using BERT	Apr 10, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Non-autoregressive Transformer with Unified Bidirectional Decoder for Automatic Speech Recognition	Sep 14, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Non-intrusive speech intelligibility prediction using automatic speech recognition derived measures	Oct 16, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Non-Parallel Voice Conversion for ASR Augmentation	Sep 15, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Nonparametric Bayesian Double Articulation Analyzer for Direct Language Acquisition from Continuous Speech Signals	Jun 22, 2015	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
NonverbalTTS: A Public English Corpus of Text-Aligned Nonverbal Vocalizations with Emotion Annotations for Text-to-Speech	Jul 17, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
No Pitch Left Behind: Addressing Gender Unbalance in Automatic Speech Recognition through Pitch Manipulation	Oct 10, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 33 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified