Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 751–800 of 3012 papers

Title	Date	Tasks	Status
ATCSpeech: a multilingual pilot-controller speech corpus from real Air Traffic Control environment	Nov 26, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Learning Video Representations using Contrastive Bidirectional Transformer	Jun 13, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Contrastive Semi-supervised Learning for ASR	Mar 9, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Contribution \`a l'\'etude de la variabilit\'e de la voix des personnes \^ag\'ees en reconnaissance automatique de la parole (Contribution to the study of elderly people's voice variability in automatic speech recognition) [in French]	Jun 1, 2012	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Controllable Time-Delay Transformer for Real-Time Punctuation Prediction and Disfluency Detection	Mar 3, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Corpus and Phonetic Dictionary for Tunisian Arabic Speech Recognition	May 1, 2014	Arabic Speech RecognitionAutomatic Speech Recognition	—Unverified
Conversational Speech Recognition By Learning Conversation-level Characteristics	Feb 16, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Conversational Speech Recognition by Learning Audio-textual Cross-modal Contextual Representation	Oct 22, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Causal Structure Discovery for Error Diagnostics of Children's ASR	May 31, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Conversational Speech Recognition Needs Data? Experiments with Austrian German	Jun 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Causal Analysis of ASR Errors for Children: Quantifying the Impact of Physiological, Cognitive, and Extrinsic Factors	Feb 12, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Convolutional Speech Recognition with Pitch and Voice Quality Features	Sep 2, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Convolutional Variational Autoencoders for Spectrogram Compression in Automatic Speech Recognition	Oct 3, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Conv-Transformer Transducer: Low Latency, Low Frame Rate, Streamable End-to-End Speech Recognition	Aug 13, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Artie Bias Corpus: An Open Dataset for Detecting Demographic Bias in Speech Applications	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Articulatory Features for ASR of Pathological Speech	Jul 28, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
CASSANDRA: A multipurpose configurable voice-enabled human-computer-interface	Apr 1, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Corpora for Cross-Language Information Retrieval in Six Less-Resourced Languages	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Corpus Generation for Voice Command in Smart Home and the Effect of Speech Synthesis on End-to-End SLU	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Corpus Phonetics Tutorial	Nov 13, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Adversarial Training for Multilingual Acoustic Modeling	Jun 17, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Correction Focused Language Model Training for Speech Recognition	Oct 17, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
MultiMed: Multilingual Medical Speech Recognition via Attention Encoder Decoder	Sep 21, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Correlated Bigram LSA for Unsupervised Language Model Adaptation	Dec 1, 2008	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Correlation Distance Skip Connection Denoising Autoencoder (CDSK-DAE) for Speech Feature Enhancement	Jul 26, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
COSMIC: Data Efficient Instruction-tuning For Speech In-Context Learning	Nov 3, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
CoSTA: Code-Switched Speech Translation using Aligned Speech-Text Interleaving	Jun 16, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Alignment Knowledge Distillation for Online Streaming Attention-based Speech Recognition	Feb 28, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Learning Speech Representation From Contrastive Token-Acoustic Pretraining	Sep 1, 2023	Audio ClassificationAutomatic Speech Recognition	—Unverified
CPT-Boosted Wav2vec2.0: Towards Noise Robust Speech Recognition for Classroom Environments	Sep 13, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
CR-CTC: Consistency regularization on CTC for improved speech recognition	Oct 7, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Creating Lithuanian and Latvian Speech Corpora from Inaccurately Annotated Web Data	May 1, 2018	Automatic Speech Recognition (ASR)Language Modeling	—Unverified
Creating Spoken Dialog Systems in Ultra-Low Resourced Settings	Dec 11, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Critical Appraisal of Artificial Intelligence-Mediated Communication	May 15, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Articulatory and bottleneck features for speaker-independent ASR of dysarthric speech	May 16, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Cross-attention conformer for context modeling in speech enhancement for ASR	Oct 30, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Cross-domain Single-channel Speech Enhancement Model with Bi-projection Fusion Module for Noise-robust ASR	Aug 26, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Attentive listening system with backchanneling, response generation and flexible turn-taking	Aug 1, 2017	Automatic Speech Recognition (ASR)Response Generation	—Unverified
Crossing the SSH Bridge with Interview Data	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Cross-lingual Embedding Clustering for Hierarchical Softmax in Low-Resource Multilingual Speech Recognition	Jan 29, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Cascade RNN-Transducer: Syllable Based Streaming On-device Mandarin Speech Recognition with a Syllable-to-Character Converter	Nov 17, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Cross-lingual studies of ASR errors: paradigms for perceptual evaluations	May 1, 2012	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Cross-modal Alignment with Optimal Transport for CTC-based ASR	Sep 24, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Cross-Modal ASR Post-Processing System for Error Correction and Utterance Rejection	Jan 10, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A review of on-device fully neural end-to-end automatic speech recognition algorithms	Dec 14, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Cross-Modal Transformer-Based Neural Correction Models for Automatic Speech Recognition	Jul 4, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Cross-utterance Reranking Models with BERT and Graph Convolutional Networks for Conversational Speech Recognition	Jun 13, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Cross-Utterance Language Models with Acoustic Error Sampling	Aug 19, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Cascaded Models With Cyclic Feedback For Direct Speech Translation	Oct 21, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Cascaded encoders for unifying streaming and non-streaming ASR	Oct 27, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 16 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified