Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 551–600 of 3012 papers

Title	Date	Tasks	Status
A Study on the Integration of Pipeline and E2E SLU systems for Spoken Semantic Parsing toward STOP Quality Challenge	May 2, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A study on native American English speech recognition by Indian listeners with varying word familiarity level	Dec 8, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Acoustics-guided evaluation (AGE): a new measure for estimating performance of speech enhancement algorithms for robust ASR	Nov 28, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Study on Lip Localization Techniques used for Lip reading from a Video	Sep 28, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Study of Non-autoregressive Model for Sequence Generation	Apr 22, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bonseyes AI Pipeline -- bringing AI to you. End-to-end integration of data, algorithms and deployment tools	Jan 15, 2019	Automatic Speech Recognition (ASR)image-classification	—Unverified
A Study of Gender Impact in Self-supervised Models for Speech-to-Text Systems	Apr 4, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Ain't Misbehavin' -- Using LLMs to Generate Expressive Robot Behavior in Conversations with the Tabletop Robot Haru	Feb 18, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Acoustics Based Intent Recognition Using Discovered Phonetic Units for Low Resource Languages	Nov 7, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Accurate and Structured Pruning for Efficient Automatic Speech Recognition	May 31, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Study of All-Convolutional Encoders for Connectionist Temporal Classification	Oct 28, 2017	AllAutomatic Speech Recognition	—Unverified
A Study into Pre-training Strategies for Spoken Language Understanding on Dysarthric Speech	Jun 15, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Acoustic-Phonetic Approach for ASR of Less Resourced Languages Using Monolingual and Cross-Lingual Information	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASTRA: Aligning Speech and Text Representations for Asr without Sampling	Jun 10, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASTER: Automatic Speech Recognition System Accessibility Testing for Stutterers	Aug 30, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Accent-Robust Automatic Speech Recognition Using Supervised and Unsupervised Wav2vec Embeddings	Oct 7, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Highly Efficient Distributed Deep Learning System For Automatic Speech Recognition	Jul 10, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Assessing the Tolerance of Neural Machine Translation Systems Against Speech Recognition Errors	Apr 24, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Acoustic Model Optimization over Multiple Data Sources: Merging and Valuation	Oct 21, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Assessing the Performance of Automatic Speech Recognition Systems When Used by Native and Non-Native Speakers of Three Major Languages in Dictation Workflows	May 1, 2015	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Assessing ASR Model Quality on Disordered Speech using BERTScore	Sep 21, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A higher order Minkowski loss for improved prediction ability of acoustic model in ASR	Dec 2, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
LegoSLM: Connecting LLM with Speech Encoder using CTC Posteriors	May 16, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Analysis of Deep Clustering as Preprocessing for Automatic Speech Recognition of Sparsely Overlapping Speech	May 9, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Causal Analysis of ASR Errors for Children: Quantifying the Impact of Physiological, Cognitive, and Extrinsic Factors	Feb 12, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Multitask Training Approach to Enhance Whisper with Contextual Biasing and Open-Vocabulary Keyword Spotting	Sep 18, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR Rescoring and Confidence Estimation with ELECTRA	Oct 5, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR is all you need: cross-modal distillation for lip reading	Nov 28, 2019	AllAutomatic Speech Recognition	—Unverified
A Hierarchical Reasoning Graph Neural Network for The Automatic Scoring of Answer Transcriptions in Video Job Interviews	Dec 22, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR in German: A Detailed Error Analysis	Apr 12, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR-GLUE: A New Multi-task Benchmark for ASR-Robust Natural Language Understanding	Aug 30, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Hierarchical Neural Model for Learning Sequences of Dialogue Acts	Apr 1, 2017	Automatic Speech Recognition (ASR)Machine Translation	—Unverified
Acoustic Model Optimization Based On Evolutionary Stochastic Gradient Descent with Anchors for Automatic Speech Recognition	Jul 10, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR for Non-standardised Languages with Dialectal Variation: the case of Swiss German	Dec 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR for Documenting Acutely Under-Resourced Indigenous Languages	May 1, 2018	Automatic Speech Recognition (ASR)Language Modeling	—Unverified
A Hardware-Oriented and Memory-Efficient Method for CTC Decoding	May 8, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR-FAIRBENCH: Measuring and Benchmarking Equity Across Speech Recognition Systems	May 16, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR error management for improving spoken language understanding	May 26, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Agent-Aware Dropout DQN for Safe and Efficient On-line Dialogue Policy Learning	Sep 1, 2017	Automatic Speech Recognition (ASR)Dialogue Management	—Unverified
Acoustic Model Fusion for End-to-end Speech Recognition	Oct 10, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Accent Recognition with Hybrid Phonetic Features	May 5, 2021	Audio ClassificationAutomatic Speech Recognition	—Unverified
ASR Error Detection via Audio-Transcript entailment	Jul 22, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Genetic Programming Approach To Zero-Shot Neural Architecture Ranking	Oct 8, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR Error Correction using Large Language Models	Sep 14, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR Error Correction and Domain Adaptation Using Machine Translation	Mar 13, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Generative Model of a Pronunciation Lexicon for Hindi	May 6, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Acoustic Model Compression with MAP adaptation	May 1, 2017	Automatic Speech Recognition (ASR)model	—Unverified
ASR-EC Benchmark: Evaluating Large Language Models on Chinese ASR Error Correction	Dec 4, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR Bundestag: A Large-Scale political debate dataset in German	Feb 12, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A General Multi-Task Learning Framework to Leverage Text Data for Speech to Text Tasks	Oct 21, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 12 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified