Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 576–600 of 3012 papers

Title	Date	Tasks	Status
A Multitask Training Approach to Enhance Whisper with Contextual Biasing and Open-Vocabulary Keyword Spotting	Sep 18, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR Rescoring and Confidence Estimation with ELECTRA	Oct 5, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR is all you need: cross-modal distillation for lip reading	Nov 28, 2019	AllAutomatic Speech Recognition	—Unverified
A Hierarchical Reasoning Graph Neural Network for The Automatic Scoring of Answer Transcriptions in Video Job Interviews	Dec 22, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR in German: A Detailed Error Analysis	Apr 12, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR-GLUE: A New Multi-task Benchmark for ASR-Robust Natural Language Understanding	Aug 30, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Hierarchical Neural Model for Learning Sequences of Dialogue Acts	Apr 1, 2017	Automatic Speech Recognition (ASR)Machine Translation	—Unverified
Acoustic Model Optimization Based On Evolutionary Stochastic Gradient Descent with Anchors for Automatic Speech Recognition	Jul 10, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR for Non-standardised Languages with Dialectal Variation: the case of Swiss German	Dec 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR for Documenting Acutely Under-Resourced Indigenous Languages	May 1, 2018	Automatic Speech Recognition (ASR)Language Modeling	—Unverified
A Hardware-Oriented and Memory-Efficient Method for CTC Decoding	May 8, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR-FAIRBENCH: Measuring and Benchmarking Equity Across Speech Recognition Systems	May 16, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR error management for improving spoken language understanding	May 26, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Agent-Aware Dropout DQN for Safe and Efficient On-line Dialogue Policy Learning	Sep 1, 2017	Automatic Speech Recognition (ASR)Dialogue Management	—Unverified
Acoustic Model Fusion for End-to-end Speech Recognition	Oct 10, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Accent Recognition with Hybrid Phonetic Features	May 5, 2021	Audio ClassificationAutomatic Speech Recognition	—Unverified
ASR Error Detection via Audio-Transcript entailment	Jul 22, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Genetic Programming Approach To Zero-Shot Neural Architecture Ranking	Oct 8, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR Error Correction using Large Language Models	Sep 14, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR Error Correction and Domain Adaptation Using Machine Translation	Mar 13, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Generative Model of a Pronunciation Lexicon for Hindi	May 6, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Acoustic Model Compression with MAP adaptation	May 1, 2017	Automatic Speech Recognition (ASR)model	—Unverified
ASR-EC Benchmark: Evaluating Large Language Models on Chinese ASR Error Correction	Dec 4, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR Bundestag: A Large-Scale political debate dataset in German	Feb 12, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A General Multi-Task Learning Framework to Leverage Text Data for Speech to Text Tasks	Oct 21, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 24 of 121Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified