Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2151–2175 of 3012 papers

Title	Date	Tasks	Status
The ILMT-s2s Corpus â€• A Multimodal Interlingual Map Task Corpus	May 1, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The Impact of Code-switched Synthetic Data Quality is Task Dependent: Insights from MT and ASR	Mar 30, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The Indigenous Languages Technology project at NRC Canada: An empowerment-oriented approach to developing language software	Dec 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The IWSLT 2016 Evaluation Campaign	Dec 1, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The IWSLT 2021 BUT Speech Translation Systems	Jul 13, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The JHU Multi-Microphone Multi-Speaker ASR System for the CHiME-6 Challenge	Jun 14, 2020	Action DetectionActivity Detection	—Unverified
The Makerere Radio Speech Corpus: A Luganda Radio Corpus for Automatic Speech Recognition	Jun 20, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The MeMAD Submission to the IWSLT 2018 Speech Translation Task	Oct 24, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The Multicultural Medical Assistant: Can LLMs Improve Medical ASR Errors Across Borders?	Jan 25, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The Nijmegen Corpus of Casual Czech	May 1, 2014	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The Norwegian Parliamentary Speech Corpus	Jan 26, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The OCON model: an old but green solution for distributable supervised classification for acoustic monitoring in smart cities	Oct 5, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The Perceptimatic English Benchmark for Speech Perception Models	May 7, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The RoyalFlush System of Speech Recognition for M2MeT Challenge	Feb 3, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The SAFE-T Corpus: A New Resource for Simulated Public Safety Communications	May 1, 2020	Action DetectionActivity Detection	—Unverified
The Second DISPLACE Challenge : DIarization of SPeaker and LAnguage in Conversational Environments	Jun 13, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The SI TEDx-UM speech database: a new Slovenian Spoken Language Resource	May 1, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The Slovene BNSI Broadcast News database and reference speech corpus GOS: Towards the uniform guidelines for future work	May 1, 2014	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The Sogou-TIIC Speech Translation System for IWSLT 2018	Oct 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The Sound of Healthcare: Improving Medical Transcription ASR Accuracy with Large Language Models	Feb 12, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The State of Commercial Automatic French Legal Speech Recognition Systems and their Impact on Court Reporters et al	Aug 21, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The SUMMA Platform Prototype	Apr 1, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The THUEE System Description for the IARPA OpenASR21 Challenge	Jun 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The USFD Spoken Language Translation System for IWSLT 2014	Sep 13, 2015	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The WaveSurfer Automatic Speech Recognition Plugin	May 1, 2014	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 87 of 121Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified