Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1651–1675 of 3012 papers

Title	Date	Tasks	Status
The Sound of Healthcare: Improving Medical Transcription ASR Accuracy with Large Language Models	Feb 12, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The State of Commercial Automatic French Legal Speech Recognition Systems and their Impact on Court Reporters et al	Aug 21, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The SUMMA Platform Prototype	Apr 1, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The THUEE System Description for the IARPA OpenASR21 Challenge	Jun 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The USFD Spoken Language Translation System for IWSLT 2014	Sep 13, 2015	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The WaveSurfer Automatic Speech Recognition Plugin	May 1, 2014	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The WAW Corpus: The First Corpus of Interpreted Speeches and their Translations for English and Arabic	May 1, 2018	Automatic Speech Recognition (ASR)Machine Translation	—Unverified
The Xiaomi Text-to-Text Simultaneous Speech Translation System for IWSLT 2022	May 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The X-LANCE Technical Report for Interspeech 2024 Speech Processing Using Discrete Speech Unit Challenge	Apr 9, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The ZevoMOS entry to VoiceMOS Challenge 2022	Jun 15, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
"This is Houston. Say again, please". The Behavox system for the Apollo-11 Fearless Steps Challenge (phase II)	Aug 4, 2020	Action DetectionActivity Detection	—Unverified
Thoughts on the potential to compensate a hearing loss in noise	Feb 24, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Three-Module Modeling For End-to-End Spoken Language Understanding Using Pre-trained DNN-HMM-Based Acoustic-Phonetic Model	Apr 7, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Thutmose Tagger: Single-pass neural model for Inverse Text Normalization	Jul 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Tigrinya Automatic Speech recognition with Morpheme based recognition units	Jul 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Time and Tokens: Benchmarking End-to-End Speech Dysfluency Detection	Sep 20, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Time-Contrastive Learning Based Deep Bottleneck Features for Text-Dependent Speaker Verification	May 11, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Time-Domain Speech Enhancement for Robust Automatic Speech Recognition	Oct 24, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Tiny-Align: Bridging Automatic Speech Recognition and Large Language Model on the Edge	Nov 21, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
TLT-school: a Corpus of Non Native Children Speech	Jan 22, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
TODM: Train Once Deploy Many Efficient Supernet-Based RNN-T Compression For On-device ASR Models	Sep 5, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Token-Level Ensemble Distillation for Grapheme-to-Phoneme Conversion	Apr 6, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Token-Level Serialized Output Training for Joint Streaming ASR and ST Leveraging Textual Alignments	Jul 7, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
TokenSplit: Using Discrete Speech Representations for Direct, Refined, and Transcript-Conditioned Speech Separation and Recognition	Aug 21, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Topic Classification on Spoken Documents Using Deep Acoustic and Linguistic Features	Jun 16, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 67 of 121Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified