Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2351–2400 of 3012 papers

Title	Date	Tasks	Status
Using Large Language Model for End-to-End Chinese ASR and NER	Jan 21, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Using multiple ASR hypotheses to boost i18n NLU performance	Dec 7, 2020	Abstractive Text SummarizationAutomatic Speech Recognition	—Unverified
Using multi-task learning to improve the performance of acoustic-to-word and conventional hybrid models	Feb 2, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Using Related Languages to Enhance Statistical Language Models	Jun 1, 2016	Automatic Speech Recognition (ASR)Domain Adaptation	—Unverified
Using Spoken Word Posterior Features in Neural Machine Translation	Oct 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Using Synthetic Audio to Improve The Recognition of Out-Of-Vocabulary Words in End-To-End ASR Systems	Nov 23, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Using Text Injection to Improve Recognition of Personal Identifiers in Speech	Aug 14, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Using the TED Talks to Evaluate Spoken Post-editing of Machine Translation	May 1, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
USM-Lite: Quantization and Sparsity Aware Fine-tuning for Speech Recognition with Universal Speech Models	Dec 13, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Utterance Intent Classification of a Spoken Dialogue System with Efficiently Untied Recursive Autoencoders	Aug 1, 2017	Automatic Speech Recognition (ASR)Classification	—Unverified
Utterance-level neural confidence measure for end-to-end children speech recognition	Sep 16, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Utterance-Wise Meeting Transcription System Using Asynchronous Distributed Microphones	Jul 31, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
V2S attack: building DNN-based voice conversion from automatic speaker verification	Aug 5, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
VAD-free Streaming Hybrid CTC/Attention ASR for Unsegmented Recording	Jul 15, 2021	Action DetectionActivity Detection	—Unverified
VADOI:Voice-Activity-Detection Overlapping Inference For End-to-end Long-form Speech Recognition	Feb 22, 2022	Action DetectionActivity Detection	—Unverified
VAIS ASR: Building a conversational speech recognition system using language model combination	Oct 12, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
VAKTA-SETU: A Speech-to-Speech Machine Translation Service in Select Indic Languages	May 21, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ValSub: Subsampling Validation Data to Mitigate Forgetting during ASR Personalization	Mar 12, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
VarArray Meets t-SOT: Advancing the State of the Art of Streaming Distant Conversational Speech Recognition	Sep 12, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
V-Cloak: Intelligibility-, Naturalness- & Timbre-Preserving Real-Time Voice Anonymization	Oct 27, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
VietASR: Achieving Industry-level Vietnamese ASR with 50-hour labeled data and Large-Scale Speech Pretraining	May 23, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
VILAS: Exploring the Effects of Vision and Language Context in Automatic Speech Recognition	May 31, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ViraPart: A Text Refinement Framework for Automatic Speech Recognition and Natural Language Processing Tasks in Persian	Oct 18, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Virtuoso: Massive Multilingual Speech-Text Joint Semi-Supervised Learning for Text-To-Speech	Oct 27, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Visual-Aware Speech Recognition for Noisy Scenarios	Apr 9, 2025	Audio-Visual Speech RecognitionAutomatic Speech Recognition	—Unverified
Visual Information Matters for ASR Error Correction	Mar 16, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Visualizing Automatic Speech Recognition -- Means for a Better Understanding?	Feb 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Voice Conversion by Cascading Automatic Speech Recognition and Text-to-Speech Synthesis with Prosody Transfer	Sep 3, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Voice Privacy with Smart Digital Assistants in Educational Settings	Mar 24, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Voice Quality and Pitch Features in Transformer-Based Speech Recognition	Dec 21, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Voice Query Auto Completion	Nov 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
VoxArabica: A Robust Dialect-Aware Arabic Speech Recognition System	Oct 17, 2023	Arabic Speech RecognitionAutomatic Speech Recognition	—Unverified
VoxHakka: A Dialectally Diverse Multi-speaker Text-to-Speech System for Taiwanese Hakka	Sep 3, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
VQ-CTAP: Cross-Modal Fine-Grained Sequence Representation Learning for Speech Processing	Aug 11, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
WaBERT: A Low-resource End-to-end Model for Spoken Language Understanding and Speech-to-BERT Alignment	Apr 22, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Warped Language Models for Noise Robust Language Understanding	Nov 3, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Wav2code: Restore Clean Speech Representations via Codebook Lookup for Noise-Robust ASR	Apr 11, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Wav2Prompt: End-to-End Speech Prompt Generation and Tuning For LLM in Zero and Few-shot Learning	Jun 1, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
wav2vec and its current potential to Automatic Speech Recognition in German for the usage in Digital History: A comparative assessment of available ASR-technologies for the use in cultural heritage contexts	Mar 6, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Wav2vec-S: Semi-Supervised Pre-Training for Low-Resource ASR	Oct 9, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Wav2vec-Switch: Contrastive Learning from Original-noisy Speech Pairs for Robust Speech Recognition	Oct 11, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
W-CTC: a Connectionist Temporal Classification Loss with Wild Cards	Sep 29, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Weak-Attention Suppression For Transformer Based Speech Recognition	May 18, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Weakly Supervised Construction of ASR Systems with Massive Video Data	Aug 4, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Weight Averaging: A Simple Yet Effective Method to Overcome Catastrophic Forgetting in Automatic Speech Recognition	Oct 27, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Weighted-Sampling Audio Adversarial Example Attack	Jan 26, 2019	Adversarial AttackAutomatic Speech Recognition	—Unverified
WER-BERT: Automatic WER Estimation with BERT in a Balanced Ordinal Classification Paradigm	Jan 14, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
WERd: Using Social Text Spelling Variants for Evaluating Dialectal Speech Recognition	Sep 21, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
WER we are and WER we think we are	Oct 7, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
WER We Stand: Benchmarking Urdu ASR Models	Sep 17, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 48 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified