Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2001–2050 of 3012 papers

Title	Date	Tasks	Status
Speech Recognition by Simply Fine-tuning BERT	Jan 30, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
BCN2BRNO: ASR System Fusion for Albayzin 2020 Speech to Text Challenge	Jan 29, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Leveraging End-to-End ASR for Endangered Language Documentation: An Empirical Study on Yoloxóchitl Mixtec	Jan 26, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Streaming Models for Joint Speech Recognition and Translation	Jan 22, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Exploiting Beam Search Confidence for Energy-Efficient Speech Recognition	Jan 22, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Arabic Speech Recognition by End-to-End, Modular Systems and Human	Jan 21, 2021	Arabic Speech RecognitionAutomatic Speech Recognition	CodeCode Available
Efficiently Fusing Pretrained Acoustic and Linguistic Encoders for Low-resource Speech Recognition	Jan 17, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
An evaluation of word-level confidence estimation for end-to-end automatic speech recognition	Jan 14, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Fast offline Transformer-based end-to-end automatic speech recognition for real-world applications	Jan 14, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
WER-BERT: Automatic WER Estimation with BERT in a Balanced Ordinal Classification Paradigm	Jan 14, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Hypothesis Stitcher for End-to-End Speaker-attributed ASR on Long-form Multi-talker Recordings	Jan 6, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
NAS-Bench-ASR: Reproducible Neural Architecture Search for Speech Recognition	Jan 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Why Does Decentralized Training Outperform Synchronous Training In The Large Batch Setting?	Jan 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Learning without Forgetting: Task Aware Multitask Learning for Multi-Modality Tasks	Jan 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-channel Multi-frame ADL-MVDR for Target Speech Separation	Dec 24, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Hierarchical Reasoning Graph Neural Network for The Automatic Scoring of Answer Transcriptions in Video Job Interviews	Dec 22, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Adversarial Meta Sampling for Multilingual Low-Resource Speech Recognition	Dec 22, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Adjust-free adversarial example generation in speech recognition using evolutionary multi-objective optimization under black-box condition	Dec 21, 2020	Adversarial AttackAutomatic Speech Recognition	—Unverified
Toward Streaming ASR with Non-Autoregressive Insertion-based Model	Dec 18, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
User-friendly automatic transcription of low-resource languages: Plugging ESPnet into Elpis	Dec 15, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Exploring Transfer Learning For End-to-End Spoken Language Understanding	Dec 15, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A review of on-device fully neural end-to-end automatic speech recognition algorithms	Dec 14, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Less Is More: Improved RNN-T Decoding Using Limited Label Context and Path Merging	Dec 12, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improved Robustness to Disfluencies in RNN-Transducer Based Speech Recognition	Dec 11, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
On Knowledge Distillation for Direct Speech Translation	Dec 9, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bayesian Learning of LF-MMI Trained Time Delay Neural Networks for Speech Recognition	Dec 8, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
MLS: A Large-Scale Multilingual Dataset for Speech Research	Dec 7, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Using multiple ASR hypotheses to boost i18n NLU performance	Dec 7, 2020	Abstractive Text SummarizationAutomatic Speech Recognition	—Unverified
End to End ASR System with Automatic Punctuation Insertion	Dec 3, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
On-Device detection of sentence completion for voice assistants with low-memory footprint	Dec 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
German-Arabic Speech-to-Speech Translation for Psychiatric Diagnosis	Dec 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sparse Transcription	Dec 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR for Non-standardised Languages with Dialectal Variation: the case of Swiss German	Dec 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Comprehensive Evaluation of Incremental Speech Recognition and Diarization for Conversational AI	Dec 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Multi-task Learning of Spoken Language Understanding by Integrating N-Best Hypotheses with Hierarchical Attention	Dec 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The Indigenous Languages Technology project at NRC Canada: An empowerment-oriented approach to developing language software	Dec 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Attentively Embracing Noise for Robust Latent Representation in BERT	Dec 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
100,000 Podcasts: A Spoken English Document Corpus	Dec 1, 2020	3D Facial Landmark LocalizationAutomatic Speech Recognition	—Unverified
Transformer-Transducers for Code-Switched Speech Recognition	Nov 30, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving accuracy of rare words for RNN-Transducer through unigram shallow fusion	Nov 30, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Domain Adaptation for Speech Recognition via Uncertainty Driven Self-Training	Nov 26, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bootstrap an end-to-end ASR system by multilingual training, transfer learning, text-to-text mapping and synthetic audio	Nov 25, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Adam^+: A Stochastic Method with Adaptive Variance Reduction	Nov 24, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-task Language Modeling for Improving Speech Recognition of Rare Words	Nov 23, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Using Synthetic Audio to Improve The Recognition of Out-Of-Vocabulary Words in End-To-End ASR Systems	Nov 23, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving RNN-T ASR Accuracy Using Context Audio	Nov 20, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
WPD++: An Improved Neural Beamformer for Simultaneous Speech Separation and Dereverberation	Nov 18, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Cascade RNN-Transducer: Syllable Based Streaming On-device Mandarin Speech Recognition with a Syllable-to-Character Converter	Nov 17, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Refining Automatic Speech Recognition System for older adults	Nov 17, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Audio-visual Multi-channel Integration and Recognition of Overlapped Speech	Nov 16, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 41 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified