Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2151–2200 of 3012 papers

Title	Date	Tasks	Status
Multimodal Speaker Segmentation and Diarization using Lexical and Acoustic Cues via Sequence to Sequence Neural Networks	May 28, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multimodal Speech Recognition with Unstructured Audio Masking	Oct 16, 2020	8kAutomatic Speech Recognition	—Unverified
Multi-modal Summarization for Asynchronous Collection of Text, Image, Audio and Video	Sep 1, 2017	Automatic Speech Recognition (ASR)Document Summarization	—Unverified
Multi-mode Transformer Transducer with Stochastic Future Context	Jun 17, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multiple-hypothesis CTC-based semi-supervised adaptation of end-to-end speech recognition	Mar 29, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multiple-hypothesis RNN-T Loss for Unsupervised Fine-tuning and Self-training of Neural Transducer	Jul 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multiple Representation Transfer from Large Language Models to End-to-End ASR Systems	Sep 7, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multiple topic identification in human/human conversations	Dec 18, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
MultiQT: Multimodal Learning for Real-Time Question Tracking in Speech	May 2, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multiresolution and Multimodal Speech Recognition with Transformers	Apr 29, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-resolution location-based training for multi-channel continuous speech separation	Jan 16, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Alternate Intermediate Conditioning with Syllable-level and Character-level Targets for Japanese ASR	Apr 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-Span Acoustic Modelling using Raw Waveform Signals	Jun 21, 2019	Acoustic ModellingAutomatic Speech Recognition	—Unverified
Multi-Staged Cross-Lingual Acoustic Model Adaption for Robust Speech Recognition in Real-World Applications - A Case Study on German Oral History Interviews	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multistage Fine-tuning Strategies for Automatic Speech Recognition in Low-resource Languages	Nov 7, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-Stage Multi-Modal Pre-Training for Automatic Speech Recognition	Mar 28, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-stage Progressive Compression of Conformer Transducer for On-device Speech Recognition	Oct 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-Stream End-to-End Speech Recognition	Jun 17, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-style Training for South African Call Centre Audio	Feb 15, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-talker ASR for an unknown number of sources: Joint training of source counting, separation and ASR	Jun 4, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-Talker MVDR Beamforming Based on Extended Complex Gaussian Mixture Model	Oct 17, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multitask-Based Joint Learning Approach To Robust ASR For Radio Communication Speech	Jul 22, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-task Language Modeling for Improving Speech Recognition of Rare Words	Nov 23, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multitask Learning for Adaptive Quality Estimation of Automatically Transcribed Utterances	May 1, 2015	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-Task Learning for End-to-End ASR Word and Utterance Confidence with Deletion Prediction	Apr 26, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multitask Learning for Low Resource Spoken Language Understanding	Nov 24, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-task Learning Of Deep Neural Networks For Audio Visual Automatic Speech Recognition	Jan 10, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-task Learning of Spoken Language Understanding by Integrating N-Best Hypotheses with Hierarchical Attention	Dec 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-task Learning with Cross Attention for Keyword Spotting	Jul 15, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-task RNN-T with Semantic Decoder for Streamable Spoken Language Understanding	Apr 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-Task Self-Supervised Pre-Training for Music Classification	Feb 5, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-Temporal Lip-Audio Memory for Visual Speech Recognition	May 8, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-turn RNN-T for streaming recognition of multi-party speech	Dec 19, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-user VoiceFilter-Lite via Attentive Speaker Embedding	Jul 2, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-view Attention-based Speech Enhancement Model for Noise-robust Automatic Speech Recognition	Sep 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-view Frequency LSTM: An Efficient Frontend for Automatic Speech Recognition	Jun 30, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
MuST-C: a Multilingual Speech Translation Corpus	Jun 1, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Mutually-Constrained Monotonic Multihead Attention for Online ASR	Mar 26, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
NAS-Bench-ASR: Reproducible Neural Architecture Search for Speech Recognition	Jan 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Natural Language Interactions in Autonomous Vehicles: Intent Detection and Slot Filling from Passenger Utterances	Apr 23, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
N-best T5: Robust ASR Error Correction using Multiple Input Hypotheses and Constrained Decoding Space	Mar 1, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
NeMo: a toolkit for building AI applications using Neural Modules	Sep 14, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
NEST-RQ: Next Token Prediction for Speech Self-Supervised Pre-Training	Sep 13, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Neural Architecture Search For LF-MMI Trained Time Delay Neural Networks	Jul 17, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Neural Kalman Filtering for Speech Enhancement	Jul 28, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Neural Machine Translation for Multilingual Grapheme-to-Phoneme Conversion	Jun 25, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Neural model robustness for skill routing in large-scale conversational AI systems: A design choice exploration	Mar 4, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Neural Morphological Analysis: Encoding-Decoding Canonical Segments	Nov 1, 2016	Automatic Speech Recognition (ASR)Keyword Spotting	—Unverified
Neural Network Architectures for Arabic Dialect Identification	Aug 1, 2018	Automatic Speech Recognition (ASR)Dialect Identification	—Unverified
Neural Network-Based Modeling of Phonetic Durations	Sep 6, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 44 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified