Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2226–2250 of 3012 papers

Title	Date	Tasks	Status
Quaternion Neural Networks for Multi-channel Distant Speech Recognition	May 18, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
An Effective End-to-End Modeling Approach for Mispronunciation Detection	May 18, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
AccentDB: A Database of Non-Native English Accents to Assist Neural Speech Recognition	May 16, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Reducing Spelling Inconsistencies in Code-Switching ASR using Contextualized CTC Loss	May 16, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
That Sounds Familiar: an Analysis of Phonetic Representations Transfer Across Languages	May 16, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Dynamic Sparsity Neural Networks for Automatic Speech Recognition	May 16, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Contextualizing ASR Lattice Rescoring with Hybrid Pointer Network Language Model	May 15, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Context-Dependent Acoustic Modeling without Explicit Phone Clustering	May 15, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Coupled Training of Sequence-to-Sequence Models for Accented Speech Recognition	May 14, 2020	Accented Speech RecognitionAutomatic Speech Recognition	CodeCode Available
You Do Not Need More Data: Improving End-To-End Speech Recognition by Text-To-Speech Data Augmentation	May 14, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Automatic Estimation of Intelligibility Measure for Consonants in Speech	May 12, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
DiscreTalk: Text-to-Speech as a Machine Translation Problem	May 12, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Incremental Learning for End-to-End Automatic Speech Recognition	May 11, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
RNN-T Models Fail to Generalize to Out-of-Domain Audio: Causes and Solutions	May 7, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The Perceptimatic English Benchmark for Speech Perception Models	May 7, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Fast and Robust Unsupervised Contextual Biasing for Speech Recognition	May 4, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Does Visual Self-Supervision Improve Learning of Speech Representations for Emotion Recognition?	May 4, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
MultiQT: Multimodal Learning for Real-Time Question Tracking in Speech	May 2, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving the Language Model for Low-Resource ASR with Online Text Corpora	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-Staged Cross-Lingual Acoustic Model Adaption for Robust Speech Recognition in Real-World Applications - A Case Study on German Oral History Interviews	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Challenges of Applying Automatic Speech Recognition for Transcribing EU Parliament Committee Meetings: A Pilot Study	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Preparation of Bangla Speech Corpus from Publicly Available Audio \& Text	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Automatic Transcription Challenges for Inuktitut, a Low-Resource Polysynthetic Language	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Crossing the SSH Bridge with Interview Data	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
An Investigative Study of Multi-Modal Cross-Lingual Retrieval	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 90 of 121Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified