Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2551–2600 of 3012 papers

Title	Date	Tasks	Status	Hype
Stream attention-based multi-array end-to-end speech recognition	Nov 12, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Reinforcement Learning Based Speech Enhancement for Robust Speech Recognition	Nov 10, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Improving End-to-end Speech Recognition with Pronunciation-assisted Sub-word Modeling	Nov 10, 2018	Automatic Speech Recognition (ASR)speech-recognition	—Unverified	0
Multimodal Grounding for Sequence-to-Sequence Speech Recognition	Nov 9, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Confusion2Vec: Towards Enriching Vector Space Word Representations with Representational Ambiguities	Nov 8, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
CNN-based MultiChannel End-to-End Speech Recognition for everyday home environments	Nov 7, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Analysis of Multilingual Sequence-to-Sequence speech recognition systems	Nov 7, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Bidirectional Quaternion Long-Short Term Memory Recurrent Neural Networks for Speech Recognition	Nov 6, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Discriminative training of RNNLMs with the average word error criterion	Nov 6, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
When CTC Training Meets Acoustic Landmarks	Nov 5, 2018	Automatic Speech Recognition (ASR)Speech Recognition	—Unverified	0
End-to-End Monaural Multi-speaker ASR System without Pretraining	Nov 5, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Leveraging Weakly Supervised Data to Improve End-to-End Speech-to-Text Translation	Nov 5, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Adversarial Black-Box Attacks on Automatic Speech Recognition Systems using Multi-Objective Evolutionary Optimization	Nov 4, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Improving the Robustness of Speech Translation	Nov 2, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Cycle-consistency training for end-to-end speech recognition	Nov 2, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Training Neural Speech Recognition Systems with Synthetic Speech Augmentation	Nov 2, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Adversarial Training of End-to-end Speech Recognition Using a Criticizing Language Model	Nov 2, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Introspection for convolutional automatic speech recognition	Nov 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Sisyphus, a Workflow Manager Designed for Machine Translation and Automatic Speech Recognition	Nov 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
How2: A Large-scale Dataset for Multimodal Language Understanding	Nov 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Tropical Modeling of Weighted Transducer Algorithms on Graphs	Nov 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
End-to-End Feedback Loss in Speech Chain Framework via Straight-Through Estimator	Oct 31, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Towards End-to-End Code-Switching Speech Recognition	Oct 31, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Towards End-to-end Automatic Code-Switching Speech Recognition	Oct 30, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Bi-Directional Lattice Recurrent Neural Networks for Confidence Estimation	Oct 30, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Contextual Speech Recognition with Difficult Negative Training Examples	Oct 29, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Cascaded CNN-resBiLSTM-CTC: An End-to-End Acoustic Model For Speech Recognition	Oct 29, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Language Modeling for Code-Switching: Evaluation, Integration of Monolingual Data, and Discriminative Training	Oct 28, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Speaker Selective Beamformer with Keyword Mask Estimation	Oct 25, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
The MeMAD Submission to the IWSLT 2018 Speech Translation Task	Oct 24, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
A Deep Generative Acoustic Model for Compositional Automatic Speech Recognition	Oct 23, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Semi-supervised acoustic model training for speech with code-switching	Oct 23, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Transferable and Configurable Audio Adversarial Attack from Low-Level Features	Oct 22, 2018	Adversarial AttackAutomatic Speech Recognition	—Unverified	0
On the Inductive Bias of Word-Character-Level Multi-Task Learning for Speech Recognition	Oct 22, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
ROBUST SPEECH COMMAND RECOGNITION USING LABEL-DRIVEN TIME-FREQUENCY MASKING	Oct 22, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Cycle-Consistent GAN Front-End to Improve ASR Robustness to Perturbed Speech	Oct 22, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
How transferable are features in convolutional neural network acoustic models across languages?	Oct 22, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Targeted Adversarial Examples for Black Box Audio Systems	Oct 22, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Training Neural Speech Recognition Systems with Synthetic Speech Augmentation	Oct 22, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Exploring Textual and Speech information in Dialogue Act Classification with Speaker Domain Adaptation	Oct 17, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Speech Recognition with Quaternion Neural Networks	Oct 15, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Robust Neural Machine Translation with Joint Textual and Phonetic Embedding	Oct 15, 2018	Automatic Speech Recognition (ASR)Machine Translation	—Unverified	0
The Sogou-TIIC Speech Translation System for IWSLT 2018	Oct 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
The AFRL IWSLT 2018 Systems: What Worked, What Didn’t	Oct 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Using Spoken Word Posterior Features in Neural Machine Translation	Oct 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Neural Speech Translation at AppTek	Oct 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
會議語音辨識使用語者資訊之語言模型調適技術 (On the Use of Speaker-Aware Language Model Adaptation Techniques for Meeting Speech Recognition ) [In Chinese]	Oct 1, 2018	Automatic Speech Recognition (ASR)Language Modeling	—Unverified	0
探討聲學模型的合併技術與半監督鑑別式訓練於會議語音辨識之研究 (Investigating acoustic model combination and semi-supervised discriminative training for meeting speech recognition) [In Chinese]	Oct 1, 2018	Automatic Speech Recognition (ASR)speech-recognition	—Unverified	0
Research Challenges in Building a Voice-based Artificial Personal Shopper - Position Paper	Oct 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Improving Neural Language Models with Weight Norm Initialization and Regularization	Oct 1, 2018	Automatic Speech Recognition (ASR)Language Modeling	—Unverified	0

Show:10 25 50

← PrevPage 52 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified