Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2776–2800 of 3012 papers

Title	Date	Tasks	Status
Speech- and Text-driven Features for Automated Scoring of English Speaking Tasks	Sep 1, 2017	Automatic Speech Recognition (ASR)Speech Recognition	—Unverified
Agent-Aware Dropout DQN for Safe and Efficient On-line Dialogue Policy Learning	Sep 1, 2017	Automatic Speech Recognition (ASR)Dialogue Management	—Unverified
Towards Quantum Language Models	Sep 1, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-modal Summarization for Asynchronous Collection of Text, Image, Audio and Video	Sep 1, 2017	Automatic Speech Recognition (ASR)Document Summarization	—Unverified
Information Theoretic Analysis of DNN-HMM Acoustic Modeling	Aug 29, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
An Improved Residual LSTM Architecture for Acoustic Modeling	Aug 17, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Dialogue Act Segmentation for Vietnamese Human-Human Conversational Texts	Aug 16, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Language Identification Using Deep Convolutional Recurrent Neural Networks	Aug 16, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Massively Multilingual Neural Grapheme-to-Phoneme Conversion	Aug 4, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Utterance Intent Classification of a Spoken Dialogue System with Efficiently Untied Recursive Autoencoders	Aug 1, 2017	Automatic Speech Recognition (ASR)Classification	—Unverified
Attentive listening system with backchanneling, response generation and flexible turn-taking	Aug 1, 2017	Automatic Speech Recognition (ASR)Response Generation	—Unverified
Progressive Joint Modeling in Unsupervised Single-channel Overlapped Speech Recognition	Jul 21, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Fast and Accurate OOV Decoder on High-Level Features	Jul 19, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Single-Channel Multi-talker Speech Recognition with Permutation Invariant Training	Jul 19, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Domain Adaptation for Robust Speech Recognition via Variational Autoencoder-Based Data Augmentation	Jul 19, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Encoding Word Confusion Networks with Recurrent Neural Networks for Dialog State Tracking	Jul 18, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Listening while Speaking: Speech Chain by Deep Learning	Jul 16, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Predicting Causes of Reformulation in Intelligent Assistants	Jul 13, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Automatic Speech Recognition with Very Large Conversational Finnish and Estonian Vocabularies	Jul 13, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Submodular Rank Aggregation on Score-based Permutations	Jul 4, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Improving LSTM-CTC based ASR performance in domains with limited training data	Jul 3, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Joint CTC/attention decoding for end-to-end speech recognition	Jul 1, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Automatic Quality Estimation for ASR System Combination	Jun 22, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Modelling prosodic structure using Artificial Neural Networks	Jun 13, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
End-to-end neural networks for subvocal speech recognition	Jun 11, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 112 of 121Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified