Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2301–2350 of 3012 papers

Title	Date	Tasks	Status
Deep Neural Networks for Automatic Speech Processing: A Survey from Large Corpora to Limited Data	Mar 9, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving Uyghur ASR systems with decoders using morpheme-based language models	Mar 3, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Controllable Time-Delay Transformer for Real-Time Punctuation Prediction and Disfluency Detection	Mar 3, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
SkinAugment: Auto-Encoding Speaker Conversions for Automatic Speech Translation	Feb 27, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
A Density Ratio Approach to Language Model Fusion in End-To-End Automatic Speech Recognition	Feb 26, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Distributed Training of Deep Neural Network Acoustic Models for Automatic Speech Recognition	Feb 24, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Attention-based ASR with Lightweight and Dynamic Convolutions	Feb 20, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
RTMobile: Beyond Real-Time Mobile Acceleration of RNNs for Speech Recognition	Feb 19, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Gradient-Adjusted Neuron Activation Profiles for Comprehensive Introspection of Convolutional Speech Recognition Models	Feb 19, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Speech Corpus of Ainu Folklore and End-to-end Speech Recognition for Ainu Language	Feb 16, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Speaker Adaptation using Attention-based Speaker Memory for End-to-End ASR	Feb 14, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Looking Enhances Listening: Recovering Missing Speech Using Images	Feb 13, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Attentional Speech Recognition Models Misbehave on Out-of-domain Utterances	Feb 12, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Robust Multi-channel Speech Recognition using Frequency Aligned Network	Feb 6, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Continuous Silent Speech Recognition using EEG	Feb 6, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Generating diverse and natural text-to-speech samples using a quantized fine-grained VAE and auto-regressive prosody prior	Feb 6, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
End-to-End Automatic Speech Recognition Integrated With CTC-Based Voice Activity Detection	Feb 3, 2020	Action DetectionActivity Detection	—Unverified
Dialogue-Based Simulation For Cultural Awareness Training	Feb 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Fully Learnable Front-End for Multi-Channel Acoustic Modeling using Semi-Supervised Learning	Feb 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
BUT Opensat 2019 Speech Recognition System	Jan 30, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Environment-aware Reconfigurable Noise Suppression	Jan 29, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Deep Xi as a Front-End for Robust Automatic Speech Recognition	Jan 28, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Joint Contextual Modeling for ASR Correction and Language Understanding	Jan 28, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Submodular Rank Aggregation on Score-based Permutations for Distributed Automatic Speech Recognition	Jan 27, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Lattice-based Improvements for Voice Triggering Using Graph Neural Networks	Jan 25, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Low-rank Gradient Approximation For Memory-Efficient On-device Training of Deep Neural Network	Jan 24, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Semi-supervised ASR by End-to-end Self-training	Jan 24, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
TLT-school: a Corpus of Non Native Children Speech	Jan 22, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sequence Labeling Approach to the Task of Sentence Boundary Detection	Jan 20, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Transformer-based Online CTC/attention End-to-End Speech Recognition Architecture	Jan 15, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving Spoken Language Understanding By Exploiting ASR N-best Hypotheses	Jan 11, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving Dysarthric Speech Intelligibility Using Cycle-consistent Adversarial Training	Jan 10, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Open Challenge for Correcting Errors of Speech Recognition Systems	Jan 9, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Streaming automatic speech recognition with the transformer model	Jan 8, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Audio-visual Recognition of Overlapped speech for the LRS2 dataset	Jan 6, 2020	Audio-Visual Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Investigation and Analysis of Hyper and Hypo neuron pruning to selectively update neurons during Unsupervised Adaptation	Jan 6, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Speaker-aware speech-transformer	Jan 2, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Deep Representation Learning in Speech Processing: Challenges, Recent Advances, and Future Trends	Jan 2, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Attention based on-device streaming speech recognition with large speech corpus	Jan 2, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
EEG based Continuous Speech Recognition using Transformers	Dec 31, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
power-law nonlinearity with maximally uniform distribution criterion for improved neural network training in automatic speech recognition	Dec 22, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Statistical Testing on ASR Performance via Blockwise Bootstrap	Dec 19, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Generating Synthetic Audio Data for Attention-Based Speech Recognition Systems	Dec 19, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Role of non-linear data processing on speech recognition task in the framework of reservoir computing	Dec 19, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Cycle-GAN Approach to Model Natural Perturbations in Speech for ASR Applications	Dec 18, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Continuous Speech Recognition using EEG and Video	Dec 16, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Synchronous Speech Recognition and Speech-to-Text Translation with Interactive Decoding	Dec 16, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
On Neural Phone Recognition of Mixed-Source ECoG Signals	Dec 12, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Leveraging End-to-End Speech Recognition with Neural Architecture Search	Dec 11, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
SpecAugment on Large Scale Datasets	Dec 11, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 47 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified