Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2501–2550 of 3012 papers

Title	Date	Tasks	Status
Universal Adversarial Perturbations for Speech Recognition Systems	May 9, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Analysis of Deep Clustering as Preprocessing for Automatic Speech Recognition of Sparsely Overlapping Speech	May 9, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Hardware-Oriented and Memory-Efficient Method for CTC Decoding	May 8, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Deep Learning for Audio Signal Processing	Apr 30, 2019	Audio Signal ProcessingAutomatic Speech Recognition	CodeCode Available
Semi-supervised Sequence-to-sequence ASR using Unpaired Speech and Text	Apr 30, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
English Broadcast News Speech Recognition by Humans and Machines	Apr 30, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Adversarial Speaker Adaptation	Apr 29, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Attentive Adversarial Learning for Domain-Invariant Training	Apr 28, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-Geometry Spatial Acoustic Modeling for Distant Speech Recognition	Apr 28, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Frequency Domain Multi-channel Acoustic Modeling for Distant Speech Recognition	Apr 28, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Assessing the Tolerance of Neural Machine Translation Systems Against Speech Recognition Errors	Apr 24, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Realizing Petabyte Scale Acoustic Modeling	Apr 24, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Natural Language Interactions in Autonomous Vehicles: Intent Detection and Slot Filling from Passenger Utterances	Apr 23, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
An Investigation of End-to-End Multichannel Speech Recognition for Reverberant and Mismatch Conditions	Apr 19, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
TTS Skins: Speaker Conversion via ASR	Apr 18, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Hard Sample Mining for the Improved Retraining of Automatic Speech Recognition	Apr 17, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Guiding CTC Posterior Spike Timings for Improved Posterior Fusion and Knowledge Distillation	Apr 17, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Multi-Task Learning Framework for Overcoming the Catastrophic Forgetting in Automatic Speech Recognition	Apr 17, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
STC Speaker Recognition Systems for the VOiCES From a Distance Challenge	Apr 12, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Speech Domain Adaptation Based on Disentangled Representation Learning for Robust Speech Recognition	Apr 12, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Distributed Deep Learning Strategies For Automatic Speech Recognition	Apr 10, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Performance Monitoring for End-to-End Speech Recognition	Apr 9, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Exploring Methods for the Automatic Detection of Errors in Manual Transcription	Apr 8, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Constrained Output Embeddings for End-to-End Code-Switching Speech Recognition with Only Monolingual Data	Apr 8, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Spoken Language Intent Detection using Confusion2Vec	Apr 7, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Token-Level Ensemble Distillation for Grapheme-to-Phoneme Conversion	Apr 6, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Impact of ASR on Alzheimer's Disease Detection: All Errors are Equal, but Deletions are More Equal than Others	Apr 2, 2019	AllAlzheimer's Disease Detection	—Unverified
Acoustically Grounded Word Embeddings for Improved Acoustics-to-Word Speech Recognition	Mar 29, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Modeling Acoustic-Prosodic Cues for Word Importance Prediction in Spoken Dialogues	Mar 28, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Imperceptible, Robust, and Targeted Adversarial Examples for Automatic Speech Recognition	Mar 22, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Unsupervised Speech Enhancement Based on Multichannel NMF-Informed Beamforming for Noise-Robust Automatic Speech Recognition	Mar 22, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Audio De-identification: A New Entity Recognition Task	Mar 17, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Automatic assessment of spoken language proficiency of non-native children	Mar 15, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Audiovisual Speaker Tracking using Nonlinear Dynamical Systems with Dynamic Stream Weights	Mar 14, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Singing voice conversion with non-parallel data	Mar 11, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bridging the Gap Between Monaural Speech Enhancement and Recognition with Distortion-Independent Acoustic Modeling	Mar 11, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Speech Recognition with no speech or with noisy speech	Mar 2, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Incorporating End-to-End Speech Recognition Models for Sentiment Analysis	Feb 28, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Context-aware Neural-based Dialog Act Classification on Automatically Generated Transcriptions	Feb 28, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
All-neural online source separation, counting, and diarization for meeting analysis	Feb 21, 2019	AllAutomatic Speech Recognition	—Unverified
Self-Attention Aligner: A Latency-Control End-to-End Model for ASR Using Self-Attention Network and Chunk-Hopping	Feb 18, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Enhanced Robot Speech Recognition Using Biomimetic Binaural Sound Source Localization	Feb 13, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Using multi-task learning to improve the performance of acoustic-to-word and conventional hybrid models	Feb 2, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Weighted-Sampling Audio Adversarial Example Attack	Jan 26, 2019	Adversarial AttackAutomatic Speech Recognition	—Unverified
Bonseyes AI Pipeline -- bringing AI to you. End-to-end integration of data, algorithms and deployment tools	Jan 15, 2019	Automatic Speech Recognition (ASR)image-classification	—Unverified
Improving noise robustness of automatic speech recognition via parallel data and teacher-student learning	Jan 5, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Speaker Adaptation for End-to-End CTC Models	Jan 4, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Noise Flooding for Detecting Audio Adversarial Examples Against Automatic Speech Recognition	Dec 25, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Pansori: ASR Corpus Generation from Open Online Video Contents	Dec 23, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Streaming Voice Query Recognition using Causal Convolutional Recurrent Neural Networks	Dec 19, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 51 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified