Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2451–2500 of 3012 papers

Title	Date	Tasks	Status	Hype
Kite: Automatic speech recognition for unmanned aerial vehicles	Jul 2, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Scalable Multi Corpora Neural Language Models for ASR	Jul 2, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Latent Dirichlet Allocation Based Acoustic Data Selection for Automatic Speech Recognition	Jul 2, 2019	2kAutomatic Speech Recognition	—Unverified	0
Automated Cross-language Intelligibility Analysis of Parkinson's Disease Patients Using Speech Recognition Technologies	Jul 1, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Comparison of Lattice-Free and Lattice-Based Sequence Discriminative Training Criteria for LVCSR	Jul 1, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Analyzing Utility of Visual Context in Multimodal Speech Recognition Under Noisy Conditions	Jun 30, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
One Size Does Not Fit All: Quantifying and Exposing the Accuracy-Latency Trade-off in Machine Learning Cloud Service APIs via Tolerance Tiers	Jun 26, 2019	AllAutomatic Speech Recognition	—Unverified	0
Auxiliary Interference Speaker Loss for Target-Speaker Speech Recognition	Jun 26, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Multi-Span Acoustic Modelling using Raw Waveform Signals	Jun 21, 2019	Acoustic ModellingAutomatic Speech Recognition	—Unverified	0
Phoneme-Based Contextualization for Cross-Lingual Speech Recognition in End-to-End Models	Jun 21, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Code-Switching Detection Using ASR-Generated Language Posteriors	Jun 19, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Multi-Graph Decoding for Code-Switching ASR	Jun 18, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Multi-Stream End-to-End Speech Recognition	Jun 17, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Advancing Speech Recognition With No Speech Or With Noisy Speech	Jun 17, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Real to H-space Encoder for Speech Recognition	Jun 17, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Adversarial Training for Multilingual Acoustic Modeling	Jun 17, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Cumulative Adaptation for BLSTM Acoustic Models	Jun 14, 2019	Acoustic ModellingAutomatic Speech Recognition	—Unverified	0
Learning Video Representations using Contrastive Bidirectional Transformer	Jun 13, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Lattice Transformer for Speech Translation	Jun 13, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Listening while Speaking and Visualizing: Improving ASR through Multimodal Chain	Jun 3, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
SpatialNet: A Declarative Resource for Spatial Relations	Jun 1, 2019	Automatic Speech Recognition (ASR)	—Unverified	0
A user study to compare two conversational assistants designed for people with hearing impairments	Jun 1, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Overcoming the bottleneck in traditional assessments of verbal memory: Modeling human ratings and classifying clinical group membership	Jun 1, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
MuST-C: a Multilingual Speech Translation Corpus	Jun 1, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Audio De-identification - a New Entity Recognition Task	Jun 1, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Building and Evaluation of a Real Room Impulse Response Dataset	May 30, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Regularization Advantages of Multilingual Neural Language Models for Low Resource Domains	May 29, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Guided Source Separation Meets a Strong ASR Backend: Hitachi/Paderborn University Joint Investigation for Dinner Party ASR	May 29, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Articulatory and bottleneck features for speaker-independent ASR of dysarthric speech	May 16, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Effective Sentence Scoring Method using Bidirectional Language Model for Speech Recognition	May 16, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Speaker-Independent Speech-Driven Visual Speech Synthesis using Domain-Adapted Acoustic Models	May 15, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Almost Unsupervised Text to Speech and Automatic Speech Recognition	May 13, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Time-Contrastive Learning Based Deep Bottleneck Features for Text-Dependent Speaker Verification	May 11, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Universal Adversarial Perturbations for Speech Recognition Systems	May 9, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Analysis of Deep Clustering as Preprocessing for Automatic Speech Recognition of Sparsely Overlapping Speech	May 9, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
RWTH ASR Systems for LibriSpeech: Hybrid vs Attention -- w/o Data Augmentation	May 8, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
A Hardware-Oriented and Memory-Efficient Method for CTC Decoding	May 8, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Semi-supervised Sequence-to-sequence ASR using Unpaired Speech and Text	Apr 30, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Deep Learning for Audio Signal Processing	Apr 30, 2019	Audio Signal ProcessingAutomatic Speech Recognition	CodeCode Available	0
English Broadcast News Speech Recognition by Humans and Machines	Apr 30, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Adversarial Speaker Adaptation	Apr 29, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Frequency Domain Multi-channel Acoustic Modeling for Distant Speech Recognition	Apr 28, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Multi-Geometry Spatial Acoustic Modeling for Distant Speech Recognition	Apr 28, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Attentive Adversarial Learning for Domain-Invariant Training	Apr 28, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Assessing the Tolerance of Neural Machine Translation Systems Against Speech Recognition Errors	Apr 24, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Realizing Petabyte Scale Acoustic Modeling	Apr 24, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Natural Language Interactions in Autonomous Vehicles: Intent Detection and Slot Filling from Passenger Utterances	Apr 23, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
An Investigation of End-to-End Multichannel Speech Recognition for Reverberant and Mismatch Conditions	Apr 19, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
TTS Skins: Speaker Conversion via ASR	Apr 18, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
SpecAugment: A Simple Data Augmentation Method for Automatic Speech Recognition	Apr 18, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1

Show:10 25 50

← PrevPage 50 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified