Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2151–2200 of 3012 papers

Title	Date	Tasks	Status	Hype
AVLnet: Learning Audio-Visual Language Representations from Instructional Videos	Jun 16, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Exploration of End-to-End ASR for OpenSTT -- Russian Open Speech-to-Text Dataset	Jun 15, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
The JHU Multi-Microphone Multi-Speaker ASR System for the CHiME-6 Challenge	Jun 14, 2020	Action DetectionActivity Detection	—Unverified	0
Evaluation of Neural Architectures Trained with Square Loss vs Cross-Entropy in Classification Tasks	Jun 12, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Data Augmentation for Training Dialog Models Robust to Speech Recognition Errors	Jun 10, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Learning not to Discriminate: Task Agnostic Learning for Improving Monolingual and Code-switched Speech Recognition	Jun 9, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Improving Cross-Lingual Transfer Learning for End-to-End Speech Recognition with Speech Translation	Jun 9, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
On the Effectiveness of Neural Text Generation based Data Augmentation for Recognition of Morphologically Rich Speech	Jun 9, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Learning to Count Words in Fluent Speech enables Online Speech Recognition	Jun 8, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Contextual RNN-T For Open Domain ASR	Jun 4, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Multi-talker ASR for an unknown number of sources: Joint training of source counting, separation and ASR	Jun 4, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Transfer Learning for British Sign Language Modelling	Jun 3, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Dilated U-net based approach for multichannel speech enhancement from First-Order Ambisonics recordings	Jun 2, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Detecting Audio Attacks on ASR Systems with Dropout Uncertainty	Jun 2, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Analyzing the Quality and Stability of a Streaming End-to-End On-Device Speech Recognizer	Jun 2, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Sur l'utilisation de la reconnaissance automatique de la parole pour l'aide au diagnostic diff\'erentiel entre la maladie de Parkinson et l'AMS (On using automatic speech recognition for the differential diagnosis of Parkinson's Disease and MSA This article presents a study regarding the contribution of automatic speech processing in the differential diagnosis between Parkinson's disease and MSA (Multi-System Atrophies))	Jun 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Introduction d'informations s\'emantiques dans un syst\`eme de reconnaissance de la parole (Despite spectacular advances in recent years, the Automatic Speech Recognition (ASR) systems still make mistakes, especially in noisy environments)	Jun 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Analyse de l'effet de la r\'everb\'eration sur la reconnaissance automatique de la parole (Analyzing how reverberation affects Automatic Speech Recognition)	Jun 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Reconnaissance automatique de la parole : g\'en\'eration des prononciations non natives pour l'enrichissement du lexique (In this study we propose a method for lexicon adaptation in order to improve the automatic speech recognition (ASR) of non-native speakers)	Jun 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Constrained Variational Autoencoder for improving EEG based Speech Recognition Systems	Jun 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
An Effective Contextual Language Modeling Framework for Speech Summarization with Augmented Features	Jun 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Learning to Recognize Code-switched Speech Without Forgetting Monolingual Speech Recognition	Jun 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Dynamic Masking for Improved Stability in Spoken Language Translation	May 30, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
On the Comparison of Popular End-to-End Models for Large Scale Speech Recognition	May 28, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
FT Speech: Danish Parliament Speech Corpus	May 25, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Adapting End-to-End Speech Recognition for Readable Subtitles	May 25, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
An End-to-End Mispronunciation Detection System for L2 English Speech Leveraging Novel Anti-Phone Modeling	May 25, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
An Audio-enriched BERT-based Framework for Spoken Multiple-choice Question Answering	May 25, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Detecting Adversarial Examples for Speech Recognition via Uncertainty Quantification	May 24, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
End-to-end Named Entity Recognition from English Speech	May 22, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Large scale evaluation of importance maps in automatic speech recognition	May 21, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
PyChain: A Fully Parallelized PyTorch Implementation of LF-MMI for End-to-End ASR	May 20, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Investigation of Large-Margin Softmax in Neural Language Modeling	May 20, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Early Stage LM Integration Using Local and Global Log-Linear Combination	May 20, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
A Comparison of Label-Synchronous and Frame-Synchronous End-to-End Models for Speech Recognition	May 20, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Improving Proper Noun Recognition in End-to-End ASR By Customization of the MWER Loss Criterion	May 19, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Iterative Pseudo-Labeling for Speech Recognition	May 19, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Generative Adversarial Training Data Adaptation for Very Low-resource Automatic Speech Recognition	May 19, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Improved Noisy Student Training for Automatic Speech Recognition	May 19, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Enhancing Monotonic Multihead Attention for Streaming ASR	May 19, 2020	AllAutomatic Speech Recognition	CodeCode Available	1
A systematic comparison of grapheme-based vs. phoneme-based label units for encoder-decoder-attention models	May 19, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Distilling Knowledge from Ensembles of Acoustic Models for Joint CTC-Attention End-to-End Speech Recognition	May 19, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
An Effective End-to-End Modeling Approach for Mispronunciation Detection	May 18, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Audio-visual Multi-channel Recognition of Overlapped Speech	May 18, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Weak-Attention Suppression For Transformer Based Speech Recognition	May 18, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Quaternion Neural Networks for Multi-channel Distant Speech Recognition	May 18, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Dynamic Sparsity Neural Networks for Automatic Speech Recognition	May 16, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
AccentDB: A Database of Non-Native English Accents to Assist Neural Speech Recognition	May 16, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Reducing Spelling Inconsistencies in Code-Switching ASR using Contextualized CTC Loss	May 16, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Conformer: Convolution-augmented Transformer for Speech Recognition	May 16, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	3

Show:10 25 50

← PrevPage 44 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified