Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1701–1750 of 3012 papers

Title	Date	Tasks	Status	Hype
On Prosody Modeling for ASR+TTS based Voice Conversion	Jul 20, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Sequence Model with Self-Adaptive Sliding Window for Efficient Spoken Document Segmentation	Jul 20, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Token-Level Supervised Contrastive Learning for Punctuation Restoration	Jul 19, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
A baseline model for computationally inexpensive speech recognition for Kazakh using the Coqui STT framework	Jul 19, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
STRODE: Stochastic Boundary Ordinary Differential Equation	Jul 17, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
A Comparison of Methods for OOV-word Recognition on a New Public Dataset	Jul 16, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
VAD-free Streaming Hybrid CTC/Attention ASR for Unsegmented Recording	Jul 15, 2021	Action DetectionActivity Detection	—Unverified	0
Multi-task Learning with Cross Attention for Keyword Spotting	Jul 15, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Zero-shot Speech Translation	Jul 13, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
A Configurable Multilingual Model is All You Need to Recognize All Languages	Jul 13, 2021	AllAutomatic Speech Recognition	—Unverified	0
The IWSLT 2021 BUT Speech Translation Systems	Jul 13, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Perceptual-based deep-learning denoiser as a defense against adversarial attacks on ASR systems	Jul 12, 2021	Adversarial RobustnessAutomatic Speech Recognition	—Unverified	0
Layer-wise Analysis of a Self-supervised Speech Representation Model	Jul 10, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Loss Prediction: End-to-End Active Learning Approach For Speech Recognition	Jul 9, 2021	Active LearningAutomatic Speech Recognition	—Unverified	0
On lattice-free boosted MMI training of HMM and CTC-based full-context ASR models	Jul 9, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Noisy Training Improves E2E ASR for the Edge	Jul 9, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Improved Language Identification Through Cross-Lingual Self-Supervised Learning	Jul 8, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
End-to-End Rich Transcription-Style Automatic Speech Recognition with Semi-Supervised Learning	Jul 7, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Advancing CTC-CRF Based End-to-End Speech Recognition with Wordpieces and Conformers	Jul 7, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
A Comparative Study of Modular and Joint Approaches for Speaker-Attributed ASR on Monaural Long-Form Audio	Jul 6, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Instant One-Shot Word-Learning for Context-Specific Neural Sequence-to-Sequence Speech Recognition	Jul 5, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Investigation of Practical Aspects of Single Channel Speech Separation for ASR	Jul 5, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Cross-Modal Transformer-Based Neural Correction Models for Automatic Speech Recognition	Jul 4, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Unified Autoregressive Modeling for Joint End-to-End Multi-Talker Overlapped Speech Recognition and Speaker Attribute Estimation	Jul 4, 2021	Age EstimationAttribute	—Unverified	0
TENET: A Time-reversal Enhancement Network for Noise-robust ASR	Jul 4, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Arabic Code-Switching Speech Recognition using Monolingual Data	Jul 4, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Dual Causal/Non-Causal Self-Attention for Streaming End-to-End Speech Recognition	Jul 2, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Relaxed Attention: A Simple Method to Boost Performance of End-to-End Automatic Speech Recognition	Jul 2, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Multi-user VoiceFilter-Lite via Attentive Speaker Embedding	Jul 2, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
SmarTerp: A CAI System to Support Simultaneous Interpreters in Real-Time	Jul 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Improving Named Entity Recognition in Spoken Dialog Systems by Context and Speech Pattern Modeling	Jul 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Pretext Tasks selection for multitask self-supervised speech representation learning	Jul 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Word-Free Spoken Language Understanding for Mandarin-Chinese	Jul 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Combining Frame-Synchronous and Label-Synchronous Systems for Speech Recognition	Jul 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
StableEmit: Selection Probability Discount for Reducing Emission Latency of Streaming Monotonic Attention ASR	Jul 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Sequence-level Confidence Classifier for ASR Utterance Accuracy and Application to Acoustic Models	Jun 30, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
On joint training with interfaces for spoken language understanding	Jun 30, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
IMS' Systems for the IWSLT 2021 Low-Resource Speech Translation Task	Jun 30, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Rethinking End-to-End Evaluation of Decomposable Tasks: A Case Study on Spoken Language Understanding	Jun 29, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
QASR: QCRI Aljazeera Speech Resource -- A Large Scale Annotated Arabic Speech Corpus	Jun 24, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Where are we in semantic concept extraction for Spoken Language Understanding?	Jun 24, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Mixtures of Deep Neural Experts for Automated Speech Scoring	Jun 23, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Zero-Shot Joint Modeling of Multiple Spoken-Text-Style Conversion Tasks using Switching Tokens	Jun 23, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
A Discriminative Entity-Aware Language Model for Virtual Assistants	Jun 21, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
An Improved Single Step Non-autoregressive Transformer for Automatic Speech Recognition	Jun 18, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
On-Device Personalization of Automatic Speech Recognition Models for Disordered Speech	Jun 18, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Golos: Russian Dataset for Speech Research	Jun 18, 2021	Automatic Speech Recognition (ASR)Language Modeling	CodeCode Available	1
Low Resource German ASR with Untranscribed Data Spoken by Non-native Children -- INTERSPEECH 2021 Shared Task SPAPL System	Jun 18, 2021	Acoustic ModellingAutomatic Speech Recognition	—Unverified	0
Multi-mode Transformer Transducer with Stochastic Future Context	Jun 17, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Layer Pruning on Demand with Intermediate CTC	Jun 17, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0

Show:10 25 50

← PrevPage 35 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified