Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1801–1850 of 3012 papers

Title	Date	Tasks	Status
VAD-free Streaming Hybrid CTC/Attention ASR for Unsegmented Recording	Jul 15, 2021	Action DetectionActivity Detection	—Unverified
Zero-shot Speech Translation	Jul 13, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The IWSLT 2021 BUT Speech Translation Systems	Jul 13, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Configurable Multilingual Model is All You Need to Recognize All Languages	Jul 13, 2021	AllAutomatic Speech Recognition	—Unverified
Perceptual-based deep-learning denoiser as a defense against adversarial attacks on ASR systems	Jul 12, 2021	Adversarial RobustnessAutomatic Speech Recognition	—Unverified
Noisy Training Improves E2E ASR for the Edge	Jul 9, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
On lattice-free boosted MMI training of HMM and CTC-based full-context ASR models	Jul 9, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Loss Prediction: End-to-End Active Learning Approach For Speech Recognition	Jul 9, 2021	Active LearningAutomatic Speech Recognition	—Unverified
Improved Language Identification Through Cross-Lingual Self-Supervised Learning	Jul 8, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
End-to-End Rich Transcription-Style Automatic Speech Recognition with Semi-Supervised Learning	Jul 7, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Advancing CTC-CRF Based End-to-End Speech Recognition with Wordpieces and Conformers	Jul 7, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Comparative Study of Modular and Joint Approaches for Speaker-Attributed ASR on Monaural Long-Form Audio	Jul 6, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Instant One-Shot Word-Learning for Context-Specific Neural Sequence-to-Sequence Speech Recognition	Jul 5, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Investigation of Practical Aspects of Single Channel Speech Separation for ASR	Jul 5, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Cross-Modal Transformer-Based Neural Correction Models for Automatic Speech Recognition	Jul 4, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unified Autoregressive Modeling for Joint End-to-End Multi-Talker Overlapped Speech Recognition and Speaker Attribute Estimation	Jul 4, 2021	Age EstimationAttribute	—Unverified
Arabic Code-Switching Speech Recognition using Monolingual Data	Jul 4, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Dual Causal/Non-Causal Self-Attention for Streaming End-to-End Speech Recognition	Jul 2, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-user VoiceFilter-Lite via Attentive Speaker Embedding	Jul 2, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
StableEmit: Selection Probability Discount for Reducing Emission Latency of Streaming Monotonic Attention ASR	Jul 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Word-Free Spoken Language Understanding for Mandarin-Chinese	Jul 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving Named Entity Recognition in Spoken Dialog Systems by Context and Speech Pattern Modeling	Jul 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
SmarTerp: A CAI System to Support Simultaneous Interpreters in Real-Time	Jul 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Pretext Tasks selection for multitask self-supervised speech representation learning	Jul 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
IMS' Systems for the IWSLT 2021 Low-Resource Speech Translation Task	Jun 30, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sequence-level Confidence Classifier for ASR Utterance Accuracy and Application to Acoustic Models	Jun 30, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
On joint training with interfaces for spoken language understanding	Jun 30, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Rethinking End-to-End Evaluation of Decomposable Tasks: A Case Study on Spoken Language Understanding	Jun 29, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
QASR: QCRI Aljazeera Speech Resource -- A Large Scale Annotated Arabic Speech Corpus	Jun 24, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Where are we in semantic concept extraction for Spoken Language Understanding?	Jun 24, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Zero-Shot Joint Modeling of Multiple Spoken-Text-Style Conversion Tasks using Switching Tokens	Jun 23, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Mixtures of Deep Neural Experts for Automated Speech Scoring	Jun 23, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Discriminative Entity-Aware Language Model for Virtual Assistants	Jun 21, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
On-Device Personalization of Automatic Speech Recognition Models for Disordered Speech	Jun 18, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Low Resource German ASR with Untranscribed Data Spoken by Non-native Children -- INTERSPEECH 2021 Shared Task SPAPL System	Jun 18, 2021	Acoustic ModellingAutomatic Speech Recognition	—Unverified
An Improved Single Step Non-autoregressive Transformer for Automatic Speech Recognition	Jun 18, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Layer Pruning on Demand with Intermediate CTC	Jun 17, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-mode Transformer Transducer with Stochastic Future Context	Jun 17, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-Speaker ASR Combining Non-Autoregressive Conformer CTC and Conditional Speaker Chain	Jun 16, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Topic Classification on Spoken Documents Using Deep Acoustic and Linguistic Features	Jun 16, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Momentum Pseudo-Labeling for Semi-Supervised Speech Recognition	Jun 16, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Multi-channel Opus compression for far-field automatic speech recognition with a fixed bitrate budget	Jun 15, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Dialectal Speech Recognition and Translation of Swiss German Speech to Standard German Text: Microsoft's Submission to SwissText 2021	Jun 15, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Study into Pre-training Strategies for Spoken Language Understanding on Dysarthric Speech	Jun 15, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR Adaptation for E-commerce Chatbots using Cross-Utterance Context and Multi-Task Language Modeling	Jun 15, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Overcoming Domain Mismatch in Low Resource Sequence-to-Sequence ASR Models using Hybrid Generated Pseudotranscripts	Jun 14, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Using heterogeneity in semi-supervised transcription hypotheses to improve code-switched speech recognition	Jun 14, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Assessing the Use of Prosody in Constituency Parsing of Imperfect Transcripts	Jun 14, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
SynthASR: Unlocking Synthetic Data for Speech Recognition	Jun 14, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Cross-utterance Reranking Models with BERT and Graph Convolutional Networks for Conversational Speech Recognition	Jun 13, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 37 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified