Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1151–1200 of 3012 papers

Title	Date	Tasks	Status
EURO: ESPnet Unsupervised ASR Open-source Toolkit	Nov 30, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Neural Transducer Training: Reduced Memory Consumption with Sample-wise Computation	Nov 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
MMSpeech: Multi-modal Multi-task Encoder-Decoder Pre-training for Speech Recognition	Nov 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Evaluating and reducing the distance between synthetic and real speech distributions	Nov 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Better Transcription of UK Supreme Court Hearings	Nov 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Inter-KD: Intermediate Knowledge Distillation for CTC-Based Automatic Speech Recognition	Nov 28, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multitask Learning for Low Resource Spoken Language Understanding	Nov 24, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bidirectional Representations for Low Resource Spoken Language Understanding	Nov 24, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Device Directedness with Contextual Cues for Spoken Dialog Systems	Nov 23, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Whose Emotion Matters? Speaking Activity Localisation without Prior Knowledge	Nov 23, 2022	Active Speaker DetectionAutomatic Speech Recognition	CodeCode Available
Complex-Valued Time-Frequency Self-Attention for Speech Dereverberation	Nov 22, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Benchmarking Evaluation Metrics for Code-Switching Automatic Speech Recognition	Nov 22, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
SSCFormer: Push the Limit of Chunk-wise Conformer for Streaming ASR Using Sequentially Sampled Chunks and Chunked Causal Convolution	Nov 21, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
SpeechNet: Weakly Supervised, End-to-End Speech Recognition at Industrial Scale	Nov 21, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Model-based speaker adaptation of end-to-end lattice-free MMI model for speech recognition	Nov 17, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Hey ASR System! Why Aren't You More Inclusive? Automatic Speech Recognition Systems' Bias and Proposed Bias Mitigation Techniques. A Literature Review	Nov 17, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
LongFNT: Long-form Speech Recognition with Factorized Neural Transducer	Nov 17, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving Speech Emotion Recognition with Unsupervised Speaking Style Transfer	Nov 16, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
On using the UA-Speech and TORGO databases to validate automatic dysarthric speech classification approaches	Nov 16, 2022	Action DetectionActivity Detection	—Unverified
Introducing Semantics into Speech Encoders	Nov 15, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Align, Write, Re-order: Explainable End-to-End Speech Translation via Operation Sequence Generation	Nov 11, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Handling Trade-Offs in Speech Separation with Sparsely-Gated Mixture of Experts	Nov 11, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The Far Side of Failure: Investigating the Impact of Speech Recognition Errors on Subsequent Dementia Classification	Nov 11, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
A Study on the Integration of Pre-trained SSL, ASR, LM and SLU Models for Spoken Language Understanding	Nov 10, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Adaptive Multi-Corpora Language Model Training for Speech Recognition	Nov 9, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving Noisy Student Training on Non-target Domain Data for Automatic Speech Recognition	Nov 9, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Robust Unstructured Knowledge Access in Conversational Dialogue with ASR Errors	Nov 8, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Streaming, fast and accurate on-device Inverse Text Normalization for Automatic Speech Recognition	Nov 7, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
End-to-End Evaluation of a Spoken Dialogue System for Learning Basic Mathematics	Nov 7, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bridging Speech and Textual Pre-trained Models with Unsupervised ASR	Nov 6, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
LAMASSU: Streaming Language-Agnostic Multilingual Speech Recognition and Translation Using Neural Transducers	Nov 5, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Evaluation of Automated Speech Recognition Systems for Conversational Speech: A Linguistic Perspective	Nov 5, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Resource-Efficient Transfer Learning From Speech Foundation Model Using Hierarchical Feature Fusion	Nov 4, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Biased Self-supervised learning for ASR	Nov 4, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Stutter-TTS: Controlled Synthesis and Improved Recognition of Stuttered Speech	Nov 4, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Phonetic-assisted Multi-Target Units Modeling for Improving Conformer-Transducer ASR system	Nov 3, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Streaming Audio-Visual Speech Recognition with Alignment Regularization	Nov 3, 2022	Audio-Visual Speech RecognitionAutomatic Speech Recognition	—Unverified
Leveraging Domain Features for Detecting Adversarial Attacks Against Deep Speech Recognition in Noise	Nov 3, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Probing Statistical Representations For End-To-End ASR	Nov 3, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
H_eval: A new hybrid evaluation metric for automatic speech recognition tasks	Nov 3, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
InterMPL: Momentum Pseudo-Labeling with Intermediate CTC Loss	Nov 2, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
More Speaking or More Speakers?	Nov 2, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Monolingual Recognizers Fusion for Code-switching Speech Recognition	Nov 2, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Towards Zero-Shot Code-Switched Speech Recognition	Nov 2, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
BECTRA: Transducer-based End-to-End ASR with BERT-Enhanced Encoder	Nov 2, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unified End-to-End Speech Recognition and Endpointing for Fast and Efficient Speech Systems	Nov 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Adapting self-supervised models to multi-talker speech recognition using speaker embeddings	Nov 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Comparative Study on Multichannel Speaker-Attributed Automatic Speech Recognition in Multi-party Meetings	Nov 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Mandarin-English Code-Switching Speech Recognition System for Specific Domain	Nov 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Preliminary Study on Automated Speaking Assessment of English as a Second Language (ESL) Students	Nov 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 24 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified