Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2751–2775 of 3012 papers

Title	Date	Tasks	Status
Multilingual Speech Recognition With A Single End-To-End Model	Nov 6, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Dual Language Models for Code Switched Speech Recognition	Nov 3, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Method for Improving Arabic Speech Recognition Systems	Nov 1, 2017	Arabic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Parallel Recurrent Neural Network for Language Modeling with POS Tags	Nov 1, 2017	Automatic Speech Recognition (ASR)Clustering	—Unverified
Joint Learning of Dialog Act Segmentation and Recognition in Spoken Dialog Using Neural Networks	Nov 1, 2017	Automatic Speech Recognition (ASR)Natural Language Understanding	—Unverified
Improving Black-box Speech Recognition using Semantic Parsing	Nov 1, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sequence-to-Sequence ASR Optimization via Reinforcement Learning	Oct 30, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Study of All-Convolutional Encoders for Connectionist Temporal Classification	Oct 28, 2017	AllAutomatic Speech Recognition	—Unverified
BridgeNets: Student-Teacher Transfer Learning Based on Recursive Neural Networks and its Application to Distant Speech Recognition	Oct 27, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Syntactic and Semantic Features For Code-Switching Factored Language Models	Oct 4, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Evaluating Word Embeddings for Sentence Boundary Detection in Speech Transcripts	Oct 1, 2017	Automatic Speech Recognition (ASR)Boundary Detection	—Unverified
Attention-based Wav2Text with Feature Transfer Learning	Sep 22, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unsupervised Learning of Disentangled and Interpretable Representations from Sequential Data	Sep 22, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
WERd: Using Social Text Spelling Variants for Evaluating Dialectal Speech Recognition	Sep 21, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Language Modeling with Highway LSTM	Sep 19, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Recorded Debating Dataset	Sep 19, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Analyzing Hidden Representations in End-to-End Automatic Speech Recognition Systems	Sep 13, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
End-to-End Waveform Utterance Enhancement for Direct Evaluation Metrics Optimization by Fully Convolutional Neural Networks	Sep 12, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Spoken English Intelligibility Remediation with PocketSphinx Alignment and Feature Extraction Improves Substantially over the State of the Art	Sep 6, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Amharic-English Speech Translation in Tourism Domain	Sep 1, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Word Transduction for Addressing the OOV Problem in Machine Translation for Similar Resource-Scarce Languages	Sep 1, 2017	Automatic Speech Recognition (ASR)Machine Translation	—Unverified
Improving Machine Translation Quality Estimation with Neural Network Features	Sep 1, 2017	Automatic Speech Recognition (ASR)Language Modeling	—Unverified
A deep-learning based native-language classification by using a latent semantic analysis for the NLI Shared Task 2017	Sep 1, 2017	Automatic Speech Recognition (ASR)Dimensionality Reduction	—Unverified
A Text Normalisation System for Non-Standard English Words	Sep 1, 2017	Automatic Speech Recognition (ASR)Speech Recognition	—Unverified
Enriching ASR Lattices with POS Tags for Dependency Parsing	Sep 1, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 111 of 121Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified