Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2851–2875 of 3012 papers

Title	Date	Tasks	Status
The IWSLT 2016 Evaluation Campaign	Dec 1, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bayesian Language Model based on Mixture of Segmental Contexts for Spontaneous Utterances with Unexpected Words	Dec 1, 2016	Automatic Speech Recognition (ASR)Language Modeling	—Unverified
Combining Human Inputters and Language Services to provide Multi-language support system for International Symposiums	Dec 1, 2016	Automatic Speech Recognition (ASR)Machine Translation	—Unverified
Comparing Two Basic Methods for Discriminating Between Similar Languages and Varieties	Dec 1, 2016	Automatic Speech Recognition (ASR)General Classification	—Unverified
Comparison of Grapheme-to-Phoneme Conversion Methods on a Myanmar Pronunciation Dictionary	Dec 1, 2016	Active LearningAutomatic Speech Recognition	—Unverified
Arabic Language WEKA-Based Dialect Classifier for Arabic Automatic Speech Recognition Transcripts	Dec 1, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A non-expert Kaldi recipe for Vietnamese Speech Recognition System	Dec 1, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Automated speech-unit delimitation in spoken learner English	Dec 1, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Dialogue Act Classification in Domain-Independent Conversations Using a Deep Recurrent Neural Network	Dec 1, 2016	Automatic Speech Recognition (ASR)Dialogue Act Classification	—Unverified
An Efficient and Effective Online Sentence Segmenter for Simultaneous Interpretation	Dec 1, 2016	Automatic Speech Recognition (ASR)Machine Translation	—Unverified
Using Ambiguity Detection to Streamline Linguistic Annotation	Dec 1, 2016	Automatic Speech Recognition (ASR)Machine Translation	—Unverified
RACAI Entry for the IWSLT 2016 Shared Task	Dec 1, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Invariant Representations for Noisy Speech Recognition	Nov 27, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Deep Recurrent Convolutional Neural Network: Improving Performance For Speech Recognition	Nov 22, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Audio Visual Speech Recognition using Deep Recurrent Neural Networks	Nov 9, 2016	Audio-Visual Speech RecognitionAutomatic Speech Recognition	—Unverified
Automatic recognition of child speech for robotic applications in noisy environments	Nov 8, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Latent Tree Language Model	Nov 1, 2016	Automatic Speech Recognition (ASR)Language Modeling	CodeCode Available
Joint Transition-based Dependency Parsing and Disfluency Detection for Automatic Speech Recognition Texts	Nov 1, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Codeswitching Detection via Lexical Features in Conditional Random Fields	Nov 1, 2016	Automatic Speech Recognition (ASR)Sentiment Analysis	—Unverified
Richer Interpolative Smoothing Based on Modified Kneser-Ney Language Modeling	Nov 1, 2016	Automatic Speech Recognition (ASR)Language Modeling	—Unverified
Neural Morphological Analysis: Encoding-Decoding Canonical Segments	Nov 1, 2016	Automatic Speech Recognition (ASR)Keyword Spotting	—Unverified
Exploiting Sentence and Context Representations in Deep Neural Models for Spoken Language Understanding	Oct 13, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Semantic Analyzer for the Comprehension of the Spontaneous Arabic Speech	Oct 8, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Challenges of Computational Processing of Code-Switching	Oct 7, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Monaural Multi-Talker Speech Recognition using Factorial Speech Processing Models	Oct 5, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 115 of 121Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified