Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2201–2225 of 3012 papers

Title	Date	Tasks	Status	Hype
That Sounds Familiar: an Analysis of Phonetic Representations Transfer Across Languages	May 16, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Context-Dependent Acoustic Modeling without Explicit Phone Clustering	May 15, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Contextualizing ASR Lattice Rescoring with Hybrid Pointer Network Language Model	May 15, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Coupled Training of Sequence-to-Sequence Models for Accented Speech Recognition	May 14, 2020	Accented Speech RecognitionAutomatic Speech Recognition	CodeCode Available	0
You Do Not Need More Data: Improving End-To-End Speech Recognition by Text-To-Speech Data Augmentation	May 14, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
DiscreTalk: Text-to-Speech as a Machine Translation Problem	May 12, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Automatic Estimation of Intelligibility Measure for Consonants in Speech	May 12, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Incremental Learning for End-to-End Automatic Speech Recognition	May 11, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
CTC-synchronous Training for Monotonic Attention Model	May 10, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
ContextNet: Improving Convolutional Neural Networks for Automatic Speech Recognition with Global Context	May 7, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
The Perceptimatic English Benchmark for Speech Perception Models	May 7, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
RNN-T Models Fail to Generalize to Out-of-Domain Audio: Causes and Solutions	May 7, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Fast and Robust Unsupervised Contextual Biasing for Speech Recognition	May 4, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Does Visual Self-Supervision Improve Learning of Speech Representations for Emotion Recognition?	May 4, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
MultiQT: Multimodal Learning for Real-Time Question Tracking in Speech	May 2, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
CEASR: A Corpus for Evaluating Automatic Speech Recognition	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
The SAFE-T Corpus: A New Resource for Simulated Public Safety Communications	May 1, 2020	Action DetectionActivity Detection	—Unverified	0
Large Corpus of Czech Parliament Plenary Hearings	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Multi-Staged Cross-Lingual Acoustic Model Adaption for Robust Speech Recognition in Real-World Applications - A Case Study on German Oral History Interviews	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
ATC-ANNO: Semantic Annotation for Air Traffic Control with Assistive Auto-Annotation	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Artie Bias Corpus: An Open Dataset for Detecting Demographic Bias in Speech Applications	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
RSC: A Romanian Read Speech Corpus for Automatic Speech Recognition	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Automatic Speech Recognition for Uyghur through Multilingual Acoustic Modeling	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Preparation of Bangla Speech Corpus from Publicly Available Audio \& Text	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Evaluating and Improving Child-Directed Automatic Speech Recognition	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0

Show:10 25 50

← PrevPage 89 of 121Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified