Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2526–2550 of 3012 papers

Title	Date	Tasks	Status
All-neural online source separation, counting, and diarization for meeting analysis	Feb 21, 2019	AllAutomatic Speech Recognition	—Unverified
Self-Attention Aligner: A Latency-Control End-to-End Model for ASR Using Self-Attention Network and Chunk-Hopping	Feb 18, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Enhanced Robot Speech Recognition Using Biomimetic Binaural Sound Source Localization	Feb 13, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Using multi-task learning to improve the performance of acoustic-to-word and conventional hybrid models	Feb 2, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Weighted-Sampling Audio Adversarial Example Attack	Jan 26, 2019	Adversarial AttackAutomatic Speech Recognition	—Unverified
Bonseyes AI Pipeline -- bringing AI to you. End-to-end integration of data, algorithms and deployment tools	Jan 15, 2019	Automatic Speech Recognition (ASR)image-classification	—Unverified
Improving noise robustness of automatic speech recognition via parallel data and teacher-student learning	Jan 5, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Speaker Adaptation for End-to-End CTC Models	Jan 4, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Noise Flooding for Detecting Audio Adversarial Examples Against Automatic Speech Recognition	Dec 25, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Pansori: ASR Corpus Generation from Open Online Video Contents	Dec 23, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Streaming Voice Query Recognition using Causal Convolutional Recurrent Neural Networks	Dec 19, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multiple topic identification in human/human conversations	Dec 18, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The Recognition Of Persian Phonemes Using PPNet	Dec 17, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
E-RNN: Design Optimization for Efficient Recurrent Neural Networks in FPGAs	Dec 12, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
End-to-end contextual speech recognition using class language models and a token passing decoder	Dec 5, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Fully Neural Network Based Speech Recognition on Mobile and Embedded Devices	Dec 1, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Acoustics-guided evaluation (AGE): a new measure for estimating performance of speech enhancement algorithms for robust ASR	Nov 28, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
On the Inductive Bias of Word-Character-Level Multi-Task Learning for Speech Recognition	Nov 28, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Speech recognition with quaternion neural networks	Nov 21, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
WEST: Word Encoded Sequence Transducers	Nov 20, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Investigating the Effects of Word Substitution Errors on Sentence Embeddings	Nov 16, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
An Online Attention-based Model for Speech Recognition	Nov 13, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Exploring RNN-Transducer for Chinese Speech Recognition	Nov 13, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Corpus Phonetics Tutorial	Nov 13, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-encoder multi-resolution framework for end-to-end speech recognition	Nov 12, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 102 of 121Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified