Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1251–1300 of 3012 papers

Title	Date	Tasks	Status
Streaming Punctuation for Long-form Dictation with Transformers	Oct 11, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Comparison of Soft and Hard Target RNN-T Distillation for Large-scale ASR	Oct 11, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Scaling Up Deliberation for Multilingual ASR	Oct 11, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
An Experimental Study on Private Aggregation of Teacher Ensemble Learning for End-to-End Speech Recognition	Oct 11, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Cloud-based Automatic Speech Recognition Systems for Southeast Asian Languages	Oct 7, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
SpeechUT: Bridging Speech and Text with Hidden-Unit for Encoder-Decoder Based Speech-Text Pre-training	Oct 7, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Pronunciation Modeling of Foreign Words for Mandarin ASR by Considering the Effect of Language Transfer	Oct 7, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Damage Control During Domain Adaptation for Transducer Based Automatic Speech Recognition	Oct 6, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Efficient acoustic feature transformation in mismatched environments using a Guided-GAN	Oct 3, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Investigating the Impact of ASR Errors on Spoken Implicit Discourse Relation Recognition	Oct 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving Code-switched ASR with Linguistic Information	Oct 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Zero-shot Disfluency Detection for Indian Languages	Oct 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multi-stage Progressive Compression of Conformer Transducer for On-device Speech Recognition	Oct 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Language-specific Effects on Automatic Speech Recognition Errors for World Englishes	Oct 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Can We Train a Language Model Inside an End-to-End ASR Model? - Investigating Effective Implicit Language Modeling	Oct 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Keyphrase Prediction from Video Transcripts: New Dataset and Directions	Oct 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
E-Branchformer: Branchformer with Enhanced merging for speech recognition	Sep 30, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Adaptive Sparse and Monotonic Attention for Transformer-based Automatic Speech Recognition	Sep 30, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Blind Signal Dereverberation for Machine Speech Recognition	Sep 30, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
An Effective, Performant Named Entity Recognition System for Noisy Business Telephone Conversation Transcripts	Sep 27, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
On the Impact of Speech Recognition Errors in Passage Retrieval for Spoken Question Answering	Sep 26, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Unsupervised domain adaptation for speech recognition with unsupervised error correction	Sep 24, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Assessing ASR Model Quality on Disordered Speech using BERTScore	Sep 21, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Watch What You Pretrain For: Targeted, Transferable Adversarial Examples on Self-Supervised Speech Recognition models	Sep 17, 2022	Adversarial AttackAutomatic Speech Recognition	CodeCode Available
An Automatic Speech Recognition System for Bengali Language based on Wav2Vec2 and Transfer Learning	Sep 16, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Non-Parallel Voice Conversion for ASR Augmentation	Sep 15, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Universally-Deployable ASR Frontend for Joint Acoustic Echo Cancellation, Speech Enhancement, and Voice Separation	Sep 14, 2022	Acoustic echo cancellationAutomatic Speech Recognition	—Unverified
Federated Pruning: Improving Neural Network Efficiency with Federated Learning	Sep 14, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bangla-Wave: Improving Bangla Automatic Speech Recognition Utilizing N-gram Language Models	Sep 13, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Analysis of Self-Attention Head Diversity for Conformer-based Automatic Speech Recognition	Sep 13, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Learning ASR pathways: A sparse multilingual ASR model	Sep 13, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Streaming End-to-End Multilingual Speech Recognition with Joint Language Identification	Sep 13, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
VarArray Meets t-SOT: Advancing the State of the Art of Streaming Distant Conversational Speech Recognition	Sep 12, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Lexicon and Attention based Handwritten Text Recognition System	Sep 11, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Streaming Target-Speaker ASR with Neural Transducer	Sep 9, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Modeling Dependent Structure for Utterances in ASR Evaluation	Sep 7, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Distilling the Knowledge of BERT for CTC-based ASR	Sep 5, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Mlphon: A Multifunctional Grapheme-Phoneme Conversion Tool Using Finite State Transducers	Sep 5, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Semantically Meaningful Metrics for Norwegian ASR Systems	Sep 3, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
DeepCon: An End-to-End Multilingual Toolkit for Automatic Minuting of Multi-Party Dialogues	Sep 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Attention Enhanced Citrinet for Speech Recognition	Sep 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Evaluation of Automatic Speech Recognition for Conversational Speech in Dutch, English and German: What Goes Missing?	Sep 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Robust Translation of French Live Speech Transcripts	Sep 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Language Agnostic Multilingual Streaming On-Device ASR System	Aug 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Investigating data partitioning strategies for crosslinguistic low-resource ASR evaluation	Aug 26, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
DualVoice: Speech Interaction that Discriminates between Normal and Whispered Voice Input	Aug 22, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Are disentangled representations all you need to build speaker anonymization systems?	Aug 22, 2022	AllAutomatic Speech Recognition	—Unverified
Analyzing Robustness of End-to-End Neural Models for Automatic Speech Recognition	Aug 17, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Building a Public Domain Voice Database for Odia	Aug 16, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Comparison and Analysis of New Curriculum Criteria for End-to-End ASR	Aug 10, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available

Show:10 25 50

← PrevPage 26 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified