Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1051–1100 of 3012 papers

Title	Date	Tasks	Status
Context-Aware Transformer Transducer for Speech Recognition	Nov 5, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Context-aware Neural-based Dialog Act Classification on Automatically Generated Transcriptions	Feb 28, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Context-aware Fine-tuning of Self-supervised Speech Models	Dec 16, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Study of Gender Impact in Self-supervised Models for Speech-to-Text Systems	Apr 4, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Ain't Misbehavin' -- Using LLMs to Generate Expressive Robot Behavior in Conversations with the Tabletop Robot Haru	Feb 18, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Acoustics Based Intent Recognition Using Discovered Phonetic Units for Low Resource Languages	Nov 7, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Accurate and Structured Pruning for Efficient Automatic Speech Recognition	May 31, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Content-Aware Speaker Embeddings for Speaker Diarisation	Feb 12, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Construction of a Large-scale Japanese ASR Corpus on TV Recordings	Mar 26, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Study of All-Convolutional Encoders for Connectionist Temporal Classification	Oct 28, 2017	AllAutomatic Speech Recognition	—Unverified
Constrained Variational Autoencoder for improving EEG based Speech Recognition Systems	Jun 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Constrained Output Embeddings for End-to-End Code-Switching Speech Recognition with Only Monolingual Data	Apr 8, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Study into Pre-training Strategies for Spoken Language Understanding on Dysarthric Speech	Jun 15, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Consistency Based Unsupervised Self-training For ASR Personalisation	Jan 22, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASTRA: Aligning Speech and Text Representations for Asr without Sampling	Jun 10, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Connecting Speech Encoder and Large Language Model for ASR	Sep 25, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Connecting Humanities and Social Sciences: Applying Language and Speech Technology to Online Panel Surveys	Feb 21, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASTER: Automatic Speech Recognition System Accessibility Testing for Stutterers	Aug 30, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Acoustic-Phonetic Approach for ASR of Less Resourced Languages Using Monolingual and Cross-Lingual Information	May 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Confusion2Vec: Towards Enriching Vector Space Word Representations with Representational Ambiguities	Nov 8, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Conformer-Based Speech Recognition On Extreme Edge-Computing Devices	Dec 16, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Assessing the Tolerance of Neural Machine Translation Systems Against Speech Recognition Errors	Apr 24, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Highly Efficient Distributed Deep Learning System For Automatic Speech Recognition	Jul 10, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Conformer-based Hybrid ASR System for Switchboard Dataset	Nov 5, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Conformer-1: Robust ASR via Large-Scale Semisupervised Bootstrapping	Apr 10, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Assessing the Performance of Automatic Speech Recognition Systems When Used by Native and Non-Native Speakers of Three Major Languages in Dictation Workflows	May 1, 2015	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Configurable Privacy-Preserving Automatic Speech Recognition	Apr 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Assessing ASR Model Quality on Disordered Speech using BERTScore	Sep 21, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A higher order Minkowski loss for improved prediction ability of acoustic model in ASR	Dec 2, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Acoustic Model Optimization over Multiple Data Sources: Merging and Valuation	Oct 21, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Accent-Robust Automatic Speech Recognition Using Supervised and Unsupervised Wav2vec Embeddings	Oct 7, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
LegoSLM: Connecting LLM with Speech Encoder using CTC Posteriors	May 16, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Towards interfacing large language models with ASR systems using confidence measures and prompting	Jul 31, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Confidence Score Based Conformer Speaker Adaptation for Speech Recognition	Jun 24, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR Rescoring and Confidence Estimation with ELECTRA	Oct 5, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Conditioning Sequence-to-sequence Networks with Learned Activations	Sep 29, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR is all you need: cross-modal distillation for lip reading	Nov 28, 2019	AllAutomatic Speech Recognition	—Unverified
A Hierarchical Reasoning Graph Neural Network for The Automatic Scoring of Answer Transcriptions in Video Job Interviews	Dec 22, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Concept-Based Embeddings for Natural Language Processing	Jul 15, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR in German: A Detailed Error Analysis	Apr 12, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Computing Optimal Location of Microphone for Improved Speech Recognition	Mar 24, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Compute Cost Amortized Transformer for Streaming ASR	Jul 5, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR-GLUE: A New Multi-task Benchmark for ASR-Robust Natural Language Understanding	Aug 30, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Hierarchical Neural Model for Learning Sequences of Dialogue Acts	Apr 1, 2017	Automatic Speech Recognition (ASR)Machine Translation	—Unverified
Acoustic Model Optimization Based On Evolutionary Stochastic Gradient Descent with Anchors for Automatic Speech Recognition	Jul 10, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Comprehensive Punctuation Restoration for English and Polish	Nov 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Comprehensive Audio Query Handling System with Integrated Expert Models and Contextual Understanding	Dec 5, 2024	Audio GenerationAutomatic Speech Recognition	—Unverified
ASR for Non-standardised Languages with Dialectal Variation: the case of Swiss German	Dec 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Complex-Valued Time-Frequency Self-Attention for Speech Dereverberation	Nov 22, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ASR for Documenting Acutely Under-Resourced Indigenous Languages	May 1, 2018	Automatic Speech Recognition (ASR)Language Modeling	—Unverified

Show:10 25 50

← PrevPage 22 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified