Automatic Speech Recognition (ASR)

Automatic Speech Recognition (ASR) involves converting spoken language into written text. It is designed to transcribe spoken words into text in real-time, allowing people to communicate with computers, mobile devices, and other technology using their voice. The goal of Automatic Speech Recognition is to accurately transcribe speech, taking into account variations in accent, pronunciation, and speaking style, as well as background noise and other factors that can affect speech quality.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2551–2600 of 3012 papers

Title	Date	Tasks	Status
Advanced Long-context End-to-end Speech Recognition Using Context-expanded Transformers	Apr 19, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Advancing Arabic Speech Recognition Through Large-Scale Weakly Supervised Learning	Apr 16, 2025	Arabic Speech RecognitionAutomatic Speech Recognition	—Unverified
Advancing CTC-CRF Based End-to-End Speech Recognition with Wordpieces and Conformers	Jul 7, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Advancing Hearing Assessment: An ASR-Based Frequency-Specific Speech Test for Diagnosing Presbycusis	May 28, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Advancing Momentum Pseudo-Labeling with Conformer and Initialization Strategy	Oct 11, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Advancing Multi-talker ASR Performance with Large Language Models	Aug 30, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Advancing Speech Recognition With No Speech Or With Noisy Speech	Jun 17, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Adversarial Attacks and Defenses for Speech Recognition Systems	Mar 31, 2021	Adversarial RobustnessAutomatic Speech Recognition	—Unverified
Adversarial Attacks on ASR Systems: An Overview	Aug 3, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Adversarial Black-Box Attacks on Automatic Speech Recognition Systems using Multi-Objective Evolutionary Optimization	Nov 4, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Adversarial Joint Training with Self-Attention Mechanism for Robust End-to-End Speech Recognition	Apr 3, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Adversarial Meta Sampling for Multilingual Low-Resource Speech Recognition	Dec 22, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Adversarial Speaker Adaptation	Apr 29, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Adversarial Speaker Disentanglement Using Unannotated External Data for Self-supervised Representation Based Voice Conversion	May 16, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Adversarial synthesis based data-augmentation for code-switched spoken language identification	May 30, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Adversarial Training for Multilingual Acoustic Modeling	Jun 17, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Adversarial Training of End-to-end Speech Recognition Using a Criticizing Language Model	Nov 2, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Advocating Character Error Rate for Multilingual ASR Evaluation	Oct 9, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Affect Recognition in Conversations Using Large Language Models	Sep 22, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Fine-tuned Wav2vec 2.0/HuBERT Benchmark For Speech Emotion Recognition, Speaker Verification and Spoken Language Understanding	Nov 4, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
AfriNames: Most ASR models "butcher" African Names	Jun 1, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
AfriSpeech-200: Pan-African Accented Speech Dataset for Clinical and General Domain ASR	Sep 30, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Afrispeech-Dialog: A Benchmark Dataset for Spontaneous English Conversations in Healthcare and Beyond	Feb 6, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
AGADIR: Towards Array-Geometry Agnostic Directional Speech Recognition	Jan 18, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A GEN AI Framework for Medical Note Generation	Sep 27, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A General Multi-Task Learning Framework to Leverage Text Data for Speech to Text Tasks	Oct 21, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Generative Model of a Pronunciation Lexicon for Hindi	May 6, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Genetic Programming Approach To Zero-Shot Neural Architecture Ranking	Oct 8, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Agent-Aware Dropout DQN for Safe and Efficient On-line Dialogue Policy Learning	Sep 1, 2017	Automatic Speech Recognition (ASR)Dialogue Management	—Unverified
A Hardware-Oriented and Memory-Efficient Method for CTC Decoding	May 8, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Hierarchical Neural Model for Learning Sequences of Dialogue Acts	Apr 1, 2017	Automatic Speech Recognition (ASR)Machine Translation	—Unverified
A Hierarchical Reasoning Graph Neural Network for The Automatic Scoring of Answer Transcriptions in Video Job Interviews	Dec 22, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A higher order Minkowski loss for improved prediction ability of acoustic model in ASR	Dec 2, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Highly Efficient Distributed Deep Learning System For Automatic Speech Recognition	Jul 10, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Ain't Misbehavin' -- Using LLMs to Generate Expressive Robot Behavior in Conversations with the Tabletop Robot Haru	Feb 18, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bonseyes AI Pipeline -- bringing AI to you. End-to-end integration of data, algorithms and deployment tools	Jan 15, 2019	Automatic Speech Recognition (ASR)image-classification	—Unverified
A Joint Model of Orthography and Morphological Segmentation	Jun 1, 2016	Automatic Speech Recognition (ASR)Keyword Spotting	—Unverified
A Language Agnostic Multilingual Streaming On-Device ASR System	Aug 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Lexical-aware Non-autoregressive Transformer-based ASR Model	May 18, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Algorithms For Automatic Accentuation And Transcription Of Russian Texts In Speech Recognition Systems	Oct 3, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A light-weight and efficient punctuation and word casing prediction model for on-device streaming ASR	Jul 18, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Light-weight contextual spelling correction model for customizing transducer-based speech recognition systems	Aug 17, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Aligning Pre-trained Models for Spoken Language Translation	Nov 27, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Aligning Speech to Languages to Enhance Code-switching Speech Recognition	Mar 9, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Alignment Entropy Regularization	Dec 22, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Alignment-Free Training for Transducer-based Multi-Talker ASR	Sep 30, 2024	AllAutomatic Speech Recognition	—Unverified
Alignment Knowledge Distillation for Online Streaming Attention-based Speech Recognition	Feb 28, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Alignment Restricted Streaming Recurrent Neural Network Transducer	Nov 5, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Align With Purpose: Optimize Desired Properties in CTC Models with a General Plug-and-Play Framework	Jul 4, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Align, Write, Re-order: Explainable End-to-End Speech Translation via Operation Sequence Generation	Nov 11, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 52 of 61Next →

All datasets LRS2 RealMAN Sagalee HUI speech corpus LRS3-TED M-AILabs speech dataset The Spoken Wikipedia Corpora Voxforge German VoxPopuli

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	TM-CTC	Test WER	10.1	—	Unverified
2	TM-seq2seq	Test WER	9.7	—	Unverified
3	CTC/attention	Test WER	8.2	—	Unverified
4	LF-MMI TDNN	Test WER	6.7	—	Unverified
5	Whisper-LLaMA	Test WER	6.6	—	Unverified
6	End2end Conformer	Test WER	3.9	—	Unverified
7	End2end Conformer	Test WER	3.7	—	Unverified
8	MoCo + wav2vec (w/o extLM)	Test WER	2.7	—	Unverified
9	CTC/Attention	Test WER	1.5	—	Unverified
10	Whisper	Test WER	1.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpatialNet	CER	14.5	—	Unverified
2	CleanMel-L-mask	CER	14.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer	Test WER	15.32	—	Unverified
2	Whisper-largev3-finetuned	Test WER	10.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	1.89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DistillAV	WER	1.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	4.28	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	8.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer	WER (%)	3.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Conformer Transducer (German)	WER (%)	8.98	—	Unverified