Automatic Speech Recognition

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 551–600 of 3174 papers

Title	Date	Tasks	Status	Score
ed-cec: improving rare word recognition using asr postprocessing based on error detection and context-aware error correction	Oct 8, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
EESEN: End-to-End Speech Recognition using Deep RNN Models and WFST-based Decoding	Jul 29, 2015	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Domain Specific Wav2vec 2.0 Fine-tuning For The SE&R 2022 Challenge	Jul 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Advances in Small-Footprint Keyword Spotting: A Comprehensive Review of Efficient Models and Algorithms	Jun 12, 2025	Automatic Speech RecognitionKeyword Spotting	CodeCode Available	5
Blank Collapse: Compressing CTC emission for the faster decoding	Oct 31, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Does Joint Training Really Help Cascaded Speech Translation?	Oct 24, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Effectiveness of Text, Acoustic, and Lattice-based representations in Spoken Language Understanding tasks	Dec 16, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
End-to-End Open Vocabulary Keyword Search With Multilingual Neural Representations	Aug 15, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Discrete Speech Unit Extraction via Independent Component Analysis	Jan 11, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Discovering Phonetic Inventories with Crosslingual Automatic Speech Recognition	Jan 26, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Advances in Joint CTC-Attention based End-to-End Speech Recognition with a Deep CNN Encoder and RNN-LM	Jun 8, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Discrete Cross-Modal Alignment Enables Zero-Shot Speech Translation	Oct 18, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Direct Segmentation Models for Streaming Speech Translation	Nov 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Did you hear that? Adversarial Examples Against Automatic Speech Recognition	Jan 2, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
BERT Attends the Conversation: Improving Low-Resource Conversational ASR	Oct 5, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Big model only for hard audios: Sample dependent Whisper model selection for efficient inferences	Sep 22, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Bigger is not Always Better: The Effect of Context Size on Speech Pre-Training	Dec 3, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Effects of Layer Freezing on Transferring a Speech Recognition System to Under-resourced Languages	Feb 8, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
A Comparison of Techniques for Language Model Integration in Encoder-Decoder Speech Recognition	Jul 27, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
DISCO: A Large Scale Human Annotated Corpus for Disfluency Correction in Indo-European Languages	Oct 25, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Bidirectional Quaternion Long-Short Term Memory Recurrent Neural Networks for Speech Recognition	Nov 6, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Bi-Directional Lattice Recurrent Neural Networks for Confidence Estimation	Oct 30, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
DiaCorrect: End-to-end error correction for speaker diarization	Oct 31, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Detecting Adversarial Examples for Speech Recognition via Uncertainty Quantification	May 24, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Deep Learning for Audio Signal Processing	Apr 30, 2019	Audio Signal ProcessingAutomatic Speech Recognition	CodeCode Available	5
Deep Spiking Neural Networks for Large Vocabulary Automatic Speech Recognition	Nov 19, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Detecting and Defending Against Adversarial Attacks on Automatic Speech Recognition via Diffusion Models	Sep 12, 2024	Adversarial AttackAdversarial Purification	CodeCode Available	5
DoCIA: An Online Document-Level Context Incorporation Agent for Speech Translation	Apr 7, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Beyond Levenshtein: Leveraging Multiple Algorithms for Robust Word Error Rate Computations And Granular Error Classifications	Aug 28, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Error-preserving Automatic Speech Recognition of Young English Learners' Language	Jun 5, 2024	Automatic Speech RecognitionLanguage Modelling	CodeCode Available	5
Beyond Instructional Videos: Probing for More Diverse Visual-Textual Grounding on YouTube	Apr 29, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Data augmentation using prosody and false starts to recognize non-native children's speech	Aug 29, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Coupled Training of Sequence-to-Sequence Models for Accented Speech Recognition	May 14, 2020	Accented Speech RecognitionAutomatic Speech Recognition	CodeCode Available	5
Cross-domain Speech Recognition with Unsupervised Character-level Distribution Matching	Apr 15, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Data Fusion for Audiovisual Speaker Localization: Extending Dynamic Stream Weights to the Spatial Domain	Feb 23, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Explainability of Speech Recognition Transformers via Gradient-based Attention Visualization	Jun 2, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
BERSting at the Screams: A Benchmark for Distanced, Emotional and Shouted Speech Recognition	Apr 30, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Continual Learning for Monolingual End-to-End Automatic Speech Recognition	Dec 17, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Contrastive and Consistency Learning for Neural Noisy-Channel Model in Spoken Language Understanding	May 23, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Confusion2vec 2.0: Enriching Ambiguous Spoken Language Representations with Subwords	Feb 3, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Confidence Score Based Speaker Adaptation of Conformer Speech Recognition Systems	Feb 15, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Conformer-based Target-Speaker Automatic Speech Recognition for Single-Channel Audio	Aug 9, 2023	Automatic Speech Recognitionspeech-recognition	CodeCode Available	5
Comparison and Analysis of New Curriculum Criteria for End-to-End ASR	Aug 10, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Fine-Grained Grounding for Multimodal Speech Recognition	Oct 5, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Comparing Self-Supervised Learning Models Pre-Trained on Human Speech and Animal Vocalizations for Bioacoustics Processing	Jan 10, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
BehancePR: A Punctuation Restoration Dataset for Livestreaming Video Transcript	Jul 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
ADIMA: Abuse Detection In Multilingual Audio	Feb 16, 2022	Abuse DetectionAutomatic Speech Recognition	CodeCode Available	5
Fleurs-SLU: A Massively Multilingual Benchmark for Spoken Language Understanding	Jan 10, 2025	Automatic Speech RecognitionClassification	CodeCode Available	5
Conditional independence for pretext task selection in Self-supervised speech representation learning	Apr 15, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Collecting Resources in Sub-Saharan African Languages for Automatic Speech Recognition: a Case Study of Wolof	May 1, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5

Show:10 25 50

← PrevPage 12 of 64Next →

No leaderboard results yet.