Automatic Speech Recognition

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 501–550 of 3174 papers

Title	Date	Tasks	Status	Hype
PI-Whisper: Designing an Adaptive and Incremental Automatic Speech Recognition System for Edge Devices	Jun 21, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Perception of Phonological Assimilation by Neural Speech Recognition Models	Jun 21, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
An Adapter-Based Unified Model for Multiple Spoken Language Processing Tasks	Jun 20, 2024	Automatic Speech RecognitionDecoder	—Unverified	0
Intelligent Interface: Enhancing Lecture Engagement with Didactic Activity Summaries	Jun 20, 2024	Automatic Speech Recognitionspeech-recognition	—Unverified	0
ManWav: The First Manchu ASR Model	Jun 19, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Joint vs Sequential Speaker-Role Detection and Automatic Speech Recognition for Air-traffic Control	Jun 19, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Unsupervised Online Continual Learning for Automatic Speech Recognition	Jun 18, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Finding Task-specific Subnetworks in Multi-task Spoken Language Understanding Model	Jun 18, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Transcribe, Align and Segment: Creating speech datasets for low-resource languages	Jun 18, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Performant ASR Models for Medical Entities in Accented Speech	Jun 18, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Growing Trees on Sounds: Assessing Strategies for End-to-End Dependency Parsing of Speech	Jun 18, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Automatic Speech Recognition for Biomedical Data in Bengali Language	Jun 16, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Continual Test-time Adaptation for End-to-end Speech Recognition on Noisy Speech	Jun 16, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Large Language Models for Dysfluency Detection in Stuttered Speech	Jun 16, 2024	Automatic Speech RecognitionLanguage Modeling	—Unverified	0
CoSTA: Code-Switched Speech Translation using Aligned Speech-Text Interleaving	Jun 16, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Imperceptible Rhythm Backdoor Attacks: Exploring Rhythm Transformation for Embedding Undetectable Vulnerabilities on Speech Recognition	Jun 16, 2024	Automatic Speech RecognitionData Poisoning	—Unverified	0
Optimized Speculative Sampling for GPU Hardware Accelerators	Jun 16, 2024	Automatic Speech RecognitionGPU	CodeCode Available	0
ROAR: Reinforcing Original to Augmented Data Ratio Dynamics for Wav2Vec2.0 Based ASR	Jun 14, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Optimizing Byte-level Representation for End-to-end ASR	Jun 14, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Inclusive ASR for Disfluent Speech: Cascaded Large-Scale Self-Supervised Learning with Targeted Fine-Tuning and Data Augmentation	Jun 14, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Learning Language Structures through Grounding	Jun 14, 2024	Automatic Speech RecognitionDependency Parsing	—Unverified	0
An efficient text augmentation approach for contextualized Mandarin speech recognition	Jun 14, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Multi-Channel Multi-Speaker ASR Using Target Speaker's Solo Segment	Jun 13, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Multi-Modal Retrieval For Large Language Model Based Speech Recognition	Jun 13, 2024	Automatic Speech RecognitionLanguage Modeling	—Unverified	0
The Second DISPLACE Challenge : DIarization of SPeaker and LAnguage in Conversational Environments	Jun 13, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
LASER: Learning by Aligning Self-supervised Representations of Speech for Improving Content-related Tasks	Jun 13, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Transcription-Free Fine-Tuning of Speech Separation Models for Noisy and Reverberant Multi-Speaker Automatic Speech Recognition	Jun 13, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Language Complexity and Speech Recognition Accuracy: Orthographic Complexity Hurts, Phonological Complexity Doesn't	Jun 13, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
ML-SUPERB 2.0: Benchmarking Multilingual Speech Models Across Modeling Constraints, Languages, and Datasets	Jun 12, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Audio-conditioned phonemic and prosodic annotation for building text-to-speech models from unlabeled speech data	Jun 12, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
DualVC 3: Leveraging Language Model Generated Pseudo Context for End-to-end Low Latency Streaming Voice Conversion	Jun 12, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Refining Self-Supervised Learnt Speech Representation using Brain Activations	Jun 12, 2024	Automatic Speech RecognitionSpeaker Verification	—Unverified	0
Speech Emotion Recognition with ASR Transcripts: A Comprehensive Study on Word Error Rate and Fusion Techniques	Jun 12, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Transformer-based Model for ASR N-Best Rescoring and Rewriting	Jun 12, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Dual-Pipeline with Low-Rank Adaptation for New Language Integration in Multilingual ASR	Jun 12, 2024	Automatic Speech RecognitionDecoder	—Unverified	0
PRoDeliberation: Parallel Robust Deliberation for End-to-End Spoken Language Understanding	Jun 12, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Guiding Frame-Level CTC Alignments Using Self-knowledge Distillation	Jun 12, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Towards Unsupervised Speech Recognition Without Pronunciation Models	Jun 12, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Tag and correct: high precision post-editing approach to correction of speech recognition errors	Jun 11, 2024	Automatic Speech Recognitionspeech-recognition	—Unverified	0
Reading Miscue Detection in Primary School through Automatic Speech Recognition	Jun 11, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Fast Context-Biasing for CTC and Transducer ASR models with CTC-based Word Spotter	Jun 11, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
AS-70: A Mandarin stuttered speech dataset for automatic speech recognition and stuttering event detection	Jun 11, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
ASTRA: Aligning Speech and Text Representations for Asr without Sampling	Jun 10, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
MS-HuBERT: Mitigating Pre-training and Inference Mismatch in Masked Language Modelling methods for learning Speech Representations	Jun 9, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
LoRA-Whisper: Parameter-Efficient and Extensible Multilingual ASR	Jun 7, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Pitch-Aware RNN-T for Mandarin Chinese Mispronunciation Detection and Diagnosis	Jun 7, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Flexible Multichannel Speech Enhancement for Noise-Robust Frontend	Jun 6, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
To Distill or Not to Distill? On the Robustness of Robust Knowledge Distillation	Jun 6, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Hypernetworks for Personalizing ASR to Atypical Speech	Jun 6, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
LipGER: Visually-Conditioned Generative Error Correction for Robust Automatic Speech Recognition	Jun 6, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1

Show:10 25 50

← PrevPage 11 of 64Next →

No leaderboard results yet.