Automatic Speech Recognition

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1051–1100 of 3174 papers

Title	Date	Tasks	Status
Unsupervised Pre-Training for Vietnamese Automatic Speech Recognition in the HYKIST Project	Sep 26, 2023	Automatic Speech Recognitionspeech-recognition	—Unverified
Segmentation-Free Streaming Machine Translation	Sep 26, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Learning from Flawed Data: Weakly Supervised Automatic Speech Recognition	Sep 26, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
AutoPrep: An Automatic Preprocessing Framework for In-the-Wild Speech Data	Sep 25, 2023	Automatic Speech RecognitionSpeech Enhancement	—Unverified
Connecting Speech Encoder and Large Language Model for ASR	Sep 25, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Speech enhancement with frequency domain auto-regressive modeling	Sep 24, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Cross-modal Alignment with Optimal Transport for CTC-based ASR	Sep 24, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Human Transcription Quality Improvement	Sep 24, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
My Science Tutor (MyST) -- A Large Corpus of Children's Conversational Speech	Sep 23, 2023	Automatic Speech Recognitionspeech-recognition	—Unverified
Dynamic ASR Pathways: An Adaptive Masking Approach Towards Efficient Pruning of A Multilingual ASR Model	Sep 22, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Importance of Smoothness Induced by Optimizers in FL4ASR: Towards Understanding Federated Learning for End-to-End ASR	Sep 22, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
NTT speaker diarization system for CHiME-7: multi-domain, multi-microphone End-to-end and vector clustering diarization	Sep 22, 2023	Automatic Speech Recognitionspeaker-diarization	—Unverified
Affect Recognition in Conversations Using Large Language Models	Sep 22, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Massive End-to-end Models for Short Search Queries	Sep 22, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Big model only for hard audios: Sample dependent Whisper model selection for efficient inferences	Sep 22, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
A Multiscale Autoencoder (MSAE) Framework for End-to-End Neural Network Speech Enhancement	Sep 21, 2023	Automatic Speech RecognitionSpeech Enhancement	—Unverified
Sparsely Shared LoRA on Whisper for Child Speech Recognition	Sep 21, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
AudioFool: Fast, Universal and synchronization-free Cross-Domain Attack on Speech Recognition	Sep 20, 2023	Automatic Speech Recognitionspeech-recognition	—Unverified
Leveraging Data Collection and Unsupervised Learning for Code-switched Tunisian Arabic Automatic Speech Recognition	Sep 20, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Harnessing the Zero-Shot Power of Instruction-Tuned Large Language Model in End-to-End Speech Recognition	Sep 19, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Incorporating Ultrasound Tongue Images for Audio-Visual Speech Enhancement	Sep 19, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Exploring Speech Enhancement for Low-resource Speech Synthesis	Sep 19, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Semi-Autoregressive Streaming ASR With Label Context	Sep 19, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Distilling HuBERT with LSTMs via Decoupled Knowledge Distillation	Sep 18, 2023	Automatic Speech RecognitionKnowledge Distillation	—Unverified
Corpus Synthesis for Zero-shot ASR domain Adaptation using Large Language Models	Sep 18, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
HTEC: Human Transcription Error Correction	Sep 18, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Investigating End-to-End ASR Architectures for Long Form Audio Transcription	Sep 18, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Multitask Training Approach to Enhance Whisper with Contextual Biasing and Open-Vocabulary Keyword Spotting	Sep 18, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Instruction-Following Speech Recognition	Sep 18, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Training dynamic models using early exits for automatic speech recognition on resource-constrained devices	Sep 18, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Continuous Modeling of the Denoising Process for Speech Enhancement Based on Deep Learning	Sep 17, 2023	Automatic Speech RecognitionDenoising	—Unverified
Enhancing Quantised End-to-End ASR Models via Personalisation	Sep 17, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Improving Speech Recognition for African American English With Audio Classification	Sep 16, 2023	Audio ClassificationAutomatic Speech Recognition	—Unverified
Decoder-only Architecture for Speech Recognition with CTC Prompts and Text Data Augmentation	Sep 16, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Boosting End-to-End Multilingual Phoneme Recognition through Exploiting Universal Speech Attributes Constraints	Sep 16, 2023	AttributeAutomatic Speech Recognition	—Unverified
Transformer Based Punctuation Restoration for Turkish	Sep 15, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Towards Word-Level End-to-End Neural Speaker Diarization with Auxiliary Network	Sep 15, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Combining TF-GridNet and Mixture Encoder for Continuous Speech Separation for Meeting Transcription	Sep 15, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
t-SOT FNT: Streaming Multi-talker ASR with Text-only Domain Adaptation Capability	Sep 15, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Echotune: A Modular Extractor Leveraging the Variable-Length Nature of Speech in ASR Tasks	Sep 14, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Hybrid Attention-based Encoder-decoder Model for Efficient Language Model Adaptation	Sep 14, 2023	Automatic Speech RecognitionDecoder	—Unverified
CPPF: A contextual and post-processing-free model for automatic speech recognition	Sep 14, 2023	Automatic Speech Recognitionspeech-recognition	—Unverified
Enhancing Child Vocalization Classification with Phonetically-Tuned Embeddings for Assisting Autism Diagnosis	Sep 13, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Can Whisper perform speech-based in-context learning?	Sep 13, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Open-vocabulary Keyword-spotting with Adaptive Instance Normalization	Sep 13, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving Robustness of Neural Inverse Text Normalization via Data-Augmentation, Semi-Supervised Learning, and Post-Aligning Method	Sep 12, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Kid-Whisper: Towards Bridging the Performance Gap in Automatic Speech Recognition for Children VS. Adults	Sep 12, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Hybrid ASR for Resource-Constrained Robots: HMM - Deep Learning Fusion	Sep 11, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Leveraging Large Language Models for Exploiting ASR Uncertainty	Sep 9, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Multiple Representation Transfer from Large Language Models to End-to-End ASR Systems	Sep 7, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 22 of 64Next →

No leaderboard results yet.