Automatic Speech Recognition

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 3174 papers

Title	Date	Tasks	Status	Hype
Adapting Whisper for Regional Dialects: Enhancing Public Services for Vulnerable Populations in the United Kingdom	Jan 15, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
persoDA: Personalized Data Augmentation for Personalized ASR	Jan 15, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
A Non-autoregressive Model for Joint STT and TTS	Jan 15, 2025	Automatic Speech Recognitionspeech-recognition	—Unverified	0
Selective Attention Merging for low resource tasks: A case study of Child ASR	Jan 14, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Loudspeaker Beamforming to Enhance Speech Recognition Performance of Voice Driven Applications	Jan 14, 2025	Automatic Speech Recognitionspeech-recognition	—Unverified	0
Joint Automatic Speech Recognition And Structure Learning For Better Speech Understanding	Jan 13, 2025	Automatic Speech Recognitionintent-classification	CodeCode Available	0
AdaCS: Adaptive Normalization for Enhanced Code-Switching ASR	Jan 13, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Speech Recognition for Automatically Assessing Afrikaans and isiXhosa Preschool Oral Narratives	Jan 11, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Discrete Speech Unit Extraction via Independent Component Analysis	Jan 11, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
A Survey on Spoken Italian Datasets and Corpora	Jan 11, 2025	Automatic Speech Recognitionspeech-recognition	—Unverified	0
Contextual ASR Error Handling with LLMs Augmentation for Goal-Oriented Conversational AI	Jan 10, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Fleurs-SLU: A Massively Multilingual Benchmark for Spoken Language Understanding	Jan 10, 2025	Automatic Speech RecognitionClassification	CodeCode Available	0
Benchmarking Rotary Position Embeddings for Automatic Speech Recognition	Jan 10, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Comparing Self-Supervised Learning Models Pre-Trained on Human Speech and Animal Vocalizations for Bioacoustics Processing	Jan 10, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Universal-2-TF: Robust All-Neural Text Formatting for ASR	Jan 10, 2025	AllAutomatic Speech Recognition	—Unverified	0
Universal Speaker Embedding Free Target Speaker Extraction and Personal Voice Activity Detection	Jan 7, 2025	Action DetectionActivity Detection	—Unverified	0
Deep Learning for Pathological Speech: A Survey	Jan 7, 2025	Automatic Speech RecognitionData Augmentation	—Unverified	0
Samba-ASR: State-Of-The-Art Speech Recognition Leveraging Structured State-Space Models	Jan 6, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Listening and Seeing Again: Generative Error Correction for Audio-Visual Speech Recognition	Jan 3, 2025	Audio-Visual Speech RecognitionAutomatic Speech Recognition	CodeCode Available	0
Improving Transducer-Based Spoken Language Understanding with Self-Conditioned CTC and Knowledge Transfer	Jan 3, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Advancing Singlish Understanding: Bridging the Gap with Datasets and Multimodal Models	Jan 2, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
LiveCC: Learning Video LLM with Streaming Speech Transcription at Scale	Jan 1, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Breaking Through the Spike: Spike Window Decoding for Accelerated and Precise Automatic Speech Recognition	Jan 1, 2025	Automatic Speech Recognitionspeech-recognition	—Unverified	0
Large Language Models Are Read/Write Policy-Makers for Simultaneous Generation	Jan 1, 2025	Automatic Speech RecognitionDecoder	CodeCode Available	1
Automatic Text Pronunciation Correlation Generation and Application for Contextual Biasing	Jan 1, 2025	Automatic Speech Recognitionspeech-recognition	—Unverified	0
Whisper Turns Stronger: Augmenting Wav2Vec 2.0 for Superior ASR in Low-Resource Languages	Dec 31, 2024	Automatic Speech RecognitionData Augmentation	—Unverified	0
Fotheidil: an Automatic Transcription System for the Irish Language	Dec 31, 2024	Action DetectionActivity Detection	—Unverified	0
DiCoW: Diarization-Conditioned Whisper for Target Speaker Automatic Speech Recognition	Dec 30, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	2
Enhancing Whisper's Accuracy and Speed for Indian Languages through Prompt-Tuning and Tokenization	Dec 27, 2024	Automatic Speech Recognitionspeech-recognition	—Unverified	0
Enhancing Audiovisual Speech Recognition through Bifocal Preference Optimization	Dec 26, 2024	Automatic Speech Recognitionspeech-recognition	—Unverified	0
Zero-resource Speech Translation and Recognition with LLMs	Dec 24, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
UME: Upcycling Mixture-of-Experts for Scalable and Efficient Automatic Speech Recognition	Dec 23, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Enhancing Multilingual ASR for Unseen Languages via Language Embedding Modeling	Dec 21, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Transducer-Llama: Integrating LLMs into Streamable Transducer-based Speech Recognition	Dec 21, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Adapting Whisper for Code-Switching through Encoding Refining and Language-Aware Decoding	Dec 21, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Speech Retrieval-Augmented Generation without Automatic Speech Recognition	Dec 21, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
TouchASP: Elastic Automatic Speech Perception that Everyone Can Touch	Dec 20, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
MathSpeech: Leveraging Small LMs for Accurate Conversion in Mathematical Speech-to-Formula	Dec 20, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
LAMA-UT: Language Agnostic Multilingual ASR through Orthography Unification and Language-Specific Transliteration	Dec 19, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Transcribing and Translating, Fast and Slow: Joint Speech Translation and Recognition	Dec 19, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Streaming Keyword Spotting Boosted by Cross-layer Discrimination Consistency	Dec 17, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	2
Speak & Improve Challenge 2025: Tasks and Baseline Systems	Dec 16, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Speak & Improve Corpus 2025: an L2 English Speech Corpus for Language Assessment and Feedback	Dec 16, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Transliterated Zero-Shot Domain Adaptation for Automatic Speech Recognition	Dec 15, 2024	Automatic Speech RecognitionDomain Adaptation	—Unverified	0
Efficient Adaptation of Multilingual Models for Japanese ASR	Dec 14, 2024	Automatic Speech Recognitionspeech-recognition	CodeCode Available	0
Greek2MathTex: A Greek Speech-to-Text Framework for LaTeX Equations Generation	Dec 11, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Bilevel Joint Unsupervised and Supervised Training for Automatic Speech Recognition	Dec 11, 2024	Automatic Speech Recognitionspeech-recognition	—Unverified	0
Harnessing Transfer Learning from Swahili: Advancing Solutions for Comorian Dialects	Dec 9, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Leveraging Prompt Learning and Pause Encoding for Alzheimer's Disease Detection	Dec 9, 2024	Alzheimer's Disease DetectionAutomatic Speech Recognition	—Unverified	0
Effective Text Adaptation for LLM-based ASR through Soft Prompt Fine-Tuning	Dec 9, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0

Show:10 25 50

← PrevPage 5 of 64Next →

No leaderboard results yet.