Automatic Speech Recognition

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 3174 papers

Title	Date	Tasks	Status	Hype
Not All Errors Are Equal: Investigation of Speech Recognition Errors in Alzheimer's Disease Detection	Dec 9, 2024	AllAlzheimer's Disease Detection	—Unverified	0
SQ-Whisper: Speaker-Querying based Whisper Model for Target-Speaker ASR	Dec 7, 2024	Automatic Speech RecognitionData Augmentation	CodeCode Available	0
Comprehensive Audio Query Handling System with Integrated Expert Models and Contextual Understanding	Dec 5, 2024	Audio GenerationAutomatic Speech Recognition	—Unverified	0
ASR-EC Benchmark: Evaluating Large Language Models on Chinese ASR Error Correction	Dec 4, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
GLM-4-Voice: Towards Intelligent and Human-Like End-to-End Spoken Chatbot	Dec 3, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	7
Late fusion ensembles for speech recognition on diverse input audio representations	Dec 1, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
A Comparative Study of LLM-based ASR and Whisper in Low Resource and Code Switching Scenario	Dec 1, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Empowering the Deaf and Hard of Hearing Community: Enhancing Video Captions Using Large Language Models	Nov 30, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
How to Learn a New Language? An Efficient Solution for Self-Supervised Learning Models Unseen Languages Adaption in Low-Resource Scenario	Nov 27, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
MSA-ASR: Efficient Multilingual Speaker Attribution with frozen ASR Models	Nov 27, 2024	Automatic Speech Recognitionspeech-recognition	—Unverified	0
AMPS: ASR with Multimodal Paraphrase Supervision	Nov 27, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Aligning Pre-trained Models for Spoken Language Translation	Nov 27, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Continual Learning in Machine Speech Chain Using Gradient Episodic Memory	Nov 27, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Enhancing Code-Switching ASR Leveraging Non-Peaky CTC Loss and Deep Language Posterior Injection	Nov 26, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Disentangled-Transformer: An Explainable End-to-End Automatic Speech Recognition Model with Speech Content-Context Separation	Nov 26, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
k2SSL: A Faster and Better Framework for Self-Supervised Speech Representation Learning	Nov 26, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Towards Maximum Likelihood Training for Transducer-based Streaming Speech Recognition	Nov 26, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Scaling Speech-Text Pre-training with Synthetic Interleaved Data	Nov 26, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	7
High-precision medical speech recognition through synthetic data and semantic correction: UNITED-MEDASR	Nov 24, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Transforming NLU with Babylon: A Case Study in Development of Real-time, Edge-Efficient, Multi-Intent Translation System for Automated Drive-Thru Ordering	Nov 22, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Tiny-Align: Bridging Automatic Speech Recognition and Large Language Model on the Edge	Nov 21, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
From Statistical Methods to Pre-Trained Models; A Survey on Automatic Speech Recognition for Resource Scarce Urdu Language	Nov 20, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Hard-Synth: Synthesizing Diverse Hard Samples for ASR using Zero-Shot TTS and LLM	Nov 20, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
CAFE A Novel Code switching Dataset for Algerian Dialect French and English	Nov 20, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Whisper Finetuning on Nepali Language	Nov 19, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Inter-linguistic Phonetic Composition (IPC): A Theoretical and Computational Approach to Enhance Second Language Pronunciation	Nov 17, 2024	Automatic Speech Recognitionspeech-recognition	—Unverified	0
XLSR-Mamba: A Dual-Column Bidirectional State Space Model for Spoofing Attack Detection	Nov 15, 2024	Audio Deepfake DetectionAutomatic Speech Recognition	CodeCode Available	1
Everyone deserves their voice to be heard: Analyzing Predictive Gender Bias in ASR Models Applied to Dutch Speech Data	Nov 14, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Transferable Adversarial Attacks against ASR	Nov 14, 2024	Action DetectionActivity Detection	—Unverified	0
DCF-DS: Deep Cascade Fusion of Diarization and Separation for Speech Recognition under Realistic Single-Channel Conditions	Nov 11, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
CTC-Assisted LLM-Based Contextual ASR	Nov 10, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Dialectal Coverage And Generalization in Arabic Speech Recognition	Nov 7, 2024	Arabic Speech RecognitionAutomatic Speech Recognition	CodeCode Available	2
Multistage Fine-tuning Strategies for Automatic Speech Recognition in Low-resource Languages	Nov 7, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Enhancing AAC Software for Dysarthric Speakers in e-Health Settings: An Evaluation Using TORGO	Nov 1, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Augmenting Polish Automatic Speech Recognition System With Synthetic Data	Oct 30, 2024	Automatic Speech Recognitionspeech-recognition	—Unverified	0
Run-Time Adaptation of Neural Beamforming for Robust Speech Dereverberation and Denoising	Oct 30, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Joint Beamforming and Speaker-Attributed ASR for Real Distant-Microphone Meeting Transcription	Oct 29, 2024	Automatic Speech Recognitionspeech-recognition	—Unverified	0
Asynchronous Tool Usage for Real-Time Agents	Oct 28, 2024	Automatic Speech Recognitionspeech-recognition	—Unverified	0
Improving Speech-based Emotion Recognition with Contextual Utterance Analysis and LLMs	Oct 27, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
emg2qwerty: A Large Dataset with Baselines for Touch Typing using Surface Electromyography	Oct 26, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	2
A Survey on Speech Large Language Models	Oct 24, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Evaluating and Improving Automatic Speech Recognition Systems for Korean Meteorological Experts	Oct 24, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
ELAICHI: Enhancing Low-resource TTS by Addressing Infrequent and Low-frequency Character Bigrams	Oct 23, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Improving Automatic Speech Recognition with Decoder-Centric Regularisation in Encoder-Decoder Models	Oct 22, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
DENOASR: Debiasing ASRs through Selective Denoising	Oct 22, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
VoiceBench: Benchmarking LLM-Based Voice Assistants	Oct 22, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	3
Enhancing Low-Resource ASR through Versatile TTS: Bridging the Data Gap	Oct 22, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Interventional Speech Noise Injection for ASR Generalizable Spoken Language Understanding	Oct 21, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Acoustic Model Optimization over Multiple Data Sources: Merging and Valuation	Oct 21, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
End-to-End Transformer-based Automatic Speech Recognition for Northern Kurdish: A Pioneering Approach	Oct 19, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0

Show:10 25 50

← PrevPage 6 of 64Next →

No leaderboard results yet.