Automatic Speech Recognition

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 651–675 of 3174 papers

Title	Date	Tasks	Status	Hype
Mel-FullSubNet: Mel-Spectrogram Enhancement for Improving Both Speech Quality and ASR	Feb 21, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
OWSM-CTC: An Open Encoder-Only Speech Foundation Model for Speech Recognition, Translation, and Language Identification	Feb 20, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
How do Hyenas deal with Human Speech? Speech Recognition and Translation with ConfHyena	Feb 20, 2024	Automatic Speech Recognitionimage-classification	—Unverified	0
Ain't Misbehavin' -- Using LLMs to Generate Expressive Robot Behavior in Conversations with the Tabletop Robot Haru	Feb 18, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
UniEnc-CASSNAT: An Encoder-only Non-autoregressive ASR for Speech SSL Models	Feb 14, 2024	Automatic Speech RecognitionDecoder	—Unverified	0
An Embarrassingly Simple Approach for LLM with Strong ASR Capacity	Feb 13, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	2
AIR-Bench: Benchmarking Large Audio-Language Models via Generative Comprehension	Feb 12, 2024	2kAutomatic Speech Recognition	CodeCode Available	2
The Sound of Healthcare: Improving Medical Transcription ASR Accuracy with Large Language Models	Feb 12, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
The Balancing Act: Unmasking and Alleviating ASR Biases in Portuguese	Feb 12, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Self-consistent context aware conformer transducer for speech recognition	Feb 9, 2024	Automatic Speech RecognitionLanguage Modeling	—Unverified	0
It's Never Too Late: Fusing Acoustic Information into Large Language Models for Automatic Speech Recognition	Feb 8, 2024	Audio-Visual Speech RecognitionAutomatic Speech Recognition	CodeCode Available	1
Paralinguistics-Aware Speech-Empowered Large Language Models for Natural Conversation	Feb 8, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	2
Progressive unsupervised domain adaptation for ASR using ensemble models and multi-stage training	Feb 7, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
REBORN: Reinforcement-Learned Boundary Segmentation with Iterative Training for Unsupervised ASR	Feb 6, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Resolving Transcription Ambiguity in Spanish: A Hybrid Acoustic-Lexical System for Punctuation Restoration	Feb 5, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
A Comprehensive Study of the Current State-of-the-Art in Nepali Automatic Speech Recognition Systems	Feb 5, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Predicting positive transfer for improved low-resource speech recognition using acoustic pseudo-tokens	Feb 3, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Whispering in Norwegian: Navigating Orthographic and Dialectic Challenges	Feb 2, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Digits micro-model for accurate and secure transactions	Feb 2, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
AccentFold: A Journey through African Accents for Zero-Shot ASR Adaptation to Target Accents	Feb 2, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Streaming Sequence Transduction through Dynamic Compression	Feb 2, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Byte Pair Encoding Is All You Need For Automatic Bengali Speech Recognition	Jan 28, 2024	AllAutomatic Speech Recognition	—Unverified	0
Toward Practical Automatic Speech Recognition and Post-Processing: a Call for Explainable Error Benchmark Guideline	Jan 26, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
MF-AED-AEC: Speech Emotion Recognition by Leveraging Multimodal Fusion, Asr Error Detection, and Asr Error Correction	Jan 24, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Locality enhanced dynamic biasing and sampling strategies for contextual ASR	Jan 23, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0

Show:10 25 50

← PrevPage 27 of 127Next →

No leaderboard results yet.