Automatic Speech Recognition

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 901–950 of 3174 papers

Title	Date	Tasks	Status
Mel-FullSubNet: Mel-Spectrogram Enhancement for Improving Both Speech Quality and ASR	Feb 21, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
OWSM-CTC: An Open Encoder-Only Speech Foundation Model for Speech Recognition, Translation, and Language Identification	Feb 20, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
How do Hyenas deal with Human Speech? Speech Recognition and Translation with ConfHyena	Feb 20, 2024	Automatic Speech Recognitionimage-classification	—Unverified
Ain't Misbehavin' -- Using LLMs to Generate Expressive Robot Behavior in Conversations with the Tabletop Robot Haru	Feb 18, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
UniEnc-CASSNAT: An Encoder-only Non-autoregressive ASR for Speech SSL Models	Feb 14, 2024	Automatic Speech RecognitionDecoder	—Unverified
The Sound of Healthcare: Improving Medical Transcription ASR Accuracy with Large Language Models	Feb 12, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The Balancing Act: Unmasking and Alleviating ASR Biases in Portuguese	Feb 12, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Self-consistent context aware conformer transducer for speech recognition	Feb 9, 2024	Automatic Speech RecognitionLanguage Modeling	—Unverified
Progressive unsupervised domain adaptation for ASR using ensemble models and multi-stage training	Feb 7, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Resolving Transcription Ambiguity in Spanish: A Hybrid Acoustic-Lexical System for Punctuation Restoration	Feb 5, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Comprehensive Study of the Current State-of-the-Art in Nepali Automatic Speech Recognition Systems	Feb 5, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Predicting positive transfer for improved low-resource speech recognition using acoustic pseudo-tokens	Feb 3, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Digits micro-model for accurate and secure transactions	Feb 2, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Whispering in Norwegian: Navigating Orthographic and Dialectic Challenges	Feb 2, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Streaming Sequence Transduction through Dynamic Compression	Feb 2, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
AccentFold: A Journey through African Accents for Zero-Shot ASR Adaptation to Target Accents	Feb 2, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Byte Pair Encoding Is All You Need For Automatic Bengali Speech Recognition	Jan 28, 2024	AllAutomatic Speech Recognition	—Unverified
Toward Practical Automatic Speech Recognition and Post-Processing: a Call for Explainable Error Benchmark Guideline	Jan 26, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
MF-AED-AEC: Speech Emotion Recognition by Leveraging Multimodal Fusion, Asr Error Detection, and Asr Error Correction	Jan 24, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Locality enhanced dynamic biasing and sampling strategies for contextual ASR	Jan 23, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Keep Decoding Parallel with Effective Knowledge Distillation from Language Models to End-to-end Speech Recognisers	Jan 22, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Consistency Based Unsupervised Self-training For ASR Personalisation	Jan 22, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Using Large Language Model for End-to-End Chinese ASR and NER	Jan 21, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Contextualized Automatic Speech Recognition with Attention-Based Bias Phrase Boosted Beam Search	Jan 19, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
SlideAVSR: A Dataset of Paper Explanation Videos for Audio-Visual Speech Recognition	Jan 18, 2024	Audio-Visual Speech RecognitionAutomatic Speech Recognition	—Unverified
Communication-Efficient Personalized Federated Learning for Speech-to-Text Tasks	Jan 18, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
AGADIR: Towards Array-Geometry Agnostic Directional Speech Recognition	Jan 18, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
On Speech Pre-emphasis as a Simple and Inexpensive Method to Boost Speech Enhancement	Jan 17, 2024	Automatic Speech RecognitionSpeech Enhancement	—Unverified
Improving ASR Contextual Biasing with Guided Attention	Jan 16, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
NOTSOFAR-1 Challenge: New Datasets, Baseline, and Tasks for Distant Meeting Transcription	Jan 16, 2024	Automatic Speech RecognitionBenchmarking	—Unverified
Multi-Input Multi-Output Target-Speaker Voice Activity Detection For Unified, Flexible, and Robust Audio-Visual Speaker Diarization	Jan 16, 2024	Action DetectionActivity Detection	—Unverified
SeMaScore : a new evaluation metric for automatic speech recognition tasks	Jan 15, 2024	Automatic Speech Recognitionspeech-recognition	—Unverified
Cascaded Cross-Modal Transformer for Audio-Textual Classification	Jan 15, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Promptformer: Prompted Conformer Transducer for ASR	Jan 14, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Joint Unsupervised and Supervised Training for Automatic Speech Recognition via Bilevel Optimization	Jan 13, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Transcending Controlled Environments Assessing the Transferability of ASRRobust NLU Models to Real-World Applications	Jan 12, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
XLS-R Deep Learning Model for Multilingual ASR on Low- Resource Languages: Indonesian, Javanese, and Sundanese	Jan 12, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
UCorrect: An Unsupervised Framework for Automatic Speech Recognition Error Correction	Jan 11, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
End to end Hindi to English speech conversion using Bark, mBART and a finetuned XLSR Wav2Vec2	Jan 11, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Useful Blunders: Can Automated Speech Recognition Errors Improve Downstream Dementia Classification?	Jan 10, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Continuously Learning New Words in Automatic Speech Recognition	Jan 9, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Exploratory Evaluation of Speech Content Masking	Jan 8, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
High-precision Voice Search Query Correction via Retrievable Speech-text Embedings	Jan 8, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
LUPET: Incorporating Hierarchical Information Path into Multilingual ASR	Jan 8, 2024	Acoustic Unit DiscoveryAutomatic Speech Recognition	—Unverified
BS-PLCNet: Band-split Packet Loss Concealment Network with Multi-task Learning Framework and Multi-discriminators	Jan 8, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ICMC-ASR: The ICASSP 2024 In-Car Multi-Channel Automatic Speech Recognition Challenge	Jan 7, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
MLCA-AVSR: Multi-Layer Cross Attention Fusion based Audio-Visual Speech Recognition	Jan 7, 2024	Audio-Visual Speech RecognitionAutomatic Speech Recognition	—Unverified
Multichannel AV-wav2vec2: A Framework for Learning Multichannel Multi-Modal Speech Representation	Jan 7, 2024	Audio-Visual Speech RecognitionAutomatic Speech Recognition	CodeCode Available
TeLeS: Temporal Lexeme Similarity Score to Estimate Confidence in End-to-End ASR	Jan 6, 2024	Active LearningAutomatic Speech Recognition	CodeCode Available
Task Oriented Dialogue as a Catalyst for Self-Supervised Automatic Speech Recognition	Jan 4, 2024	AttributeAutomatic Speech Recognition	CodeCode Available

Show:10 25 50

← PrevPage 19 of 64Next →

No leaderboard results yet.