Automatic Speech Recognition

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 851–900 of 3174 papers

Title	Date	Tasks	Status	Hype
Harnessing the Zero-Shot Power of Instruction-Tuned Large Language Model in End-to-End Speech Recognition	Sep 19, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
HTEC: Human Transcription Error Correction	Sep 18, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Corpus Synthesis for Zero-shot ASR domain Adaptation using Large Language Models	Sep 18, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Training dynamic models using early exits for automatic speech recognition on resource-constrained devices	Sep 18, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
HypR: A comprehensive study for ASR hypothesis revising with a reference corpus	Sep 18, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Investigating End-to-End ASR Architectures for Long Form Audio Transcription	Sep 18, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Instruction-Following Speech Recognition	Sep 18, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Distilling HuBERT with LSTMs via Decoupled Knowledge Distillation	Sep 18, 2023	Automatic Speech RecognitionKnowledge Distillation	—Unverified	0
A Multitask Training Approach to Enhance Whisper with Contextual Biasing and Open-Vocabulary Keyword Spotting	Sep 18, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Continuous Modeling of the Denoising Process for Speech Enhancement Based on Deep Learning	Sep 17, 2023	Automatic Speech RecognitionDenoising	—Unverified	0
Enhancing Quantised End-to-End ASR Models via Personalisation	Sep 17, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Improving Speech Recognition for African American English With Audio Classification	Sep 16, 2023	Audio ClassificationAutomatic Speech Recognition	—Unverified	0
Decoder-only Architecture for Speech Recognition with CTC Prompts and Text Data Augmentation	Sep 16, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Boosting End-to-End Multilingual Phoneme Recognition through Exploiting Universal Speech Attributes Constraints	Sep 16, 2023	AttributeAutomatic Speech Recognition	—Unverified	0
Transformer Based Punctuation Restoration for Turkish	Sep 15, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
t-SOT FNT: Streaming Multi-talker ASR with Text-only Domain Adaptation Capability	Sep 15, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
DiaCorrect: Error Correction Back-end For Speaker Diarization	Sep 15, 2023	Automatic Speech RecognitionDecoder	CodeCode Available	1
Unimodal Aggregation for CTC-based Speech Recognition	Sep 15, 2023	Automatic Speech RecognitionDecoder	CodeCode Available	1
Towards Word-Level End-to-End Neural Speaker Diarization with Auxiliary Network	Sep 15, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Combining TF-GridNet and Mixture Encoder for Continuous Speech Separation for Meeting Transcription	Sep 15, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Echotune: A Modular Extractor Leveraging the Variable-Length Nature of Speech in ASR Tasks	Sep 14, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Hybrid Attention-based Encoder-decoder Model for Efficient Language Model Adaptation	Sep 14, 2023	Automatic Speech RecognitionDecoder	—Unverified	0
CPPF: A contextual and post-processing-free model for automatic speech recognition	Sep 14, 2023	Automatic Speech Recognitionspeech-recognition	—Unverified	0
PromptASR for contextualized ASR with controllable style	Sep 14, 2023	Automatic Speech Recognitionspeech-recognition	CodeCode Available	2
EnCodecMAE: Leveraging neural codecs for universal audio representation learning	Sep 14, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
FunCodec: A Fundamental, Reproducible and Integrable Open-source Toolkit for Neural Speech Codec	Sep 14, 2023	Automatic Speech Recognitionspeech-recognition	CodeCode Available	2
Enhancing Child Vocalization Classification with Phonetically-Tuned Embeddings for Assisting Autism Diagnosis	Sep 13, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Open-vocabulary Keyword-spotting with Adaptive Instance Normalization	Sep 13, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Can Whisper perform speech-based in-context learning?	Sep 13, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Improving Robustness of Neural Inverse Text Normalization via Data-Augmentation, Semi-Supervised Learning, and Post-Aligning Method	Sep 12, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Kid-Whisper: Towards Bridging the Performance Gap in Automatic Speech Recognition for Children VS. Adults	Sep 12, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Hybrid ASR for Resource-Constrained Robots: HMM - Deep Learning Fusion	Sep 11, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Leveraging Large Language Models for Exploiting ASR Uncertainty	Sep 9, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Perceptual and Task-Oriented Assessment of a Semantic Metric for ASR Evaluation	Sep 7, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Multiple Representation Transfer from Large Language Models to End-to-End ASR Systems	Sep 7, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
LanSER: Language-Model Supported Speech Emotion Recognition	Sep 7, 2023	Automatic Speech RecognitionEmotion Recognition	—Unverified	0
TODM: Train Once Deploy Many Efficient Supernet-Based RNN-T Compression For On-device ASR Models	Sep 5, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Bring the Noise: Introducing Noise Robustness to Pretrained Automatic Speech Recognition	Sep 5, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
AVATAR: Robust Voice Search Engine Leveraging Autoregressive Document Retrieval and Contrastive Learning	Sep 4, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Text-Only Domain Adaptation for End-to-End Speech Recognition through Down-Sampling Acoustic Representation	Sep 4, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Contextual Biasing of Named-Entities with Large Language Models	Sep 1, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Learning Speech Representation From Contrastive Token-Acoustic Pretraining	Sep 1, 2023	Audio ClassificationAutomatic Speech Recognition	—Unverified	0
Knowledge Distillation from Non-streaming to Streaming ASR Encoder using Auxiliary Non-streaming Layer	Aug 31, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
ASTER: Automatic Speech Recognition System Accessibility Testing for Stutterers	Aug 30, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Adapting Text-based Dialogue State Tracker for Spoken Dialogues	Aug 29, 2023	Automatic Speech RecognitionData Augmentation	—Unverified	0
Unsupervised Active Learning: Optimizing Labeling Cost-Effectiveness for Automatic Speech Recognition	Aug 28, 2023	Active LearningAutomatic Speech Recognition	—Unverified	0
Neural approaches to spoken content embedding	Aug 28, 2023	Automatic Speech RecognitionDynamic Time Warping	—Unverified	0
Decoupled Structure for Improved Adaptability of End-to-End Models	Aug 25, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
A Small and Fast BERT for Chinese Medical Punctuation Restoration	Aug 24, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
SeamlessM4T: Massively Multilingual & Multimodal Machine Translation	Aug 22, 2023	Automatic Speech RecognitionMachine Translation	CodeCode Available	2

Show:10 25 50

← PrevPage 18 of 64Next →

No leaderboard results yet.