Automatic Speech Recognition

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–400 of 3174 papers

Title	Date	Tasks	Status	Hype
LM-assisted keyword biasing with Aho-Corasick algorithm for Transducer-based ASR	Sep 20, 2024	ARCAutomatic Speech Recognition	—Unverified	0
A Multimodal Dense Retrieval Approach for Speech-Based Open-Domain Question Answering	Sep 20, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Personalized Speech Recognition for Children with Test-Time Adaptation	Sep 19, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Enhancing Synthetic Training Data for Speech Commands: From ASR-Based Filtering to Domain Adaptation in SSL Latent Space	Sep 19, 2024	Automatic Speech RecognitionData Augmentation	—Unverified	0
Channel-Aware Domain-Adaptive Generative Adversarial Network for Robust Speech Recognition	Sep 19, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
META-CAT: Speaker-Informed Speech Embeddings via Meta Information Concatenation for Multi-talker ASR	Sep 18, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Large Language Models are Strong Audio-Visual Speech Recognition Learners	Sep 18, 2024	Audio-Visual Speech RecognitionAutomatic Speech Recognition	CodeCode Available	2
ASR Benchmarking: Need for a More Representative Conversational Dataset	Sep 18, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
WER We Stand: Benchmarking Urdu ASR Models	Sep 17, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Zero Shot Text to Speech Augmentation for Automatic Speech Recognition on Low-Resource Accented Speech Corpora	Sep 17, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Chain-of-Thought Prompting for Speech Translation	Sep 17, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Ideal-LLM: Integrating Dual Encoders and Language-Adapted LLM for Multilingual Speech-to-Text	Sep 17, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
M-BEST-RQ: A Multi-Channel Speech Foundation Model for Smart Glasses	Sep 17, 2024	Action DetectionActivity Detection	—Unverified	0
A Study on Zero-shot Non-intrusive Speech Assessment using Large Language Models	Sep 16, 2024	Automatic Speech RecognitionPrompt Engineering	—Unverified	0
SMILE: Speech Meta In-Context Learning for Low-Resource Language Automatic Speech Recognition	Sep 16, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
An Efficient Self-Learning Framework For Interactive Spoken Dialog Systems	Sep 16, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Augmenting Automatic Speech Recognition Models with Disfluency Detection	Sep 16, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Large Language Model Based Generative Error Correction: A Challenge and Baselines for Speech Recognition, Speaker Tagging, and Emotion Recognition	Sep 15, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
ASR Error Correction using Large Language Models	Sep 14, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
CPT-Boosted Wav2vec2.0: Towards Noise Robust Speech Recognition for Classroom Environments	Sep 13, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Learnings from curating a trustworthy, well-annotated, and useful dataset of disordered English speech	Sep 13, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Exploring SSL Discrete Tokens for Multilingual ASR	Sep 13, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Exploring the Impact of Data Quantity on ASR in Extremely Low-resource Languages	Sep 13, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Multi-modal Speech Transformer Decoders: When Do Multiple Modalities Improve Accuracy?	Sep 13, 2024	Automatic Speech RecognitionDecoder	—Unverified	0
LA-RAG:Enhancing LLM-based ASR Accuracy with Retrieval-Augmented Generation	Sep 13, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
NEST-RQ: Next Token Prediction for Speech Self-Supervised Pre-Training	Sep 13, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Large Language Model Can Transcribe Speech in Multi-Talker Scenarios with Versatile Instructions	Sep 13, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	2
Detecting and Defending Against Adversarial Attacks on Automatic Speech Recognition via Diffusion Models	Sep 12, 2024	Adversarial AttackAdversarial Purification	CodeCode Available	0
The Faetar Benchmark: Speech Recognition in a Very Under-Resourced Language	Sep 12, 2024	Automatic Speech Recognitionspeech-recognition	—Unverified	0
WhisperNER: Unified Open Named Entity and Speech Recognition	Sep 12, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	3
Full-text Error Correction for Chinese Speech Recognition with Large Language Model	Sep 12, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Enhancing CTC-Based Visual Speech Recognition	Sep 11, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Linear Time Complexity Conformers with SummaryMixing for Streaming Speech Recognition	Sep 11, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
An Effective Context-Balanced Adaptation Approach for Long-Tailed Speech Recognition	Sep 10, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Keyword-Aware ASR Error Augmentation for Robust Dialogue State Tracking	Sep 10, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Advancing Topic Segmentation of Broadcasted Speech with Multilingual Semantic Embeddings	Sep 10, 2024	Automatic Speech RecognitionDiversity	CodeCode Available	0
NTT Multi-Speaker ASR System for the DASR Task of CHiME-8 Challenge	Sep 9, 2024	Action DetectionActivity Detection	—Unverified	0
An investigation of modularity for noise robustness in conformer-based ASR	Sep 9, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
A Toolkit for Joint Speaker Diarization and Identification with Application to Speaker-Attributed ASR	Sep 9, 2024	Automatic Speech Recognitionspeaker-diarization	—Unverified	0
Retrieval Augmented Correction of Named Entity Speech Recognition Errors	Sep 9, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Findings of the 2024 Mandarin Stuttering Event Detection and Automatic Speech Recognition Challenge	Sep 9, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Evaluation of real-time transcriptions using end-to-end ASR models	Sep 9, 2024	Action DetectionActivity Detection	—Unverified	0
Exploring WavLM Back-ends for Speech Spoofing and Deepfake Detection	Sep 8, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Probing self-attention in self-supervised speech models for cross-linguistic differences	Sep 4, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Quantification of stylistic differences in human- and ASR-produced transcripts of African American English	Sep 4, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
What is lost in Normalization? Exploring Pitfalls in Multilingual ASR Model Evaluations	Sep 4, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Reassessing Noise Augmentation Methods in the Context of Adversarial Speech	Sep 3, 2024	Adversarial RobustnessAutomatic Speech Recognition	—Unverified	0
Temporal Order Preserved Optimal Transport-based Cross-modal Knowledge Transfer Learning for ASR	Sep 3, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
VoxHakka: A Dialectally Diverse Multi-speaker Text-to-Speech System for Taiwanese Hakka	Sep 3, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Resource-Efficient Adaptation of Speech Foundation Models for Multi-Speaker ASR	Sep 2, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0

Show:10 25 50

← PrevPage 8 of 64Next →

No leaderboard results yet.