Automatic Speech Recognition

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 3174 papers

Title	Date	Tasks	Status	Hype
LiteASR: Efficient Automatic Speech Recognition with Low-Rank Approximation	Feb 27, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	2
DiCoW: Diarization-Conditioned Whisper for Target Speaker Automatic Speech Recognition	Dec 30, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	2
Streaming Keyword Spotting Boosted by Cross-layer Discrimination Consistency	Dec 17, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	2
Dialectal Coverage And Generalization in Arabic Speech Recognition	Nov 7, 2024	Arabic Speech RecognitionAutomatic Speech Recognition	CodeCode Available	2
emg2qwerty: A Large Dataset with Baselines for Touch Typing using Surface Electromyography	Oct 26, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	2
MOSEL: 950,000 Hours of Speech Data for Open-Source Speech Foundation Model Training on EU Languages	Oct 1, 2024	Automatic Speech Recognitionspeech-recognition	CodeCode Available	2
Recent Advances in Speech Language Models: A Survey	Oct 1, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	2
Large Language Models are Strong Audio-Visual Speech Recognition Learners	Sep 18, 2024	Audio-Visual Speech RecognitionAutomatic Speech Recognition	CodeCode Available	2
Large Language Model Can Transcribe Speech in Multi-Talker Scenarios with Versatile Instructions	Sep 13, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	2
wav2graph: A Framework for Supervised Learning Knowledge Graph from Speech	Aug 8, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	2
Pretraining End-to-End Keyword Search with Automatically Discovered Acoustic Units	Jul 5, 2024	Acoustic Unit DiscoveryAutomatic Speech Recognition	CodeCode Available	2
Let's Fuse Step by Step: A Generative Fusion Decoding Algorithm with LLMs for Multi-modal Text Recognition	May 23, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	2
PixIT: Joint Training of Speaker Diarization and Speech Separation from Real-world Multi-speaker Recordings	Mar 4, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	2
An Embarrassingly Simple Approach for LLM with Strong ASR Capacity	Feb 13, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	2
AIR-Bench: Benchmarking Large Audio-Language Models via Generative Comprehension	Feb 12, 2024	2kAutomatic Speech Recognition	CodeCode Available	2
Paralinguistics-Aware Speech-Empowered Large Language Models for Natural Conversation	Feb 8, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	2
Large Language Models are Efficient Learners of Noise-Robust Speech Recognition	Jan 19, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	2
Whispering LLaMA: A Cross-Modal Generative Error Correction Framework for Speech Recognition	Oct 10, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	2
LauraGPT: Listen, Attend, Understand, and Regenerate Audio with GPT	Oct 7, 2023	Audio captioningAutomatic Speech Recognition	CodeCode Available	2
LibriSpeech-PC: Benchmark for Evaluation of Punctuation and Capitalization Capabilities of end-to-end ASR Models	Oct 4, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	2
FunCodec: A Fundamental, Reproducible and Integrable Open-source Toolkit for Neural Speech Codec	Sep 14, 2023	Automatic Speech Recognitionspeech-recognition	CodeCode Available	2
PromptASR for contextualized ASR with controllable style	Sep 14, 2023	Automatic Speech Recognitionspeech-recognition	CodeCode Available	2
SeamlessM4T: Massively Multilingual & Multimodal Machine Translation	Aug 22, 2023	Automatic Speech RecognitionMachine Translation	CodeCode Available	2
Auto-AVSR: Audio-Visual Speech Recognition with Automatic Labels	Mar 25, 2023	Audio-Visual Speech RecognitionAutomatic Speech Recognition	CodeCode Available	2
Stabilizing Transformer Training by Preventing Attention Entropy Collapse	Mar 11, 2023	Automatic Speech Recognitionimage-classification	CodeCode Available	2

Show:10 25 50

← PrevPage 2 of 127Next →

No leaderboard results yet.