Speech-to-Text

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–400 of 403 papers

Title	Date	Tasks	Status
Kurdish (Sorani) Speech to Text: Presenting an Experimental Dataset	Nov 29, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Finstreder: Simple and fast Spoken Language Understanding with Finite State Transducers using modern Speech-to-Text models	Jun 29, 2022	Intent ClassificationSlot Filling	CodeCode Available
CoVoSwitch: Machine Translation of Synthetic Code-Switched Text Based on Intonation Units	Jul 19, 2024	Machine TranslationSpeech-to-Text	CodeCode Available
Joint CTC-Attention based End-to-End Speech Recognition using Multi-task Learning	Sep 21, 2016	DecoderMulti-Task Learning	CodeCode Available
Let's Give a Voice to Conversational Agents in Virtual Reality	Aug 4, 2023	Speech-to-Texttext-to-speech	CodeCode Available
fairseq S2T: Fast Speech-to-Text Modeling with fairseq	Oct 11, 2020	Machine TranslationMulti-Task Learning	CodeCode Available
BeaverTalk: Oregon State University's IWSLT 2025 Simultaneous Speech Translation System	May 29, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Tools and resources for Romanian text-to-speech and speech-to-text applications	Feb 15, 2018	speech-recognitionSpeech Recognition	CodeCode Available
LibriS2S: A German-English Speech-to-Speech Translation Corpus	Apr 22, 2022	Speech-to-Speech TranslationSpeech-to-Text	CodeCode Available
Voices Unheard: NLP Resources and Models for Yorùbá Regional Dialects	Jun 27, 2024	Automatic Speech RecognitionMachine Translation	CodeCode Available
Listen and Speak Fairly: A Study on Semantic Gender Bias in Speech Integrated Large Language Models	Jul 9, 2024	coreference-resolutionCoreference Resolution	CodeCode Available
Listen and Translate: A Proof of Concept for End-to-End Speech-to-Text Translation	Dec 6, 2016	Speech-to-TextSpeech-to-Text Translation	CodeCode Available
Investigating Zero-Shot Generalizability on Mandarin-English Code-Switched ASR and Speech-to-text Translation of Recent Foundation Models with Self-Supervision and Weak Supervision	Dec 30, 2023	Speech-to-TextSpeech-to-Text Translation	CodeCode Available
Simultaneous Interpretation Corpus Construction by Large Language Models in Distant Language Pair	Apr 18, 2024	Machine TranslationSpeech-to-Text	CodeCode Available
Spanish and English Phoneme Recognition by Training on Simulated Classroom Audio Recordings of Collaborative Learning Environments	Feb 21, 2022	Data AugmentationPhoneme Recognition	CodeCode Available
SparQLe: Speech Queries to Text Translation Through LLMs	Feb 13, 2025	Speech-to-TextSpeech-to-Text Translation	CodeCode Available
Streaming Sequence Transduction through Dynamic Compression	Feb 2, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
M-Adapter: Modality Adaptation for End-to-End Speech-to-Text Translation	Jul 3, 2022	DecoderSpeech-to-Text	CodeCode Available
A Change of Heart: Improving Speech Emotion Recognition through Speech-to-Text Modality Conversion	Jul 21, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Measuring the Effect of Transcription Noise on Downstream Language Understanding Tasks	Feb 19, 2025	Automatic Speech Recognitionspeech-recognition	CodeCode Available
InstaIndoor and Multi-modal Deep Learning for Indoor Scene Recognition	Dec 23, 2021	BenchmarkingDeep Learning	CodeCode Available
End-to-End Learning of Speech 2D Feature-Trajectory for Prosthetic Hands	Sep 22, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Pre-training on high-resource speech recognition improves low-resource speech-to-text translation	Sep 5, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
A wearable sensor vest for social humanoid robots with GPGPU, IoT, and modular software architecture	Jan 6, 2022	Speech-to-Texttext-to-speech	CodeCode Available
Greek2MathTex: A Greek Speech-to-Text Framework for LaTeX Equations Generation	Dec 11, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
End-to-End Automatic Speech Translation of Audiobooks	Feb 12, 2018	automatic-speech-translationSpeech-to-Text	CodeCode Available
Augmenting Librispeech with French Translations: A Multimodal Corpus for Direct Speech Translation Evaluation	Feb 9, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
End to End ASR System with Automatic Punctuation Insertion	Dec 3, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Code-Switched Urdu ASR for Noisy Telephonic Environment using Data Centric Approach with Hybrid HMM and CNN-TDNN	Jul 24, 2023	Automatic Speech RecognitionSentiment Analysis	CodeCode Available
Audio Adversarial Examples: Targeted Attacks on Speech-to-Text	Jan 5, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Efficient Speech Translation with Dynamic Latent Perceivers	Oct 28, 2022	Speech-to-TextSpeech-to-Text Translation	CodeCode Available
Careless Whisper: Speech-to-Text Hallucination Harms	Feb 12, 2024	HallucinationLanguage Modeling	CodeCode Available
Re-Translation Strategies For Long Form, Simultaneous, Spoken Language Translation	Dec 6, 2019	FormMachine Translation	CodeCode Available
Towards End-to-end Speech-to-text Summarization	Jun 6, 2023	Abstractive Text SummarizationSpeech-to-Text	CodeCode Available
Don't Discard Fixed-Window Audio Segmentation in Speech-to-Text Translation	Oct 24, 2022	SegmentationSpeech-to-Text	CodeCode Available
Towards End-to-End Training of Automatic Speech Recognition for Nigerian Pidgin	Oct 21, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Synchronous Speech Recognition and Speech-to-Text Translation with Interactive Decoding	Dec 16, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
A Dataset for Speech Emotion Recognition in Greek Theatrical Plays	Mar 27, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
WACO: Word-Aligned Contrastive Learning for Speech Translation	Dec 19, 2022	Contrastive LearningSpeech-to-Text	CodeCode Available
Transformer-Based Named Entity Recognition for Automated Server Provisioning	Apr 1, 2025	named-entity-recognitionNamed Entity Recognition	CodeCode Available
Automatic Quality Assessment for Speech Translation Using Joint ASR and MT Features	Sep 20, 2016	Speech-to-TextTranslation	CodeCode Available
Attentively Embracing Noise for Robust Latent Representation in BERT	Dec 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
SpeechUT: Bridging Speech and Text with Hidden-Unit for Encoder-Decoder Based Speech-Text Pre-training	Oct 7, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Scribosermo: Fast Speech-to-Text models for German and other Languages	Oct 15, 2021	Speech RecognitionSpeech-to-Text	CodeCode Available
FunnyNet-W: Multimodal Learning of Funny Moments in Videos in the Wild	Jan 8, 2024	Language ModellingLarge Language Model	CodeCode Available
Direct speech-to-speech translation with a sequence-to-sequence model	Apr 12, 2019	Speech SynthesisSpeech-to-Speech Translation	CodeCode Available
mask-Net: Learning Context Aware Invariant Features using Adversarial Forgetting (Student Abstract)	Nov 25, 2020	Speech-to-Text	CodeCode Available
An Empirical Study of Consistency Regularization for End-to-End Speech-to-Text Translation	Aug 28, 2023	Machine TranslationNMT	CodeCode Available
SPGISpeech: 5,000 hours of transcribed financial audio for fully formatted end-to-end speech recognition	Apr 5, 2021	speech-recognitionSpeech Recognition	CodeCode Available
Tensor Comprehensions: Framework-Agnostic High-Performance Machine Learning Abstractions	Feb 13, 2018	BIG-bench Machine LearningManagement	CodeCode Available

Show:10 25 50

← PrevPage 8 of 9Next →

No leaderboard results yet.