Speech-to-Text

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–400 of 403 papers

Title	Date	Tasks	Status
CUIfy the XR: An Open-Source Package to Embed LLM-powered Conversational Agents in XR	Nov 7, 2024	Language ModellingLarge Language Model	—Unverified
DARTS: Dialectal Arabic Transcription System	Sep 26, 2019	Language ModelingLanguage Modelling	—Unverified
Data Efficient Direct Speech-to-Text Translation with Modality Agnostic Meta-Learning	Nov 11, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Decision Attentive Regularization to Improve Simultaneous Speech Translation Systems	Oct 13, 2021	SentenceSimultaneous Speech-to-Text Translation	—Unverified
DeepCruiser: Automated Guided Testing for Stateful Deep Learning Systems	Dec 13, 2018	Deep LearningSpeech-to-Text	—Unverified
Deepfake audio as a data augmentation technique for training automatic speech to text transcription models	Sep 22, 2023	Data AugmentationFace Swapping	—Unverified
Deep Learning Based Natural Language Processing for End to End Speech Translation	Aug 9, 2018	Speech-to-TextTranslation	—Unverified
Deep Speech Based End-to-End Automated Speech Recognition (ASR) for Indian-English Accents	Apr 3, 2022	speech-recognitionSpeech Recognition	—Unverified
Design of a novel Korean learning application for efficient pronunciation correction	May 4, 2022	Sentencespeech-recognition	—Unverified
Developing a Speech Recognition System for Recognizing Tonal Speech Signals Using a Convolutional Neural Network	Jun 17, 2022	speech-recognitionSpeech Recognition	—Unverified
Developing automatic verbatim transcripts for international multilingual meetings: an end-to-end solution	Sep 27, 2023	Machine TranslationManagement	—Unverified
Development of Natural Language Processing Tools for Cook Islands M\=aori	Dec 1, 2018	Machine TranslationPart-Of-Speech Tagging	—Unverified
Dialetto, ma Quanto Dialetto? Transcribing and Evaluating Dialects on a Continuum	Oct 18, 2024	Speech-to-Text	—Unverified
Digits micro-model for accurate and secure transactions	Feb 2, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Direct Punjabi to English speech translation using discrete units	Feb 25, 2024	Speech-to-Speech TranslationSpeech-to-Text	—Unverified
Direct Simultaneous Speech-to-Text Translation Assisted by Synchronized Streaming ASR	Jun 11, 2021	Simultaneous Speech-to-Text TranslationSpeech-to-Text	—Unverified
Effectively pretraining a speech translation decoder with Machine Translation data	Nov 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Efficient Monotonic Multihead Attention	Dec 7, 2023	Simultaneous Speech-to-Text TranslationSpeech-to-Text	—Unverified
End-to-End Offline Speech Translation System for IWSLT 2020 using Modality Agnostic Meta-Learning	Jul 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
End-to-End Simultaneous Translation System for IWSLT2020 Using Modality Agnostic Meta-Learning	Jul 1, 2020	Meta-LearningSpeech-to-Text	—Unverified
End-to-End Speech-to-Text Translation: A Survey	Dec 2, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
End-to-End Speech Translation for Low-Resource Languages Using Weakly Labeled Data	Jun 19, 2025	SentenceSpeech-to-Text	—Unverified
Enhanced Direct Speech-to-Speech Translation Using Self-supervised Pre-training and Data Augmentation	Apr 6, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Enhancing Speech-to-Speech Translation with Multiple TTS Targets	Apr 10, 2023	Speech-to-Speech TranslationSpeech-to-Text	—Unverified
Enhancing Transformer for End-to-end Speech-to-Text Translation	Aug 1, 2019	Speech-to-TextSpeech-to-Text Translation	—Unverified
Ensemble Chinese End-to-End Spoken Language Understanding for Abnormal Event Detection from audio stream	Oct 19, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ESPnet-ST-v2: Multipurpose Spoken Language Translation Toolkit	Apr 10, 2023	BenchmarkingSimultaneous Speech-to-Text Translation	—Unverified
Europarl-ST: A Multilingual Corpus For Speech Translation Of Parliamentary Debates	Nov 8, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Evaluating Voice Command Pipelines for Drone Control: From STT and LLM to Direct Classification and Siamese Networks	Jul 10, 2024	Language ModelingLanguage Modelling	—Unverified
Evaluation of real-time transcriptions using end-to-end ASR models	Sep 9, 2024	Action DetectionActivity Detection	—Unverified
Existential Crisis: A Social Robot's Reason for Being	Jan 6, 2025	Speech-to-Text	—Unverified
Exploration of End-to-End ASR for OpenSTT -- Russian Open Speech-to-Text Dataset	Jun 15, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Exploring Transfer Learning For End-to-End Spoken Language Understanding	Dec 15, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Extending RNN-T-based speech recognition systems with emotion and language classification	Jul 28, 2022	Emotion ClassificationEmotion Recognition	—Unverified
Fast Labeling and Transcription with the Speechalyzer Toolkit	May 1, 2012	Audio ClassificationBenchmarking	—Unverified
Findings of the Second Workshop on Automatic Simultaneous Translation	Jun 1, 2021	Machine TranslationSpeech-to-Text	—Unverified
Findings of the Third Workshop on Automatic Simultaneous Translation	Jul 1, 2022	Speech-to-TextTranslation	—Unverified
Finetuning End-to-End Models for Estonian Conversational Spoken Language Translation	Jul 4, 2024	Machine Translationspeech-recognition	—Unverified
Focusing Robot Open-Ended Reinforcement Learning Through Users' Purposes	Mar 16, 2025	Large Language Modelreinforcement-learning	—Unverified
Google USM: Scaling Automatic Speech Recognition Beyond 100 Languages	Mar 2, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Graph Neural Networks to Predict Customer Satisfaction Following Interactions with a Corporate Call Center	Jan 31, 2021	Graph Neural NetworkSpeech-to-Text	—Unverified
Handling and extracting key entities from customer conversations using Speech recognition and Named Entity recognition	Nov 28, 2022	named-entity-recognitionNamed Entity Recognition	—Unverified
Hands-Free VR	Feb 23, 2024	DiversityLanguage Modelling	—Unverified
Hearing voices at the National Library -- a speech corpus and acoustic model for the Swedish language	May 6, 2022	speech-recognitionSpeech Recognition	—Unverified
How "Real" is Your Real-Time Simultaneous Speech-to-Text Translation System?	Dec 24, 2024	Simultaneous Speech-to-Text TranslationSpeech-to-Text	—Unverified
How to Connect Speech Foundation Models and Large Language Models? What Matters and What Does Not	Sep 25, 2024	Automatic Speech Recognitionspeech-recognition	—Unverified
Hybrid Transducer and Attention based Encoder-Decoder Modeling for Speech-to-Text Tasks	May 4, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Ideal-LLM: Integrating Dual Encoders and Language-Adapted LLM for Multilingual Speech-to-Text	Sep 17, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Impact of Microphone position Measurement Error on Multi Channel Distant Speech Recognition & Intelligibility	Dec 1, 2021	Distant Speech RecognitionPosition	—Unverified
Improved Cross-Lingual Transfer Learning For Automatic Speech Translation	Jun 1, 2023	automatic-speech-translationCross-Lingual Transfer	—Unverified

Show:10 25 50

← PrevPage 8 of 9Next →

No leaderboard results yet.