Text to Speech

import gTTS import os def text_to_speech_kurdish(text, output_file="output.mp3"): # گۆڕینی نووسین بۆ دەنگ بە زمانی کوردی (هەڵبژاردنی زمانی "ku" بۆ کوردی) tts = gTTS(text=text, lang='ku', slow=False) tts.save(output_file) os.system(f"start {output_file}") # کردنەوەی فایلە دەنگییەکە (لە Windows) # نموونە: text_to_speech_kurdish("سڵاو، ئەمە دەنگی منە بە زمانی کوردی.")

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1251–1300 of 1419 papers

Title	Date	Tasks	Status
Synthesizing Dysarthric Speech Using Multi-talker TTS for Dysarthric Speech Recognition	Jan 27, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Synthesizing Personalized Non-speech Vocalization from Discrete Speech Representations	Jun 25, 2022	text-to-speechText to Speech	—Unverified
Synthetic Speaking Children -- Why We Need Them and How to Make Them	Nov 8, 2023	text-to-speechText to Speech	—Unverified
Synthetic Speech Detection Based on Temporal Consistency and Distribution of Speaker Features	Sep 29, 2023	Synthetic Speech Detectiontext-to-speech	—Unverified
Talking Face Generation with Multilingual TTS	May 13, 2022	Face GenerationTalking Face Generation	—Unverified
Talrómur: A large Icelandic TTS corpus	May 1, 2021	text-to-speechText to Speech	—Unverified
Statistical Context-Dependent Units Boundary Correction for Corpus-based Unit-Selection Text-to-Speech	Mar 5, 2020	Segmentationtext-to-speech	—Unverified
Teacher-Student Training for Robust Tacotron-based TTS	Nov 7, 2019	DecoderKnowledge Distillation	—Unverified
Technology Pipeline for Large Scale Cross-Lingual Dubbing of Lecture Videos into Multiple Indian Languages	Nov 1, 2022	ChunkingRhythm	—Unverified
Telephone Surveys Meet Conversational AI: Evaluating a LLM-Based Telephone Survey System at Scale	Feb 27, 2025	AI AgentLarge Language Model	—Unverified
Telephonetic: Making Neural Language Models Robust to ASR and Semantic Noise	Jun 13, 2019	Data AugmentationDecoder	—Unverified
Teochew-Wild: The First In-the-wild Teochew Dataset with Orthographic Annotations	May 8, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Text-aware and Context-aware Expressive Audiobook Speech Synthesis	Jun 9, 2024	Contrastive LearningLanguage Modeling	—Unverified
Text-driven Emotional Style Control and Cross-speaker Style Transfer in Neural TTS	Jul 13, 2022	Language ModelingLanguage Modelling	—Unverified
Text-free non-parallel many-to-many voice conversion using normalising flows	Mar 15, 2022	Normalising FlowsSpeech Synthesis	—Unverified
Text Generation with Speech Synthesis for ASR Data Augmentation	May 22, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Text is All You Need: Personalizing ASR Models using Controllable Speech Synthesis	Mar 27, 2023	AllAutomatic Speech Recognition	—Unverified
Text Is Not All You Need: Multimodal Prompting Helps LLMs Understand Humor	Dec 1, 2024	AllNatural Language Understanding	—Unverified
Textless Streaming Speech-to-Speech Translation using Semantic Speech Tokens	Oct 4, 2024	Language ModelingLanguage Modelling	—Unverified
Text-To-Speech Data Augmentation for Low Resource Speech Recognition	Apr 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Text-To-Speech for Languages without an Orthography	Dec 1, 2012	Speech Synthesistext-to-speech	—Unverified
Text-to-Speech for Under-Resourced Languages: Phoneme Mapping and Source Language Selection in Transfer Learning	Jun 1, 2022	Cross-Lingual Transfertext-to-speech	—Unverified
Text-to-Speech Pipeline for Swiss German -- A comparison	May 31, 2023	Speech Synthesistext-to-speech	—Unverified
Text-to-speech synthesis based on latent variable conversion using diffusion probabilistic model and variational autoencoder	Dec 16, 2022	Representation LearningSpeech Synthesis	—Unverified
Text-To-Speech Synthesis In The Wild	Sep 13, 2024	BenchmarkingSpeaker Recognition	—Unverified
Textual Echo Cancellation	Aug 13, 2020	Acoustic echo cancellationspeech-recognition	—Unverified
The Art of Storytelling: Multi-Agent Generative AI for Dynamic Multimodal Narratives	Sep 17, 2024	text-to-speechText to Speech	—Unverified
The C-ORAL-BRASIL I: Reference Corpus for Spoken Brazilian Portuguese	May 1, 2012	text-to-speechText to Speech	—Unverified
The DeepZen Speech Synthesis System for Blizzard Challenge 2023	Aug 30, 2023	SentenceSpeech Synthesis	—Unverified
The Effects of Input Type and Pronunciation Dictionary Usage in Transfer Learning for Low-Resource Text-to-Speech	Jun 1, 2023	Cross-Lingual Transfertext-to-speech	—Unverified
The FruitShell French synthesis system at the Blizzard 2023 Challenge	Sep 1, 2023	Data AugmentationSpeech Synthesis	—Unverified
The ILMT-s2s Corpus â€• A Multimodal Interlingual Map Task Corpus	May 1, 2016	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
The Impact of Silence on Speech Anti-Spoofing	Sep 21, 2023	Action DetectionActivity Detection	—Unverified
The MSXF TTS System for ICASSP 2022 ADD Challenge	Jan 27, 2022	text-to-speechText to Speech	—Unverified
The Nós Project: Opening routes for the Galician language in the field of language technologies	Jun 1, 2022	Cultural Vocal Bursts Intensity PredictionMachine Translation	—Unverified
The NTU-AISG Text-to-speech System for Blizzard Challenge 2020	Oct 22, 2020	text-to-speechText to Speech	—Unverified
The PartialSpoof Database and Countermeasures for the Detection of Short Fake Speech Segments Embedded in an Utterance	Apr 11, 2022	Speaker VerificationSpeech Synthesis	—Unverified
The Theory behind Controllable Expressive Speech Synthesis: a Cross-disciplinary Approach	Oct 14, 2019	Expressive Speech SynthesisSociology	—Unverified
The VoiceMOS Challenge 2023: Zero-shot Subjective Speech Quality Prediction for Multiple Domains	Oct 4, 2023	Speech Synthesistext-to-speech	—Unverified
The X-LANCE Technical Report for Interspeech 2024 Speech Processing Using Discrete Speech Unit Challenge	Apr 9, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Listening while Speaking and Visualizing: Improving ASR through Multimodal Chain	Jun 3, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
TI-ASU: Toward Robust Automatic Speech Understanding through Text-to-speech Imputation Against Missing Speech Modality	Apr 27, 2024	Imputationtext-to-speech	—Unverified
T-Modules: Translation Modules for Zero-Shot Cross-Modal Machine Translation	May 24, 2022	DecoderMachine Translation	—Unverified
Token-Level Ensemble Distillation for Grapheme-to-Phoneme Conversion	Apr 6, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Total-Duration-Aware Duration Modeling for Text-to-Speech Systems	Jun 6, 2024	Diversitytext-to-speech	—Unverified
Towards Accurate Lip-to-Speech Synthesis in-the-Wild	Mar 2, 2024	Language ModellingLip to Speech Synthesis	—Unverified
Towards a Japanese Full-duplex Spoken Dialogue System	Jun 3, 2025	Spoken Dialogue Systemstext-to-speech	—Unverified
Towards a Language Service Infrastructure for Mobile Environments	May 1, 2016	text-to-speechText to Speech	—Unverified
Towards Evaluating the Robustness of Automatic Speech Recognition Systems via Audio Style Transfer	May 15, 2024	Adversarial AttackAutomatic Speech Recognition	—Unverified
Towards Flow-Matching-based TTS without Classifier-Free Guidance	Apr 29, 2025	Speech Synthesistext-to-speech	—Unverified

Show:10 25 50

← PrevPage 26 of 29Next →

No leaderboard results yet.