Text to Speech

import gTTS import os def text_to_speech_kurdish(text, output_file="output.mp3"): # گۆڕینی نووسین بۆ دەنگ بە زمانی کوردی (هەڵبژاردنی زمانی "ku" بۆ کوردی) tts = gTTS(text=text, lang='ku', slow=False) tts.save(output_file) os.system(f"start {output_file}") # کردنەوەی فایلە دەنگییەکە (لە Windows) # نموونە: text_to_speech_kurdish("سڵاو، ئەمە دەنگی منە بە زمانی کوردی.")

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 601–650 of 1419 papers

Title	Date	Tasks	Status
Guided Flows for Generative Modeling and Decision Making	Nov 22, 2023	Conditional Image GenerationDecision Making	—Unverified
Cross-speaker Emotion Transfer by Manipulating Speech Style Latents	Mar 15, 2023	text-to-speechText to Speech	—Unverified
A multilingual training strategy for low resource Text to Speech	Sep 2, 2024	Cross-Lingual Transfertext-to-speech	—Unverified
A Multi-Agent Framework for Automated Qinqiang Opera Script Generation Using Large Language Models	Apr 22, 2025	cross-modal alignmentScript Generation	—Unverified
Cross-Lingual Transfer Learning for Phrase Break Prediction with Multilingual Language Model	Jun 5, 2023	Cross-Lingual TransferLanguage Modeling	—Unverified
Accent Conversion in Text-To-Speech Using Multi-Level VAE and Adversarial Training	Jun 3, 2024	Speech Synthesistext-to-speech	—Unverified
Cross-lingual Text-To-Speech with Flow-based Voice Conversion for Improved Pronunciation	Oct 31, 2022	DecoderDisentanglement	—Unverified
Cross-Lingual Text-to-Speech Using Multi-Task Learning and Speaker Classifier Joint Training	Jan 20, 2022	Multi-Task LearningSpeech Synthesis	—Unverified
AttentionStitch: How Attention Solves the Speech Editing Problem	Mar 5, 2024	text-to-speechText to Speech	—Unverified
Handling Numeric Expressions in Automatic Speech Recognition	Jul 18, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
GOAT-TTS: Expressive and Realistic Speech Generation via A Dual-Branch LLM	Apr 15, 2025	QuantizationReading Comprehension	—Unverified
Cross-lingual Multispeaker Text-to-Speech under Limited-Data Scenario	May 21, 2020	AttributeSpeech Synthesis	—Unverified
Cross-lingual Multi-speaker Text-to-speech Synthesis for Voice Cloning without Using Parallel Corpus for Unseen Speakers	Nov 26, 2019	Speech Synthesistext-to-speech	—Unverified
Get Large Language Models Ready to Speak: A Late-fusion Approach for Speech Generation	Oct 27, 2024	parameter-efficient fine-tuningQuestion Answering	—Unverified
GenerTTS: Pronunciation Disentanglement for Timbre and Style Generalization in Cross-Lingual Text-to-Speech	Jun 27, 2023	DisentanglementStyle Generalization	—Unverified
Grapheme-Coherent Phonemic and Prosodic Annotation of Speech by Implicit and Explicit Grapheme Conditioning	Jun 5, 2025	text-to-speechText to Speech	—Unverified
An Investigation of the Relation Between Grapheme Embeddings and Pronunciation for Tacotron-based Systems	Oct 21, 2020	Grapheme-to-Phoneme ConversionRelation	—Unverified
Grapheme-to-Phoneme Transformer Model for Transfer Learning Dialects	Apr 8, 2021	text-to-speechText to Speech	—Unverified
GraphPB: Graphical Representations of Prosody Boundary in Speech Synthesis	Dec 3, 2020	DecoderGraph Embedding	—Unverified
GraphSpeech: Syntax-Aware Graph Attention Network For Neural Speech Synthesis	Oct 23, 2020	Graph AttentionGraph Neural Network	—Unverified
GraphTTS: graph-to-sequence modelling in neural text-to-speech	Mar 4, 2020	Graph EmbeddingGraph-to-Sequence	—Unverified
GRASS: Unified Generation Model for Speech-to-Semantic Tasks	Sep 6, 2023	named-entity-recognitionNamed Entity Recognition	—Unverified
Cross-lingual Knowledge Distillation via Flow-based Voice Conversion for Robust Polyglot Text-To-Speech	Sep 15, 2023	Knowledge DistillationSpeech Synthesis	—Unverified
Generic Indic Text-to-speech Synthesisers with Rapid Adaptation in an End-to-end Framework	Jun 12, 2020	text-to-speechText to Speech	—Unverified
Cross-Domain Audio Deepfake Detection: Dataset and Analysis	Apr 7, 2024	Audio Deepfake DetectionDeepFake Detection	—Unverified
Guided-TTS: A Diffusion Model for Text-to-Speech via Classifier Guidance	Nov 23, 2021	speech-recognitionSpeech Recognition	—Unverified
A Methodology for Controlling the Emotional Expressiveness in Synthetic Speech -- a Deep Learning approach	Jul 5, 2019	text-to-speechText to Speech	—Unverified
Improve Cross-lingual Voice Cloning Using Low-quality Code-switched Data	Oct 14, 2021	text-to-speechText to Speech	—Unverified
Hand Sign to Bangla Speech: A Deep Learning in Vision based system for Recognizing Hand Sign Digits and Generating Bangla Speech	Jan 17, 2019	Gesture Recognitiontext-to-speech	—Unverified
Harder or Different? Understanding Generalization of Audio Deepfake Detection	Jun 5, 2024	Audio Deepfake DetectionDeepFake Detection	—Unverified
Hard-Synth: Synthesizing Diverse Hard Samples for ASR using Zero-Shot TTS and LLM	Nov 20, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Hear Your Code Fail, Voice-Assisted Debugging for Python	Jul 20, 2025	CPUMedical Diagnosis	—Unverified
Hierarchical and Multi-Scale Variational Autoencoder for Diverse and Natural Non-Autoregressive Text-to-Speech	Apr 8, 2022	Diversitytext-to-speech	—Unverified
Hierarchical Context-Aware Transformers for Non-Autoregressive Text to Speech	Jun 29, 2021	DecoderSentence	—Unverified
Cross-Utterance Conditioned VAE for Non-Autoregressive Text-to-Speech	Nov 16, 2021	Diversitytext-to-speech	—Unverified
Hierarchical Multi-Grained Generative Model for Expressive Speech Synthesis	Sep 17, 2020	Expressive Speech SynthesisSpeech Synthesis	—Unverified
Improved Prosodic Clustering for Multispeaker and Speaker-independent Phoneme-level Prosody Control	Nov 19, 2021	ClusteringData Augmentation	—Unverified
Hierarchical Prosody Modeling for Non-Autoregressive Speech Synthesis	Nov 12, 2020	Speech Synthesistext-to-speech	—Unverified
Hierarchical Representation of Prosody for Statistical Speech Synthesis	Oct 7, 2015	Speech Synthesistext-to-speech	—Unverified
Hierarchical Sequence to Sequence Voice Conversion with Limited Data	Jul 15, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Generative Semantic Communication for Text-to-Speech Synthesis	Oct 4, 2024	QuantizationSemantic Communication	—Unverified
Generative Pre-training for Speech with Flow Matching	Oct 25, 2023	Speech EnhancementSpeech Synthesis	—Unverified
HiFiTTS-2: A Large-Scale High Bandwidth Speech Dataset	Jun 4, 2025	Speech Synthesistext-to-speech	—Unverified
Cross-Dialect Text-To-Speech in Pitch-Accent Language Incorporating Multi-Dialect Phoneme-Level BERT	Sep 11, 2024	text-to-speechText to Speech	—Unverified
Audio Deep Fake Detection System with Neural Stitching for ADD 2022	Apr 19, 2022	text-to-speechText to Speech	—Unverified
High-Fidelity Speech Synthesis with Minimal Supervision: All Using Diffusion Models	Sep 27, 2023	AllSpeech Synthesis	—Unverified
Generative Data Augmentation Challenge: Zero-Shot Speech Synthesis for Personalized Speech Enhancement	Jan 23, 2025	Data AugmentationSpeech Enhancement	—Unverified
Highly Effective Arabic Diacritization using Sequence to Sequence Modeling	Jun 1, 2019	Feature EngineeringMachine Translation	—Unverified
High-Quality Automatic Voice Over with Accurate Alignment: Supervision through Self-Supervised Discrete Speech Units	Jun 29, 2023	Speech Synthesistext-to-speech	—Unverified
Creating New Voices using Normalizing Flows	Dec 22, 2023	Speech Synthesistext-to-speech	—Unverified

Show:10 25 50

← PrevPage 13 of 29Next →

No leaderboard results yet.