Text to Speech

import gTTS import os def text_to_speech_kurdish(text, output_file="output.mp3"): # گۆڕینی نووسین بۆ دەنگ بە زمانی کوردی (هەڵبژاردنی زمانی "ku" بۆ کوردی) tts = gTTS(text=text, lang='ku', slow=False) tts.save(output_file) os.system(f"start {output_file}") # کردنەوەی فایلە دەنگییەکە (لە Windows) # نموونە: text_to_speech_kurdish("سڵاو، ئەمە دەنگی منە بە زمانی کوردی.")

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 726–750 of 1419 papers

Title	Date	Tasks	Status	Hype
Parallel Attention Forcing for Machine Translation	Nov 6, 2022	Machine TranslationNMT	—Unverified	0
Stutter-TTS: Controlled Synthesis and Improved Recognition of Stuttered Speech	Nov 4, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Technology Pipeline for Large Scale Cross-Lingual Dubbing of Lecture Videos into Multiple Indian Languages	Nov 1, 2022	ChunkingRhythm	—Unverified	0
Investigating Content-Aware Neural Text-To-Speech MOS Prediction Using Prosodic and Linguistic Features	Nov 1, 2022	POSPrediction	—Unverified	0
Generating Multilingual Gender-Ambiguous Text-to-Speech Voices	Nov 1, 2022	text-to-speechText to Speech	—Unverified	0
Adapter-Based Extension of Multi-Speaker Text-to-Speech Model for New Speakers	Nov 1, 2022	parameter-efficient fine-tuningSpeech Synthesis	—Unverified	0
Combining Automatic Speaker Verification and Prosody Analysis for Synthetic Speech Detection	Oct 31, 2022	Audio CompressionFace Swapping	—Unverified	0
Structured State Space Decoder for Speech Recognition and Synthesis	Oct 31, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Cross-lingual Text-To-Speech with Flow-based Voice Conversion for Improved Pronunciation	Oct 31, 2022	DecoderDisentanglement	—Unverified	0
Lightweight and High-Fidelity End-to-End Text-to-Speech with Multi-Band Generation and Inverse Short-Time Fourier Transform	Oct 28, 2022	CPUKnowledge Distillation	CodeCode Available	2
Period VITS: Variational Inference with Explicit Pitch Modeling for End-to-end Emotional Speech Synthesis	Oct 28, 2022	DecoderDiversity	—Unverified	0
Residual Adapters for Few-Shot Text-to-Speech Speaker Adaptation	Oct 28, 2022	text-to-speechText to Speech	—Unverified	0
Towards zero-shot Text-based voice editing using acoustic context conditioning, utterance embeddings, and reference encoders	Oct 28, 2022	Speaker Verificationtext-to-speech	—Unverified	0
FCTalker: Fine and Coarse Grained Context Modeling for Expressive Conversational Speech Synthesis	Oct 27, 2022	Speech Synthesistext-to-speech	CodeCode Available	1
Explicit Intensity Control for Accented Text-to-speech	Oct 27, 2022	speech-recognitionSpeech Recognition	—Unverified	0
Virtuoso: Massive Multilingual Speech-Text Joint Semi-Supervised Learning for Text-To-Speech	Oct 27, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Improving Speech-to-Speech Translation Through Unlabeled Text	Oct 26, 2022	Machine Translationspeech-recognition	—Unverified	0
Semi-Supervised Learning Based on Reference Model for Low-resource TTS	Oct 25, 2022	Speech Synthesistext-to-speech	—Unverified	0
Adapitch: Adaption Multi-Speaker Text-to-Speech Conditioned on Pitch Disentangling with Untranscribed Data	Oct 25, 2022	DecoderDisentanglement	—Unverified	0
Efficiently Trained Low-Resource Mongolian Text-to-Speech System Based On FullConv-TTS	Oct 24, 2022	Data AugmentationGPU	—Unverified	0
HiFi-WaveGAN: Generative Adversarial Network with Auxiliary Spectrogram-Phase Loss for High-Fidelity Singing Voice Generation	Oct 23, 2022	Generative Adversarial NetworkSinging Voice Synthesis	CodeCode Available	1
Low-Resource Multilingual and Zero-Shot Multispeaker TTS	Oct 21, 2022	Meta-Learningtext-to-speech	—Unverified	0
Adaptive re-calibration of channel-wise features for Adversarial Audio Classification	Oct 21, 2022	Audio ClassificationFace Swapping	—Unverified	0
Towards Relation Extraction From Speech	Oct 17, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Generating Synthetic Speech from SpokenVocab for Speech Translation	Oct 15, 2022	Data AugmentationMachine Translation	CodeCode Available	0

Show:10 25 50

← PrevPage 30 of 57Next →

No leaderboard results yet.