Une p\'enalit\'e floue fond\'ee phonologiquement pour am\'eliorer la S\'election d'Unit\'e (A Phonologically Motivated Penalty To Improve Unit Selection)
David Guennec, Damien Lolive
Unverified — Be the first to reproduce this paper.
ReproduceAbstract
Les syst\`emes de synth\`ese par corpus reposent, sauf de rares exceptions, sur des co\^uts cibles et des co\^uts de concat\'enation pour s\'electionner la meilleure s\'equence d'unit\'es. Le r\^ole du co\^ut de concat\'enation est de s'assurer que l'assemblage de deux segments de parole ne causera l'apparition d'aucun artefact acoustique. Pour cette t\^ache, des distances acoustiques (MFCC, F0) sont g\'en\'eralement utilis\'ees, mais dans de nombreux cas cela ne suffit pas. Dans cet article, nous introduisons une p\'enalit\'e h\'erit\'ee du domaine de la couverture de corpus dans le co\^ut de concat\'enation afin de bloquer certaines concat\'enations en fonction de la classe phonologique des diphones \`a concat\'ener. En outre, une seconde version faisant appel \`a une fonction floue est propos\'ee pour rel\^acher la p\'enalit\'e en fonction du positionnement du co\^ut de concat\'enation par rapport \`a sa distribution. Une \'evaluation objective montre que la p\'enalit\'e est efficace et am\`ene \`a un meilleur classement des s\'equences d'unit\'es candidates au cours de la s\'election. Une \'evaluation subjective r\'ev\`ele une performance sup\'erieure de l'approche floue.