Caract\'erisation du locuteur par CNN \`a l'aide des contours d'intensit\'e et d'intonation : comparaison avec le spectrogramme (CNN speaker characterisation through prosody : spectrogram comparison )
Gabriele Chignoli, C{\'e}dric Gendrot, Emmanuel Ferragne
Unverified — Be the first to reproduce this paper.
ReproduceAbstract
Dans ce travail nous avons recours aux variations de f0 et d'intensit\'e de 44 locuteurs francophones \`a partir de s\'equences de 4 secondes de parole spontan\'ee pour comprendre comment ces param\`etres prosodiques peuvent \^etre utilis\'es pour caract\'eriser des locuteurs. Une classification automatique est effectu\'ee avec un r\'eseau de neurones convolutifs, fournissant comme r\'eponse des scores de probabilit\'e pour chacun des 44 locuteurs mod\'elis\'es. Une repr\'esentation par spectrogrammes a \'et\'e utilis\'ee comme r\'ef\'erence pour le m\^eme syst\`eme de classification. Nous avons pu mettre en avant la pertinence de l'intensit\'e, et lorsque les deux param\`etres prosodiques sont combin\'es pour repr\'esenter les locuteurs nous observons un score qui atteint en moyenne 59 \% de bonnes classifications.