Reconnaissance de phones fond\'ee sur du Transfer Learning pour des enfants apprenants lecteurs en environnement de classe (Transfer Learning based phone recognition on children learning to read, with speech recorded in a classroom environment)
Lucile Gelin, Morgane Daniel, Thomas Pellegrini, Julien Pinquier
Unverified — Be the first to reproduce this paper.
ReproduceAbstract
A conditions \'egales, les performances actuelles de la reconnaissance vocale pour enfants sont inf\'erieures \`a celles des syst\`emes pour adultes. La parole des jeunes enfants est particuli\`erement difficile \`a reconna\^ tre, et les donn\'ees disponibles sont rares. En outre, pour notre application d'assistant de lecture pour les enfants de 5-7 ans, les mod\`eles doivent s'adapter \`a une lecture lente, des disfluences et du bruit de brouhaha typique d'une classe. Nous comparons ici plusieurs mod\`eles acoustiques pour la reconnaissance de phones sur de la parole lue d'enfant avec des donn\'ees bruit\'ees et en quantit\'e limit\'ee. Nous montrons que faire du Transfer Learning avec des mod\`eles entra\^ n\'es sur la parole d'adulte et trois heures de parole d'enfant am\'eliore le taux d'erreur au niveau du phone (PER) de 7,6\% relatifs, par rapport \`a un mod\`ele enfant. La normalisation de la longueur du conduit vocal sur la parole d'adulte r\'eduit ce taux d'erreur de 5,1\% relatifs suppl\'ementaires, atteignant un PER de 37,1\%.