Adaptation de domaine non supervis\'ee pour la reconnaissance de la langue par r\'egularisation d'un r\'eseau de neurones (Unsupervised domain adaptation for language identification by regularization of a neural network)
Rapha{\"e}l Duroselle, Denis Jouvet, Irina Illina
Unverified — Be the first to reproduce this paper.
ReproduceAbstract
Les syst\`emes automatiques d'identification de la langue subissent une d\'egradation importante de leurs performances quand les caract\'eristiques acoustiques des signaux de test diff\`erent fortement des caract\'eristiques des donn\'ees d'entra\^ nement. Dans cet article, nous \'etudions l'adaptation de domaine non supervis\'ee d'un syst\`eme entra\^ n\'e sur des conversations t\'el\'ephoniques \`a des transmissions radio. Nous pr\'esentons une m\'ethode de r\'egularisation d'un r\'eseau de neurones consistant \`a ajouter \`a la fonction de co\^ut un terme mesurant la divergence entre les deux domaines. Des exp\'eriences sur le corpus OpenSAD15 nous permettent de s\'electionner la Maximum Mean Discrepancy pour r\'ealiser cette mesure. Cette approche est ensuite appliqu\'ee \`a un syst\`eme moderne d'identification de la langue reposant sur des x-vectors. Sur le corpus RATS, pour sept des huit canaux radio \'etudi\'es, l'approche permet, sans utiliser de donn\'ees annot\'ees du domaine cible, de surpasser la performance d'un syst\`eme entra\^ n\'e de facon supervis\'ee avec des donn\'ees annot\'ees de ce domaine.