Optimiser l'adaptation en ligne d'un module de compr\'ehension de la parole avec un algorithme de bandit contre un adversaire (Adversarial bandit for optimising online active learning of spoken language understanding)
Emmanuel Ferreira, Alex Reiffers-Masson, re, Bassam Jabaian, Fabrice Lef{\`e}vre
Unverified — Be the first to reproduce this paper.
ReproduceAbstract
De nombreux modules de compr\'ehension de la parole ont en commun d'\^etre probabilistes et bas\'es sur des algorithmes d'apprentissage automatique. Deux difficult\'es majeures, rencontr\'ees par toutes les m\'ethodes existantes sont : le co\^ut de la collecte des donn\'ees et l'adaptation d'un module existant \`a un nouveau domaine. Dans cet article, nous proposons un processus d'adaptation en ligne avec une politique apprise en utilisant un algorithme de type bandit contre un adversaire. Nous montrons que cette proposition peut permettre d'optimiser un \'equilibre entre le co\^ut de la collecte des retours demand\'es aux utilisateurs et la performance globale de la compr\'ehension du langage parl\'e apr\`es sa mise \`a jour.