SOTAVerified

Optimiser l'adaptation en ligne d'un module de compr\'ehension de la parole avec un algorithme de bandit contre un adversaire (Adversarial bandit for optimising online active learning of spoken language understanding)

2016-07-01JEPTALNRECITAL 2016Unverified0· sign in to hype

Emmanuel Ferreira, Alex Reiffers-Masson, re, Bassam Jabaian, Fabrice Lef{\`e}vre

Unverified — Be the first to reproduce this paper.

Reproduce

Abstract

De nombreux modules de compr\'ehension de la parole ont en commun d'\^etre probabilistes et bas\'es sur des algorithmes d'apprentissage automatique. Deux difficult\'es majeures, rencontr\'ees par toutes les m\'ethodes existantes sont : le co\^ut de la collecte des donn\'ees et l'adaptation d'un module existant \`a un nouveau domaine. Dans cet article, nous proposons un processus d'adaptation en ligne avec une politique apprise en utilisant un algorithme de type bandit contre un adversaire. Nous montrons que cette proposition peut permettre d'optimiser un \'equilibre entre le co\^ut de la collecte des retours demand\'es aux utilisateurs et la performance globale de la compr\'ehension du langage parl\'e apr\`es sa mise \`a jour.

Tasks

Reproductions