SOTAVerified

Strat\'egies de s\'election des exemples pour l'apprentissage actif avec des champs al\'eatoires conditionnels

2015-06-01JEPTALNRECITAL 2015Unverified0· sign in to hype

Vincent Claveau, Ewa Kijak

Unverified — Be the first to reproduce this paper.

Reproduce

Abstract

Beaucoup de probl\`emes de TAL sont d\'esormais mod\'elis\'es comme des t\^aches d'apprentissage supervis\'e. De ce fait, le co\^ut des annotations des exemples par l'expert repr\'esente un probl\`eme important. L'apprentissage actif (active learning) apporte un cadre \`a ce probl\`eme, permettant de contr\^oler le co\^ut d'annotation tout en maximisant, on l'esp\`ere, la performance de la t\^ache vis\'ee, mais repose sur le choix difficile des exemples \`a soumettre \`a l'expert. Dans cet article, nous examinons et proposons des strat\'egies de s\'election des exemples pour le cas sp\'ecifique des champs al\'eatoires conditionnels (Conditional Random Fields, CRF), outil largement utilis\'e en TAL. Nous proposons d'une part une m\'ethode simple corrigeant un biais de certaines m\'ethodes de l'\'etat de l'art. D'autre part, nous d\'etaillons une m\'ethode originale de s\'election s'appuyant sur un crit\`ere de respect des proportions dans les jeux de donn\'ees manipul\'es. Le bien- fond\'e de ces propositions est v\'erifi\'e au travers de plusieurs t\^aches et jeux de donn\'ees, incluant reconnaissance d'entit\'es nomm\'ees, chunking, phon\'etisation, d\'esambigu\" sation de sens.

Tasks

Reproductions