Curriculum d'apprentissage : reconnaissance d'entit\'es nomm\'ees pour l'extraction de concepts s\'emantiques (Curriculum learning : named entity recognition for semantic concept extraction)
Antoine Caubri{\`e}re, Natalia Tomashenko, Yannick Est{\`e}ve, Antoine Laurent, Emmanuel Morin
Unverified — Be the first to reproduce this paper.
ReproduceAbstract
Dans cet article, nous pr\'esentons une approche de bout en bout d'extraction de concepts s\'emantiques de la parole. En particulier, nous mettons en avant l'apport d'une cha\^ ne d'apprentissage successif pilot\'ee par une strat\'egie de curriculum d'apprentissage. Dans la cha\^ ne d'apprentissage mise en place, nous exploitons des donn\'ees francaises annot\'ees en entit\'es nomm\'ees que nous supposons \^etre des concepts plus g\'en\'eriques que les concepts s\'emantiques li\'es \`a une application informatique sp\'ecifique. Dans cette \'etude, il s'agit d'extraire des concepts s\'emantiques dans le cadre de la t\^ache MEDIA. Pour renforcer le syst\`eme propos\'e, nous exploitons aussi des strat\'egies d'augmentation de donn\'ees, un mod\`ele de langage 5-gramme, ainsi qu'un mode \'etoile aidant le syst\`eme \`a se concentrer sur les concepts et leurs valeurs lors de l'apprentissage. Les r\'esultats montrent un int\'er\^et \`a l'utilisation des donn\'ees d'entit\'es nomm\'ees, permettant un gain relatif allant jusqu'\`a 6,5 \%.