SOTAVerified

Curriculum d'apprentissage : reconnaissance d'entit\'es nomm\'ees pour l'extraction de concepts s\'emantiques (Curriculum learning : named entity recognition for semantic concept extraction)

2019-07-01JEPTALNRECITAL 2019Unverified0· sign in to hype

Antoine Caubri{\`e}re, Natalia Tomashenko, Yannick Est{\`e}ve, Antoine Laurent, Emmanuel Morin

Unverified — Be the first to reproduce this paper.

Reproduce

Abstract

Dans cet article, nous pr\'esentons une approche de bout en bout d'extraction de concepts s\'emantiques de la parole. En particulier, nous mettons en avant l'apport d'une cha\^ ne d'apprentissage successif pilot\'ee par une strat\'egie de curriculum d'apprentissage. Dans la cha\^ ne d'apprentissage mise en place, nous exploitons des donn\'ees francaises annot\'ees en entit\'es nomm\'ees que nous supposons \^etre des concepts plus g\'en\'eriques que les concepts s\'emantiques li\'es \`a une application informatique sp\'ecifique. Dans cette \'etude, il s'agit d'extraire des concepts s\'emantiques dans le cadre de la t\^ache MEDIA. Pour renforcer le syst\`eme propos\'e, nous exploitons aussi des strat\'egies d'augmentation de donn\'ees, un mod\`ele de langage 5-gramme, ainsi qu'un mode \'etoile aidant le syst\`eme \`a se concentrer sur les concepts et leurs valeurs lors de l'apprentissage. Les r\'esultats montrent un int\'er\^et \`a l'utilisation des donn\'ees d'entit\'es nomm\'ees, permettant un gain relatif allant jusqu'\`a 6,5 \%.

Tasks

Reproductions