Chunker diff\'erents types de discours oraux : d\'efis pour l'apprentissage automatique (Chunking different spoken speech types : challenges for machine learning)
Iris Eshkol-Taravella, Mariame Maarouf, Marie Skrovec, Flora Badin
Unverified — Be the first to reproduce this paper.
ReproduceAbstract
Le travail d\'ecrit le d\'eveloppement d'un chunker pour l'oral par apprentissage supervis\'e avec les CRFs, \`a partir d'un corpus de r\'ef\'erence de petite taille et compos\'e de productions de nature diff\'erente : monologue pr\'epar\'e vs discussion spontan\'ee. La m\'ethodologie respecte les sp\'ecificit\'es des donn\'ees trait\'ees. L'apprentissage tient compte des r\'esultats propos\'es par diff\'erents \'etiqueteurs morpho-syntaxiques disponibles sans correction manuelle de leurs r\'esultats. Les exp\'eriences montrent que le genre de discours (monologue vs discussion), la nature de discours (spontan\'e vs pr\'epar\'e) et la taille du corpus peuvent influencer les r\'esultats de l'apprentissage, ce qui confirme que la nature des donn\'ees trait\'ees est \`a prendre en consid\'eration dans l'interpr\'etation des r\'esultats.