Chunker diff\'erents types de discours oraux : d\'efis pour l'apprentissage automatique (Chunking different spoken speech types : challenges for machine learning)

2019-07-01JEPTALNRECITAL 2019Unverified0· sign in to hype

Iris Eshkol-Taravella, Mariame Maarouf, Marie Skrovec, Flora Badin

Unverified — Be the first to reproduce this paper.

Abstract

Le travail d\'ecrit le d\'eveloppement d'un chunker pour l'oral par apprentissage supervis\'e avec les CRFs, \`a partir d'un corpus de r\'ef\'erence de petite taille et compos\'e de productions de nature diff\'erente : monologue pr\'epar\'e vs discussion spontan\'ee. La m\'ethodologie respecte les sp\'ecificit\'es des donn\'ees trait\'ees. L'apprentissage tient compte des r\'esultats propos\'es par diff\'erents \'etiqueteurs morpho-syntaxiques disponibles sans correction manuelle de leurs r\'esultats. Les exp\'eriences montrent que le genre de discours (monologue vs discussion), la nature de discours (spontan\'e vs pr\'epar\'e) et la taille du corpus peuvent influencer les r\'esultats de l'apprentissage, ce qui confirme que la nature des donn\'ees trait\'ees est \`a prendre en consid\'eration dans l'interpr\'etation des r\'esultats.

Tasks

Chunking

Chunker diff\'erents types de discours oraux : d\'efis pour l'apprentissage automatique (Chunking different spoken speech types : challenges for machine learning)

Abstract

Tasks

Reproductions