SOTAVerified

Apprentissage automatique d'un mod\`ele de r\'esolution de la cor\'ef\'erence \`a partir de donn\'ees orales transcrites du fran : le syst\`eme CROC

2015-06-01JEPTALNRECITAL 2015Unverified0· sign in to hype

Ad{\`e}le D{\'e}soyer, L, Fr{\'e}d{\'e}ric ragin, Isabelle Tellier

Unverified — Be the first to reproduce this paper.

Reproduce

Abstract

Cet article pr\'esente CROC 1 (Coreference Resolution for Oral Corpus), un premier syst\`eme de r\'esolution des cor\'ef\'erences en francais reposant sur des techniques d'apprentissage automatique. Une des sp\'ecificit\'es du syst\`eme r\'eside dans son apprentissage sur des donn\'ees exclusivement orales, \`a savoir ANCOR (anaphore et cor\'ef\'erence dans les corpus oraux), le premier corpus de francais oral transcrit annot\'e en relations anaphoriques. En l'\'etat actuel, le syst\`eme CROC n\'ecessite un rep\'erage pr\'ealable des mentions. Nous d\'etaillons les choix des traits -- issus du corpus ou calcul\'es -- utilis\'es par l'apprentissage, et nous pr\'esentons un ensemble d'exp\'erimentations avec ces traits. Les scores obtenus sont tr\`es proches de ceux de l'\'etat de l'art des syst\`emes concus pour l'\'ecrit. Nous concluons alors en donnant des perspectives sur la r\'ealisation d'un syst\`eme end-to-end valable \`a la fois pour l'oral transcrit et l'\'ecrit.

Tasks

Reproductions