M\'ethodes de repr\'esentation de la langue pour l'analyse syntaxique multilingue (Language representation methods for multilingual syntactic parsing )
Manon Scholivet
Unverified — Be the first to reproduce this paper.
ReproduceAbstract
L'existence de mod\`eles universels pour d\'ecrire la syntaxe des langues a longtemps \'et\'e d\'ebattue. L'apparition de ressources comme le World Atlas of Language Structures et les corpus des Universal Dependencies rend possible l'\'etude d'une grammaire universelle pour l'analyse syntaxique en d\'ependances. Notre travail se concentre sur l'\'etude de diff\'erentes repr\'esentations des langues dans des syst\`emes multilingues appris sur des corpus arbor\'es de 37 langues. Nos tests d'analyse syntaxique montrent que repr\'esenter la langue dont est issu chaque mot permet d'obtenir de meilleurs r\'esultats qu'en cas d'un apprentissage sur une simple concat\'enation des langues. En revanche, l'utilisation d'un vecteur pour repr\'esenter la langue ne permet pas une am\'elioration \'evidente des r\'esultats dans le cas d'une langue n'ayant pas du tout de donn\'ees d'apprentissage.