SOTAVerified

M\'ethodes de repr\'esentation de la langue pour l'analyse syntaxique multilingue (Language representation methods for multilingual syntactic parsing )

2019-07-01JEPTALNRECITAL 2019Unverified0· sign in to hype

Manon Scholivet

Unverified — Be the first to reproduce this paper.

Reproduce

Abstract

L'existence de mod\`eles universels pour d\'ecrire la syntaxe des langues a longtemps \'et\'e d\'ebattue. L'apparition de ressources comme le World Atlas of Language Structures et les corpus des Universal Dependencies rend possible l'\'etude d'une grammaire universelle pour l'analyse syntaxique en d\'ependances. Notre travail se concentre sur l'\'etude de diff\'erentes repr\'esentations des langues dans des syst\`emes multilingues appris sur des corpus arbor\'es de 37 langues. Nos tests d'analyse syntaxique montrent que repr\'esenter la langue dont est issu chaque mot permet d'obtenir de meilleurs r\'esultats qu'en cas d'un apprentissage sur une simple concat\'enation des langues. En revanche, l'utilisation d'un vecteur pour repr\'esenter la langue ne permet pas une am\'elioration \'evidente des r\'esultats dans le cas d'une langue n'ayant pas du tout de donn\'ees d'apprentissage.

Tasks

Reproductions