SOTAVerified

Mise au point d'une m\'ethode d'annotation morphosyntaxique fine du serbe (Developping a method for detailed morphosyntactic tagging of Serbian)

2016-07-01JEPTALNRECITAL 2016Unverified0· sign in to hype

Aleks Miletic, ra, C{\'e}cile Fabre, Dejan Stosic

Unverified — Be the first to reproduce this paper.

Reproduce

Abstract

Cet article pr\'esente une exp\'erience d'annotation morphosyntaxique fine du volet serbe du corpus parall\`ele ParCoLab (corpus serbe-francais-anglais). Elle a consist\'e \`a enrichir une annotation existante en parties du discours avec des traits morphosyntaxiques fins, afin de pr\'eparer une \'etape ult\'erieure de parsing. Nous avons compar\'e trois approches : 1) annotation manuelle ; 2) pr\'eannotation avec un \'etiqueteur entra\^ n\'e sur le croate suivie d'une correction manuelle ; 3) r\'eentra\^ nement de l'outil sur un petit \'echantillon valid\'e du corpus, suivi de l'annotation automatique et de la correction manuelle. Le mod\`ele croate maintient une stabilit\'e globale en passant au serbe, mais les diff\'erences entre les deux jeux d'\'etiquettes exigent des interventions manuelles importantes. Le mod\`ele r\'e-entra\^ n\'e sur un \'echantillon de taille limit\'e (20K tokens) atteint la m\^eme exactitude que le mod\`ele existant et le gain de temps observ\'e montre que cette m\'ethode optimise la phase de correction.

Tasks

Reproductions