SOTAVerified

Transformation d'annotations en parties du discours et lemmes vers le format Universal Dependencies : \'etude de cas pour l'alsacien et l'occitan (Converting POS-tag and Lemma Annotations into the Universal Dependencies Format : A Case Study on Alsatian and Occitan )

2019-07-01JEPTALNRECITAL 2019Unverified0· sign in to hype

Aleks Mileti{\'c}, ra, Delphine Bernhard, Myriam Bras, Anne-Laure Ligozat, Marianne Vergez-Couret

Unverified — Be the first to reproduce this paper.

Reproduce

Abstract

Cet article pr\'esente un retour d'exp\'erience sur la transformation de corpus annot\'es pour l'alsacien et l'occitan vers le format CONLL-U d\'efini dans le projet Universal Dependencies. Il met en particulier l'accent sur divers points de vigilance \`a prendre en compte, concernant la tok\'enisation et la d\'efinition des cat\'egories pour l'annotation.

Tasks

Reproductions