Cr\'eation d'un nouveau treebank \`a partir de quatri\`emes de couverture
2015-06-01JEPTALNRECITAL 2015Unverified0· sign in to hype
Philippe Blache, Gr{\'e}goire Moncheuil, St{\'e}phane Rauzy, Marie-Laure Gu{\'e}not
Unverified — Be the first to reproduce this paper.
ReproduceAbstract
Nous pr\'esentons ici 4-couv, un nouveau corpus arbor\'e d'environ 3 500 phrases, constitu\'e d'un ensemble de quatri\`emes de couverture, \'etiquet\'e et analys\'e automatiquement puis corrig\'e et valid\'e \`a la main. Il r\'epond \`a des besoins sp\'ecifiques pour des projets de linguistique exp\'erimentale, et vise \`a rester compatible avec les autres treebanks existants pour le francais. Nous pr\'esentons ici le corpus lui-m\^eme ainsi que les outils utilis\'es pour les diff\'erentes \'etapes de son \'elaboration : choix des textes, \'etiquetage, parsing, correction manuelle.