SOTAVerified

Cr\'eation d'un nouveau treebank \`a partir de quatri\`emes de couverture

2015-06-01JEPTALNRECITAL 2015Unverified0· sign in to hype

Philippe Blache, Gr{\'e}goire Moncheuil, St{\'e}phane Rauzy, Marie-Laure Gu{\'e}not

Unverified — Be the first to reproduce this paper.

Reproduce

Abstract

Nous pr\'esentons ici 4-couv, un nouveau corpus arbor\'e d'environ 3 500 phrases, constitu\'e d'un ensemble de quatri\`emes de couverture, \'etiquet\'e et analys\'e automatiquement puis corrig\'e et valid\'e \`a la main. Il r\'epond \`a des besoins sp\'ecifiques pour des projets de linguistique exp\'erimentale, et vise \`a rester compatible avec les autres treebanks existants pour le francais. Nous pr\'esentons ici le corpus lui-m\^eme ainsi que les outils utilis\'es pour les diff\'erentes \'etapes de son \'elaboration : choix des textes, \'etiquetage, parsing, correction manuelle.

Tasks

Reproductions