Un corpus libre, \'evolutif et versionn\'e en entit\'es nomm\'ees du Fran (A free, evolving and versioned french named entity recognition corpus)
Yoann Dupont
Unverified — Be the first to reproduce this paper.
ReproduceAbstract
Les corpus annot\'es sont des ressources difficiles \`a cr\'eer en raison du grand effort humain qu'elles impliquent. Une fois rendues disponibles, elles sont difficilement modifiables et tendent \`a ne pas \'evoluer pas dans le temps. Dans cet article, nous pr\'esentons un corpus annot\'e pour la reconnaissance des entit\'es nomm\'ees libre et \'evolutif en utilisant les textes d'articles Wikinews francais de 2016 \`a 2018, pour un total de 1191 articles annot\'es. Nous d\'ecrivons succinctement le guide d'annotation avant de situer notre corpus par rapport \`a d'autres corpus d\'ej\`a existants. Nous donnerons \'egalement un accord intra-annotateur afin de donner un indice de stabilit\'e des annotations ainsi que le processus global pour poursuivre les travaux d'enrichissement du corpus.