SOTAVerified

Un corpus libre, \'evolutif et versionn\'e en entit\'es nomm\'ees du Fran (A free, evolving and versioned french named entity recognition corpus)

2019-07-01JEPTALNRECITAL 2019Unverified0· sign in to hype

Yoann Dupont

Unverified — Be the first to reproduce this paper.

Reproduce

Abstract

Les corpus annot\'es sont des ressources difficiles \`a cr\'eer en raison du grand effort humain qu'elles impliquent. Une fois rendues disponibles, elles sont difficilement modifiables et tendent \`a ne pas \'evoluer pas dans le temps. Dans cet article, nous pr\'esentons un corpus annot\'e pour la reconnaissance des entit\'es nomm\'ees libre et \'evolutif en utilisant les textes d'articles Wikinews francais de 2016 \`a 2018, pour un total de 1191 articles annot\'es. Nous d\'ecrivons succinctement le guide d'annotation avant de situer notre corpus par rapport \`a d'autres corpus d\'ej\`a existants. Nous donnerons \'egalement un accord intra-annotateur afin de donner un indice de stabilit\'e des annotations ainsi que le processus global pour poursuivre les travaux d'enrichissement du corpus.

Tasks

Reproductions