FENEC : un corpus équilibré pour l’évaluation des entités nommées en français (FENEC : a balanced sample corpus for French named entity recognition )
2022-06-01JEP/TALN/RECITAL 2022Code Available0· sign in to hype
Alice Millour, Yoann Dupont, Alexane Jouglar, Karën Fort
Code Available — Be the first to reproduce this paper.
ReproduceCode
- github.com/alicemillour/fenecOfficialIn papernone★ 6
Abstract
Nous présentons ici FENEC (FrEnch Named-entity Evaluation Corpus), un corpus à échantillons équilibrés contenant six genres, annoté en entités nommées selon le schéma fin Quæro. Les caractéristiques de ce corpus nous permettent d’évaluer et de comparer trois outils d’annotation automatique — un à base de règles et deux à base de réseaux de neurones — en jouant sur trois dimensions : la finesse du jeu d’étiquettes, le genre des corpus, et les métriques d’évaluation.