Construction automatique d'une base de donn\'ees \'etymologiques \`a partir du wiktionary (Automatic construction of an etymological database using Wiktionary)
Beno{\^\i}t Sagot
Unverified — Be the first to reproduce this paper.
ReproduceAbstract
Les ressources lexicales \'electroniques ne contiennent quasiment jamais d'informations \'etymologiques. De telles informations, convenablement formalis\'ees, permettraient pourtant de d\'evelopper des outils automatiques au service de la linguistique historique et comparative, ainsi que d'am\'eliorer significativement le traitement automatique de langues anciennes. Nous d\'ecrivons ici le processus que nous avons mis en uvre pour extraire des donn\'ees \'etymologiques \`a partir des notices \'etymologiques du wiktionary, r\'edig\'ees en anglais. Nous avons ainsi produit une base multilingue de pr\`es d'un million de lex\`emes et une base de plus d'un demi-million de relations \'etymologiques entre lex\`emes.