SOTAVerified

Construction automatique d'une base de donn\'ees \'etymologiques \`a partir du wiktionary (Automatic construction of an etymological database using Wiktionary)

2017-06-01JEPTALNRECITAL 2017Unverified0· sign in to hype

Beno{\^\i}t Sagot

Unverified — Be the first to reproduce this paper.

Reproduce

Abstract

Les ressources lexicales \'electroniques ne contiennent quasiment jamais d'informations \'etymologiques. De telles informations, convenablement formalis\'ees, permettraient pourtant de d\'evelopper des outils automatiques au service de la linguistique historique et comparative, ainsi que d'am\'eliorer significativement le traitement automatique de langues anciennes. Nous d\'ecrivons ici le processus que nous avons mis en uvre pour extraire des donn\'ees \'etymologiques \`a partir des notices \'etymologiques du wiktionary, r\'edig\'ees en anglais. Nous avons ainsi produit une base multilingue de pr\`es d'un million de lex\`emes et une base de plus d'un demi-million de relations \'etymologiques entre lex\`emes.

Tasks

Reproductions