D\'etection et classification non supervis\'ees de relations s\'emantiques dans des articles scientifiques (Unsupervised Classification of Semantic Relations in Scientific Papers)
Kata G{\'a}bor, Isabelle Tellier, Thierry Charnois, Ha{\"\i}fa Zargayouna, Davide Buscaldi
Unverified — Be the first to reproduce this paper.
ReproduceAbstract
Dans cet article, nous abordons une t\^ache encore peu explor\'ee, consistant \`a extraire automatiquement l'\'etat de l'art d'un domaine scientifique \`a partir de l'analyse d'articles de ce domaine. Nous la ramenons \`a deux sous-t\^aches \'el\'ementaires : l'identification de concepts et la reconnaissance de relations entre ces concepts. Une extraction terminologique permet d'identifier les concepts candidats, qui sont ensuite align\'es \`a des ressources externes. Dans un deuxi\`eme temps, nous cherchons \`a reconna\^ tre et classifier automatiquement les relations s\'emantiques entre concepts de mani\`ere nonsupervis\'ee, en nous appuyant sur diff\'erentes techniques de clustering et de biclustering. Nous mettons en uvre ces deux \'etapes dans un corpus extrait de l'archive de l'ACL Anthology. Une analyse manuelle nous a permis de proposer une typologie des relations s\'emantiques, et de classifier un \'echantillon d'instances de relations. Les premi\`eres \'evaluations sugg\`erent l'int\'er\^et du biclustering pour d\'etecter de nouveaux types de relations dans le corpus.