SOTAVerified

Mod\'elisation unifi\'ee du document et de son domaine pour une indexation par termes-cl\'es libre et contr\^ol\'ee (Unified document and domain-specific model for keyphrase extraction and assignment )

2016-07-01JEPTALNRECITAL 2016Unverified0· sign in to hype

Adrien Bougouin, Florian Boudin, Beatrice Daille

Unverified — Be the first to reproduce this paper.

Reproduce

Abstract

Dans cet article, nous nous int\'eressons \`a l'indexation de documents de domaines de sp\'ecialit\'e par l'interm\'ediaire de leurs termes-cl\'es. Plus particuli\`erement, nous nous int\'eressons \`a l'indexation telle qu'elle est r\'ealis\'ee par les documentalistes de biblioth\`eques num\'eriques. Apr\`es analyse de la m\'ethodologie de ces indexeurs professionnels, nous proposons une m\'ethode \`a base de graphe combinant les informations pr\'esentes dans le document et la connaissance du domaine pour r\'ealiser une indexation (hybride) libre et contr\^ol\'ee. Notre m\'ethode permet de proposer des termes-cl\'es ne se trouvant pas n\'ecessairement dans le document. Nos exp\'eriences montrent aussi que notre m\'ethode surpasse significativement l'approche \`a base de graphe \'etat de l'art.

Tasks

Reproductions