SOTAVerified

Impact de la structure logique des documents sur les mod\`eles distributionnels : exp\'erimentations sur le corpus TALN (Impact of document structure on distributional semantics models: a case study on NLP research articles )

2020-06-01JEPTALNRECITAL 2020Unverified0· sign in to hype

Ludovic Tanguy, C{\'e}cile Fabre, Yoann Bard

Unverified — Be the first to reproduce this paper.

Reproduce

Abstract

Nous pr\'esentons une exp\'erience visant \`a mesurer en quoi la structure logique d'un document impacte les repr\'esentations lexicales dans les mod\`eles de s\'emantique distributionnelle. En nous basant sur des documents structur\'es (articles de recherche en TAL) nous comparons des mod\`eles construits sur des corpus obtenus par suppression de certaines parties des textes du corpus : titres de section, r\'esum\'es, introductions et conclusions. Nous montrons que malgr\'e des diff\'erences selon les parties et le lexique pris en compte, ces zones r\'eput\'ees particuli\`erement informatives du contenu d'un article ont un impact globalement moins significatif que le reste du texte sur la construction du mod\`ele.

Tasks

Reproductions