SOTAVerified

Approche supervis\'ee de calcul de similarit\'e s\'emantique entre paires de phrases (Supervised approach to compute semantic similarity between sentence pairs)

2020-06-01JEPTALNRECITAL 2020Unverified0· sign in to hype

Khadim Dram{\'e}, Gorgoumack Sambe, Ibrahima Diop, Lamine Faty

Unverified — Be the first to reproduce this paper.

Reproduce

Abstract

Ce papier d\'ecrit les m\'ethodes que nous avons d\'evelopp\'ees pour participer aux t\^aches 1 et 2 de l'\'edition 2020 du d\'efi fouille de textes (DEFT 2020). Pour la premi\`ere t\^ache, qui s'int\'eresse au calcul de scores de similarit\'e s\'emantique entre paires de phrases, sur une \'echelle de 0 \`a 5, une approche supervis\'ee o\`u chaque paire de phrases est repr\'esent\'ee par un ensemble d'attributs a \'et\'e propos\'ee. Des algorithmes classiques d'apprentissage automatique sont ensuite utilis\'es pour entrainer les mod\`eles. Diff\'erentes mesures de similarit\'e textuelle sont explor\'ees et les plus pertinentes sont combin\'ees pour supporter nos m\'ethodes. Diff\'erentes combinaisons ont \'et\'e test\'ees et \'evalu\'ees sur les donn\'ees de test du DEFT 2020. Notre meilleur syst\`eme qui s'appuie sur un mod\`ele Random Forest a obtenu les meilleures performances sur la premi\`ere t\^ache avec une EDRM de 0,8216.

Tasks

Reproductions