...des conf\'erences enfin disons des causeries... D\'etection automatique de segments en relation de paraphrase dans les reformulations de corpus oraux
Natalia Grabar, Iris Eshkol
Unverified — Be the first to reproduce this paper.
ReproduceAbstract
Notre travail porte sur la d\'etection automatique des segments en relation de reformulation paraphrastique dans les corpus oraux. L'approche propos\'ee est une approche syntagmatique qui tient compte des marqueurs de reformulation paraphrastique et des sp\'ecificit\'es de l'oral. Les donn\'ees de r\'ef\'erence sont consensuelles. Une m\'ethode automatique fond\'ee sur l'apprentissage avec les CRF est propos\'ee afin de d\'etecter les segments paraphras\'es. Diff\'erents descripteurs sont exploit\'es dans une fen\^etre de taille variable. Les tests effectu\'es montrent que les segments en relation de paraphrase sont assez difficiles \`a d\'etecter, surtout avec leurs fronti\`eres correctes. Les meilleures moyennes atteignent 0,65 de F-mesure, 0,75 de pr\'ecision et 0,63 de rappel. Nous avons plusieurs perspectives \`a ce travail pour am\'eliorer la d\'etection des segments en relation de paraphrase et pour \'etudier les donn\'ees depuis d'autres points de vue.