Projection Interlingue d'\'Etiquettes pour l'Annotation S\'emantique Non Supervis\'ee (Cross-lingual Annotation Projection for Unsupervised Semantic Tagging)
Othman Zennaki, Nasredine Semmar, Laurent Besacier
Unverified — Be the first to reproduce this paper.
ReproduceAbstract
Nos travaux portent sur la construction rapide d'outils d'analyse linguistique pour des langues peu dot\'ees en ressources. Dans une pr\'ec\'edente contribution, nous avons propos\'e une m\'ethode pour la construction automatique d'un analyseur morpho-syntaxique via une projection interlingue d'annotations linguistiques \`a partir de corpus parall\`eles (m\'ethode fond\'ee sur les r\'eseaux de neurones r\'ecurrents). Nous pr\'esentons, dans cet article, une am\'elioration de notre mod\`ele neuronal, avec la prise en compte d'informations linguistiques externes pour un annotateur plus complexe. En particulier, nous proposons d'int\'egrer des annotations morpho-syntaxiques dans notre architecture neuronale pour l'apprentissage non supervis\'e d'annotateurs s\'emantiques multilingues \`a gros grain (annotation en SuperSenses). Nous montrons la validit\'e de notre m\'ethode et sa g\'en\'ericit\'e sur l'italien et le francais et \'etudions aussi l'impact de la qualit\'e du corpus parall\`ele sur notre approche (g\'en\'er\'e par traduction manuelle ou automatique). Nos exp\'eriences portent sur la projection d'annotations de l'anglais vers le francais et l'italien.