SOTAVerified

Une m\'ethode non-supervis\'ee pour la segmentation morphologique et l'apprentissage de morphotactique \`a l'aide de processus de Pitman-Yor (An unsupervised method for joint morphological segmentation and morphotactics learning using Pitman-Yor processes)

2016-07-01JEPTALNRECITAL 2016Unverified0· sign in to hype

Kevin L{\"o}ser, Alex Allauzen, re

Unverified — Be the first to reproduce this paper.

Reproduce

Abstract

Cet article pr\'esente un mod\`ele bay\'esien non-param\'etrique pour la segmentation morphologique non supervis\'ee. Ce mod\`ele semi-markovien s'appuie sur des classes latentes de morph\`emes afin de mod\'eliser les caract\'eristiques morphotactiques du lexique, et son caract\`ere non-param\'etrique lui permet de s'adapter aux donn\'ees sans avoir \`a sp\'ecifier \`a l'avance l'inventaire des morph\`emes ainsi que leurs classes. Un processus de Pitman-Yor est utilis\'e comme a priori sur les param\`etres afin d'\'eviter une convergence vers des solutions d\'eg\'en\'er\'ees et inadapt\'ees au traitemement automatique des langues. Les r\'esultats exp\'erimentaux montrent la pertinence des segmentations obtenues pour le turc et l'anglais. Une \'etude qualitative montre \'egalement que le mod\`ele inf\`ere une morphotactique linguistiquement pertinente, sans le recours \`a des connaissances expertes quant \`a la structure morphologique des formes de mots.

Tasks

Reproductions