D\'ecodeur neuronal pour la transcription de documents manuscrits anciens (Neural decoder for the transcription of historical handwritten documents)
Adeline Granet, Emmanuel Morin, Harold Mouch{\`e}re, Solen Quiniou, Christian Viard-Gaudin
Unverified — Be the first to reproduce this paper.
ReproduceAbstract
L'absence de donn\'ees annot\'ees peut \^etre une difficult\'e majeure lorsque l'on s'int\'eresse \`a l'analyse de documents manuscrits anciens. Pour contourner cette difficult\'e, nous proposons de diviser le probl\`eme en deux, afin de pouvoir s'appuyer sur des donn\'ees plus facilement accessibles. Dans cet article nous pr\'esentons la partie d\'ecodeur d'un encodeur-d\'ecodeur multimodal utilisant l'apprentissage par transfert de connaissances pour la transcription des titres de pi\`eces de la Com\'edie Italienne. Le d\'ecodeur transforme un vecteur de n-grammes au niveau caract\`eres en une s\'equence de caract\`eres correspondant \`a un mot. L'apprentissage par transfert de connaissances est r\'ealis\'e principalement \`a partir d'une nouvelle ressource inexploit\'ee contemporaine \`a la Com\'edie-Italienne et th\'ematiquement proche ; ainsi que d'autres ressources couvrant d'autres domaines, des langages diff\'erents et m\^eme des p\'eriodes diff\'erentes. Nous obtenons 97,27\% de caract\`eres bien reconnus sur les donn\'ees de la Com\'edie-Italienne, ainsi que 86,57\% de mots correctement g\'en\'er\'es malgr\'e une couverture de 67,58\% uniquement entre la Com\'edie-Italienne et l'ensemble d'apprentissage. Les exp\'eriences montrent qu'un tel syst\`eme peut \^etre une approche efficace dans le cadre d'apprentissage par transfert.