Classification automatique de dict\'ees selon leur niveau de difficult\'e de compr\'ehension et orthographique (Automatic classification of dictations according to their complexity for comprehension and writing production)
Adeline M{\"u}ller, Thomas Francois, Sophie Roekhaut, Cedrick Fairon
Unverified — Be the first to reproduce this paper.
ReproduceAbstract
Cet article pr\'esente une approche visant \`a \'evaluer automatiquement la difficult\'e de dict\'ees en vue de les int\'egrer dans une plateforme d'apprentissage de l'orthographe. La particularit\'e de l'exercice de la dict\'ee est de devoir percevoir du code oral et de le retranscrire via le code \'ecrit. Nous envisageons ce double niveau de difficult\'e \`a l'aide de 375 variables mesurant la difficult\'e de compr\'ehension d'un texte ainsi que les ph\'enom\`enes orthographiques et grammaticaux complexes qu'il contient. Un sous-ensemble optimal de ces variables est combin\'e \`a l'aide d'un mod\`ele par machines \`a vecteurs de support (SVM) qui classe correctement 56\% des textes. Les variables lexicales bas\'ees sur la liste orthographique de Catach (1984) se r\'ev\`elent les plus informatives pour le mod\`ele.