SOTAVerified

Vers une analyse des diff\'erences interlinguistiques entre les genres textuels : \'etude de cas bas\'ee sur les n-grammes et l'analyse factorielle des correspondances (Towards a cross-linguistic analysis of genres: A case study based on n-grams and Correspondence Analysis)

2016-07-01JEPTALNRECITAL 2016Unverified0· sign in to hype

Marie-Aude Lefer, Yves Bestgen, Natalia Grabar

Unverified — Be the first to reproduce this paper.

Reproduce

Abstract

L'objectif de notre travail est d'\'evaluer l'int\'er\^et d'employer les n-grammes et l'analyse factorielle des correspondances (AFC) pour comparer les genres textuels dans les \'etudes contrastives interlinguistiques. Nous exploitons un corpus bilingue anglais-francais constitu\'e de textes originaux comparables. Le corpus r\'eunit trois genres : les d\'ebats parlementaires europ\'eens, les \'editoriaux de presse et les articles scientifiques. Dans un premier temps, les n-grammes d'une longueur de 2 \`a 4 mots sont extraits dans chaque langue. Ensuite, pour chaque longueur, les 1 000 n-grammes les plus fr\'equents dans chaque langue sont trait\'es par l'AFC pour d\'eterminer quels n-grammes sont particuli\`erement saillants dans les genres \'etudi\'es. Enfin, les n-grammes sont cat\'egoris\'es manuellement en distinguant les expressions d'opinion et de certitude, les marqueurs discursifs et les expressions r\'ef\'erentielles. Les r\'esultats montrent que les n-grammes permettent de mettre au jour des caract\'eristiques typiques des genres \'etudi\'es, de m\^eme que des contrastes interlangues int\'eressants.

Tasks

Reproductions