SOTAVerified

Annotation automatique des types de discours dans des livres audio en vue d'une oralisation par un syst\`eme de synth\`ese (Automatic annotation of discourse types in audio-books)

2018-05-01JEPTALNRECITAL 2018Unverified0· sign in to hype

Aghilas Sini, Elisabeth Delais-Roussarie, Damien Lolive

Unverified — Be the first to reproduce this paper.

Reproduce

Abstract

Pour synth\'etiser automatiquement et de mani\`ere expressive des livres audio, il est n\'ecessaire de conna\^ tre le type des discours \`a oraliser. Ceci \'etant, dans un roman ou une nouvelle, les perspectives narratives et les types de discours \'evoluent souvent entre de la narration, du r\'ecitatif, du discours direct, du discours rapport\'e, voire des dialogues. Dans ce travail, nous allons pr\'esenter un outil qui a \'et\'e d\'evelopp\'e \`a partir de l'analyse d'un corpus de livres audio (extraits de Madame Bovary et des Myst\`eres de Paris) et qui prend comme unit\'e de base pour l'analyse le paragraphe. Cet outil permet donc non seulement de d\'eterminer automatiquement les types de discours (narration, discours direct, dialogue), et donc de savoir qui parle, mais \'egalement d'annoter l'extension des modifications discursives. Ce dernier point est important, notamment dans le cas d'incises de citation o\`u le narrateur reprend la parole dans une s\'equence au discours direct. Dans sa forme actuelle, l'outil atteint un taux de 89 \% de bonne d\'etection.

Tasks

Reproductions