SOTAVerified

Identification of complex words and passages in medical documents in French

2022-06-01JEP/TALN/RECITAL 2022Unverified0· sign in to hype

Kim Cheng SHEANG, Anaïs Koptient, Natalia Grabar, Horacio Saggion

Unverified — Be the first to reproduce this paper.

Reproduce

Abstract

Identification de mots et passages difficiles dans les documents médicaux en français. L’objectif de la simplification automatique des textes consiste à fournir une nouvelle version de documents qui devient plus facile à comprendre pour une population donnée ou plus facile à traiter par d’autres applications du TAL. Cependant, avant d’effectuer la simplification, il est important de savoir ce qu’il faut simplifier exactement dans les documents. En effet, même dans les documents techniques et spécialisés, il n’est pas nécessaire de tout simplifier mais juste les segments qui présentent des difficultés de compréhension. Il s’agit typiquement de la tâche d’identification de mots complexes : effectuer le diagnostic de difficulté d’un document donné pour y détecter les mots et passages complexes. Nous proposons de travail sur l’identification de mots et passages complexes dans les documents biomédicaux en français.

Tasks

Reproductions