Fouille de motifs et CRF pour la reconnaissance de sympt\^omes dans les textes biom\'edicaux (Pattern mining and CRF for symptoms recognition in biomedical texts)
Pierre Holat, Nadi Tomeh, Thierry Charnois, Delphine Battistelli, Marie-Christine Jaulent, Jean-Philippe M{\'e}tivier
Unverified — Be the first to reproduce this paper.
ReproduceAbstract
Dans cet article, nous nous int\'eressons \`a l'extraction d'entit\'es m\'edicales de type sympt\^ome dans les textes biom\'edicaux. Cette t\^ache est peu explor\'ee dans la litt\'erature et il n'existe pas \`a notre connaissance de corpus annot\'e pour entra\^ ner un mod\`ele d'apprentissage. Nous proposons deux approches faiblement supervis\'ees pour extraire ces entit\'es. Une premi\`ere est fond\'ee sur la fouille de motifs et introduit une nouvelle contrainte de similarit\'e s\'emantique. La seconde formule la tache comme une tache d'\'etiquetage de s\'equences en utilisant les CRF (champs conditionnels al\'eatoires). Nous d\'ecrivons les exp\'erimentations men\'ees qui montrent que les deux approches sont compl\'ementaires en termes d'\'evaluation quantitative (rappel et pr\'ecision). Nous montrons en outre que leur combinaison am\'eliore sensiblement les r\'esultats.