Overblog
Editer l'article Suivre ce blog Administration + Créer mon blog

Présentation

  • : Sipina - Arbres de décision
  • : Sipina : fonctionnalités et références
  • Contact

Recherche

11 mars 2008 2 11 /03 /mars /2008 13:42
Cet article présente de manière didactique l'induction d'un arbre de décision à partir de données. A l'aide d'un exemple tiré de l'ouvrage de Quinlan (1993), les principales étapes de l'apprentissage d'un arbre de décision sont mises en avant. L'accent est mis sur les points principaux : choix de la variable de segmentation, découpage des descripteurs continus, détermination de la profondeur optimale de l'arbre, règle de décision sur les feuilles.

Dans un deuxième temps, un tutoriel montre l'instanciation d'un arbre de décision dans un logiciel gratuit, en l'occurrence SIPINA. L'exemple porte sur le fameux fichier IRIS de Fisher (1936). Nous en profitons pour introduire les aspects géométriques de l'apprentissage supervisé.

Enfin, dans un troisième temps, un bilan des forces et faiblesses de la méthode permet de la situer parmi les autres techniques de Data Mining. Un tour d'horizon très rapide sur les variantes méthodologiques conclut l'article.

Cet article peut être lu de différentes manières : pour comprendre le processus d'induction, pour voir un peu ce qui se fait dans le domaine ces dernières années, pour situer la technique parmi les autres méthodes de fouille de données,…

Référence : R. Rakotomalala, " Arbres de décision ", in Revue Modulad, n°33, 2005.

Partager cet article
Repost0

commentaires