Overblog
Editer l'article Suivre ce blog Administration + Créer mon blog

Présentation

  • : Sipina - Arbres de décision
  • : Sipina : fonctionnalités et références
  • Contact

Recherche

27 mars 2008 4 27 /03 /mars /2008 14:36
Description. ID3-IV (1986) est la (une des) dernière version de ID3, avant que Quinlan ne se tourne vers le post-élagage avec C4 puis C4.5 (et les autres versions commerciales, non publiées qui s'en suivront).

Par rapport à l'algorithme originel (ID 3 - Quinlan, 1979), il apporte un certain nombre d'améliorations, dont une nouvelle stratégie de pré-élagage basée sur un test d'indépendance du KHI-2. Lorsque la segmentation n'est plus significative, le sommet n'est plus segmenté.

Paramètres.
Confidence level : Risque du test d'indépendance du KHI-2 sur un nœud à segmenter. Une p-value du test plus grande que ce  constitue une règle d'arrêt de l'expansion de l'arbre.

Référence. J. Quinlan, " Induction of Decision Trees ", in Machine Learning, 1, pp.81-106, 1986.
Partager cet article
Repost0

commentaires