27 mars 2008
4
27
/03
/mars
/2008
14:36
Description. ID3-IV (1986) est la (une des) dernière version de ID3, avant que Quinlan ne se tourne vers le post-élagage avec C4 puis C4.5 (et les autres versions commerciales, non publiées qui s'en suivront).
Par rapport à l'algorithme originel (ID 3 - Quinlan, 1979), il apporte un certain nombre d'améliorations, dont une nouvelle stratégie de pré-élagage basée sur un test d'indépendance du KHI-2. Lorsque la segmentation n'est plus significative, le sommet n'est plus segmenté.
Paramètres.
Confidence level : Risque du test d'indépendance du KHI-2 sur un nœud à segmenter. Une p-value du test plus grande que ce constitue une règle d'arrêt de l'expansion de l'arbre.
Référence. J. Quinlan, " Induction of Decision Trees ", in Machine Learning, 1, pp.81-106, 1986.
Par rapport à l'algorithme originel (ID 3 - Quinlan, 1979), il apporte un certain nombre d'améliorations, dont une nouvelle stratégie de pré-élagage basée sur un test d'indépendance du KHI-2. Lorsque la segmentation n'est plus significative, le sommet n'est plus segmenté.
Paramètres.
Confidence level : Risque du test d'indépendance du KHI-2 sur un nœud à segmenter. Une p-value du test plus grande que ce constitue une règle d'arrêt de l'expansion de l'arbre.
Référence. J. Quinlan, " Induction of Decision Trees ", in Machine Learning, 1, pp.81-106, 1986.