Overblog Suivre ce blog
Editer l'article Administration Créer mon blog

Présentation

  • : Sipina - Arbres de décision
  • Sipina - Arbres de décision
  • : Sipina : fonctionnalités et références
  • Contact

Recherche

11 mars 2008 2 11 /03 /mars /2008 16:58

Une présentation convenue mais finalement très didactique des arbres de décision. Après un exemple introductif où l’on construit un arbre sur les données de Quinlan (1993), les points importants dans la construction de l’arbre sont mis en avant : choix des variables de segmentation, discrétisation des variables continues, etc.
 
La partie sur la définition de la bonne taille de l’arbre est très instructive. Elle montre la difficulté à trouver le bon équilibre entre exploiter au mieux l’information qu’apporte les données, et apprendre les particularités du fichier de données, singularités qui ne sont pas transposables dans la population. Plusieurs mots clés importants sont mis en avant : arbitrage performance/complexité, principe de parcimonie, compromis biais variance, minimisation du risque structurel vs. minimisation du risque empirique,… 

Quelques liens vers des logiciels, commerciaux essentiellement, sont disponibles.

Référence : Wikipédia

Partager cet article

Repost 0

commentaires