Overblog Suivre ce blog
Administration Créer mon blog

Présentation

  • : Sipina - Arbres de décision
  • Sipina - Arbres de décision
  • : Sipina : fonctionnalités et références
  • Contact

Recherche

11 mars 2008 2 11 /03 /mars /2008 19:04

Cette étude compare 43 de logiciels de Data Mining à dominante Machine Learning. Les logiciels d’obédience statistique sont très peu représentés. Les prototypes issus de la recherche comme les produits commerciaux sont représentés. On notera néanmoins que les mastodontes sont absents.

En ce qui nous concerne, la version 2.5 de SIPINA a été intégrée dans l’étude et positionnée par rapport aux autres méthodes.

Les auteurs ont su ne pas tomber dans le jeu du « qui est le meilleur ? », toujours agaçant quand on confronte des outils qui n’ont pas les mêmes finalités, et donc ont été élaborés à partir de cahiers de charges différents. Plus intéressant à mon sens sont les critères qu’ont mis en avant les auteurs pour positionner les outils.

La dernière partie de l’article, la section 4, est réellement précieuse. On y trouve tous les références importantes pour l’élaboration d’un logiciel de Data Mining, je m’en suis beaucoup servi par ailleurs lorsqu’il a fallu redéfinir le cahier des charges de TANAGRA. Les auteurs y citent, en les explicitant, entre autres : la variété des techniques et la possibilité de les faire coopérer ; la possibilité de faire évoluer simplement la bibliothèque des techniques ; l’accès et même l’intégration dans les SGBD ; le paramétrage du logiciel selon le niveau d’expertise de l’utilisateur ; l’incrémentalité, lorsque les données sont mises à jour ; etc.

Malgré la relative ancienneté de l'article, le domaine évolue réellement très vite, la lecture de cet article reste très instructive.

Référence : M. Goebel, L. Gruenwald, « A Survey Of  Data Mining And Knowledge Discovery Software Tools », in SIGKDD Explorations, (1) 1, 20-33, 1999.

Repost 0
Published by Sipina - dans Ils en parlent
commenter cet article
11 mars 2008 2 11 /03 /mars /2008 15:00
Une documentation réalisée par des étudiants de Master 2.

Elle liste les principaux menus du logiciel. Une étude comparative de quelques algorithmes d'induction d'arbres sur un même jeu de données est réalisée. Les étudiants ont surtout eu le mérite de manipuler un logiciel qui n'était absolument pas documenté à l'époque, un véritable tour de force.

Documentation : Etude du logiciel SIPINA (Version expérimentale)

Repost 0
Published by Sipina - dans Ils en parlent
commenter cet article