Informations Générales | |
---|---|
Responsable | Laetitia Jourdan |
Semestre | S3 |
Enseignement | Obligatoire -- Présentiel |
UEs pré-requises | BDR |
Modalités d’évaluation | CC+CT |
Structure | ECTS | |
---|---|---|
Élément de cours | De la fouille de données à l’auto-ML | |
Unité d’enseignement | FD | 3 |
Bloc de compétence | Bases de données |
Répartition horaire | CM | CTD | TD | TP | à distance | total |
---|---|---|---|---|---|---|
Heures encadrées | 12 | 12 | 24 | |||
Heures Projet | ||||||
Travail Personnel | 24 | |||||
Stage |
La fouille de données est un processus complet de différentes tâches permettant de :
Ce processus nécessite pour chaque tâche de maitriser différents algorithmes, de pouvoir les mettre en oeuvre, d’être capable de les paramétrer et d’utiliser différents outils logiciels. Nous verrons dans le cadre de ce cours, différents outils logiciels permettant de réaliser un pipeline des tâches de fouilles de données (Weka, orange, Knime …). Chaque tâche devant être paramétrée, nous verrons dans le cadre de ce cours comment hyperparamétrer les différents algorithmes permettant de réaliser chaque tâche.
La complexité des tâches de fouille de données dépasse souvent les compétences de non-spécialistes, la croissance rapide des applications d’apprentissage automatique a créé une demande pour des méthodes d’apprentissage automatique prêtes à l’emploi pouvant être utilisées facilement et sans connaissances approfondies. L’autoML tente de répondre à ces exigences. Nous verrons dans le cadre de ce cours, les principales méthodes d’autoML et notamment TPOT, Auto-Weka et auto-Sklearn.
Beaucoup de méthodes d’autoML et d’hyperparamétrage étant basées sur l’optimisation combinatoire et continue aussi bien mono- et multi-objective nous reverrons rapidement quelques uns des concepts vu en M1 afin de bien comprendre les algorithmes mis en jeu.