Organisme de Formation aux technologies et métiers de L'informatique
python

Formation L'apprentissage Machine en Python (SciKit-Learn)

Utiliser la bibliothèque d'apprentissage statistique en Python de référence

Informations générales

DEC050
2 jours (14h)
1 450 €HT

Objectifs

Après ce cours, vous serez capable de :

  • Être capable de mettre en œuvre SciKit-learn pour de l'apprentissage machine et l'analyse de données
  • Identifier comment collecter les données et les préparer pour un traitement efficient
  • Savoir modéliser les données et optimiser les modèles
  • Être en mesure d'industrialiser et de déployer une application de prédiction

Public

Ce cours s'adresse avant tout aux personnes suivantes :

  • Chefs de projet et data-scientists souhaitant comprendre le fonctionnement de SciKit-learn

Prérequis

Pour suivre ce cours, vous devez déjà posséder les connaissances suivantes :

  • Connaissance de Python et d'une bibliothèque de calcul telle que Numpy ou Pandas

Programme de la formation

Spécifiquement conçue par de nombreux contributeurs et notamment par des instituts français d'enseignement supérieurs et de recherche tels que l'INRIA et Télécom Paritech, SciKit-Learn est une bibliothèque libre développée en Python et destinée à la mise en œuvre de solutions d'apprentissage automatique. Simple d'utilisation et polyvalente, SciKit-Learn peut être utilisée dans une grande variété de projets : ciblages marketing, prévisions de comportements d'internautes, optimisation de processus industriels ou logistiques... Les participants à cette formation de 2 jours acquerront les compétences et connaissances nécessaires à la mise en œuvre de SciKit-Learn dans leurs projets.

L'écosystème SciKit Learn

  • Origine
  • Missions et évolutions
  • Architecture
  • Modules
  • Atelier pratique : Installation de l'écosystème (PC, MAC, LINUX)

Bonnes pratiques SciKit Learn : la récupération de données

  • L'API dédiée aux jeux de données
  • Problématique des grands jeux de données
  • Les jeux de données internes au framework
  • La génération de données artificielles
  • L'accès aux données ouvertes
  • Méthodologies de chargement de données externes
  • Atelier pratique : Collecte de données sur un cas concret

Bonnes pratiques SciKit Learn : le prétraitement

  • Cadre et rôle du prétraitement
  • Méthodes de mise à l'échelle des données
  • Normalisation des données
  • Traitement des données catégorielles
  • Traitement des données manquantes
  • Atelier pratique : Prétraitement des données dans un cas concret

Bonnes pratiques SciKit Learn : l'ingénierie des variables prédictives

  • Cadre et rôle de l'ingénierie des variables prédictives
  • Transformations non linéaires
  • Algorithmes de réduction dimensionnelle de données
  • L'extraction automatique de traits (textes, images)
  • Combinaison et transformations ad-hoc des données
  • Atelier pratique : Ingénierie des variables prédictives sur un cas concret

Bonnes pratiques SciKit Learn : la modélisation

  • Cartographie des algorithmes de l'écosystème
  • Tour de l'apprentissage supervisé avec SciKit Learn
  • Tour de l'apprentissage non supervisé avec SciKit Learn
  • En pratique, mode de sélection d'algorithmes pertinents
  • Atelier pratique : L'apprentissage supervisé et non supervisé sur cas concrets

Bonnes pratiques SciKit Learn : sélection et optimisation des modèles

  • Présentation et usage des outils de combinaison et de chaînage de processus
  • L'évaluation de performance par validation-croisée
  • Le réglage des hyper-paramètres d'un modèle
  • Les APIs d'évaluation des modèles de prédiction
  • Les différentes courbes d'évaluations de modèles de prédictions
  • Atelier pratique : Sélection de modèle, et optimisation des réglages

Bonnes pratiques SciKit Learn : industrialisation et déploiement

  • Persistance des modèles
  • Scaling des applications de prédictions avec SciKit Learn
  • Problématiques de latence et de débit à l'exécution
  • La parallélisation
  • La gestion de l'environnement Python associé
  • Atelier pratique : Industrialisation d'une application de prédiction
plus d'infos

Méthode pédagogique

Un tour d'horizon complet des fonctionnalités de SciKit-Learn Une formation très opérationnelle durant laquelle s'alternent les phases d'apports théoriques, d'échanges, de partage d'expériences et les séquences de mise en pratique Une formation pratique : chaque point abordé fera l'objet de manipulations à travers des ateliers pratiques Les retours d'expérience et conseils de consultants experts.

Méthode d'évaluation

Tout au long de la formation, les exercices et mises en situation permettent de valider et contrôler les acquis du stagiaire. En fin de formation, le stagiaire complète un QCM d'auto-évaluation.

Suivre cette formation à distance

  • Un ordinateur avec webcam, micro, haut-parleur et un navigateur (de préférence Chrome ou Firefox). Un casque n'est pas nécessaire suivant l'environnement.
  • Une connexion Internet de type ADSL ou supérieure. Attention, une connexion Internet ne permettant pas, par exemple, de recevoir la télévision par Internet, ne sera pas suffisante, cela engendrera des déconnexions intempestives du stagiaire et dérangera toute la classe.
  • Privilégier une connexion filaire plutôt que le Wifi.
  • Avoir accès au poste depuis lequel vous suivrez le cours à distance au moins 2 jours avant la formation pour effectuer les tests de connexion préalables.
  • Votre numéro de téléphone portable (pour l'envoi du mot de passe d'accès aux supports de cours et pour une messagerie instantanée autre que celle intégrée à la classe virtuelle).
  • Selon la formation, une configuration spécifique de votre machine peut être attendue, merci de nous contacter.
  • Pour les formations incluant le passage d'une certification la dernière journée, un voucher vous est fourni pour passer l'examen en ligne.
  • Pour les formations logiciel (Adobe, Microsoft Office...), il est nécessaire d'avoir le logiciel installé sur votre machine, nous ne fournissons pas de licence ou de version test.
  • Horaires identiques au présentiel.

Mis à jour le 04/12/2024