Formation Machine learning, l'état de l'art
Informations générales
Objectifs
Après ce cours, vous serez capable de :
- Identifier les concepts d’apprentissage automatique et l’évolution du Big Data vers le Machine Learning
- Appréhender les enjeux de l'utilisation du Machine Learning, incluant les bénéfices attendus et des exemples d’usage
- Identifier le positionnement du Machine Learning dans la chaîne de traitement de la donnée
- Identifier les outils et les acteurs leaders du marché
- Découvrir les principaux algorithmes et la démarche projet à appliquer selon les cas d'usages en entreprise
- Identifier les clés de réussite d'un projet intégrant du Machine Learning
Public
Ce cours s'adresse avant tout aux personnes suivantes :
- Toute personne souhaitant comprendre les mécanismes et les bénéfices du Machine Learning : dirigeants d'entreprise, DSI, responsables informatiques, consultants, responsables de projets Big Data...
Prérequis
Pour suivre ce cours, vous devez déjà posséder les connaissances suivantes :
- Il est recommandé de posséder des notions de probabilités et statistiques.
Programme de la formation
les concepts d’apprentissage automatique et l’évolution du Big Data vers le Machine Learning
- Définition.
- De la statistique à l'apprentissage automatique.
- Apprentissage automatique : comprendre ou prédire?
- Besoin en puissance de calcul et de stockage.
- Intégration de l'apprentissage automatique dans les fermes de Big Data.
- Les valeurs d'observation, et les variables cibles.
- Ingénierie des variables.
Appréhender les enjeux de l'utilisation du Machine Learning, incluant les bénéfices attendus et des exemples d’usage
- Comment automatiser les processus métier.
- Attentes.
- Création de valeur à partir de la donnée.
- Problème du ratio pertinence/volume.
- Les risques et écueils.
- Importance de la préparation des données.
- L'écueil du "surapprentissage".
- Les erreurs d'architecture à éviter.
- Atelier : mise en évidence d'erreurs d'apprentissage sur des données non qualifiées.
- Modélisation automatique.
- Le rôle du data scientist.
- Atelier : démonstration de reconnaissance d'images.
Identifier le positionnement du Machine Learning dans la chaîne de traitement de la donnée
- Le pattern MapReduce.
- Exemple d'utilisation.
- Gouvernance des données.
- Qualité des données.
- Transformation de l'information en donnée.
- Qualification et enrichissement.
- Sécurisation et étanchéité des lacs de données.
- Flux de données et organisation dans l'entreprise.
- De la donnée maître à la donnée de travail.
- MDM.
- Mise en oeuvre pratique des différentes phases : nettoyage, enrichissement,organisation des données.
- Zoom sur les données : format, volumes, structures.
- Zoom sur les requêtes, attentes des utilisateurs.
- Etapes de la préparation des données.
- Définitions, présentation du data munging
Connaitre les outils et les acteurs leaders du marché
- Comparatifs des outils d'apprentissage automatique.
- Les outils en mode local, en mode distribué.
- Les acteurs.
- Leurs outils.
- Atelier : utilisation de scikit learn et de SparkML.
- Comparatif. Apprentissage profond : introduction aux réseaux de neurones.
- Réseaux de neurones à convolution.
- Modèles de CNN.
- L'approche du Deep Learning.
- Deeplearning4j sur Spark.
- TensorFlow sur rig, sur Spark.
- Atelier : mise en oeuvre d'une reconnaissance automatique avec TensorFlow
Découvrir les principaux algorithmes et la démarche projet à appliquer selon les cas d'usages en entreprise
- Apprentissage supervisé/non supervisé, classification ou régression.
- Algorithme paramétrique ou non-paramétrique, linéaire ou non-linéaire.
- Les méthodes : apprentissage supervisé et non supervisé
- Classification des données,
- Algorithmes : régression linéaire, k-moyennes, k-voisins, classification naïve bayésienne, arbres de décision, forêts aléatoires, ...
- Atelier : classification automatique d'un jeu de données à partir d'une régression logistique
- Création de jeux d'essai, entraînement et construction de modèles. Prévisions à partir de données réelles.
- Mesure de l'efficacité des algorithmes.
- Courbes ROC.
- Parallélisation des algorithmes.
- Choix automatique.
- Atelier : Mise en évidence des erreurs d'apprentissage en fonction des hyper-paramètres
Identifier les clés de réussite d'un projet intégrant du Machine Learning
- Choix des architecture.
- Comment définir le besoin métier ?
- Extraction et organisation des classes de données.
- Applications aux fermes de calculs distribués.
- Problématiques induites.
- Approximations.
- Précision des estimations
- Analyse factorielle.
- Visualisation des données.
- L'intérêt de la visualisation
- Outils disponibles.
Méthode pédagogique
Chaque participant travaille sur un poste informatique qui lui est dédié. Un support de cours lui est remis soit en début soit en fin de cours. La théorie est complétée par des cas pratiques ou exercices corrigés et discutés avec le formateur. Le formateur projette une présentation pour animer la formation et reste disponible pour répondre à toutes les questions.
Méthode d'évaluation
Tout au long de la formation, les exercices et mises en situation permettent de valider et contrôler les acquis du stagiaire. En fin de formation, le stagiaire complète un QCM d'auto-évaluation.
Suivre cette formation à distance
- Un ordinateur avec webcam, micro, haut-parleur et un navigateur (de préférence Chrome ou Firefox). Un casque n'est pas nécessaire suivant l'environnement.
- Une connexion Internet de type ADSL ou supérieure. Attention, une connexion Internet ne permettant pas, par exemple, de recevoir la télévision par Internet, ne sera pas suffisante, cela engendrera des déconnexions intempestives du stagiaire et dérangera toute la classe.
- Privilégier une connexion filaire plutôt que le Wifi.
- Avoir accès au poste depuis lequel vous suivrez le cours à distance au moins 2 jours avant la formation pour effectuer les tests de connexion préalables.
- Votre numéro de téléphone portable (pour l'envoi du mot de passe d'accès aux supports de cours et pour une messagerie instantanée autre que celle intégrée à la classe virtuelle).
- Selon la formation, une configuration spécifique de votre machine peut être attendue, merci de nous contacter.
- Pour les formations incluant le passage d'une certification la dernière journée, un voucher vous est fourni pour passer l'examen en ligne.
- Pour les formations logiciel (Adobe, Microsoft Office...), il est nécessaire d'avoir le logiciel installé sur votre machine, nous ne fournissons pas de licence ou de version test.
- Horaires identiques au présentiel.
Mis à jour le 29/01/2024