Organisme de Formation aux technologies et métiers de L'informatique

Formation Machine learning, l'état de l'art

Informations générales

MLE
2 jours (14h)
2 090 €HT
repas inclus

Objectifs

Après ce cours, vous serez capable de :

  • Identifier les enjeux de l'utilisation du machine learning dans l'entreprise
  • Positionner le machine learning dans la chaîne de traitement de la donnée
  • Distinguer les compétences nécessaires ou les profils à recruter
  • Identifier les clés de réussite d'un projet autour du machine learning

Public

Ce cours s'adresse avant tout aux personnes suivantes :

  • dirigeants d'entreprise (CEO, COO, CFO, SG, DRH...)
  • DSI
  • les CDO
  • responsables informatique
  • consultants
  • responsables de projets Big Data

Prérequis

Pour suivre ce cours, vous devez déjà posséder les connaissances suivantes :

  • Posséder une culture informatique de base.
  • La connaissance des bases des mathématiques statistiques est un plus.

Programme de la formation

Ce séminaire vise à prendre conscience des enjeux liés au traitement de la donnée par l'intelligence artificielle, et en particulier par les algorithmes du machine learning. Il montre aux décideurs, par une approche vulgarisatrice et interactive, les mécanismes du machine learning, les solutions concrètes et la démarche de projet à appliquer selon les cas d'usages en entreprise.

Histoire du machine learning et contexte du Big Data

  • Replacer à leur échelle les concepts d'intelligence artificielle, apprentissage automatique (machine learning)...
  • Le lien avec les mathématiques, statistiques (inférentielles), data mining et data science.
  • Passer de l'analyse descriptive à l'analyse prédictive puis prescriptive.
  • Les applications du machine learning (moteurs de recherche, détection des spams, lecture des chèques).
  • La typologie des algorithmes de Dominique CARDON.
  • La communauté Data Science et les challenges Kaggle (ex. de Netflix).
  • Etude de cas : Etudes d'applications concrètes du machine learning (moteurs de recherche, détection des spams, lecture des chèques).

Les données à disposition : collecte et préparation

  • Données structurées, semi-structurées et non structurées.
  • Nature statistique des données (qualitatives ou quantitatives).
  • Objets connectés (IoT) et streaming.
  • Opportunités et limites de l'Open Data.
  • Identification des corrélations, problème de la multicolinéarité.
  • Réduction des dimensions par Analyse des Composantes Principales.
  • Détection et correction des valeurs aberrantes.
  • Les ETL (Extract Transform Load).
  • Le Web scraping.
  • Démonstration : Démonstration d'un ETL (Extract Transform Load). Recueil de données Web.

Les outils du marché pour le traitement de la donnée et le machine learning

  • Les logiciels traditionnels (SAS, SPSS, Stata...) et leur ouverture à l'Open Source.
  • Choisir entre les deux leaders Open Source : Python et R.
  • Plateformes Cloud (Azure, AWS, Google Cloud Platform) et solutions SAAS (IBM Watson, Dataïku).
  • Nouveaux postes en entreprises : data engineer, data scientist, data analyst, etc.
  • Associer les bonnes compétences à ces différents outils.
  • Les API en ligne (IBM Watson, Microsoft Cortana Intelligence...).
  • Les chats bot (agent conversationnel).
  • Démonstration : Démonstration d'un chat bot (agent conversationnel) et d'Azure Machine Learning.

Les différents types d'apprentissage en machine learning

  • Apprentissage supervisé : répéter un exemple.
  • Apprentissage non supervisé : découvrir les données.
  • Online (machine) learning par opposition aux techniques batch.
  • Reinforcement learning : optimisation d'une récompense.
  • Autres types d'apprentissage (par transfert, séquentiel, actif...).
  • Illustrations (moteurs de recommandation...).
  • Démonstration : Démonstrations sur les différents types d'apprentissage machine learning possibles.

Les algorithmes du machine learning

  • Régression linéaire simple et multiple. Limites des approches linéaires.
  • Régression polynomiale (LASSO). Séries temporelles.
  • Régression logistique et applications en scoring.
  • Classification hiérarchique et non hiérarchique (KMeans).
  • Classification par arbres de décision ou approche Naïve Bayes.
  • Ramdom Forest (développement des arbres de décision).
  • Gradiant Boosting. Réseaux de neurones. Machine à support de vecteurs.
  • Deep learning : exemples et raisons du succès actuel.
  • Text Mining : analyse des corpus de données textuelles.
  • Démonstration : Démonstration des différents algorithmes de base sous R ou Python.

Procédure d'entraînement et d'évaluation des algorithmes

  • Séparation du jeu de données en plusieurs : entraînement, test et validation.
  • Techniques de bootstrap (bagging).
  • Exemple de la validation croisée.
  • Définition d'une métrique de performance.
  • Descente de gradient stochastique (minimisation de la métrique).
  • Courbes ROC et de lift pour évaluer et comparer les algorithmes.
  • Matrice de confusion : faux positifs et faux négatifs.
  • Démonstration : Démonstration du choix du meilleur algorithme.

Mise en production d'un algorithme de machine learning

  • Description d'une plateforme Big Data.
  • Principe de fonctionnement des API.
  • Du développement à la mise en production.
  • Stratégie de maintenance corrective et évolutive.
  • Evaluation du coût de fonctionnement en production.
  • Démonstration : Démonstration d'API de géolocalisation et d'analyse de sentiments.

Aspects éthiques et juridiques liés à l'intelligence artificielle

  • Missions de la CNIL et évolutions à venir.
  • Question du droit d'accès aux données personnelles.
  • Question de la propriété intellectuelle des algorithmes.
  • Nouveaux rôles dans l'entreprise : Chief Data Officer et Data Protection Officer.
  • Question de l'impartialité des algorithmes.
  • Attention au biais de confirmation.
  • Les secteurs et les métiers touchés par l'automatisation.
  • Réflexion collective : Réflexion en commun pour identifier les clés de réussite.
plus d'infos

Méthode pédagogique

Illustration par des cas concrets.

Présentation des principaux cas d'usage selon les secteurs d'activités (Automobile, industrie, biens de consommation, finance, santé énergie, agriculture, transports, télécommunication...).

Méthode d'évaluation

Tout au long de la formation, les exercices et mises en situation permettent de valider et contrôler les acquis du stagiaire. En fin de formation, le stagiaire complète un QCM d'auto-évaluation.

Suivre cette formation à distance

  • Un ordinateur avec webcam, micro, haut-parleur et un navigateur (de préférence Chrome ou Firefox). Un casque n'est pas nécessaire suivant l'environnement.
  • Une connexion Internet de type ADSL ou supérieure. Attention, une connexion Internet ne permettant pas, par exemple, de recevoir la télévision par Internet, ne sera pas suffisante, cela engendrera des déconnexions intempestives du stagiaire et dérangera toute la classe.
  • Privilégier une connexion filaire plutôt que le Wifi.
  • Avoir accès au poste depuis lequel vous suivrez le cours à distance au moins 2 jours avant la formation pour effectuer les tests de connexion préalables.
  • Votre numéro de téléphone portable (pour l'envoi du mot de passe d'accès aux supports de cours et pour une messagerie instantanée autre que celle intégrée à la classe virtuelle).
  • Selon la formation, une configuration spécifique de votre machine peut être attendue, merci de nous contacter.
  • Pour les formations incluant le passage d'une certification la dernière journée, un voucher vous est fourni pour passer l'examen en ligne.
  • Pour les formations logiciel (Adobe, Microsoft Office...), il est nécessaire d'avoir le logiciel installé sur votre machine, nous ne fournissons pas de licence ou de version test.
  • Horaires identiques au présentiel.

Mis à jour le 08/11/2023