Organisme de Formation aux technologies et métiers de L'informatique
google

Formation Google Cloud Platform - Les fondamentaux du Big Data et du Machine Learning

Les fondamentaux du Big Data et du Machine Learning sur Google Cloud Platform

Informations générales

GCP100B
1 jour (7h)
850 €HT

Objectifs

Après ce cours, vous serez capable de :

  • Identifier l'utilité et la valeur des principaux produits Big Data et Machine Learning de Google Cloud Platform
  • Savoir utiliser Cloud SQL et Cloud Dataproc pour migrer les workloads MySQL et Hadoop / Pig / Spark / Hive existantes vers Google Cloud Platform
  • Identifier comment utiliser BigQuery et Cloud Datalab pour effectuer une analyse interactive des données
  • Être capable de créer et d'utiliser un réseau de neurones à l'aide de TensorFlow
  • Identifier comment utiliser des API Machine Learning
  • Savoir choisir parmi différents produits de traitement de données sur Google Cloud Platform

Public

Ce cours s'adresse avant tout aux personnes suivantes :

  • Analystes de données, data scientists et analystes d'affaires qui font leurs premiers pas avec Google Cloud Platform
  • Toute personne en charge des opérations suivantes : conception de pipelines et d'architectures pour le traitement de données, création et gestion de modèles de Machine Learning et de modèles statistiques, interrogation d'ensembles de données, visualisation de résultats de requête, et création de rapports
  • Cadres dirigeants et décideurs informatiques qui évaluent la pertinence de Google Cloud Platform pour les data scientists

Prérequis

Pour suivre ce cours, vous devez déjà posséder les connaissances suivantes :

  • Maîtriser les principes de base des langages de requête courants tels que SQL
  • Avoir de l'expérience en modélisation, extraction, transformation et chargement des données
  • Savoir développer des applications à l'aide d'un langage de programmation courant tel que Python
  • Savoir utiliser le Machine Learning et/ou les statistiques
  • Pour suivre cette formation dans des conditions optimales, nous vous recommandons de venir en formation avec un ordinateur portable

Programme de la formation

Présentation de Google Cloud Platform

  • Présentation des principes de base de Google Cloud Platform
  • Produits de Big Data Google Cloud Platform

Principes de base du calcul et du stockage

  • CPU à la demande (Compute Engine)
  • Un système de fichiers à l'échelle mondiale (Cloud Storage)
  • Cloud Shell
  • Atelier : Configurer un pipeline de traitement de données (Ingestion-Transformation-Publication)

L'analyse de données dans le Cloud

  • Transition pas-à-pas vers le Cloud
  • Cloud SQL : votre base de données SQL dans le cloud
  • Atelier : Importer des données dans Cloud SQL et exécuter des requêtes
  • Spark sur Dataproc
  • Atelier : Recommandations pour le Machine Learning – Spark sur Dataproc

Évolutivité de l'analyse des données

  • Accès aléatoire rapide
  • Datalab
  • BigQuery
  • Atelier : Créer un ensemble de données de Machine Learning

Machine Learning

  • Machine Learning avec TensorFlow
  • Atelier : Exécuter le ML avec TensorFlow
  • Modèles prédéfinis pour les besoins courants
  • Atelier : Utiliser les API de ML

Architectures de traitement de données

  • Architectures de messagerie avec Pub/Sub
  • Créer des pipelines avec Dataflow
  • Architecture de référence pour le traitement des données en temps réel et par lots

Résumé

  • Pourquoi utiliser GCP ?
  • Quelles sont les prochaines étapes ?
  • Autres ressources
plus d'infos

Certification

Cette formation prépare au test "Professional Data Engineer" et entre en jeu dans le cursus de certification "Google Cloud Certified Professional Data Engineer".

Méthode pédagogique

Chaque participant travaille sur un poste informatique qui lui est dédié. Un support de cours lui est remis soit en début soit en fin de cours. La théorie est complétée par des cas pratiques ou exercices corrigés et discutés avec le formateur. Le formateur projette une présentation pour animer la formation et reste disponible pour répondre à toutes les questions.

Méthode d'évaluation

Tout au long de la formation, les exercices et mises en situation permettent de valider et contrôler les acquis du stagiaire. En fin de formation, le stagiaire complète un QCM d'auto-évaluation.

Suivre cette formation à distance

  • Un ordinateur avec webcam, micro, haut-parleur et un navigateur (de préférence Chrome ou Firefox). Un casque n'est pas nécessaire suivant l'environnement.
  • Une connexion Internet de type ADSL ou supérieure. Attention, une connexion Internet ne permettant pas, par exemple, de recevoir la télévision par Internet, ne sera pas suffisante, cela engendrera des déconnexions intempestives du stagiaire et dérangera toute la classe.
  • Privilégier une connexion filaire plutôt que le Wifi.
  • Avoir accès au poste depuis lequel vous suivrez le cours à distance au moins 2 jours avant la formation pour effectuer les tests de connexion préalables.
  • Votre numéro de téléphone portable (pour l'envoi du mot de passe d'accès aux supports de cours et pour une messagerie instantanée autre que celle intégrée à la classe virtuelle).
  • Selon la formation, une configuration spécifique de votre machine peut être attendue, merci de nous contacter.
  • Pour les formations incluant le passage d'une certification la dernière journée, un voucher vous est fourni pour passer l'examen en ligne.
  • Pour les formations logiciel (Adobe, Microsoft Office...), il est nécessaire d'avoir le logiciel installé sur votre machine, nous ne fournissons pas de licence ou de version test.
  • Horaires identiques au présentiel.

Mis à jour le 23/01/2024