Organisme de Formation aux technologies et métiers de L'informatique
google

Formation Google Cloud Platform - Analyse et visualisation de données

Obtenez des informations via l'analyse et la visualisation de données grâce à Google Cloud Platform

Informations générales

GCP200DA
3 jours (21h)
2 550 €HT

Objectifs

Après ce cours, vous serez capable de :

  • Obtenir des informations pertinentes à partir de données à l'aide des outils d'analyse et de visualisation de Google Cloud Platform
  • Charger, nettoyer et transformer des données à grande échelle
  • Explorer et visualiser les données à l'aide de Google Data Studio
  • Optimiser et écrire des requêtes hautes performances et résoudre les problèmes associés
  • S'exercer avec des API de ML prédéfinies pour analyser les images et le texte
  • Savoir "entraîner" des modèles de ML de classification et de prévision à l'aide de SQL avec BQML

Public

Ce cours s'adresse avant tout aux personnes suivantes :

  • Analystes de données, analystes d'affaires et professionnels de la veille stratégique
  • Ingénieurs des données Cloud qui collaborent avec des analystes de données pour créer des solutions de données évolutives sur Google Cloud Platform

Prérequis

Pour suivre ce cours, vous devez déjà posséder les connaissances suivantes :

  • Maîtriser les principes de base du langage ANSI SQL
  • Pour suivre cette formation dans des conditions optimales, nous vous recommandons de venir en formation avec un ordinateur portable

Programme de la formation

Présentation des données dans Google Cloud Platform

  • D'hier à aujourd'hui : analyse de données évolutive dans le Cloud
  • Mettre en avant les difficultés auxquelles font face les analystes de données
  • Comparer le Big Data sur site et dans le Cloud
  • Étudier des cas d'utilisation concrets d'entreprises qui se sont transformées grâce à l'analyse dans le Cloud
  • Découvrir les principes de base des projets Google Cloud Platform
  • Atelier : Premiers pas avec Google Cloud Platform

Présentation des outils de Big Data

  • Optimiser les outils de votre kit d'analyste de données
  • Découvrir les tâches des analystes de données et les défis auxquels ils font face, ainsi que les outils de données Google Cloud Platform
  • Démonstration : Analyser 10 milliards d'enregistrements avec Google BigQuery
  • Découvrir 9 fonctionnalités essentielles de Google BigQuery
  • Comparer les outils GCP pour les analystes, les data scientists et les ingénieurs de données
  • Atelier : Explorer les ensembles de données avec Google BigQuery

Exploration de vos données avec SQL

  • En savoir plus sur Google BigQuery et les bonnes pratiques SQL
  • Comparer les techniques courantes d'exploration des données
  • Apprendre à coder le langage SQL standard de haute qualité
  • Explorer les ensembles de données publics Google BigQuery
  • Aperçu de visualisation : Google Data Studio
  • Atelier : Résoudre les erreurs SQL courantes

Tarifs de Google BigQuery

  • Calculer les coûts du stockage et des requêtes Google BigQuery
  • Présentation complète d'une tâche BigQuery
  • Calculer les tarifs de BigQuery : coûts du stockage, des requêtes et des flux
  • Optimiser les coûts des requêtes
  • Atelier : Calculer les tarifs de Google BigQuery

Nettoyage et transformation de vos données

  • Superposer vos données brutes dans un ensemble de données plus simple et plus riche
  • Étudier les 5 principes de l'intégrité d'un ensemble de données
  • Caractériser la forme et l'asymétrie des ensembles de données
  • Nettoyer et transformer les données à l'aide de SQL
  • Nettoyer et transformer les données à l'aide d'une nouvelle interface utilisateur : présentation de Cloud Dataprep
  • Atelier : Explorer et mettre en forme les données avec Cloud Dataprep

Stockage et exportation des données

  • Créer des tables et exporter les résultats
  • Comparer les tables permanentes aux tables temporaires
  • Enregistrer et exporter les résultats de requêtes
  • Aperçu des performances : cache des requêtes
  • Atelier : Créer des tables permanentes

Ingestion de nouveaux ensembles de données dans Google BigQuery

  • Transférer vos données dans le cloud
  • Interroger à partir de sources de données externes
  • Éviter les pièges liés à l'ingestion de données
  • Ingérer de nouvelles données dans des tables permanentes
  • Discuter des insertions en flux continu
  • Atelier : Ingérer et interroger de nouveaux ensembles de données

Visualisation des données

  • Explorer et expliquer vos données de manière efficace grâce à la visualisation
  • Présentation des principes de visualisation des données
  • Comparer l'analyse exploratoire à l'analyse explicative
  • Démonstration : Interface utilisateur de Google Data Studio
  • Connecter Google Data Studio à Google BigQuery
  • Atelier : Explorer un ensemble de données dans Google Data Studio

Regroupement et fusion des ensembles de données

  • Plus de données pour combiner et enrichir vos ensembles de données
  • Fusionner les tables de données historiques avec UNION
  • Intégrer des caractères génériques de table pour faciliter la fusion
  • Étudier les schémas de données : associer les données dans plusieurs tables
  • Présentation complète d'exemples JOIN et des pièges associés
  • Atelier : Associer des données provenant de plusieurs tables

Fonctions avancées et clauses

  • En savoir plus sur l'écriture des requêtes avancées avec Google BigQuery
  • Étudier les instructions CASE SQL
  • Présentation des fonctions de fenêtre d'analyse
  • Sauvegarder les données avec le chiffrement de champ unidirectionnel
  • Discuter de la conception efficace de sous-requête et de CTE
  • Comparer les fonctions définies par l'utilisateur dans SQL et JavaScript
  • Atelier : Obtenir des informations grâce aux fonctions SQL avancées

Conception de schémas et structures de données imbriquées

  • Modéliser vos ensembles de données à grande échelle avec Google BigQuery
  • Comparer Google BigQuery à l'architecture de données SGBDR traditionnelle
  • Normalisation et dénormalisation : compromis de performance
  • Étude du schéma : Le Bon, la Brute et le Truand
  • Tableaux et données imbriquées dans Google BigQuery
  • Atelier : Interroger les données imbriquées et répétées

Visualisation améliorée avec Google Data Studio

  • Créer des tableaux de bord Pixel-Perfect
  • Créer des instructions CASE et des champs calculés
  • Éviter les problèmes de performance grâce au cache
  • Partager les tableaux de bord et discuter de l'accès aux données

Optimisation des performances

  • Résoudre les problèmes de performances de requêtes
  • Éviter les problèmes de performance de Google BigQuery
  • Empêcher le hotspotting dans vos données
  • Effectuer un diagnostic des problèmes de performances grâce au mappage Query Explanation
  • Atelier : Optimisation et résolution des problèmes de performances

Accès aux données

  • La sécurité des données dans le Cloud au coeur des préoccupations
  • Comparer les rôles des ensembles de données IAM et BigQuery
  • Éviter les pièges liés à l'accès
  • Vérifier les membres, les rôles, les organisations, l'administration des comptes et les comptes de service

Notebooks dans le Cloud

  • Collaborer sur des insights et les partager à l'aide de notebooks
  • Cloud Datalab
  • Compute Engine et Cloud Storage
  • Atelier : Louer une VM pour traiter des données sur des séismes
  • Analyse de données avec BigQuery

Google et le Machine Learning

  • Exploiter des API de ML prédéfinies pour vos projets
  • Présentation du Machine Learning pour les analystes
  • S'exercer avec des API de ML prédéfinies pour analyser les images et le texte
  • Atelier : API de ML pré-entraînées

Application du Machine Learning à vos ensembles de données (BQML)

  • Créer et faire des prévisions avec des modèles de Machine Learning à l'aide de SQL dans BigQuery
  • Créer des ensembles de données de Machine Learning et analyser les fonctionnalités
  • Créer des modèles de ML de classification et de prévision à l'aide de BQML
  • Atelier : Prédire les achats des visiteurs avec un modèle de classification dans BQML
  • Atelier : Prédire le prix d'une course en taxi à l'aide d'un modèle de prévision ML BigQuery
plus d'infos

Méthode pédagogique

Chaque participant travaille sur un poste informatique qui lui est dédié. Un support de cours lui est remis soit en début soit en fin de cours. La théorie est complétée par des cas pratiques ou exercices corrigés et discutés avec le formateur. Le formateur projette une présentation pour animer la formation et reste disponible pour répondre à toutes les questions.

Méthode d'évaluation

Tout au long de la formation, les exercices et mises en situation permettent de valider et contrôler les acquis du stagiaire. En fin de formation, le stagiaire complète un QCM d'auto-évaluation.

Suivre cette formation à distance

  • Un ordinateur avec webcam, micro, haut-parleur et un navigateur (de préférence Chrome ou Firefox). Un casque n'est pas nécessaire suivant l'environnement.
  • Une connexion Internet de type ADSL ou supérieure. Attention, une connexion Internet ne permettant pas, par exemple, de recevoir la télévision par Internet, ne sera pas suffisante, cela engendrera des déconnexions intempestives du stagiaire et dérangera toute la classe.
  • Privilégier une connexion filaire plutôt que le Wifi.
  • Avoir accès au poste depuis lequel vous suivrez le cours à distance au moins 2 jours avant la formation pour effectuer les tests de connexion préalables.
  • Votre numéro de téléphone portable (pour l'envoi du mot de passe d'accès aux supports de cours et pour une messagerie instantanée autre que celle intégrée à la classe virtuelle).
  • Selon la formation, une configuration spécifique de votre machine peut être attendue, merci de nous contacter.
  • Pour les formations incluant le passage d'une certification la dernière journée, un voucher vous est fourni pour passer l'examen en ligne.
  • Pour les formations logiciel (Adobe, Microsoft Office...), il est nécessaire d'avoir le logiciel installé sur votre machine, nous ne fournissons pas de licence ou de version test.
  • Horaires identiques au présentiel.

Mis à jour le 23/01/2024