Organisme de Formation aux technologies et métiers de L'informatique
google

Formation Google Cloud : Surveiller, dépanner et améliorer

Surveiller, dépanner et améliorer les performances des infrastructures et applications dans Google Cloud

Informations générales

GCP200LMO
3 jours (21h)
2 100 €HT

Objectifs

Après ce cours, vous serez capable de :

  • Planifier et mettre en œuvre une infrastructure de journalisation et de surveillance bien conçue
  • Définir des indicateurs de niveau de service (SLI) et des objectifs de niveau de service (SLO)
  • Créer des tableaux de bord et des alertes de surveillance efficaces
  • Surveiller, dépanner et améliorer l’infrastructure Google Cloud
  • Analyser et exporter les journaux d’audit Google Cloud
  • Identifier les défauts du code de production, identifier les goulots d’étranglement et améliorer les performances
  • Optimiser les coûts de surveillance

Public

Ce cours s'adresse avant tout aux personnes suivantes :

  • Architectes cloud, administrateurs et personnel SysOps
  • Développeurs cloud et personnel DevOps

Prérequis

Pour suivre ce cours, vous devez déjà posséder les connaissances suivantes :

  • Avoir suivi la formation "Google Cloud Platform les fondamentaux de l'infrastructure" ou avoir une expérience équivalente
  • Connaissance de base des scripts ou du codage
  • Maîtrise des outils de ligne de commande et de l’environnement du système d’exploitation Linux

Programme de la formation

Ce cours de trois jours dirigé par un instructeur enseigne aux participants des techniques de surveillance, de dépannage et d’amélioration des performances de l’infrastructure et des applications dans Google Cloud. Guidé par les principes de l’ingénierie de fiabilité du site (SRE), et en utilisant une combinaison de présentations, démos, laboratoires pratiques et études de cas dans le monde réel, les participants acquièrent de l’expérience sur la surveillance full-stack, la gestion et l’analyse des journaux en temps réel, le débogage de code en production, le traçage des goulots d’étranglement des performances des applications et le profilage de l’utilisation du processeur et de la mémoire.

Module 1: Introduction aux outils de surveillance Google Cloud

  • Comprendre l’objectif et les capacités des composants Google Cloud axés sur les opérations: journalisation, surveillance, rapports d’erreur et surveillance des services
  • Comprendre l’objectif et les capacités des composants Google Cloud composants axés sur la gestion des performances des applications: débogueur, traceur, et profileur
  • Atelier: Connaissance produit

Module 2: Éviter aux clients des situations douloureuses

  • Construire une base de surveillance sur les quatre signaux d’or: latence, trafic, erreurs et saturation
  • Mesurez la souffrance des clients avec les SLI
  • Définir des mesures de performances critiques
  • Créer et utiliser des SLO et SLA
  • Atteindre l’harmonie des développeurs et des opérations avec les budgets d’erreur
  • Ateliers: Revue post mortem
  • Développer SLO et SLI

Module 3: Politiques d’alerte

  • Développer des stratégies d’alerte
  • Définir des politiques d’alerte
  • Ajouter des canaux de notification
  • Identifier les types d’alertes et les utilisations courantes de chaque
  • Construire et alerter sur les groupes de ressources
  • Gérer les politiques d’alerte par programmation
  • Ateliers: Politiques d’alerte
  • Surveillance de service

Module 4: Surveillance des systèmes critiques

  • Choisir les meilleures pratiques de surveillance de projet d’architecture
  • Différencier les rôles Cloud IAM pour la surveillance
  • Utiliser les tableaux de bord par défaut de manière appropriée
  • Créer des tableaux de bord personnalisés pour montrer la consommation des ressources et la charge d’application
  • Définir des contrôles de disponibilité pour suivre la vitalité et la latence
  • Atelier: Surveillance et création de tableau de bord sur plusieurs projets depuis un seul espace de travail

Module 5: Configurer les services d’observabilité Google Cloud

  • Intégrer des agents de journalisation et de surveillance dans les VM et les images Compute Engine
  • Activer et utiliser la surveillance Kubernetes
  • Étendre et clarifier la surveillance Kubernetes avec Prometheus
  • Exposer des métriques personnalisées via du code et à l’aide de OpenCensus
  • Atelier: Journalisation et surveillance du Compute

Module 6: Journalisation et analyse avancées

  • Identifier et choisir parmi les approches d’étiquetage des ressources
  • Définir les récepteurs de journaux (filtres d’inclusion) et les filtres d’exclusion
  • Créer des métriques basées sur les journaux
  • Définir des métriques personnalisées
  • Lier les erreurs d’application à la journalisation à l’aide du rapport d’erreurs
  • Exporter les journaux vers BigQuery
  • Atelier: Analyse des journaux

Module 7: Surveillance de la sécurité réseau et journaux d’audit

  • Collecter et analyser les journaux de flux VPC et les journaux des règles de pare-feu
  • Activer et surveiller le Packet Mirroring
  • Expliquer les capacités de Network Intelligence Center
  • Utiliser les journaux d’audit des activités d’administration pour suivre les modifications apportées à la configuration ou aux métadonnées des ressources
  • Utiliser les journaux d’audit d’accès aux données pour suivre les accès ou les modifications des données de ressources fournies par l’utilisateur
  • Utiliser les journaux d’audit des événements système pour suivre les actions administratives de GCP
  • Ateliers: Journaux d’accès aux données
  • Analyser le trafic réseau avec les journaux de flux VPC

Module 8: Gérer les incidents

  • Définir les rôles de gestion des incidents et les canaux de communication
  • Atténuer l’impact des incidents
  • Dépanner les causes profondes
  • Résoudre les incidents
  • Documenter les incidents dans un processus post-mortem

Module 9: Investiguer les problèmes de performance applicative

  • Déboguer le code de production pour corriger les défauts de code
  • Tracer la latence à travers les couches d’interaction de service pour éliminer les goulots d’étranglement de performance
  • Profiler et identifier les fonctions gourmandes en ressources dans une application
  • Atelier: Débogueur

Module 10: Optimiser les coûts de surveillance

  • Analyser l’utilisation des ressources pour surveiller les composants associés dans Google Cloud
  • Mettre en œuvre les meilleures pratiques pour contrôler le coût de la surveillance au sein Google Cloud
plus d'infos

Méthode pédagogique

Chaque participant travaille sur un poste informatique qui lui est dédié. Un support de cours lui est remis soit en début soit en fin de cours. La théorie est complétée par des cas pratiques ou exercices corrigés et discutés avec le formateur. Le formateur projette une présentation pour animer la formation et reste disponible pour répondre à toutes les questions.

Méthode d'évaluation

Tout au long de la formation, les exercices et mises en situation permettent de valider et contrôler les acquis du stagiaire. En fin de formation, le stagiaire complète un QCM d'auto-évaluation.

Mis à jour le 26/10/2023