Formation Google Cloud : Surveiller, dépanner et améliorer

Surveiller, dépanner et améliorer les performances des infrastructures et applications dans Google Cloud

Télécharger le plan de cours

Demander un devis

Obtenir un renseignement

Informations générales

Référence GCP200LMO

Durée 2 jours (14h)

Tarif 1 400 €HT

Objectifs

Après ce cours, vous serez capable de :

Planifier et mettre en œuvre une infrastructure de journalisation et de surveillance bien conçue
Définir des indicateurs de niveau de service (SLI) et des objectifs de niveau de service (SLO)
Créer des tableaux de bord et des alertes de surveillance efficaces
Surveiller, dépanner et améliorer l’infrastructure Google Cloud
Analyser et exporter les journaux d’audit Google Cloud
Identifier les défauts du code de production, identifier les goulots d’étranglement et améliorer les performances
Optimiser les coûts de surveillance

Public

Ce cours s'adresse avant tout aux personnes suivantes :

Architectes cloud, administrateurs et personnel SysOps
Développeurs cloud et personnel DevOps

Prérequis

Pour suivre ce cours, vous devez déjà posséder les connaissances suivantes :

Avoir suivi la formation "Google Cloud Platform les fondamentaux de l'infrastructure" ou avoir une expérience équivalente
Connaissance de base des scripts ou du codage
Maîtrise des outils de ligne de commande et de l’environnement du système d’exploitation Linux

Programme de la formation

Ce cours de trois jours dirigé par un instructeur enseigne aux participants des techniques de surveillance, de dépannage et d’amélioration des performances de l’infrastructure et des applications dans Google Cloud. Guidé par les principes de l’ingénierie de fiabilité du site (SRE), et en utilisant une combinaison de présentations, démos, laboratoires pratiques et études de cas dans le monde réel, les participants acquièrent de l’expérience sur la surveillance full-stack, la gestion et l’analyse des journaux en temps réel, le débogage de code en production, le traçage des goulots d’étranglement des performances des applications et le profilage de l’utilisation du processeur et de la mémoire.

Module 1: Introduction aux outils de surveillance Google Cloud

Comprendre l’objectif et les capacités des composants Google Cloud axés sur les opérations: journalisation, surveillance, rapports d’erreur et surveillance des services
Comprendre l’objectif et les capacités des composants Google Cloud composants axés sur la gestion des performances des applications: débogueur, traceur, et profileur
Atelier: Connaissance produit

Module 2: Éviter aux clients des situations douloureuses

Construire une base de surveillance sur les quatre signaux d’or: latence, trafic, erreurs et saturation
Mesurez la souffrance des clients avec les SLI
Définir des mesures de performances critiques
Créer et utiliser des SLO et SLA
Atteindre l’harmonie des développeurs et des opérations avec les budgets d’erreur
Ateliers: Revue post mortem
Développer SLO et SLI

Module 3: Politiques d’alerte

Développer des stratégies d’alerte
Définir des politiques d’alerte
Ajouter des canaux de notification
Identifier les types d’alertes et les utilisations courantes de chaque
Construire et alerter sur les groupes de ressources
Gérer les politiques d’alerte par programmation
Ateliers: Politiques d’alerte
Surveillance de service

Module 4: Surveillance des systèmes critiques

Choisir les meilleures pratiques de surveillance de projet d’architecture
Différencier les rôles Cloud IAM pour la surveillance
Utiliser les tableaux de bord par défaut de manière appropriée
Créer des tableaux de bord personnalisés pour montrer la consommation des ressources et la charge d’application
Définir des contrôles de disponibilité pour suivre la vitalité et la latence
Atelier: Surveillance et création de tableau de bord sur plusieurs projets depuis un seul espace de travail

Module 5: Configurer les services d’observabilité Google Cloud

Intégrer des agents de journalisation et de surveillance dans les VM et les images Compute Engine
Activer et utiliser la surveillance Kubernetes
Étendre et clarifier la surveillance Kubernetes avec Prometheus
Exposer des métriques personnalisées via du code et à l’aide de OpenCensus
Atelier: Journalisation et surveillance du Compute

Module 6: Journalisation et analyse avancées

Identifier et choisir parmi les approches d’étiquetage des ressources
Définir les récepteurs de journaux (filtres d’inclusion) et les filtres d’exclusion
Créer des métriques basées sur les journaux
Définir des métriques personnalisées
Lier les erreurs d’application à la journalisation à l’aide du rapport d’erreurs
Exporter les journaux vers BigQuery
Atelier: Analyse des journaux

Module 7: Surveillance de la sécurité réseau et journaux d’audit

Collecter et analyser les journaux de flux VPC et les journaux des règles de pare-feu
Activer et surveiller le Packet Mirroring
Expliquer les capacités de Network Intelligence Center
Utiliser les journaux d’audit des activités d’administration pour suivre les modifications apportées à la configuration ou aux métadonnées des ressources
Utiliser les journaux d’audit d’accès aux données pour suivre les accès ou les modifications des données de ressources fournies par l’utilisateur
Utiliser les journaux d’audit des événements système pour suivre les actions administratives de GCP
Ateliers: Journaux d’accès aux données
Analyser le trafic réseau avec les journaux de flux VPC

Module 8: Gérer les incidents

Définir les rôles de gestion des incidents et les canaux de communication
Atténuer l’impact des incidents
Dépanner les causes profondes
Résoudre les incidents
Documenter les incidents dans un processus post-mortem

Module 9: Investiguer les problèmes de performance applicative

Déboguer le code de production pour corriger les défauts de code
Tracer la latence à travers les couches d’interaction de service pour éliminer les goulots d’étranglement de performance
Profiler et identifier les fonctions gourmandes en ressources dans une application
Atelier: Débogueur

Module 10: Optimiser les coûts de surveillance

Analyser l’utilisation des ressources pour surveiller les composants associés dans Google Cloud
Mettre en œuvre les meilleures pratiques pour contrôler le coût de la surveillance au sein Google Cloud

plus d'infos

Méthode pédagogique

Chaque participant travaille sur un poste informatique qui lui est dédié. Un support de cours lui est remis soit en début soit en fin de cours. La théorie est complétée par des cas pratiques ou exercices corrigés et discutés avec le formateur. Le formateur projette une présentation pour animer la formation et reste disponible pour répondre à toutes les questions.

Méthode d'évaluation

Tout au long de la formation, les exercices et mises en situation permettent de valider et contrôler les acquis du stagiaire. En fin de formation, le stagiaire complète un QCM d'auto-évaluation.

Suivre cette formation à distance

Un ordinateur avec webcam, micro, haut-parleur et un navigateur (de préférence Chrome ou Firefox). Un casque n'est pas nécessaire suivant l'environnement.
Une connexion Internet de type ADSL ou supérieure. Attention, une connexion Internet ne permettant pas, par exemple, de recevoir la télévision par Internet, ne sera pas suffisante, cela engendrera des déconnexions intempestives du stagiaire et dérangera toute la classe.
Privilégier une connexion filaire plutôt que le Wifi.
Avoir accès au poste depuis lequel vous suivrez le cours à distance au moins 2 jours avant la formation pour effectuer les tests de connexion préalables.
Votre numéro de téléphone portable (pour l'envoi du mot de passe d'accès aux supports de cours et pour une messagerie instantanée autre que celle intégrée à la classe virtuelle).
Selon la formation, une configuration spécifique de votre machine peut être attendue, merci de nous contacter.
Pour les formations incluant le passage d'une certification la dernière journée, un voucher vous est fourni pour passer l'examen en ligne.
Pour les formations logiciel (Adobe, Microsoft Office...), il est nécessaire d'avoir le logiciel installé sur votre machine, nous ne fournissons pas de licence ou de version test.
Horaires identiques au présentiel.

Mis à jour le 21/03/2025