Formation Building Streaming Data Analytics Solutions on AWS
Informations générales
Prérequis
Pour suivre ce cours, vous devez déjà posséder les connaissances suivantes :
- Posséder au moins un an d’expérience en analyse de données ou une expérience directe dans la création d’applications en temps réel ou de solutions d’analyse en continu. Nous suggérons le livre blanc Streaming Data Solutions on AWS pour ceux qui ont besoin d’un rappel sur les concepts de streaming.
- Avoir suivi la formation Architecting on AWS
- Avoir suivi la formation Building Data Lakes on AWS
Public
Ce cours s'adresse avant tout aux personnes suivantes :
- Ingénieurs et architectes de données
- Développeurs qui souhaitent créer et gérer des applications en temps réel et des solutions d’analyse de données en continu
Programme de la formation
Dans ce cours, vous apprendrez à créer des solutions d’analyse de données de streaming à l’aide des services AWS, notamment Amazon Kinesis et Amazon Managed Streaming for Apache Kafka (Amazon MSK). Amazon Kinesis est un service de streaming de données en temps réel massivement évolutif et durable. Amazon MSK propose un service Apache Kafka sécurisé, entièrement géré et hautement disponible.
Vous apprendrez comment Amazon Kinesis et Amazon MSK s’intègrent aux services AWS tels qu’AWS Glue et AWS Lambda. Le cours aborde les composants d’ingestion de données en continu, de stockage de flux et de traitement de flux du pipeline d’analyse de données. Vous apprendrez également à appliquer les meilleures pratiques en matière de sécurité, de performances et de gestion des coûts au fonctionnement de Kinesis et d’Amazon MSK.
Présentation de l’analyse des données et du pipeline de données
- Cas d’utilisation de l’analyse de données
- Utilisation du pipeline de données pour l’analyse
Utilisation des services de streaming dans le pipeline d’analyse de données
- L’importance de l’analyse des données en continu
- Le pipeline d’analyse de données en continu
- Concepts de streaming
Introduction aux services de diffusion en continu AWS
- Services de données en continu dans AWS
- Amazon Kinesis dans les solutions d’analyse
- Utilisation d’Amazon Kinesis Data Analytics
- Présentation d’Amazon MSK
- Présentation de Spark Streaming
- Mise en pratique : Configuration d’un pipeline de diffusion en continu avec Amazon Kinesis
Utilisation d’Amazon Kinesis pour l’analyse de données en temps réel
- Explorer Amazon Kinesis à l’aide d’une charge de travail clickstream
- Création de données Kinesis et de flux de diffusion
- Construire des producteurs de flux
- Construire des consommateurs de flux
- Création et déploiement d’applications Flink dans Kinesis Data Analytics
- Mise en pratique : analyses en continu avec Amazon Kinesis Data Analytics et Apache Flink
Sécurisation, surveillance et optimisation d’Amazon Kinesis
- Optimisez Amazon Kinesis pour obtenir des informations commerciales exploitables
- Bonnes pratiques de sécurité et de surveillance
Utilisation d’Amazon MSK dans les solutions d’analyse de données en continu
- Cas d’utilisation pour Amazon MSK
- Création de clusters MSK
- Ingestion de données dans Amazon MSK
- Transformation et traitement dans Amazon MSK
- Mise en pratique : Introduction au contrôle d’accès avec Amazon MSK
Sécurisation, surveillance et optimisation d’Amazon MSK
- Optimisation d’Amazon MSK
- Démonstration : Mise à l’échelle du stockage Amazon MSK
- Sécurité et surveillance
- Mise en pratique : pipeline de diffusion en continu Amazon MSK et déploiement d’applications
Conception de solutions d’analyse de données en continu
- Examen des cas d’utilisation
- Exercice de classe : Conception d’un flux de travail d’analyse de données en continu
Développement d’architectures de données modernes sur AWS
- Architectures de données modernes
Méthode pédagogique
Chaque participant travaille sur un poste informatique qui lui est dédié. Un support de cours lui est remis soit en début soit en fin de cours. La théorie est complétée par des cas pratiques ou exercices corrigés et discutés avec le formateur. Le formateur projette une présentation pour animer la formation et reste disponible pour répondre à toutes les questions.
Méthode d'évaluation
Tout au long de la formation, les exercices et mises en situation permettent de valider et contrôler les acquis du stagiaire. En fin de formation, le stagiaire complète un QCM d'auto-évaluation.
Suivre cette formation à distance
- Un ordinateur avec webcam, micro, haut-parleur et un navigateur (de préférence Chrome ou Firefox). Un casque n'est pas nécessaire suivant l'environnement.
- Une connexion Internet de type ADSL ou supérieure. Attention, une connexion Internet ne permettant pas, par exemple, de recevoir la télévision par Internet, ne sera pas suffisante, cela engendrera des déconnexions intempestives du stagiaire et dérangera toute la classe.
- Privilégier une connexion filaire plutôt que le Wifi.
- Avoir accès au poste depuis lequel vous suivrez le cours à distance au moins 2 jours avant la formation pour effectuer les tests de connexion préalables.
- Votre numéro de téléphone portable (pour l'envoi du mot de passe d'accès aux supports de cours et pour une messagerie instantanée autre que celle intégrée à la classe virtuelle).
- Selon la formation, une configuration spécifique de votre machine peut être attendue, merci de nous contacter.
- Pour les formations incluant le passage d'une certification la dernière journée, un voucher vous est fourni pour passer l'examen en ligne.
- Pour les formations logiciel (Adobe, Microsoft Office...), il est nécessaire d'avoir le logiciel installé sur votre machine, nous ne fournissons pas de licence ou de version test.
- Horaires identiques au présentiel.
Mis à jour le 24/01/2024