Formation Building Batch Data Analytics Solutions on AWS

Télécharger le plan de cours

Demander un devis

Obtenir un renseignement

Informations générales

Référence AWSBBDAS

Durée 1 jour (7h)

Tarif 700 €HT

Objectifs

Après ce cours, vous serez capable de :

Comparer les fonctionnalités et les avantages des entrepôts de données, des lacs de données et des architectures de données modernes
Concevoir et mettre en œuvre une solution d’analyse de données par lots
Identifier et appliquer les techniques appropriées, y compris la compression, pour optimiser le stockage des données
Sélectionner et déployer les options appropriées pour ingérer, transformer et stocker des données
Choisir les types d’instance et de nœud, les clusters, la mise à l’échelle automatique et la topologie de réseau appropriés pour un cas d’utilisation métier particulier
Identifier comment le stockage et le traitement des données affectent les mécanismes d’analyse et de visualisation nécessaires pour obtenir des informations commerciales exploitables
Sécuriser les données au repos et en transit
Surveiller les charges de travail analytiques pour identifier et résoudre les problèmes
Appliquer les meilleures pratiques de gestion des coûts

plus d'infos

Prérequis

Pour suivre ce cours, vous devez déjà posséder les connaissances suivantes :

Avoir suivi les cours :
- AWS Technical Essentials ou Architecting sur AWS
- Building Data Lakes on AWS

Public

Ce cours s'adresse avant tout aux personnes suivantes :

Ingénieurs plateformes de données
Architectes et opérateurs qui construisent et gèrent des pipelines d’analyse de données

Programme de la formation

Dans ce cours, vous apprendrez à créer des solutions d’analyse de données par lots à l’aide d’Amazon EMR, un service géré Apache Spark et Apache Hadoop de niveau entreprise. Vous apprendrez comment Amazon EMR s’intègre à des projets open source tels qu’Apache Hive, Hue et HBase, et à des services AWS tels qu’AWS Glue et AWS Lake Formation.

Le cours aborde les composants de collecte, d’ingestion, de catalogage, de stockage et de traitement des données dans le contexte de Spark et Hadoop. Vous apprendrez à utiliser les blocs-notes EMR pour prendre en charge les charges de travail d’analyse et d’apprentissage automatique. Vous apprendrez également à appliquer les meilleures pratiques en matière de sécurité, de performances et de gestion des coûts au fonctionnement d’Amazon EMR.

Présentation de l’analyse des données et du pipeline de données

Cas d’utilisation de l’analyse de données
Utilisation du pipeline de données pour l’analyse

Présentation d’Amazon EMR

Utilisation d’Amazon EMR dans les solutions d’analyse
Architecture de cluster Amazon EMR
Stratégies de gestion des coûts

Pipeline d’analyse de données à l’aide d’Amazon EMR : ingestion et stockage

Optimisation du stockage avec Amazon EMR
Techniques d’ingestion de données

Analyse de données par lots hautes performances à l’aide d’Apache Spark sur Amazon EMR

Cas d’utilisation d’Apache Spark sur Amazon EMR
Pourquoi Apache Spark sur Amazon EMR
Concepts de Spark
Transformation, traitement et analytique
Utilisation de blocs-notes avec Amazon EMR
Mise en pratique 1 : Analyse de données à faible latence à l’aide d’Apache Spark sur Amazon EMR

Traitement et analyse des données de lot avec Amazon EMR et Apache Hive

Utilisation d’Amazon EMR avec Hive pour traiter les données par lots
Transformation, traitement et analytique
Introduction à Apache HBase sur Amazon EMR
Mise en pratique 2 : traitement de données par lots à l’aide d’Amazon EMR avec Hive

Méthode pédagogique

Chaque participant travaille sur un poste informatique qui lui est dédié. Un support de cours lui est remis soit en début soit en fin de cours. La théorie est complétée par des cas pratiques ou exercices corrigés et discutés avec le formateur. Le formateur projette une présentation pour animer la formation et reste disponible pour répondre à toutes les questions.

Méthode d'évaluation

Tout au long de la formation, les exercices et mises en situation permettent de valider et contrôler les acquis du stagiaire. En fin de formation, le stagiaire complète un QCM d'auto-évaluation.

Mis à jour le 24/01/2024

Sessions programmées

Aucune session programmée pour le moment.

Recevez une alerte par e-mail lorsque de nouvelles dates seront programmées

J'accepte le traitement de mes données personnelles.

Si vous désirez organiser une session en intra-entreprise, nous vous répondons sous 72 heures

Demander un devis

ou par téléphone au

01 85 77 07 07

Formations prérequises

ACCESSIBILITÉ

Le site où se déroule la formation est accessible aux personnes à mobilité réduite.
Pour tout besoin spécifique (vue, audition...), veuillez nous contacter au 01 85 77 07 07.