Organisme de Formation aux technologies et métiers de L'informatique
hadoop

Formation Hadoop : stockage Hbase

Hadoop - HBase, mise en oeuvre et administration

Informations générales

CB034
2 jours (14h)
1 570 €HT
46 €HT (en option)

Objectifs

Après ce cours, vous serez capable de :

  • Appréhender l’écosystème Hadoop
  • Identifier l’architecture et le fonctionnement de HBase
  • Identifier les apports d’HBase en termes de stockage distribué des données
  • Mener à bien l’installation du système
  • Savoir mettre en place une configuration distribuée

Public

Ce cours s'adresse avant tout aux personnes suivantes :

  • Chefs de projet, administrateurs et toute personne souhaitant stocker des données avec Hbase.

Prérequis

Pour suivre ce cours, vous devez déjà posséder les connaissances suivantes :

  • Connaissance des principes de base Hadoop et des bases de données.

Programme de la formation

Appréhender l’écosystème Hadoop

  • Rappels rapides sur l'écosystème Hadoop. Fonctionnalités.
  • Le projet et les modules : Hadoop Common, HDFS, YARN, Spark, MapReduce
  • Présentation HBase. Historique. Lien avec HDFS.

Comprendre l’architecture et le fonctionnement de HBase

  • Définitions : table, région, ligne, famille de colonnes,cellules, espace de nommage, ...
  • Fonctionnalités : failover automatique, sharding, requêtage
  • HBase master node, Region Master, liens avec les clients HBase. Haute disponibilité. Consistance des données.
  • Présentation du rôle de Zookeeper.
  • Atelier : définition d'une architecture HBase en fonction de contraintes d'utilisation

Identifier les apports d’HBase en termes de stockage distribué des données

  • Format des données dans HBase. Comparaison avec d'autres bases clés/valeurs.
  • Présentation des différentes interfaces disponibles.
  • Outils HBase : hbase pe et hbase ltt pour les performances, hbase shell pour l'exploitation
  • Atelier : gestion de base avec hbase shell.

 Mener à bien l’installation

  • Choix des paquets. Vérification des pré-requis.
  • Installation et configuration en mode distribué. Mise en oeuvre avec HDFS dans un environnement distribué.
  • Test de connexion avec hbase shell.
  • Atelier : installation d'une grappe de serveurs HBase en mode distribué
  • Atelier : interrogations depuis le serveur http intégré.

Savoir mettre en place une configuration distribuée

  • Fonctionnement en mode distribué
  • Fonctionnement indépendant des démons (HMaster, HRegionServer, Zookeeper). Gestion de la consistance. Mise en évidence.
  • Atelier : utilisationn des outils d'exploitation : hbck, hfile, ...
  • Atelier : mise en oeuvre des splits sur un exemple de tables réparties. regionsplitter.
plus d'infos

Méthode pédagogique

Chaque participant travaille sur un poste informatique qui lui est dédié. Un support de cours lui est remis soit en début soit en fin de cours. La théorie est complétée par des cas pratiques ou exercices corrigés et discutés avec le formateur. Le formateur projette une présentation pour animer la formation et reste disponible pour répondre à toutes les questions.

Méthode d'évaluation

Tout au long de la formation, les exercices et mises en situation permettent de valider et contrôler les acquis du stagiaire. En fin de formation, le stagiaire complète un QCM d'auto-évaluation.

Suivre cette formation à distance

  • Un ordinateur avec webcam, micro, haut-parleur et un navigateur (de préférence Chrome ou Firefox). Un casque n'est pas nécessaire suivant l'environnement.
  • Une connexion Internet de type ADSL ou supérieure. Attention, une connexion Internet ne permettant pas, par exemple, de recevoir la télévision par Internet, ne sera pas suffisante, cela engendrera des déconnexions intempestives du stagiaire et dérangera toute la classe.
  • Privilégier une connexion filaire plutôt que le Wifi.
  • Avoir accès au poste depuis lequel vous suivrez le cours à distance au moins 2 jours avant la formation pour effectuer les tests de connexion préalables.
  • Votre numéro de téléphone portable (pour l'envoi du mot de passe d'accès aux supports de cours et pour une messagerie instantanée autre que celle intégrée à la classe virtuelle).
  • Selon la formation, une configuration spécifique de votre machine peut être attendue, merci de nous contacter.
  • Pour les formations incluant le passage d'une certification la dernière journée, un voucher vous est fourni pour passer l'examen en ligne.
  • Pour les formations logiciel (Adobe, Microsoft Office...), il est nécessaire d'avoir le logiciel installé sur votre machine, nous ne fournissons pas de licence ou de version test.
  • Horaires identiques au présentiel.

Mis à jour le 13/07/2023