Organisme de Formation aux technologies et métiers de L'informatique
hadoop

Formation Hadoop : stockage Hbase

Hadoop - HBase, mise en oeuvre et administration

Informations générales

CB034
2 jours (14h)
1 510 €HT
46 €HT (en option)

Objectifs

Après ce cours, vous serez capable de :

  • Appréhender l’écosystème Hadoop
  • Identifier l’architecture et le fonctionnement de HBase
  • Identifier les apports d’HBase en termes de stockage distribué des données
  • Mener à bien l’installation du système
  • Savoir mettre en place une configuration distribuée

Public

Ce cours s'adresse avant tout aux personnes suivantes :

  • Chefs de projet, administrateurs et toute personne souhaitant stocker des données avec Hbase.

Prérequis

Pour suivre ce cours, vous devez déjà posséder les connaissances suivantes :

  • Connaissance des principes de base Hadoop et des bases de données.

Programme de la formation

Appréhender l’écosystème Hadoop

  • Rappels rapides sur l'écosystème Hadoop. Fonctionnalités.
  • Le projet et les modules : Hadoop Common, HDFS, YARN, Spark, MapReduce
  • Présentation HBase. Historique. Lien avec HDFS.

Comprendre l’architecture et le fonctionnement de HBase

  • Définitions : table, région, ligne, famille de colonnes,cellules, espace de nommage, ...
  • Fonctionnalités : failover automatique, sharding, requêtage
  • HBase master node, Region Master, liens avec les clients HBase. Haute disponibilité. Consistance des données.
  • Présentation du rôle de Zookeeper.
  • Atelier : définition d'une architecture HBase en fonction de contraintes d'utilisation

Identifier les apports d’HBase en termes de stockage distribué des données

  • Format des données dans HBase. Comparaison avec d'autres bases clés/valeurs.
  • Présentation des différentes interfaces disponibles.
  • Outils HBase : hbase pe et hbase ltt pour les performances, hbase shell pour l'exploitation
  • Atelier : gestion de base avec hbase shell.

 Mener à bien l’installation

  • Choix des paquets. Vérification des pré-requis.
  • Installation et configuration en mode distribué. Mise en oeuvre avec HDFS dans un environnement distribué.
  • Test de connexion avec hbase shell.
  • Atelier : installation d'une grappe de serveurs HBase en mode distribué
  • Atelier : interrogations depuis le serveur http intégré.

Savoir mettre en place une configuration distribuée

  • Fonctionnement en mode distribué
  • Fonctionnement indépendant des démons (HMaster, HRegionServer, Zookeeper). Gestion de la consistance. Mise en évidence.
  • Atelier : utilisationn des outils d'exploitation : hbck, hfile, ...
  • Atelier : mise en oeuvre des splits sur un exemple de tables réparties. regionsplitter.
plus d'infos

Méthode pédagogique

Chaque participant travaille sur un poste informatique qui lui est dédié. Un support de cours lui est remis soit en début soit en fin de cours. La théorie est complétée par des cas pratiques ou exercices corrigés et discutés avec le formateur. Le formateur projette une présentation pour animer la formation et reste disponible pour répondre à toutes les questions.

Méthode d'évaluation

Tout au long de la formation, les exercices et mises en situation permettent de valider et contrôler les acquis du stagiaire. En fin de formation, le stagiaire complète un QCM d'auto-évaluation.

Mis à jour le 13/07/2023