Organisme de Formation aux technologies et métiers de L'informatique

Formation Systèmes décisionnels, Data Factory

Informations générales

SID
3 jours (21h)
2 890 €HT
repas inclus

Objectifs

Après ce cours, vous serez capable de :

  • Identifier la valeur ajoutée, les enjeux et les principes des systèmes décisionnels
  • Mélanger la modélisation décisionnelle classique et le mode découverte
  • Mettre en œuvre une démarche pour concevoir un référentiel des données d'entreprise
  • Intégrer le Big Data dans le SID pour bâtir la Data Factory
  • Suivre pas à pas les étapes pour piloter son projet SID
  • Faire les bons choix d'outils en ayant un panorama global du marché

Public

Ce cours s'adresse avant tout aux personnes suivantes :

  • responsables informatiques
  • responsables des études
  • architectes SI
  • consultants et chefs de projet décisionnel
  • autres chefs de projets fonctionnels et techniques

Prérequis

Pour suivre ce cours, vous devez déjà posséder les connaissances suivantes :

  • aucune connaissance particulière

Programme de la formation

Aujourd'hui, 80% des dirigeants attribuent une importance stratégique à l'extraction de la valeur de l'information par le Machine Learning et l'analyse. Pourtant, 43% des entreprises ne dégagent que peu d'avantages concrets de leurs informations. Devant ces constats, et face au levier de croissance que représentent les données, les dirigeants souhaitent en tirer parti en intégrant les technologies type Big Data, à leur décisionnel existant. Tout l'enjeu est une intégration cohérente pour servir au mieux l'analyse des données dans un souci de liberté, de réactivité et d'opportunités.

Finalité et principes des SID

  • Positionnement du SID par rapport au Big Data et au SIO (Système d'Information Opérationnel).
  • Tendances et évolutions du décisionnel. Data Lake versus Datawarehouse.
  • Nouveaux enjeux : valorisation de l'information, corrélation rapide.
  • L'architecture d'un SID.
  • Les choix stratégiques d'architecture : intégration du Data Lake.
  • Nouvel équilibre entre modélisation préalable et analyse dynamique.

Démarche de conception du SID, impact du mode découverte

  • La typologie universelle des demandes sur un SID autour du pilotage et de l'analyse comportementale prédictive.
  • Maîtriser le processus de conception des datamarts et des datalabs.
  • Comment passer de datamarts en silo à un SI ouvert à la BI découverte et au Big Data ?
  • Cohérence des modèles en étoile : multidimensionnel. Analyse en mémoire contre modèle en étoile. Modèle du datalab.
  • Dénormalisation NoSQL versus dénormalisation décisionnelle classique.
  • Différence entre analyse multidimensionnelle et prédictive.
  • Eviter le foisonnement d'agrégats et indicateurs en réutilisant les développements.
  • Concevoir une architecture mixte BI classique-BI découverte-Analytique dynamique.
  • Etude de cas : Proposer une démarche de conception à partir de besoins d'analyse.

Construire les référentiels

  • Comment faciliter l'accès aux informations ? Réconcilier MOA, MOE autour du référentiel.
  • Construire le référentiel d'entreprise. Les dimensions d'analyse et les indicateurs partageables.
  • Construire une architecture couvrant toutes les étapes, du pilotage à l'analyse des comportements.
  • Construire les dictionnaires pour le SID, utiliser les métadonnées pour gérer la cohérence.
  • Etude de cas : Déploiement des méthodes proposées sur des exemples.

Optimiser l'accès aux données

  • Comment répondre aux besoins et définir les réponses informatiques optimales ?
  • Le multidimensionnel, ROLAP, MOLAP ou Hybride : les critères de choix, les évolutions futures.
  • Le multidimensionnel In-Memory.
  • Organiser son Data Lake. Construire les Datalabs.
  • Appliquer une normalisation décisionnelle à vos modèles en étoile.

Mesurer la valeur du SID

  • Faire de son SID un levier de la stratégie d'entreprise.
  • Réunir les cas d'usage en process décisionnels.
  • Urbanisation du SID : éviter trop de traitements et des couches sémantiques surchargées.
  • Identifier les zones éligibles au Cloud Computing.
  • Cartographier son SID pour lier finalité d’usage et données utilisées pour le RGPD.
  • Définir les critères d'efficacité d'un SID.
  • Piloter la valeur des données.

Big Data en mode industriel

  • Principaux types de cas d’usage.
  • Problème de l’industrialisation des projets Big Data.
  • Check-list des recommandations.
  • Analytique – prédictif temps réel et streaming (CEP Complex Event Processing).

Etat de l'art des outils décisionnels

  • Lier ou fusionner son Data Lake et son Datawarehouse pour créer la Data Factory.
  • Panorama des suites décisionnelles : SAS, Microsoft, SAP B.O...
  • Degré d'intégration du mode découverte, de l'analytique et de la data visualisation.
  • ETL. Outils multidimensionnels. Déploiement Web.
  • Big Data intégré au SID. BD NoSQL. BD NewSQL. Cohabitation entre les différentes Bases de Données.
  • Analyse en mémoire. Appliance ou Commodity Hardware.
  • Positionnement de l'écosystème Hadoop dans l'analyse du comportement client.
  • Basculer le SID sur une BD NoSQL, NewSQL ou intégrer les approches ?
  • Combiner une solution Agile de data-discovery et des capacités d'industrialisation de la BI.
  • Etude de cas : Déterminer votre trajectoire d'évolution vers une architecture intégrée.

Opportunité et création de valeur pour l'entreprise

  • Evaluer la valeur ajoutée pour l'entreprise et la conduite du changement utile.
  • Gérer son portefeuille de projets, les prioriser. Critères de lotissement.
  • Spécificités d'un projet décisionnel et d'un projet Big Data.
  • Techniques d'analyse de besoin en décisionnel : pièges à éviter.
  • Comment évaluer la complexité, la maturité des besoins ?
  • Conduire le passage du décisionnel classique au mixte classique-analytique en mode libre.

Organisation de la gouvernance : équipes - process - données

  • Différents acteurs et rôles respectifs. Nouvelle relation entre métiers et IT.
  • Leviers de la BI découverte, du Big Data et de la Datascience.
  • Positionner le décisionnel au sein de l'entreprise. Organiser la gouvernance, la cohérence globale des données.
  • Créer une organisation cohérente et pluridisciplinaire.
  • Préserver l'autonomie des utilisateurs. Gérer la réactivité.
  • Intégrer les métiers dans le pilotage de la valeur : données et cas d’usages.
  • Organiser la Data Factory. Administrer les composants du SID.
  • Garantir la fiabilité des données et des informations.
  • Mettre en place le processus de la gestion de la qualité et de la véracité.
  • Définir les contrôles qualité minimum. Définir le phasing des contrôles.
  • Impact de la réglementation RGPD sur la sécurité d’accès aux données.

Exemple : Un exemple complet de mise en œuvre d'un système d'information décisionnel sera traité.

plus d'infos

Méthode pédagogique

Chaque participant travaille sur un poste informatique qui lui est dédié. Un support de cours lui est remis soit en début soit en fin de cours. La théorie est complétée par des cas pratiques ou exercices corrigés et discutés avec le formateur. Le formateur projette une présentation pour animer la formation et reste disponible pour répondre à toutes les questions.

Méthode d'évaluation

Tout au long de la formation, les exercices et mises en situation permettent de valider et contrôler les acquis du stagiaire. En fin de formation, le stagiaire complète un QCM d'auto-évaluation.

Suivre cette formation à distance

  • Un ordinateur avec webcam, micro, haut-parleur et un navigateur (de préférence Chrome ou Firefox). Un casque n'est pas nécessaire suivant l'environnement.
  • Une connexion Internet de type ADSL ou supérieure. Attention, une connexion Internet ne permettant pas, par exemple, de recevoir la télévision par Internet, ne sera pas suffisante, cela engendrera des déconnexions intempestives du stagiaire et dérangera toute la classe.
  • Privilégier une connexion filaire plutôt que le Wifi.
  • Avoir accès au poste depuis lequel vous suivrez le cours à distance au moins 2 jours avant la formation pour effectuer les tests de connexion préalables.
  • Votre numéro de téléphone portable (pour l'envoi du mot de passe d'accès aux supports de cours et pour une messagerie instantanée autre que celle intégrée à la classe virtuelle).
  • Selon la formation, une configuration spécifique de votre machine peut être attendue, merci de nous contacter.
  • Pour les formations incluant le passage d'une certification la dernière journée, un voucher vous est fourni pour passer l'examen en ligne.
  • Pour les formations logiciel (Adobe, Microsoft Office...), il est nécessaire d'avoir le logiciel installé sur votre machine, nous ne fournissons pas de licence ou de version test.
  • Horaires identiques au présentiel.

Mis à jour le 28/11/2023