Organisme de Formation aux technologies et métiers de L'informatique
python

Formation Visualisation avancée de données avec Python

Informations générales

VISLY005
3 jours (21h)
1 960 €HT
69 €HT (en option)

Objectifs

Après ce cours, vous serez capable de :

  • Traiter les données scientifiques brutes pour leur visualisation
  • Utiliser les librairies graphiques de python pour visualiser des données graphiques spécifiques : graphes dynamiques, cartographie

Public

Ce cours s'adresse avant tout aux personnes suivantes :

  • Développeurs souhaitant mettre en valeur les données scientifiques avec un support visuel, Data analysts, Data scientists.

Prérequis

Pour suivre ce cours, vous devez déjà posséder les connaissances suivantes :

  • Avoir une pratique régulière du langage Python

Programme de la formation

Visualisation de données

  • Contexte de la visualisation de données scientifiques et pièges à éviter
  • Concepts essentiels de la communication visuelle (couleurs, taille, forme, type de graphique, ...)
  • Architecture de présentation des données (DPA)
  • La valorisation des données. Les indicateurs de performance clés (KPI).
  • Objectifs et règles de conception : clarté, pertinence, cohérence, stimulation.
  • Principes de perceptions des informations.
  • Types de visualisation de base : graphiques linéaires, diagrammes en secteurs, cartes de zone, frise
  • chronologique, diagrammes de dispersion, arbres, pyramides des populations
  • Types évolués : infographie, nuages de bulles, graphiques à puces, cartes de chaleur, graphiques de séries
  • chronologiques
  • Atelier : mise en évidence de la pertinence du type de graphiques : comparaison camemberts, barres, chandeliers japonais, ...

Personnalisation des graphes avec Matplotlib

  • Fonctionnement de matplotlib : les backends, graphiques interactifs, polices, gestion des évènements,
  • performances.
  • Exploration du package pour créer des graphes sur différents types de données (qualitatives, quantitatives,
  • séries temporelles, 3 dimensions)
  • Affiner et compléter les graphes (échelle, valeurs aberrrantes, barres d'erreur, etc ..)
  • Les types : bar, scatter, plot, boxplot, fill_between, imshow, tricontour, quiver
  • Personnalisation de graphes (légende, points remarquables avec flèche et texte en LateX dans le graphe,
  • modification du style de graphe)
  • Atelier : création de graphiques personnalisés. Utilisation des styles Matplotlib
  • Atelier : détection d'anomalie par l'utilisation d'animations

Packages spécialisés

  • Transformer des données avec Pandas (calculs d'agrégats, traitement des valeurs manquantes ou
  • incohérentes, gestion des dates, etc ...
  • Atelier : nettoyage, préparation et regroupement de données de
  • températures. Mise en oeuvre des bfill, ffill, ... Gestion des nan.
  • Gestion des données temporelles. Préparation des données pour
  • visualisation.
  • Le package Seaborn pour les données statistiques (box plot, pair plot, violin plot, matrices de graphiques,
  • cartes thermiques, etc ...)
  • Atelier : installation du paquet et création d'une carte thermique sur les données précédentes.
  • Cartographie (package cartopy et/ou Folium)
  • Atelier : ajout d'une planisphère sur la carte thermique précédente. Visualisation des points chauds de la planère en fonction des années.

Interactivité et gros volumes de données

  • Création de dashboards simples (graphes et boutons simples permettant l'action de l'utilisateur)
  • Dashboards interactifs et partageables (par exemple, lien avec un notebook IPython ou Jupyter)
  • Création de graphiques web interactifs avec le package Bokeh, Plotty ...
  • Les apis Bokeh
  • Atelier : mise en oeuvre de Bokeh. Création d'un graphique interactif reliant les isothermes de la carte précédente
  • Visualisation dans un navigateur.
  • Paasage à l'échelle, présentation de l'écosystème HoloViz : datashader, geoviews, panel.
  • Gros volume de données avec datashader ou holoViz.
  • Atelier : intégration de données vents, visibilité au graphique précédent.
  • Mise en évidence de la tenue à la charge.

Méthode pédagogique

Chaque participant travaille sur un poste informatique qui lui est dédié. Un support de cours lui est remis soit en début soit en fin de cours. La théorie est complétée par des cas pratiques ou exercices corrigés et discutés avec le formateur. Le formateur projette une présentation pour animer la formation et reste disponible pour répondre à toutes les questions.

Méthode d'évaluation

Tout au long de la formation, les exercices et mises en situation permettent de valider et contrôler les acquis du stagiaire. En fin de formation, le stagiaire complète un QCM d'auto-évaluation.

Mis à jour le 29/01/2024