Organisme de Formation aux technologies et métiers de L'informatique

Formation Les fondamentaux de l'analyse statistique avec R

Première mise en œuvre pratique

Informations générales

DEC103
3 jours (21h)
2 250 €HT

Objectifs

Après ce cours, vous serez capable de :

  • Savoir installer R
  • Identifier comment manipuler des données avec R
  • Savoir importer et exporter des données
  • Être en mesure de réaliser des analyses statistiques basiques avec R
  • Savoir restituer des résultats à l'aide de graphiques

Public

Ce cours s'adresse avant tout aux personnes suivantes :

  • Ingénieurs
  • Analystes
  • Data analysts
  • Toute personne intéressée par l'analyse statistique avec R

Prérequis

Pour suivre ce cours, vous devez déjà posséder les connaissances suivantes :

  • Avoir suivi la formation Les fondamentaux de la statistique appliquée (BI090) ou connaissances mathématiques équivalentes
  • Être familier avec l'environnement Microsoft Windows

Programme de la formation

Considéré depuis quelques années comme le logiciel le plus complet et puissant pour l'analyse statistique avancée de données, R dispose aujourd'hui d'une large communauté d'utilisateurs. Fidèles à la philosophie Open Source, ils ont peu à peu créé et mis à disposition des extensions réutilisables qui permettent par exemple de se connecter aisément à des bases de données ou encore qui proposent des modèles d'analyses spécifiquement adaptés à des domaines particuliers (ingénierie, finance quantitative, sociologie, économie, marketing, ...). Cette formation de premier niveau sur R permettra aux participants de créer leurs premières analyses statistiques et d'apprendre à les restituer sous forme graphique.

Introduction

  • Qu'est-ce que R ?
  • Avantages et inconvénients
  • Solutions concurrentes gratuites ou payantes

Installation

  • Installation de R ou Microsoft R Open sur MS Windows ou Scientific Linux
  • Découverte de l'environnement
  • Utiliser l'historique des commandes
  • Exemple d'environnement superposé (R-Studio)
  • Comment citer le logiciel dans une publication scientifique
  • Comment citer des packages dans une publication scientifique

Utilisation

  • Vider la console de commande
  • Utilisation de l'aide
  • Changer la langue de l'interface
  • Quitter en ligne de commande
  • Changer le dossier de travail par défaut temporairement ou à chaque session (*.Rprofile)
  • Changer définitivement le dossier par défaut des packages (*.Rprofile)
  • Sauver/Charger l'espace de travail (*.Rdata)
  • Sauver/Charger/Exécuter un historique des commandes (*.Rhistory)
  • Sauver les commandes et sorties dans un fichier (*.txt)
  • Sauver/Charger un script (*.R)

Manipulation de packages

  • Installer/Désinstaller/Mettre à jour des packages
  • Obtenir des informations systèmes sur les packages
  • Écrire plusieurs commandes sur une ligne
  • Ajouter des commentaires

Types de données

  • Manipulations de scalaires (réels)
  • Manipulations de nombres complexes
  • Manipulations de variables
  • Manipulations de vecteurs
  • Manipulations de matrices
  • Manipulations de textes
  • Manipulations de dates et de durées
  • Création/Édition de données en ligne de commande
  • Gérer les variables dans la mémoire

Import et export de données

  • Importer/Exporter des données d'Excel
  • Importer/Exporter des données en *.csv et gestion du passage d'encodage Linux/Windows
  • Importer/Exporter des fichiers SAS
  • Importer des données *.csv du web
  • Fusionner des fichiers *.csv
  • Importer de données de MS Access
  • Importer des données *.xml du web
  • Importer des données de MySQL
  • Importer des données d'Oracle (Express)
  • Importer des fichiers *.json

Manipulation de données

  • Utiliser le SQL
  • Quelques Data set
  • Manipuler les data frames
  • Accélérer l'accès aux colonnes
  • Renommer les colonnes
  • Appliquer des rangs
  • Trier des données
  • Filtrer des données
  • Réaliser des sous-sélections
  • Fusionner des données
  • Supprimer les doublons
  • Échantillonnage
  • Empiler/Désempiler des données

Analyse de données

  • Synthétiser des données (tables de contingence)
  • Travailler avec des valeurs absentes
  • Définir le nombre de décimales de chaque sortie
  • Générer des variables pseudo-aléatoires
  • Statistiques descriptives simples (comptage, éléments uniques, moyenne, max, min, centiles, somme, écart-type biaisé/non biaisé, cv, médiane, etc.)
  • Plotter (tracer) des fonctions algébriques
  • Racines d'équations univariées
  • Intégration numérique
  • Intégration algébrique
  • Dérivation algébrique/numérique
  • Optimisation linéaire uni ou multidimensionnelle
  • Optimisation sous contrainte
  • Programmation linéaire
plus d'infos

Méthode pédagogique

Une formation très pratique : 90% du temps de la formation est dédié à la mise en pratique pour une meilleure assimilation de notions de base Des consultants expérimentés partagent leur savoir-faire avec les participants.

Méthode d'évaluation

Tout au long de la formation, les exercices et mises en situation permettent de valider et contrôler les acquis du stagiaire. En fin de formation, le stagiaire complète un QCM d'auto-évaluation.

Suivre cette formation à distance

  • Un ordinateur avec webcam, micro, haut-parleur et un navigateur (de préférence Chrome ou Firefox). Un casque n'est pas nécessaire suivant l'environnement.
  • Une connexion Internet de type ADSL ou supérieure. Attention, une connexion Internet ne permettant pas, par exemple, de recevoir la télévision par Internet, ne sera pas suffisante, cela engendrera des déconnexions intempestives du stagiaire et dérangera toute la classe.
  • Privilégier une connexion filaire plutôt que le Wifi.
  • Avoir accès au poste depuis lequel vous suivrez le cours à distance au moins 2 jours avant la formation pour effectuer les tests de connexion préalables.
  • Votre numéro de téléphone portable (pour l'envoi du mot de passe d'accès aux supports de cours et pour une messagerie instantanée autre que celle intégrée à la classe virtuelle).
  • Selon la formation, une configuration spécifique de votre machine peut être attendue, merci de nous contacter.
  • Pour les formations incluant le passage d'une certification la dernière journée, un voucher vous est fourni pour passer l'examen en ligne.
  • Pour les formations logiciel (Adobe, Microsoft Office...), il est nécessaire d'avoir le logiciel installé sur votre machine, nous ne fournissons pas de licence ou de version test.
  • Horaires identiques au présentiel.

Mis à jour le 08/11/2023