Organisme de Formation aux technologies et métiers de L'informatique

Formation Environnement R, traitement de données et analyse statistique

Informations générales

TDA
2 jours (14h)
1 550 €HT
repas inclus

Objectifs

Après ce cours, vous serez capable de :

  • Installer l'environnement d'analyse R
  • Utiliser la console de R, et les environnements de travail Tinn-R et RStudio
  • Créer et regrouper plusieurs types d'objets de R
  • Créer des programmes d'analyse avec R
  • Elaborer des graphiques avec R
  • Utiliser les packages de R pour mettre en œuvre des modélisations statistiques (régression, ACP...)

Public

Ce cours s'adresse avant tout aux personnes suivantes :

  • Utilisateurs finaux, statisticiens, analystes type Data Miners, acteurs impliqués dans l'analyse/fouille des données.

Prérequis

Pour suivre ce cours, vous devez déjà posséder les connaissances suivantes :

  • Connaissances de base en statistiques (régressions, analyse en composantes principales, classification) et des concepts de programmation.

Programme de la formation

R est un environnement logiciel Open Source spécialisé dans le calcul et l'analyse statistique. Ce stage vous présentera ses concepts et ses fonctionnalités. Il vous montrera comment manipuler les données et leur appliquer des modèles statistiques dans le cadre de cet environnement.

Introduction

  • Présentation du logiciel R et de ses fonctionnalités.
  • Avantages et inconvénients.
  • Accès au site de téléchargement de l'outil et installation.
  • Exercice  : Installation de l'environnement d'analyse.

Premiers pas

  • Environnement de base (console, script).
  • Utilisation de la console.
  • Création et sauvegarde d'un script.
  • Le répertoire sous R Installation.
  • Aide et commentaires.
  • Les autres éditeurs Tinn-R et R Studio.
  • Exercice : Création de scripts.

Objets et notions de programmation R

  • Les objets de type vecteurs, matrix, array, factor, data.frame, list.
  • Manipulation des objets, classe d'objet, fonctions spécifiques, jointure.
  • Sauvegarde, suppression de mémoire.
  • Notions de boucle (for et while), condition (if), switch.
  • Exercice : Manipulation des types d'objets.

Création et utilisation de fonctions

  • Structure d'une fonction.
  • Fonctions de type mathématique.
  • Fonctions de type chaîne de caractères.
  • Fonctions liées au temps/date.
  • Opérations ensemblistes.
  • Les tables de contingences.
  • Exercice : Création et utilisation de fonctions.

Génération, gestion et visualisation des données

  • Les données : séquences régulières et aléatoires.
  • Données exemples de R.
  • Importation et exportation de données.
  • Modifier les données d'un objet.
  • Exemples de graphiques construits avec R.
  • Création des graphiques de base.
  • Les options graphiques, partager une fenêtre graphique, sauvegarder un graphique.
  • Exercice : Exercice d'application sur les données.

Analyses statistiques

  • Présentation de la notion de package (librairie).
  • Télécharger/charger des packages.
  • Quelques packages utiles.
  • Cas de la régression linéaire multiple.
  • Cas de l'analyse en composantes principales ACP.
  • Cas de la classification CAH.
  • Exercice : Exercice d'application sur les packages.
plus d'infos

Méthode pédagogique

Chaque participant travaille sur un poste informatique qui lui est dédié. Un support de cours lui est remis soit en début soit en fin de cours. La théorie est complétée par des cas pratiques ou exercices corrigés et discutés avec le formateur. Le formateur projette une présentation pour animer la formation et reste disponible pour répondre à toutes les questions.

Méthode d'évaluation

Tout au long de la formation, les exercices et mises en situation permettent de valider et contrôler les acquis du stagiaire. En fin de formation, le stagiaire complète un QCM d'auto-évaluation.

Suivre cette formation à distance

  • Un ordinateur avec webcam, micro, haut-parleur et un navigateur (de préférence Chrome ou Firefox). Un casque n'est pas nécessaire suivant l'environnement.
  • Une connexion Internet de type ADSL ou supérieure. Attention, une connexion Internet ne permettant pas, par exemple, de recevoir la télévision par Internet, ne sera pas suffisante, cela engendrera des déconnexions intempestives du stagiaire et dérangera toute la classe.
  • Privilégier une connexion filaire plutôt que le Wifi.
  • Avoir accès au poste depuis lequel vous suivrez le cours à distance au moins 2 jours avant la formation pour effectuer les tests de connexion préalables.
  • Votre numéro de téléphone portable (pour l'envoi du mot de passe d'accès aux supports de cours et pour une messagerie instantanée autre que celle intégrée à la classe virtuelle).
  • Selon la formation, une configuration spécifique de votre machine peut être attendue, merci de nous contacter.
  • Pour les formations incluant le passage d'une certification la dernière journée, un voucher vous est fourni pour passer l'examen en ligne.
  • Pour les formations logiciel (Adobe, Microsoft Office...), il est nécessaire d'avoir le logiciel installé sur votre machine, nous ne fournissons pas de licence ou de version test.
  • Horaires identiques au présentiel.

Mis à jour le 08/11/2023