(+33)1 55 60 76 72
Toutes nos formations sont disponibles en classe virtuelle. Contactez-nous pour plus d’informations : formation@oxiane.com

Programmation R et intégration Big Data

Programmation R pour Hadoop
Vous cherchez une formation et vous ne l'avez pas trouvée...Faites une suggestion
Accueil » Formations » Data » Programmation R et intégration Big Data
1510 € HT 2 jours DB-LR

Programmation R et intégration Big Data — Programmation R pour Hadoop

Programme

Présentation R

  • Le projet R Programming
  • Calculs statistiques et génération de graphiques
  • Points forts de R Programming
  • Besoins du BigData
  • Positionnement R programming par rapport à Hadoop

Mise en oeuvre de R

  • Travaux pratiques : installation et tests sur une plate-forme CentOS
  • Utilisation de R en mode commande
  • Commandes de base
  • Syntaxe
  • Opérations de base
  • Expressions
  • Manipulations de nombres, vecteurs, tableaux, matrices, listes, …

Tableaux et matrices

  • Déclaration, dimensionnement, indexation
  • Opérations de base : produit de tableaux, transposition, produits de matrices
  • Matrices : équations linéaires, inversion, valeur propre, vecteur propre, déterminant, moindre carré, …

Liste et DataFrames

  • Définitions, cas d’utilisation
  • Attachement, détachement
  • Chargement d’un dataframe
  • La fonction scan

Statistiques

  • Distributions embarquées : uniforme, normale, poisson, exponentielle, …
  • Calculs statistiques
  • Modèles statistiques
  • Affichage en graphes, histogrammes

Import/export

  • Formats texte, csv, xml, binaire, largeur fixe, images (jpeg, png)
  • Encodage
  • Filtrage
  • Importation SQL
  • Importation depuis un socket réseau
  • Travaux pratiques : importation de données géodésiques et export au format Json

Intégration Hadoop

  • Association de la puissance du calcul distribué fourni par les outils hadoop et de la richesse des outils d’analyse statistique de R
  • Différents moyens d’intégration : sparkR, RHbase, RHDFS, RHadoop, rmr2 pour utiliser le système distribué hdfs depuis R, pour accéder à HBase depuis les programmes en R
  • Transformation d’un dataframe R en un dataframe Spark
  • Travaux pratiques avec Hadoop

Fonctions spécifiques

  • Définition de nouvelles fonctions
  • Appels
  • Passage d’argument
  • Construction d’une bibliothèque
  • Diffusion, installation avec R CMD INSTALL

Évolutions

  • Les acteurs : IBM avec BigInsights, Revolution R avec ScaleR

Profils des intervenants

Toutes nos formations sont animées par des consultants-formateurs expérimentés et reconnus par leurs pairs.

Modalités d'évaluation

Evaluation des acquis de la formation par le biais de cas pratiques et/ou mises en situation.
Attestation de formation remise à chaque participant.

Démarche qualité

Questionnaire d’évaluation de satisfaction à chaud complété par chaque participant à l’issue de la formation.

Moyens pédagogiques

Salle équipée de PC (1 poste par stagiaire), vidéo-projecteur.
Espace de pause.
Dernière mise à jour le 19/01/2022