R interactif

1 Découvrir R

1.1 Prise en main

R est tout d’abord une calculatrice. Calculez l’opération 2+2. Une fois faite, effacez-la et calculez 3/2

1.2 Créer un objet simple

Il existe différents types d’objets dans R :

  • les vecteurs
  • les data frames
  • les matrices
  • les listes

La syntaxe est toujours la même pour créer un objet :

Nom de l'objet <- objet lui-même

Ainsi, pour créer un objet qui s’appelera a et qui vaudra 1, il faut procéder ainsi : a <- 1

A vous, créez l’objet a, et executez le code a + 2 pour visualiser le résultat :

1.3 Créer un vecteur

En utilisant la fonction c(), on peut stocker une série de valeurs dans un seul objet : c’est un vecteur.

Par exemple, le code a <- c(2,4,6) va créer un vecteur de 3 valeurs (2, 4 et 6).

Créez ci-dessous un objet s’appelant vecteur1 et contenant les valeurs 5, 15, 14, 65, 2 et 32 :

1.4 Utiliser une fonction basique

Le langage R est basé sur l’utilisation de fonctions. Par exemple, la fonction sqrt() calcule directement la racine carrée d’une valeur. De a même façon, la fonction exp() calcule l’exponentielle.

Créez un objet b qui vaudra 12, puis calculez sa racine carrée :

2 Explorer un tableau de données

2.1 Chargez un jeu de données

Quand plusieurs vecteurs de même longueur sont associés, on obtient un data frame, c’est-à-dire un tableau de données.

Nous allons explorer un jeu de données disponible dans R, qui s’appelle iris. Il s’agit d’un tableau décrivant les caractéristiques de 150 fleurs (des iris) en termes de sépales et de pétales (largeur et longueur).

Pour rappel, les sépales consitutent le calice de la fleur (l’enveloppe qui protège la fleur) : [https://fr.wikipedia.org/wiki/S%C3%A9pale].

Pour charger le tableau (dont le nom est iris), il faut procéder ainsi :

data("iris")

2.2 Explorer la table

Il y a quelques fonctions à connaitre pour explorer une table :

  • names() : renvoie le nom des variables (colonnes)
  • head() : renvoie les 5 premières lignes (nombre paramétrable)
  • dim() : renvoie le nombre de lignes et de colonnes

Testez chacune de ces fonctions sur la table iris :

3 Caractériser des variables

3.1 Appeler une variable

Pour appeler une variable, il faut utiliser le signe $ entre le nom de la table et le nom de la variable :

iris$Sepal.Length

3.2 Caractérisez une variable quantitative continue : moyenne, écart-type et distribution

Il y a trois fonctions à connaitre :

  • mean() : renvoie la moyenne
  • sd() : renvoie l’écart-type
  • hist() : renvoie l’histogramme

Calculez la moyenne et l’écart-type de la variable Petal.Length :

Pour l’histogramme, voilà le scipt. Vous pouvez modifier les paramètres à votre guise :

hist(iris$Petal.Length, breaks = 10, col = "blue")

3.3 Caractérisez une variable qualitative

Le bon réflexe pour une variable qualitative est de réaliser un diagramme en barres pour estimer la part d’obervations dans chaque modalité :

barplot(iris$Species)

4 La loi normale

La distribution normale est la plus commune : elle sous-entend que la majorité des observations sont situées autour de la moyenne :

# Création d"une variable suivant une loi normale de moyenne 0 et écart-type 1)
varNorm <- rnorm(n = 10000, mean = 0, sd = 1) 

# Représentation de sa distribution
hist(varNorm, main = "Distribution normale")