AFIHM - Géry Casiez
2017 
RJC IHM



TP  : Introduction à R

Vous trouverez une version de ce document au format PDF ici.

Objectif :

Travail à réaliser :

1  Introduction

R est un logiciel de statistiques gratuit et open-source, disponible sous Linux, Windows et OS X.

Pour lancer R, tapez R en ligne de commande. Il est également possible d’écrire des scripts et de les interpréter avec R. Pour obtenir de l’aide en ligne sur une commande, il suffit de la faire précéder du symbole ?. Les flèches haut et bas permettent de naviguer dans l’historique de commandes. Les commentaires sont précédés par le symbole #. La touche tab peut être utilisée pour la complétion des commandes et des noms de variables. Il est recommandé de travail avec l’IDE RStudio et d’utiliser la syntaxe Markdown (fichiers avec l’extension Rmd).

2  Premiers pas

Le moyen le plus rapide d’entrer un faible nombre de données dans R est la fonction c (combine operator). Ainsi la commande suivante permet d’affecter un ensemble de réels à la variable v. Pour visualiser le contenu d’une variable, il suffit de taper son nom. Dans le cas présent le [1] qui est affiché indique que la variable est de type vecteur. Calculer la moyenne, médiane, variance ... de ces valeurs s’obtient simplement en tapant le nom de la fonction correspondante en passant le nom de la variable en paramètre. Notez que le symbole = est utilisé pour l’affectation mais il est également possible d’utiliser <-.
Modifier le contenu d’un vecteur peut se faire en indiquant l’indice de l’élément à modifier entre crochets. De nombreuses opérations sont possibles sur les vecteurs comme déterminer la somme des éléments dont la valeur est supérieure à 10. Les autres types de données fréquemment manipulés sont les matrices, les listes et les data frames.

v = c(12, .4, 5, 2, 50, 8, 3, 1, 4, .25) # data
v
 [1] 12.00  0.40  5.00  2.00 50.00  8.00  3.00  1.00  4.00  0.25
mean(v)
[1] 8.565
v[2]=7
v
 [1] 12.00  7.00  5.00  2.00 50.00  8.00  3.00  1.00  4.00  0.25
sum(v[v>10])
[1] 62

Q 1. Cherchez comment calculer le nième percentile d’un vecteur. Calculez le 90e percentile de v.

Toutes ces commandes peuvent être enregistrées dans un fichier qui peut être interprété en spécifiant son chemin avec la commande setwd et lancé avec la commande source (dans le cas de l’utilisation en ligne de commande).

3  Graphiques

Q 2. Testez les commandes boxplot et barplot pour représenter graphiquement les données d’un vecteur. Il est possible de mettre plusieurs vecteurs en paramètre. Dans ce cas, chacun des vecteurs sera représenté.

4  Analyses statistiques sur l’article ForceEdge

L’objectif est de refaire une partie des analyses statistiques détaillées dans l’article suivant:
Axel Antoine, Sylvain Malacria, and Géry Casiez. 2017. ForceEdge: Controlling Autoscroll on Both Desktop and Mobile Computers Using the Force. In Proceedings of the 2017 CHI Conference on Human Factors in Computing Systems (CHI ’17). ACM, New York, NY, USA, 3281-3292.

Nous allons nous concentrer uniquement sur la première expérience. Commencez par lire le protocole expérimental.

Q 3. Commencez par faire fonctionner les exemples du cours et lisez attentivement le code.

Q 4. Reproduisez les graphiques de la figure 4 (le point important est d’afficher les intervalles de confiance à 95%).

Q 5. Refaites les analyses statistiques sur le temps.

Q 6. Refaites les analyses sur les données NASA-TLX.

5  Analyses de vos propres données

Si vous avez déjà réalisé des expériences contrôlées et que vous avez les données à disposition l’objectif est de faire / refaire des analyses statistiques avec R.


Ce document a été traduit de LATEX par HEVEA