Programmation et analyse statistique avec R
Christian Paroissin
Ellipses
I Programmation avec R
1
1 Introduction
3
1.1 Caractéristiques R3
1.2 Installation de R4
1.3 Démarrer et quitter une session R4
1.4 Historique des fonctions et aide6
1.5 Chargement et installation de packages7
1.6 Environnements graphiques pour R8
1.6.1 Le package r-commander8
1.6.2 Le logiciel RStudio8
1.7 Exécution en mode batch8
1.8 Sites internet et référence officiels de R10
2 Commandes de base
11
2.1 Les objets dans R11
2.1.1 Vecteurs12
2.1.2 Matrices et tableaux22
2.1.3 Listes24
2.1.4 Tableaux de données25
2.1.5 Conversions28
2.2 Valeurs spéciales29
2.3 Opérations arithmétiques30
2.4 Ordre de priorité30
3 Gestion des fichiers sous R
33
3.1 Importation et exportation de données33
3.1.1 Fichier au format texte33
3.1.2 Fichier au format R36
3.1.3 Fichier aux formats liés à d'autres logiciels36
3.2 Exécution d'un script R36
3.3 Redirection des sorties36
3.4 Gestion des fichiers37
4 Éléments de programmation
39
4.1 Opérateurs logiques39
4.2 Instructions conditionnelles40
4.3 Boucle for41
4.4 Boucle while42
4.5 Boucle repeat42
4.6 Actions dans une boucle43
4.7 Sélecteur switch43
5 Fonctions
45
5.1 Construire des fonctions45
5.2 Somme, minimum, etc.48
5.3 Tri, rang et permutation49
5.4 Comment appliquer une fonction à tout objet ?49
5.5 Arrondis et troncatures51
5.6 Mathématiques52
5.6.1 Fonctions et opérateurs mathématiques52
5.6.2 Méthodes numériques53
6 Graphiques
59
6.1 Fonctions graphiques de haut niveau59
6.1.1 Fonction par59
6.1.2 Fonction plot60
6.1.3 Fonction curve65
6.1.4 Fonction persp65
6.1.5 Fonction matplot66
6.2 Fonctions graphiques de bas niveau66
6.3 Partage de la fenêtre70
6.3.1 Options graphiques mfrow et mfcol70
6.3.2 Fonction split.screen71
6.3.3 Fonction layout73
6.4 Les couleurs avec R74
6.5 Exporter des graphiques77
6.6 Le package lattice79
6.7 Cartographies80
6.7.1 Le package maps80
6.7.2 Le package maptools83
7 Création d'une interface graphique (GUI)
85
7.1 Le package tcltk85
7.1.1 Simples fenêtres de dialogue85
7.1.2 Des fenêtres plus complexes86
7.2 Le package tkrplot92
8 Déboguer un programme R
95
8.1 La fonction traceback96
8.2 La fonction debug97
8.3 La fonction browser99
8.4 La fonction trace100
9 Utiliser R avec d'autres langages
103
9.1 Intégrer des fonctions C dans un programme R103
9.1.1 Étape 1 : écrire la fonction en C103
9.1.2 Étape 2 : écrire le script R104
9.1.3 Comparaisons105
9.2 Utiliser des fonctions Fortran dans un programme R106
9.2.1 Étape 1 : écrire la fonction en Fortran106
9.2.2 Étape 2 : écrire le script R107
9.2.3 Comparaisons108
10 Création de package
111
10.1 Structure d'un package111
10.2 La fonction package.skeleton111
10.3 Vérification et création d'un package112
II Analyses statistiques avec R
115
11 Statistique descriptive
117
11.1 Statistiques univariées117
11.1.1 Variables qualitatives117
11.1.2 Variables quantitatives121
11.2 Statistiques bivariées129
11.2.1 Cas de deux variables qualitatives129
11.2.2 Cas de deux variables quantitatives132
11.2.3 Cas d'une variables quantitative et d'une variable qualitative135
12 Lois de probabilité
139
12.1 Un peu de combinatoire139
12.2 Quelques lois de probabilité140
12.3 Simulations de variables aléatoires143
12.4 Inférence statistique144
12.4.1 Estimateur du maximum de vraisemblance pour quelques modèles
paramétriques144
12.4.2 Estimation non-paramétrique de la fonction de répartition150
12.4.3 Estimation non-paramétrique des quantiles153
12.4.4 Estimation non-paramétrique de la densité155
13 Quelques tests statistiques
165
13.1 Tests paramétriques de comparaison165
13.1.1 Test d'égalité de proportions166
13.1.2 Test d'égalité de moyennes de deux échantillons gaussiens173
13.1.3 Test d'égalité de variances pour des échantillons gaussiens178
13.1.4 Test de rapports de paramètres pour des lois de Poisson180
13.2 Tests non-paramétriques de comparaison181
13.2.1 Test de comparaison de Kolmogorov-Smirnov181
13.2.2 Test de Wilcoxon-Mann-Whitney183
13.2.3 Test de Kruskal-Wallis187
13.2.4 Diagramme quantiles-quantiles188
13.3 Tests d'adéquation189
13.3.1 Test pour la loi de Bernoulli189
13.3.2 Test pour la loi de Poisson189
13.3.3 Test d'adéquation du x2190
13.3.4 Test d'adéquation de Kolmogorov-Smirnov191
13.3.5 Test d'adéquation d'Anderson-Darling193
13.3.6 Tests de normalité193
13.3.7 Diagramme quantiles-quantiles194
13.4 Tests d'indépendance et de corrélation195
13.4.1 Test du x2 et variantes195
13.4.2 Tests de corrélation198
13.5 Tests de détection de valeurs aberrantes201
13.5.1 Tests de Dixon201
13.5.2 Tests de Grubbs203
14 Modèles linéaires de régression
207
14.1 Régression linéaire208
14.1.1 Régression linéaire simple208
14.1.2 Régression linéaire multiple224
14.1.3 Analyse des résidus229
14.1.4 Outils de diagnostics231
14.1.5 Comparaison et sélection de modèles245
14.1.6 Transformation de Box-Cox248
14.2 Analyse de la variance251
14.2.1 Cas d'un seul facteur252
14.2.2 Cas de deux facteurs256
14.3 Analyse de la covariance264
14.4 Régression logistique267
15 Séries temporelles
271
15.1 Les classes spécifiques271
15.1.1 La classe Date271
15.1.2 La classe ts272
15.2 Moyennes mobiles et lissages exponentiels273
15.2.1 Moyennes mobiles (filtres linéaires)273
15.2.2 Méthodes de lissage275
15.2.3 Décomposition d'une série temporelle278
15.3 Modèles SARIMA279
15.3.1 Analyse préliminaire281
15.3.2 Modèles autorégressifs285
15.3.3 Modèles ARIMA287
16 Analyse de durées de vie
293
16.1 La classe Survival293
16.1.1 Durées censurées à droite294
16.1.2 Durées censurées par intervalles294
16.1.3 Durées censurées à droite et tronquées à gauche295
16.2 Modèle paramétrique de vie accélérée296
16.3 Méthodes non-paramétriques298
16.4 Modèle à risques proportionnels et modèle de Cox307
17 Analyse de données multivariées
309
17.1 Analyse en composantes principales309
17.2 Analyse factorielle des correspondances316
17.3 Analyse des correspondances multiples322
18 Méthodes de classification
327
18.1 Classification ascendante hiérarchique327
18.2 Méthode des k centres mobiles332
19 Rapports automatiques
337
19.1 R et OpenOffice337
19.2 R et Latex338
Index
343