Biostatistique et analyse informatique des données de santé avec R
Christophe Lalanne/Mounir Mesbah
ISTE éditions
Introduction
9
Chapitre 1. Eléments du langage
13
1.1. Avant de démarrer13
1.1.1. Installer R13
1.1.2. RStudio13
1.1.3. Liste de packages utiles14
1.1.4. Rechercher de l'aide14
1.1.5. Scripts R14
1.2. Représentation des données sous R15
1.2.1. Gestion de variables numériques15
1.2.2. Opérations sur une variable numérique16
1.2.3. Gestion de variables catégorielles18
1.2.4. Manipulation de variables catégorielles19
1.3. Sélection d'observations21
1.3.1. Sélection indexée d'observations21
1.3.2. Sélection critériée d'observations21
1.4. Représentation et traitement des valeurs manquantes22
1.5. Importation et sauvegarde de données24
1.5.1. Données univariées24
1.5.2. Données multivariées24
1.5.3. Sauvegarde de données dans un fichier externe26
1.6. Gestion de données multidimensionnelles26
1.6.1. Construction d'un tableau structuré de données26
1.6.2. Les données birthwt28
1.7. Ce qu'il faut retenir30
1.8. Pour aller plus loin30
1.9. Applications31
Chapitre 2. Statistiques descriptives et estimation
35
2.1. Résumer une variable numérique35
2.1.1. Tendance centrale et forme de la distribution35
2.1.2. Indicateurs de dispersion36
2.2. Résumer une variable catégorielle37
2.3. Représenter graphiquement la distribution d'une variable39
2.3.1. Cas des variables numériques40
2.3.2. Cas des variables catégorielles43
2.4. Estimation par intervalles pour une moyenne ou une proportion44
2.4.1. Intervalles de confiance pour une moyenne44
2.4.2. Intervalles de confiance pour une proportion47
2.5. Ce qu'il faut retenir48
2.6. Applications48
Chapitre 3. Mesures et tests d'association
entre deux variables
53
3.1. Statistiques descriptives bivariées53
3.1.1. Décrire une variable numérique selon les modalités
d'une variable qualitative53
3.1.2. Décrire deux variables qualitatives56
3.2. Comparaisons de deux moyennes de groupe58
3.2.1. Echantillons indépendants59
3.2.2. Echantillons non indépendants61
3.3. Comparaisons de proportions64
3.3.1. Cas de deux proportions64
3.3.2. Test du chi-deux66
3.3.3. Cas de deux échantillons non indépendants67
3.4. Mesures de risque et odds-ratio67
3.5. Approches non paramétriques et tests exacts69
3.6. Ce qu'il faut retenir70
3.7. Pour aller plus loin71
3.8. Applications71
Chapitre 4. Analyse de variance et plans d'expérience
77
4.1. Représentation des données et statistiques descriptives77
4.1.1. Format de représentation des données77
4.1.2. Statistiques descriptives et structuration des données78
4.2. ANOVA à un facteur80
4.2.1. Le modèle d'ANOVA à un facteur80
4.2.2. Comparaisons par paires de traitement83
4.2.3. Test de tendance linéaire84
4.3. Approche non paramétrique de l'ANOVA à un facteur88
4.4. ANOVA à deux facteurs88
4.4.1. Construction du tableau d'ANOVA89
4.4.2. Diagnostic du modèle91
4.5. Ce qu'il faut retenir92
4.6. Applications92
Chapitre 5. Corrélation et régression linéaire
101
5.1. Corrélation101
5.1.1. Statistiques descriptives101
5.1.2. Diagramme de dispersion et courbe loess103
5.1.3. Mesures d'association paramétrique et non paramétrique103
5.1.4. Estimation par intervalles et test d'inférence104
5.2. Régression linéaire simple105
5.2.1. Droite de régression105
5.2.2. Estimation par intervalles et tableau d'analyse de variance108
5.2.3. Prédictions à partir du modèle de régression109
5.2.4. Diagnostic du modèle et analyse des résidus110
5.2.5. Lien avec l'ANOVA112
5.3. Régression linéaire multiple113
5.4. Ce qu'il faut retenir114
5.5. Pour aller plus loin114
5.6. Applications114
Chapitre 6. Mesures d'association en épidémiologie
et régression logistique
121
6.1. Tableaux de contingence et mesures d'association121
6.1.1. Tableaux de contingence121
6.1.2. Mesures et tests d'association122
6.1.3. Odds-ratio et stratification122
6.2. Etudes diagnostiques125
6.2.1. Sensibilité et spécificité d'un test diagnostique125
6.2.2. Valeurs prédictives positive et négative126
6.2.3. Tableau de synthèse des propriétés diagnostiques d'un test127
6.3. Régression logistique128
6.3.1. Estimation des paramètres du modèle128
6.3.2. Prédiction par intervalles131
6.3.3. Cas des données groupées133
6.4. Courbe ROC134
6.5. Ce qu'il faut retenir135
6.6. Applications136
Chapitre 7. Analyse des données de survie
147
7.1. Représentation des données et statistiques descriptives147
7.2. Fonction de survie et courbe de Kaplan-Meier148
7.2.1. Table de mortalité/survie148
7.2.2. Courbe de Kaplan-Meier150
7.2.3. Fonction de risque cumulé152
7.2.4. Test d'égalité des fonctions de survie153
7.3. Régression de Cox154
7.4. Ce qu'il faut retenir156
7.5. Pour aller plus loin157
7.6. Applications158
Annexe A. Introduction à RStudio
165
Annexe B. Les graphiques avec le package lattice
169
Annexe C. Les packages Hmisc et rms
181
Bibliographie
195
Index
199