Introduction aux statistiques inférentielles
De la logique à la pratique
Alain Méot
De boeck
Dédicace
5
Avant-propos
7
Sommaire
11
Introduction
13
Partie 1
Les bases descriptives et probabilistes
Chapitre 1
Rappels de statistique descriptive
21
1. Introduction21
2. Caractères quantitatifs et qualitatifs, codages et variables22
2.1 Définitions22
2.2 Codages24
3. La fréquence : définition et grandes règles de calcul25
3.1 Règles de calcul pour modalités incompatibles25
3.2 Règles de calcul pour modalités non incompatibles27
4. Moyenne, variance, coefficient de corrélation30
4.1 La moyenne30
4.2 La variance32
4.3 La corrélation entre deux variables quantitatives35
5. Fréquences conjointes, marginales, conditionnelles et indépendance39
5.1 Effectifs et fréquences conjointes39
5.2 Effectifs et fréquences marginales41
5.3 Effectifs et fréquences conditionnelles43
5.4 Premières notions sur l'indépendance46
6. Histogramme48
Chapitre 2
Probabilités et variables aléatoires
53
1. Expériences aléatoires et événements associés53
2. Probabilité54
2.1 L'approche intuitive (ou classique)54
2.2 L'approche intuitive fréquentielle55
2.3 L'approche générale56
2.4 Remarque : choix de l'approche fréquentielle dans cet ouvrage57
3. Variables aléatoires58
3.1 Définition58
3.2 Distribution de probabilités - Variables aléatoires discrètes et continues59
3.3 Espérance et variance d'une variable aléatoire65
3.3.1 L'espérance65
3.3.2 La variance66
4. Indépendance de variables aléatoires68
5. Trois types de variables aléatoires fondamentales72
5.1 Variables aléatoires de Bernoulli72
5.2 La loi binomiale73
5.2.1 Présentation73
5.2.2 Lecture de la table associée à une loi B(n ; Pi) pour n 1077
5.2.3 Approximation de la loi binomiale par une loi de Poisson80
5.3 Variables aléatoires normales N(Mu ; Sigma)83
5.3.1 Présentation83
5.3.2 Lecture de la table associée à la loi N(0 ; 1)86
5.3.3 Approximation des lois binomiales par des lois normales89
6. Sept expressions particulièrement utiles au calcul des probabilités90
Partie 2
Introduction aux concepts et procédures
de l'inférence statistique
Chapitre 3
Concepts fondamentaux de l'inférence statistique
93
1. Populations et échantillons93
1.1 La population et ses caractéristiques statistiques sont par nature inconnues93
1.2 Le caractère inconnu des paramètres populationnels rend nécessaire l'étude
d'échantillons pour s'informer95
2. Statistiques et distributions d'échantillonnage97
2.1 Indice statistique sur un échantillon observé et triplet {expérience et variable aléatoire,
distribution de probabilités}97
2.2 Indice statistique sur plusieurs échantillons observés et triplet
{expérience et variable aléatoire, distribution de probabilités}100
Chapitre 4
Introduction aux tests d'hypothèses :
le cas des tests sur des distributions et sur l'indépendance
103
1. Introduction sur la base d'un exemple103
1.1 Hypothèse nulle et hypothèse alternative103
1.2 Indice d'accord entre l'attendu si H0était vraie et les observations réalisées106
1.3 La p-value108
1.4 Calcul pratique de la p-value : utilisation de la table du X2110
1.5 Seuil de test (Alpha) et conclusion114
2. Tests d'hypothèses : cas général et test du X2 d'adéquation à une distribution théorique115
2.1 Cas général115
2.2 Deux concepts supplémentaires fondamentaux : erreurs de première et seconde espèce116
2.3 Le test du X2d'adéquation à une distribution théorique117
2.3.1 Petite explication de la dénomination du test117
2.3.2 Le test dans le cas général117
3. Autres exemples d'utilisation du test du X2 d'adéquation119
3.1 Le rôle pondérateur des «NPij» du dénominateur119
3.2 Ajustement à une loi binomiale : cas où Pi n'est pas estimée121
3.3 Ajustement à une loi binomiale : cas où Pi doit être estimée123
4. Autres tests classiques du X2126
4.1 Le test du X2d'indépendance126
4.1.1 Principe126
4.1.2 Présentation générale129
4.2 Le test du X2d'homogénéité des proportions dans plusieurs populations130
4.2.1 Objet et logique sur la base d'un exemple130
4.2.2 Cas général134
5. Remarques à propos des tests du X2 des paragraphes précédents137
6. Test de normalité pour petits échantillons : le test de Kolmogorov-Smirnov141
7. Une méthode visuelle pour vérifier l'adéquation à une loi continue146
Chapitre 5
Tests sur un ou deux paramètres populationnels
149
1. Tests bilatéraux vs unilatéraux149
1.1 Tests bilatéraux149
1.2 Tests unilatéraux150
2. La démarche de test : cas général151
3. Exemple 1 : un test unilatéral sur une proportion152
4. Exemple 2 : un test unilatéral sur une moyenne156
4.1 Le test156
4.2 La loi de Student158
4.2.1 Présentation158
4.2.2 Utilisation de la table 5.1159
5. Exemple 3 : un second test unilatéral sur une moyenne162
6. Exemple 4 : un test bilatéral sur une moyenne163
7. Exemple 5 : un test unilatéral sur deux moyennes sur la base d'échantillons indépendants166
7.1 Le test sur les moyennes166
7.2 Le test sur les variances168
7.3 La loi de Fisher-Snedeccor169
7.3.1 Présentation169
7.3.2 Utilisation de la table 5.2170
8. Exemple 6 : un test unilatéral sur deux moyennes pour deux échantillons appariés178
9. Pour simplifier la procédure de test : réaliser des tests unilatéraux au moyen
de tests bilatéraux181
9.1 Comparaison des résultats aux tests uni- et bilatéraux181
9.2 Réaliser un test unilatéral par l'intermédiaire d'un test bilatéral182
9.3 Deux exemples184
10. Retour sur les significations logiques de p et Alpha185
10.1 Signification de la p-value185
10.2 Relation entre Alpha et p186
10.3 Choix de Alpha186
11. Quelques contraintes pour que ça marche186
Chapitre 6
L'estimation
189
1. Introduction189
2. L'estimation ponctuelle190
2.1 Première qualité d'un indice statistique servant à estimer un paramètre : l'absence de biais190
2.2 Deuxième qualité d'un indice statistique servant à estimer un paramètre populationnel :
avoir une variance faible195
2.3 Absence de biais et variance minimale : l'efficacité196
3. L'estimation par intervalles de confiance197
4. Relations entre tests d'hypothèses et intervalles de confiance199
Partie 3
Pratique des tests et estimations
sur un ou deux paramètres populationnels
Chapitre 7
Exercices corrigés sur le chapitre 5
203
1. Énoncé 1 (une proportion Pi)204
1.1 Énoncé204
1.2 Correction204
2. Énoncé 2 (deux proportions Pi1 et Pi2)205
2.1 Énoncé205
2.2 Correction206
3. Énoncé 3 (une moyenne Mu1)207
3.1 Énoncé207
3.2 Correction208
4. Énoncé 4 (deux moyennes Mu1 et Mu2 à partir d'échantillons appariés)210
4.1 Énoncé210
4.2 Correction210
5. Énoncé 5 (deux moyennes Mu1 et Mu2 et deux variances Sigma21 et Sigma22
à partir d'échantillons indépendants)214
5.1 Énoncé214
5.2 Correction214
6. Énoncé 6 (une moyenne Mu, une variance Sigma2, deux moyennes Mu1 et Mu2
à partir d'échantillons indépendants et appariés)217
6.1 Énoncé217
6.2 Correction218
Chapitre 8
Problèmes corrigés
225
1. Problème 1225
1.1 Énoncé225
1.2 Correction226
2. Problème 2229
2.1 Énoncé229
2.2 Correction229
3. Problème 3235
3.1 Énoncé235
3.2 Correction235
4. Problème 4240
4.1 Énoncé240
4.2 Correction241
5. Problème 5243
5.1 Énoncé243
5.2 Correction244
6. Problème 6250
6.1 Énoncé250
6.2 Correction251
Partie 4
Compléments et approfondissements
Chapitre 9
Quelques tests non paramétriques
259
1. Détail de la logique sur un exemple : le test de Wilcoxon
pour deux échantillons indépendants260
2. Le test de Wilcoxon pour deux échantillons indépendants : résumé265
2.1 Descriptif265
2.2 Utilisation de la table 1 de l'annexe 2266
2.3 Remarques266
2.4 Un exemple267
3. Le test de Wilcoxon pour deux échantillons appariés269
3.1 Le test269
3.2 Utilisation de la table 2 de l'annexe 2270
3.3 Remarques271
4. Le test du signe (deux échantillons appariés)271
4.1 Le test271
4.2 Remarques272
4.3 Un exemple d'utilisation des tests de Wilcoxon apparié et du signe272
5. Le test de dépendance monotone de Spearman276
5.1 Le test276
5.2 Utilisation de la table 3 de l'annexe 2277
5.3 Un exemple277
6. Le test d'indépendance d'Irwin-Fisher279
6.1 Logique et exemple279
6.2 Le test d'Irwin-Fisher comme précurseur à certaines approches statistiques basées
sur des calculs intensifs par ordinateur281
Chapitre 10
Précisions et compléments sur les tests d'hypothèses
285
1. Détermination de la distribution d'échantillonnage de la variable aléatoire T
associée à l'indice d'accord à H0 (t)286
1.1 Détails de la réflexion dans le cas du test d'une proportion286
1.2 Les grandes lignes pour généraliser à d'autres tests289
2. Une autre manière de décider : utiliser une région de rejet de l'hypothèse nulle
(ou région critique)293
2.1 Introduction293
2.2 Exemples296
3. Choix des seuils de tests Alpha et relations entre ceux-ci et p300
3.1 Le seuil du test Alpha300
3.2 La p-value301
3.3 Conséquence : rejeter H0si p Alpha302
4. Relations entre tests uni- et bilatéraux302
4.1 Relations à partir des p-value302
4.2 Relations à partir des régions de rejet303
4.3 Conclusion : n'utiliser que des tests bilatéraux ?304
5. Compléments : risques de première et deuxième espèce ; puissance305
5.1 Les risques de première et deuxième espèce305
5.2 La fonction puissance d'un test307
5.2.1 Définition307
5.2.2 Un exemple détaillé de l'étude de la puissance : test sur une proportion308
5.2.3 Des enseignements pratiques de l'étude de la puissance pour la mise en place des expériences314
Annexes
Annexe 1
Formulaire pour les principaux tests et intervalles de confiance
sur un ou deux paramètres
323
1. Comparaison d'une proportion à une valeur de référence324
2. Comparaison de deux proportions pour échantillons indépendants de tailles importantes324
3. Comparaison d'une moyenne à une valeur de référence325
4. Comparaison d'une variance à une valeur de référence326
5. Comparaison de deux variances327
6. Comparaison de deux moyennes pour échantillons indépendants328
7. Comparaison de deux moyennes pour échantillons appariés329
8. Comparaison d'un coefficient de corrélation à zéro331
9. Comparaison d'un coefficient de corrélation à une valeur de référence331
10. Comparaison de deux coefficients de corrélation indépendants332
11. Comparaison de deux coefficients de corrélation non indépendants333
Annexe 2
Tables statistiques pour les tests non paramétriques
335
1. Test de Wilcoxon pour échantillons indépendants335
2. Test de Wilcoxon pour échantillons appariés343
3. Test de corrélation des rangs de Spearman346
Glossaire des principaux symboles
349
1. Lettres grecques349
2. Lettres latines349
3. Autres351
Index
353