La démarche statistique
Bernard Prum
Cépaduès
1 Modèles statistiques9
1.1 L'aléatoire9
1.1.1 Inférence10
1.1.2 Lois empiriques, lois théoriques12
1.2 Modèles statistiques13
1.2.1 La vraisemblance15
1.2.2 ... et la log-vraisemblance17
1.2.3 Un exemple à suivre18
1.2.4 Les trois avatars de thêta21
1.3 Bases probabilistes22
2 Premiers éléments d'inférence statistique25
2.1 Le modèle binomial25
2.2 Estimation (cas de la binomiale)26
2.3 Notion de test28
2.3.1 Avant de rompre la symétrie29
2.3.2 Où l'on rompt la symétrie33
2.3.3 La démarche du test36
2.3.4 La démarche par l'absurde45
2.3.5 La relation entre niveau et puissance48
2.4 Tests unilatères50
2.4.1 Un exemple50
2.4.2 Tests unilatères (contre p > p0)52
2.4.3 Influence de la taille d'échantillon54
2.5 Tests bilatères56
3 Rapport de vraisemblance, Neyman-Pearson61
3.1 Tests d'hypothèses simples61
3.1.1 Rapport continu64
3.1.2 Rapport non nécessairement continu69
3.2 Rapport de vraisemblance monotone77
3.2.1 Exemple gaussien77
3.2.2 Cas général80
3.2.3 Tests de H0 : thêta* (...) thêta082
3.2.4 Familles exponentielles83
3.2.5 Discussion89
4 Vraisemblance, Information91
4.1 La vraisemblance et ses dérivées91
4.1.1 Échantillon91
4.1.2 Le score L'x (thêta)93
4.2 L'information de Fisher95
4.2.1 L'information empirique99
4.2.2 Changement de paramètre99
4.2.3 La matrice d'information de Fisher100
4.3 Exhaustivité101
4.4 Exemples105
4.4.1 Lois de Poisson105
4.4.2 Lois gaussiennes105
4.4.3 Lois Gamma108
4.5 Perte d'information par image110
5 Estimation115
5.1 Estimation115
5.1.1 Estimateur, biais, écart quadratique115
5.1.2 Consistance117
5.1.3 La borne de Cramér-Rao118
5.1.4 Deux autres qualités asymptotiques119
5.2 Maximum de vraisemblance120
5.2.1 Définitions120
5.2.2 Propriétés121
5.3 Contrastes125
5.4 Méthode des moments131
5.5 Le théorème de Blackwell-Rao133
5.5.1 Exemples135
5.6 Paramètre thêta multidimensionnel138
5.6.1 Image réciproque d'une hypothèse140
6 Les trois tests141
6.0.2 L'obligation de manipuler deux thêta141
6.0.3 Le problème de ce chapitre142
6.0.4 Un intervalle, deux points de vue143
6.1 Le test du score144
6.1.1 Le théorème du score144
6.1.2 Le test145
6.2 Le test de Wald148
6.3 Test du rapport de vraisemblance151
6.3.1 Le théorème152
6.3.2 Le test153
6.4 Discussion155
6.4.1 Un exemple « non standard »158
7 Modèles multiparamétriques163
7.1 Quelques propriétés probabilistes163
7.2 Les trois tests de Ho contre Hd165
7.2.1 Les théorèmes165
7.2.2 Les tests167
7.3 Les trois tests de Hc contre Hd172
7.3.1 Eléments théoriques pour le test de H1 contre H2173
7.3.2 En dimensions quelconques176
7.4 Le cas du modèle linéaire182
7.4.1 Le modèle182
7.4.2 Un théorème, des projections185
7.4.3 Lois de Student et lois de Fisher-Snedecor188
7.4.4 Les tests189
7.4.5 Un exemple, la droite de régression190
8 Test d'une hypothèse composée195
8.1 Définitions195
8.1.1 Niveau, puissance195
8.1.2 Modèle de tests196
8.2 Thêta réel, tests unilatères197
8.2.1 Test fondé sur T(X)199
8.2.2 Test fondé sur Tthêta(X)202
8.2.3 Lien avec le rapport de vraisemblance monotone204
8.3 Thêta réel, tests bilatères205
8.4 Paramètre multidimensionnel206
9 Régions de confiance207
9.1 Intervalles : pari, non rejet, confiance207
9.2 Une démarche incontrôlée209
9.3 Mise en oeuvre : thêta (...)211
9.3.1 Intervalle de confiance unilatère211
9.3.2 Intervalle de confiance bilatère212
9.4 Région de prédiction214
10 Résumé : l'équation centrale217
11 Tests du x2219
11.1 Bases probabilistes219
11.2 Tests d'ajustement220
11.2.1 Ajustement à une loi multinomiale fixe220
11.2.2 Ajustement à une loi quelconque225
11.2.3 Test avec estimation de paramètres227
11.3 Tests d'indépendance229
12 Tests non paramétriques231
12.1 Définitions231
12.2 Tests de rangs sur un échantillon232
12.2.1 Statistiques d'ordre et de rang233
12.2.2 Test « signe et rang »234
12.3 Tests de rangs sur deux échantillons237
12.4 Tests de Kolmogorov-Smirnov241
13 Taille d'échantillon245
13.1 Niveau, puissance, taille d'échantillon245
13.2 Tests séquentiels249
13.2.1 Test séquentiel du rapport de vraisemblances250
14 Choix de modèle257
14.1 Modèles emboîtés et non emboîtés257
14.1.1 Choix de la pénalisation : prédiction optimale261
14.1.2 Choix de la pénalisation : consistance de l'ordre estimé264
14.2 Sur-ajustement, la validation croisée268
15 Multi-tests273
16 Approches stochastiques281
16.1 Ré-échantillonnage284
16.1.1 Le bootstrap285
16.1.2 Autres ré-échantillonnage, le Jackknife287
16.2 Algorithmes EM288
17 L'approche bayésienne293
17.1 Lois de probabilité sur thêta293
17.1.1 Bayésien généralisé297
17.2 Estimateur bayésien, admissibilité298
17.2.1 Lois conjuguées300
17.3 Le bayésien séquentiel302
17.4 Loi non informative307
Envoi311
A Rappels de probabilités315
A.1 Événements, probabilités, densités315
A.2 Variables aléatoires319
A.3 Fonctions de variables aléatoires324
A.4 Lois multinomiales, Equilibre de Hardy-Weinberg329
A.5 Les trois piliers des Probabilités331
A.6 Transformée de Laplace332
B Quelques programmes en R335