Méthodes statistiques de l'économie et de la gestion
Économétrie des variables qualitatives
Théorie et application sous SAS
Virginie Delsart
Nicolas Vaneecloo
Presses universitaires du Septentrion
Introduction9
Première partie
Théorie
Chapitre 1. Le modèle linéaire et les raisons de son dépassement15
1. Le modèle linéaire dans le cas d'une variable dichotomique
15
1.1. Signification du modèle linéaire et de ses coefficients15
1.2. L'estimation des coefficients du modèle et la variance de ces estimations18
1.3. Le problème de l'hétéroscédasticité et ses solutions20
2. L'inconsistance du modèle linéaire et son dépassement : les modèles Logit et Probit
23
2.1. L'inconsistance du modèle linéaire23
2.2. Le dépassement du modèle linéaire : les modèles logit et probit27
2.2.1. Le modèle logit et son hypothèse sous-jacente
27
2.2.2. Le modèle probit, l'hypothèse d'une variable latente et les problèmes d'interprétation des coefficients
37
2.3. Le choix de la spécification d'un modèle dichotomique45
2.3.1. Le modèle linéaire
45
2.3.2. Le modèle probit
47
2.3.3. Le modèle Logit
48
Chapitre 2. Estimation et test du modèle logit55
1. L'estimation des paramètres du modèle
55
1.1. Rappels sur la méthode du maximum de vraisemblance56
1.1.1. Définitions préalables et application à l'estimation d'une proportion
56
1.1.2. Rappel des propriétés générales des estimateurs du maximum de vraisemblance
58
1.2. Application de la méthode du maximum de vraisemblance à l'estimation des paramètres du modèle logit60
1.2.1. La détermination des coefficients du modèle
60
1.2.2. La matrice des variances-covariances des estimateurs des coefficients du modèle
64
2. Le test du modèle logit
67
2.1. Les restrictions sur le modèle initial67
2.2. Les tests de restriction69
2.2.1. Les tests de Wald
70
2.2.2. Les test du rapport de vraisemblance
71
2.2.3. Le choix d'une voie de test
74
3. Les infractions aux hypothèses sous-jacentes de la modélisation et leurs effets
81
3.1. La corrélation entre variable explicatives81
3.2. L'omission d'une variable explicative importante85
3.3. L'erreur de spécification91
3.4. L'hétéroscédasticité et l'autocorrélation du résidu94
3.4.1. Les conséquences de l'autocorrélation du résidu
95
3.4.2. Les conséquences de l'hétéroscédasticité du résidu
97
3.5. La pluralité de régimes99
Chapitre 3. La qualité de l'ajustement et les prévisions réalisées105
1. La qualité de l'ajustement
105
1.1. La filiation directe du coefficient de détermination : le pseudo-R2 « classique » et celui de Mac Kelvey et Zavoina107
1.1.1. Le pseudo-R2 « classique » ou d'Efron
107
1.1.2. Le pseudo-R2 de Mac Kelvey et Zavoina
108
1.2. Les pseudo-R2 déduits de la vraisemblance : Cox et Snell, Nagelkerke et McFadden110
1.2.1. Le pseudo-R2 de Cox et Snell et la correction de Nagelkerke
111
1.2.2. Le pseudo-R2 de McFadden
116
2. La prévision et ses erreurs
119
2.1. Fondements économico-statistiques du pari et erreurs de prévision120
2.1.1. Une première approche du pari
120
2.1.2. Une approche économique du pari
122
2.2 La courbe ROC et ses fondements124
2.2.1. Un détour médical
124
2.2.2. Retour au problème de la qualité des prévisions réalisée à l'aide d'un modèle logit
132
Chapitre 4. Les modèles polytomiques143
1. Le modèle logit polytomique ordonné
146
1.1. L'hypothèse d'une variable latente à résidu logistique et la formulation du modèle146
1.2. Signification des coefficients et hypothèse fondamentale du modèle148
2. Le logit multinomial, modèle polytomique non ordonné
150
2.1. Formulation du modèle et liens avec le modèle logit dichotomique150
2.1.1. Les deux expressions du modèle logit multinomial
150
2.1.2. Liens entre le logit multinomial et le logit dichotomique
152
2.2. Interprétation des coefficients et mesure de l'impact d'une variable sur les probabilités154
2.2.1. L'impossibilité de porter un diagnostic sur l'impact d'une variable sur la seule vue de son coefficient
154
2.2.2. Une mesure synthétique de l'effet d'une variable
157
2.3. Utilisation du modèle pour la prévision159
2.3.1. Finalités et méthodes de la prévision
159
2.3.2. Risques d'erreur et mesure de la réduction des risques permise par l'utilisation du modèle
162
3. La modélisation des choix : le modèle logit « conditionnel »
166
3.1. Fondements du modèle logit « conditionnel »167
3.1.1. De la logique des choix discrets aux probabilités associées aux différentes options
167
3.1.2. Propriété fondamentale du modèle et expressions alternatives de celui-ci
171
3.2. Interprétation des coefficients du modèle logit conditionnel177
3.3. Test de l'hypothèse IIA et remèdes possibles à la non indépendance des alternatives182
3.3.1. Le test de l'hypothèse d'indépendance relative aux hypothèses non retenues
182
3.3.2. Modèles logits alternatifs : le logit hiérarchique et le logit emboîté
184
Deuxième partie
Application sous SAS®
Cas n° 1. Étude des déterminants économiques ou sociaux de la possession d'un lave-vaisselle197
Corrigé du Cas n° 1201
Préparation des données201
1. Première étape202
2. Deuxième étape208
3. Comparaison des deux modèles212
4. Conclusion216
Cas n° 2. Établissement d'un score informatif pour le concours d'entrée d'une école universitaire d'économie et de management219
1re partie de l'étude de cas220
2e partie de l'étude de cas222
Corrigé du cas n° 2225
Première partie225
Préparation des données225
1. Première étape : modèle linéaire de la note226
2. Deuxième étape : modèle linéaire de la probabilité d'admissibilité230
3. Troisième étape : modèle logit de la probabilité d'admissibilité233
4. Quatrième étape : modélisation probit235
5. Comparaison des résultats obtenus dans les quatre modélisations238
6. Conclusion247
Deuxième partie250
1. Remarques préalables250
2. La courbe ROC et le choix d'un seuil d'admissibilité sur dossier252
3. Conclusion254
Cas n° 3. Étude des déterminants socio-économiques de l'audience des chaînes de télévision255
Corrigés du Cas n° 3261
1. La modélisation multinomiale et ses résultats
261
1.1. Préparation des données261
1.2. Écriture de la procédure et codage des modalités des variables qualitatives262
1.3. Présentation des résultats265
2. L'utilisation du modèle pour la « prévision »
271
3. La mesure des effets des variables sur le choix d'un type de chaîne
273
3.1. Les facteurs principaux276
3.2. Les facteurs secondaires277
3.3. Les facteurs marginaux278
4. Conclusion
280
Cas n° 4. Déterminants économiques du choix d'un mode de transport281
Corrigé du Cas n° 4285
1. Ajustement d'un modèle logit conditionnel unique sur l'ensemble des données
285
1.1. Préparation des données285
1.2. La procédure d'ajustement du modèle et les sorties SAS286
1.3. Les prévisions de choix modal289
1.4. L'introduction de préférences modales290
2. L'introduction de variables supplémentaires dans le modèle logit conditionnel
292
2.1. De l'intérêt d'intégrer de nouvelles variables comme déterminants du choix modal292
2.2. L'introduction directe de la variable revenu dans la modélisation295
2.3. L'introduction indirecte de la variable revenu dans la modélisation297
3. Conclusion
301