Initiation à la génétique des populations naturelles
Application aux parasites et à leurs vecteurs
2e édition
Thierry De Meeûs
IRD éditions
Avant-propos de la 1reédition
9
Avant-propos pour la 2e édition
13
Introduction
15
1. Concepts théoriques et statistiques19
Qu'est-ce qu'un marqueur génétique ?
21
Notions préliminaires21
Marqueurs cytoplasmiques22
Marqueurs nucléaires dominants24
Marqueurs nucléaires codominants25
Les allozymes
26
Pas de tache où des traînées non interprétables sont présentes sur le gel26
Les taches révélées de tous les individus se retrouvent toutes au même niveau26
Les taches révélées ne sont pas retrouvées au même endroit27
Autres cas27
Commentaires sur les allozymes28
Les microsatellites
29
Concepts de base en génétique des populations
31
Calcul des fréquences alléliques à partir d'un échantillon31
Conformité avec les proportions d'Hardy-Weinberg31
Les hypothèses d'Hardy-Weinberg
31
L'équilibre d'Hardy-Weinberg
32
Relaxation des hypothèses de Hardy-Weinberg33
La population est de taille finie
33
Il y a mutation
33
Mutation récurrente33
Modèle de mutation en nombre fini d'allèles ou KAM (K Alleles Model)34
IAM ou Infinite Allele Model34
SMM ou Stepwise Mutation Model34
Conclusion sur la mutation34
Migration
34
Sélection
35
Sélection directionnelle35
Sous-dominance36
Super-dominance36
La sélection fréquence-dépendante37
Hétérosis37
La sélection gamétique38
Le régime de reproduction n'est pas panmictique
38
Autofécondation38
Les croisements systématiques entre apparentés40
L'homogamie40
L'hétérogamie40
La clonalité42
Les générations se chevauchent
42
La notion de déficit en hétérozygotes, définitions42
Populations structurées, effet Wahlund et statistiques F (F-statistics)45
L'exempte du modèle en îles
45
Le déficit en hétérozygotes dû à la structuration (effet Wahlund)
46
Les statistiques F de Wright (1965)
48
Définitions classiques48
Définitions en fonction des probabilités d'identité50
Inférer Nm à partir du Fst dans un modèle en îles51
Pertinence du modèle en îles52
Autres modèles de populations structurées
53
Estimateurs non biaisés des statistiques F
53
Mesures de différenciation génétique alternatives au FST
61
Les R-Statistiques61
Le FST maximum possible62
Différenciation génétique par paire d'échantillons ou d'individus62
Espèces haploïdes et loci liés au sexe63
Le problème de l'homoplasie
64
Structuration à plus de trois niveaux
64
Probabilités (ou indices) d'assignement
66
Les déséquilibres de liaison67
Tests statistiques
69
Bases69
L'hypothèse nulle
69
Qu'est-ce qu'un test statistique ?
70
Risques de première et de seconde espèce
71
Le principe des randomisations72
Intervalles de confiance de bootstrap et jackknife
73
Le bootstrap73
Bootstrap sur les loci
73
Bootstrap sur les populations
74
Le jackknife74
Jackknife sur les loci
74
Jackknife sur populations
75
Applications numériques pour le jackknife
75
Mise en garde75
Les permutations
76
Tester la panmixie locale78
Tester le FIS
78
Tester s'il existe un déficit en hétérozygotes78
Tester s'il existe un excès d'hétérozygotes78
Tester un écart dans n'importe quelle direction (excès ou déficit)78
Autres méthodes pour tester l'écart à la panmixie
79
Tests exacts79
Méthode de Rousset et Raymond (1995)79
Tester la pangamie
79
Tester la structuration80
Tester le FST
80
La méthode basée sur le G de Goudet et al. (1996)
81
Test exact allélique de Rousset et Raymond (1995)
81
Tester la panmixie globale82
Tester les déséquilibres de liaison82
Nombre de randomisations
83
Correction du seuil
83
Remarques sur les tests de déséquilibres de liaison et leur interprétation
84
Le problème des tests répétés84
Les tests répétés sont indépendants
85
Tester si un signal global existe85
Déterminer quels sont les tests significatifs, procédures de type Bonferroni87
Les tests répétés ne sont pas indépendants
88
Tester si un signal global existe89
Déterminer quels sont les tests significatifs, procédure de Benjamini et Yekutieli89
Le cas des déséquilibres de liaison
89
Tester la corrélation entre distances90
Distances génétiques et géographiques
90
Les sous-échantillons sont alignés en une seule dimension91
Les sous-échantillons sont distribués sur deux dimensions91
Autres distances
92
Tester les biais de dispersion de certaines catégories d'individus93
Tester la différence entre groupes95
Analyses multivariées96
Analyse factorielle des correspondances (AFC)
96
Exemples96
Recommandations et astuces pour les utilisateurs de l'AFC98
Analyse en composantes principales (ACP)
98
Analyse canonique des correspondances (ACC)
100
Construction d'arbres
100
Trouver une sous-structure cachée101
Commentaires sur les algorithmes bayésiens de clusterisation103
Estimer des effectifs efficaces106
Définition de l'effectif efficace d'une population
106
Méthodes de calcul de l'effectif efficace des populations naturelles
107
Détection de goulots d'étranglement
108
Le cas spécial des allèles nuls 110
Présentation générale
110
Détecter la présence d'allèles nuls
110
Trucs et astuces pour tester la présence des allèles nuls
111
Le cas très spécial de la dominance des allèles courts112
Point de vue théorique
112
Du point de vue pratique : détection de la dominance des allèles courts
115
Méthode fastidieuse de régression multiple115
Méthode rapide de corrélation116
Le cas du « stuttering »116
2. Applications à des exemples concrets119
La tique Ixodes ricinus et les pathogènes (Borrelia sp.) qu'elle transmet
121
Introduction121
État des lieux121
Premier recodage des données124
Premières analyses : indépendance entre allèles dans et entre loci dans les sous-échantillons124
Recherche d'allèles nuls et de dominance d'allèles courts131
Convertir le fichier pour Micro-Checker et ouverture du logiciel
131
Analyses des loci autosomiques du premier sous-échantillon par Micro-Checker
131
Analyses des autres sous-échantillons, des autres loci autosomiques et du locus IR08
133
Bilan des analyses avec Micro-Checker
134
Détection de dominance d'allèles courts par la méthode de régression multiple
135
Bilan de l'analyse des déficits locaux en hétérozygotes
140
Recherche d'une structure cachée (effet Wahlund)141
Introduction
141
Construction des fichiers BAPS
142
Analyse des fichiers par BAPS
142
Commentaires sur l'analyse des fichiers par BAPS
151
Conclusion sur les déficits en hétérozygotes152
Structure des populations et schémas de différenciation153
Structure génétique spécifique à chaque sexe des données brutes (sans tenir compte de BAPS)
153
Structure génétique spécifique à chaque sexe des données clusterisées par BAPS
156
Interpréter l'ensemble des résultats sur les biais de structuration
158
Différenciation globale et isolement par la distance
159
Définir différents niveaux de subdivision pour l'analyse hiérarchique159
Analyse hiérarchique sur données brutes (pas de cluster BAPS)159
Analyse hiérarchique sur données clusterisées par BAPS162
Test d'isolement par la distance163
Estimation d'effectifs efficaces, extrapolation des densités et de la dispersion
166
Effectifs efficaces des tiques de Suisse166
Extrapolation des densités et des distances de dispersion des tiques en Suisse171
Conclusions de la 1reédition de ce manuel sur la biologie et la génétique des populations d'I. ricinus en Suisse171
Discussion des résultats obtenus par des méthodes plus récentes d'analyse pour la 2e édition de ce manuel175
Interactions avec les micropathogènes transmis179
Introduction
179
Présentation des données
180
Distribution des différentes borrélies dans les femelles et mâles d'I. ricinus : analyses de la 1re édition
180
Analyses correctes en modèles généralisés pour cette réédition184
Co-occurrence des différentes espèces de borrélies
188
Analyses de la 1reédition
188
Analyses effectuées pour la réédition de ce manuel sur les occurrences des différentes espèces de borrélies dans leur environnement192
Co-occurrences des différentes espèces de borrélies
192
Distribution spatiale
194
Occurrence des différentes espèces de borrélies et génétique des tiques : analyses de la 1re édition195
Différenciation entre tiques Infectées et non Infectées195
Différenciation entre tiques infectées par différentes borrélies198
Biais de structuration spécifique associé au pathogène198
Biais de structuration spécifique au pathogène et au sexe202
Occurrence des différentes espèces de borrélies et génétique des tiques : nouvelles analyses
203
Différenciation entre tiques infectées et non infectées203
Différenciation entre tiques infectées par différentes borrélies203
Différenciation génétique pathogène spécifique204
Tests de comparaisons de niveaux de subdivision
204
Pour Bbss204
Pour Ba205
Pour Bbundet205
Toutes borrélies confondues205
Tests de biais de dispersion pathogène spécifique
206
Conclusion sur le statut Infectieux et la génétique des tiques206
Conclusions de la 1re édition sur les borrélies et I. ricinus en Suisse207
Conclusions sur les borrélies et I. ricinus en Suisse : 2e édition208
Glossina palpalis gambiensis le long de la rivière Mouhoun au Burkina Faso
211
Introduction211
État des lieux211
Le cycle de vie particulier des mouches tsé-tsé et leur capture212
Premier recodage des données214
Premières analyses : indépendance entre allèles dans et entre loci215
Déséquilibres de liaison au sein des quatre zones
215
Test de la panmixie dans les quatre zones d'échantillonnage
219
Analyse par Micro-Checker219
Mise en évidence d'une sous-structuration à l'intérieur des zones A, H, C et D220
Analyse par piège
220
Clusters BAPS
223
Isolement par la distance entre individus
223
Effectifs efficaces
226
Densités efficaces
231
Conclusions : isolement par la distance intra-zone (rolling on the river)
232
Différenciation entre les quatre zones233
Analyse HierFstat du jeu de données total partitionné par BAPS
233
Comprendre le manque de structure inter-zones avec un peu de théorie
235
Comprendre le manque de structure inter-zones avec un peu de simulations
236
Conclusions239
Résultats obtenus avec les analyses pour la 2e édition239
Déséquilibres de liaison et panmixie locale dans les pièges
239
Recherche du niveau hiérarchique minimal de structuration avec HierFstat
240
Déséquilibres de liaison et panmixie locale dans les zones Zs
242
Isolement par la distance entre les zones Zs
242
Isolement par la distance en une dimension243
Isolement par la distance en deux dimensions244
Effectifs efficaces et distances de dispersion
244
Effectifs efficaces244
Conclusions sur les nouveaux résultats de cette réédition
245
Invasion de la Nouvelle-Calédonie par la tique du bétail Rhipicephalus microplus : hétérogénéité locale, dispersion et goulots d'étranglement
247
Introduction247
État des lieux247
Analyse de la consanguinité relative intra-hôte250
Homozygotie et déséquilibre de liaison intra-hôte
250
Analyse hiérarchique
253
Bibliographie
321
Réponses aux questions
339
Glossaire
349
Annexe de la 2e édition
361
Clé de décisions pour les études de génétique des populations empirique361
Liste des logiciels gratuits utilisés dans ce manuel de génétique des populations empirique376
Liste des méthodes utilisables pour l'analyse des données de génétique des populations384