Bioinformatique avec Python et Biopython
Emmanuel Jaspard
Gilles Hunault
Dunod
Introduction1
Chapitre 1 Dénombrement des nucléotides et calculs associés (%GC, Tm)7
1. Rappel sur la structure des nucléotides7
2. La composition en nucléotides de l'ADN et des ARN8
3. Illustration des îlots CpG9
4. Calculs du pourcentage de GC et de la température de fusion Tm10
5. Buts du script gctm.py11
6. Code du script gctm.py12
7. Explications du code gctm.py12
8. Code de l'auto-test pour le script gctm.py14
9. Calculs de %GC et de Tm avec Biopython15
L'essentiel16
Bibliographie16
Ressources Web16
Exercices18
Chapitre 2 Écriture de séquences d'acides nucléiques19
1. Les séquences d'acides nucléiques19
2. Les formats des fichiers bioinformatiques - le format FASTA20
3. Buts du script brinscomp.py22
4. Code du script brinscomp.py23
5. Explications du code brinscomp.py23
6. Code de l'auto-test pour le script brinscomp.py24
L'essentiel25
Bibliographie25
Ressources Web25
Exercices26
Chapitre 3 Séquences et expressions régulières27
1. Rappels sur les caractéristiques des expressions régulières27
2. Utilisation des expressions régulières dans l'analyse des données bioinformatiques28
3. Buts du script rchmotif.py29
4. Code du script rchmotif.py30
5. Explications du code rchmotif.py31
6. Code de l'auto-test pour le script rchmotif.py31
L'essentiel32
Bibliographie32
Ressources Web32
Exercices33
Chapitre 4 Recherches bibliographiques dans PubMed35
1. Rappel sur les données bibliographiques et le moteur de recherche Entrez35
2. Buts du script rchbiblio.py37
3. Code du script rchbiblio.py38
4. Explications du code rchbiblio.py39
5. Code de l'auto-test pour le script rchbiblio.py40
L'essentiel41
Bibliographie41
Ressources Web41
Exercices42
Chapitre 5 Profil d'une famille de protéines43
1. Rappel sur les domaines structuraux des protéines43
2. Profils, domaines et bases de données de familles de protéines44
3. Méthode de construction des alignements PFAM45
4. Buts du script familprot.py45
5. Code du script familprot.py47
6. Explications du code familprot.py48
7. Code de l'auto-test pour le script familprot.py51
L'essentiel52
Bibliographie52
Ressources Web52
Exercices53
Chapitre 6 Profil d'hydrophobicité d'une protéine - fenêtre de taille variable55
1. Propriétés physico-chimiques des acides aminés55
2. Calcul de l'hydrophobicité d'une séquencé d'acides aminés avec une fenêtre glissante56
3. Exemple d'un récepteur couplé à une protéine G (RCPG)57
4. Buts du script profilhyd.py57
5. Code du script profilhyd.py58
6. Explications du code profilhyd.py59
7. Code de l'auto-test pour le script profilhyd.py60
8. Code du script profilhyd_utils.py61
9. Explications du code profilhyd_utils.py62
10. Calculs avec les fonctions de Biopython62
L'essentiel63
Bibliographie63
Ressources Web63
Exercices64
Chapitre 7 Position de cystéines impliquées dans un pont disulfure65
1. Propriétés physico-chimiques et particularité de la cystéine65
2. Pont disulfure et structure 3D des protéines66
3. La base de données « Protein DataBank » ou PDB67
4. Buts du script disulfure.py69
5. Code du script disulfure.py70
6. Explications du code disulfure.py71
7. Code de l'auto-test pour le script disulfure.py73
L'essentiel74
Bibliographie74
Ressources Web74
Exercices75
Chapitre 8 Calcul du barycentre d'une chaîne polypeptidique repliée77
1. Structure tridimensionnelle des protéines77
2. Calcul du barycentre des carbones ? des acides aminés d'une chaîne polypeptidique repliée78
3. Buts du script barycentre.py78
4. Code du script barycentre.py79
5. Explications du code barycentre.py80
6. Code de l'auto-test pour le script barycentre.py82
L'essentiel83
Bibliographie83
Ressources Web83
Exercices84
Chapitre 9 Diagrammes de Ramachandran85
1. La liaison peptidique85
2. Les angles de torsion86
3. Les diagrammes de Ramachandran87
4. Buts du script ramachandran.py87
5. Code du script ramachandran.py89
6. Explications du code ramachandran.py90
7. Code de l'auto-test pour le script ramachandran.py91
8. Code du script ramachandran_utils.py92
9. Explications du code ramachandran_utils.py94
L'essentiel96
Bibliographie96
Ressources Web96
Exercices97
Chapitre 10 Contacts entre résidus d'acides aminés dans les structures 3D99
1. Interactions entre résidus d'acides aminés au sein des protéines99
2. Contacts et distances entre résidus d'acides aminés100
3. Buts du script contacts.py101
4. Code du script contacts.py102
5. Explications du code contacts.py102
6. Code de l'auto-test pour le script contacts.py103
7. Code du script structure_pdb.py103
8. Explications du code structure_pdb.py104
9. Code du script contacts_utils.py105
10. Explications du code contacts_utils.py106
L'essentiel108
Bibliographie108
Ressources Web108
Exercices109
Chapitre 11 Superposition de structures protéiques111
1. Superposition de structures de protéines et scores de distances interatomiques111
2. Exemples de scores de mesure de similarité de structures112
3. L'algorithme AlphaFold113
4. Buts du script superp.py114
5. Code du script superp.py115
6. Explications du code superp.py116
7. Code dé l'auto-test pour le script superp.py116
8. Code du script superp_pdb.py117
9. Explications du code superp_pdb.py118
L'essentiel120
Bibliographie120
Ressources Web120
Exercices121
Chapitre 12 Les protéines ou régions intrinsèquement désordonnées123
1. Découverte des protéines ou régions intrinsèquement désordonnées -123
2. Abondance et fonctions biologiques des IDP/IDR125
3. Prédiction des IDP/IDR126
4. Buts du script repliement.py126
5. Code du script repliement.py127
6. Explications du code repliement.py128
7. Code de l'auto-test pour le script repliement.py129
L'essentiel130
Bibliographie130
Ressources Web130
Exercices131
Chapitre 13 Alignements de séquences et protéines homologues133
1. Notions élémentaires d'alignement de séquences133
2. Description de BLAST (« Basic Local Alignment Search Tool »)135
3. Principe de PHI-BLAST (« Pattern Hit Initiated-BLAST »)136
4. Buts du script homologues.py138
5. Code du script homologues.py139
6. Explications du code homologues.py140
7. Code de l'auto-test pour le script homologues.py141
8. Code du script homologues_utils.py142
9. Explications du code homologues_utils.py144
L'essentiel146
Bibliographie146
Ressources Web146
Exercices147
Réponses aux questions149
Chapitre 1149
Chapitre 2152
Chapitre 3155
Chapitre 4158
Chapitre 5160
Chapitre 6161
Chapitre 7165
Chapitre 8166
Chapitre 9167
Chapitre 10169
Chapitre 11171
Chapitre 12172
Chapitre 13176
Annexes181
Annexe 1 : rappels Python183
Annexe 2 : expressions régulières191
Annexe 3 : présentation de Biopython197
Annexe 4 : liste des scripts dans les chapitres199
Annexe 5 : liste des scripts dans les réponses aux questions201
Annexe 6 : packages et modules cités203
Index205