Introduction à la bioinformatique
Cynthia Gibas/Per Jambeck
Editions O'Reilly
Préfaceix
A qui s'adresse ce livre ?x
Structure de ce livrexi
Notre approche de la bioinformatiquexiii
Conventions typographiquesxiii
Pour nous contacterxiii
Pour être tenu au courant de nos publicationsxiii
Remerciementsxiv
Edition françaisexv
I Introduction1
1. La biologie à l'ère de l'informatique1
Comment l'informatique transforme-t-elle la biologie ?4
Le but de la bioinformatique serait-il seulement de créer des bases de données ?8
Que représente l'informatique pour les biologistes ?12
Quels défis la biologie offre-t-elle aux informaticiens ?12
Comment configurer son PC pour faire de la recherche en bioinformatique ?14
Quels sont les informations et les logiciels disponibles ?15
Est-il possible d'apprendre un langage de programmation sans enseignement ?16
Quels sont les informations et les logiciels disponibles ?17
Comment ranger, visualiser et interpréter ses données ?17
Comment écrire un programme pour aligner deux séquences biologiques ?18
A quelles questions la bioinformatique permet-elle de répondre ?18
2. Approches informatiques de quelques questions biologiques21
Mécanismes fondamentaux en génétique moléculaire21
Quelles modélisations en biologie ?25
Une expérience en bioinformatique34
II. Station de travail bioinformatique39
3. Installation d'une station de travail41
Travailler sur un système Unix41
Installer une station de travail sous Linux44
Comment faire fonctionner les logiciels ?52
4. Fichiers et répertoires sous Unix59
Les notions de base d'un système de fichiers59
Commandes opérant sur les répertoires et les fichiers64
Travailler dans un environnement multi-utilisateurs71
5. Travailler sur un système Unix83
Les shells Unix83
Emettre une commande sous Unix84
L'affichage et l'édition des fichiers89
Transformations et filtres95
Les statistiques sur les fichiers et les comparaisons101
Le langage des expressions régulières103
Les scripts shell Unix106
Communiquer avec d'autres ordinateurs107
Bien s'entendre avec les autres dans un environnement partagé112
Tableaux récapitulatifs124
III. Outils pour la bioinformatique129
6. Recherche d'informations biologiques sur le Web131
Retrouver des articles scientifiques132
Les bases publiques de données biologiques137
Recherche d'informations dans les banques de données biologiques142
Soumission de données dans les banques publiques148
Recherche de logiciels149
Juger de la qualité de l'information149
7. Analyse et comparaison de séquences151
Prédiction de gènes152
Traduction et traduction inverse153
Comparaison de séquences deux à deux154
Comparaison d'une séquence contre toutes les séquences d'une banque de données biologiques163
Outils multifonctions pour l'analyse de séquence168
8. Alignements multiples de séquences, arbres et profils171
Alignement multiple de séquences171
Analyse phylogénétique175
Profils et motifs181
9. Visualisation de structures protéiques et calcul de propriétés structurales189
Les formats des données de structures protéiques190
La structure chimique des protéines190
Outils web pour l'analyse de la structure des protéines202
Visualisation des structures204
Classification des structures210
Alignement structural215
CE et CL217
VAST (Vector Alignment Search Tool)218
Analyse Structurale218
Accessibilité au solvant et interactions221
Calcul des propriétés physicochimiques224
Optimisation d'une structure226
Bases de données de protéines230
Presage231
En résumé231
10. Prédiction de la structure et de la fonction d'une protéine à partir de sa séquence235
Détection de caractéristiques fonctionnelles dans les séquences protéiques235
Détermination expérimentale de structures protéiques236
Prédiction de structures protéiques240
Prédiction de structure secondaire242
Prédiction de la structure 3D248
En résumé : un projet de modélisation de protéine252
Conclusion256
11. Outils pour la génomique et la prétéomique259
Du séquençage des gènes au séquençage des génomes260
Accéder aux informations génomiques sur le Web266
L'annotation et l'analyse de séquences de génomes complets269
Génomique fonctionnelle : les nouveaux défis de l'analyse de données272
Protéomique277
Les bases de données de voies métaboliques281
Modélisation de la cinétique et de la physiologie284
Résumé286
IV. Bases de données et visualisation289
12. Automatisation de l'analyse des données avec Perl291
Pourquoi Perl ?291
Les bases de Perl292
Recherche de motif et expressions régulières298
Traiter une sortie de BLAST en utilisant Perl299
Utiliser Perl en bioinformatique304
LWP306
13. Construire des bases de données biologiques309
Différents types de bases de données309
Logiciels pour les SGBD315
Introduction à SQL317
Installer le système de gestion de base de données MySQL322
Conception de la base de données326
Développer un programme web pour interagir avec des bases de données330
14. Visualisation et fouille de données337
Préparer les données337
Affichage de documents graphiques338
Visualisation de séquences339
Visualisation des réseaux et voies métaboliques342
Travailler avec des données numériques343
Visualisation : récapitulation349
Fouille de données et information biologique350
Bibliographie355
Unix355
Administration Système355
Perl356
Références générales356
Bioinformatique356
Biologie moléculaire - Biologie357
Structure des protéines et Biophysique357
Génomique357
Biotechnologie357
Bases de données358
Visualisation358
Fouille de données358
Index361