Data mining et statistique décisionnelle : la science des données

Auteur(s) :

Tufféry, Stéphane (1965-....) Découvrir l'auteur

Résumé

L'ouvrage couvre l'essentiel des connaissances pour comprendre et appliquer les techniques du data mining et de la statistique décisionnelle. Il présente les méthodes classiques (analyse factorielle, régression linéaire, arbres de décision, etc.) ainsi que les plus récentes (régressions robustes, réseaux de neurones, etc.), et aborde l'exploration, le contrôle et la préparation des données. ©Electre 2017

Contributeur(s)
- Saporta, Gilbert. Préfacier, etc.
Éditeur(s)
- Éditions Technip
Date
- DL 2017
Notes
- La couv. porte en plus : "Apprentissage statistique, arbres de décision, classification, data science, exploration des données, machine learning, modèles linéaires, régression logistique, règles d'associations, réseaux de neurones, text mining"
Langues
- Français
Description matérielle
- 1 vol. (XX-913 p.) : ill., graph., tabl.; ; 24 cm
Sujet(s)
ISBN
- 978-2-7108-1180-0
Indice
- 681.4 Systèmes d'exploitation
Quatrième de couverture
- Data Mining et Statistique décisionnelle
  La science des données
  Cinquième édition
  Le data mining et la data science sont de plus en plus répandus dans les entreprises et les organisations soucieuses d'extraire l'information pertinente de leurs bases de données, qu'elles peuvent utiliser pour expliquer et prévoir les phénomènes qui les concernent (risques, production, consommation, fidélisation...).
  Cette cinquième édition, actualisée et augmentée de 90 pages, fait le point sur le data mining, ses méthodes, ses outils et ses applications, qui vont du scoring jusqu'au text mining, objet d'un chapitre complètement remanié. Nombre de ses outils appartiennent à l'analyse des données et à la statistique « classiques » (analyse factorielle, classification automatique, analyse discriminante, régression logistique, modèles linéaires généralisés, régression pénalisée, régression clusterwise...) mais certains sont plus spécifiques au data mining, comme les réseaux de neurones, les algorithmes génétiques, les SVM, les arbres de décision, les forêts aléatoires, le boosting et la détection des règles d'associations. Les avancées les plus récentes du machine learning et les applications les plus actuelles des Big Data sont présentées, qui vont des algorithmes de reconnaissance d'image aux méthodes de plongement de mots en text mining. Les chapitres sur les réseaux de neurones et les SVM sont illustrés par la reconnaissance de l'écriture manuscrite.
  Ces outils sont disponibles dans des logiciels de plus en plus puissants et complets, à commencer par le logiciel libre R, que nous comparons en détail aux logiciels SAS et IBM SPSS dans un chapitre spécifique. Ces logiciels sont utilisés pour illustrer par des exemples précis les explications théoriques données.
  Les aspects méthodologiques vont de la conduite des projets jusqu'aux facteurs de réussite et aux pièges à éviter, en passant par l'évaluation et la comparaison des modèles, leur intégration dans les processus opérationnels. Un chapitre est consacré à une étude de cas complète de credit scoring, de l'exploration des données jusqu'à l'élaboration de la grille de score.
  « Ce livre très riche et agréable à lire, malgré sa technicité, est destiné aux statisticiens et praticiens du data mining, aux utilisateurs et gestionnaires de bases de données mais aussi à tous les décideurs et aux étudiants en sciences économiques. » (Bulletin APMEP, n° 462, janvier-février 2006)
  « Un manuel très clair et très complet. » (Revue de statistique appliquée, mars 2006)
  « A mix of high level coverage of general issues, deep discussions of methodology, and detailed explorations of particular application areas. » (David Hand, préface de l'édition anglaise, décembre 2010)
Origine de la notice:
- FR-751131015 ;
- Electre