Branchenübergreifender Standardprozess für Data Mining

Der branchenübergreifende Standardprozess für Data Mining ( CRISP-DM ) ist ein Data Mining- Prozessmodell, das einen häufig verwendeten Ansatz zur Lösung von Domänenproblemen beschreibt .

Umfragen aus den Jahren 2002, 2004, 2007, 2014 und 2020 zeigen, dass dies die Hauptmethode von Data Minern ist. Diese Methode wurde von einem Konsortium aus den Unternehmen NCR, SPSS und Daimler-Benz entwickelt. Der Prozess definiert eine Hierarchie, die aus Hauptphasen, allgemeinen Aufgaben, speziellen Aufgaben und Prozessinstanzen besteht.

Hauptphasen

CRISP-DM unterteilt den Data Mining- Prozess in sechs Hauptphasen:

Geschichte

Die CRISP-DM-Methode wurde 1996 entwickelt. 1997 wurde sie als EU-Projekt entwickelt, das vom ESPRIT- Programm finanziert wurde . Das Projekt wird von vier Unternehmen geleitet: ISL, NCR Corporation , Daimler-Benz und OHRA. Dieser Kern des Konsortiums bringt unterschiedliche Erfahrungen in das Projekt ein: ISL, das später erworben und in SPSS Inc. integriert wurde, produziert seine gleichnamigen Predictive Analysis-Softwarepakete, die jetzt in die IBM-Gruppe integriert sind. Der Computergigant NCR Corporation gründete die auf Data Warehouses spezialisierte Division Teradata und ein eigenes Data Mining-Softwarepaket. Daimler-Benz hatte ein großes Team von Data Minern. OHRA , eine Versicherungsgesellschaft, hatte gerade damit begonnen, das Potenzial für den Einsatz von Data Mining zu untersuchen.

Die erste Version der Methode wurde 1999 unter der Versionsnummer CRISP-DM 1.0 veröffentlicht.

CRISP-DM 2.0

Im Juli 2006Das Konsortium kündigt an, an einer zweiten Version von CRISP-DM zu arbeiten. Das26. September 2006CRISP-DM SIG trifft sich, um Verbesserungen für CRISP-DM 2.0 und die daraus resultierende Roadmap zu besprechen. Schon seit22. Juni 2011Die Website leitet zu einer Seite auf der IBM Site weiter, die SPSS gewidmet ist.

Leistungen

Anmerkungen

Externe Links

Verweise

  1. (in) C. Shearer, "  Das CRISP-DM-Modell: die neue Blaupause für Data Mining  " ( ArchivWikiwixArchiv.isGoogle • Was zu tun ist ) [PDF] (abgerufen am 9. April 2013 ) . J Data Warehousing 2000; 5: 13-22.
  2. Gregory Piatetsky-Shapiro (2002) Umfrage zur KDnuggets-Methodik
  3. Gregory Piatetsky-Shapiro (2004) Umfrage zur KDnuggets-Methodik
  4. Gregory Piatetsky-Shapiro (2007) Umfrage zur KDnuggets-Methodik
  5. (en-US) "  CRISP-DM, immer noch die Top-Methode für Analytics-, Data Mining- oder Data Science-Projekte  " , auf KDnuggets (abgerufen am 21. April 2021 )
  6. (en-US) Jeff Saltz , „  CRISP-DM ist nach wie vor das beliebteste Framework für die Ausführung von Data Science-Projekten  “ , zum Thema Data Science-Projektmanagement ,30. November 2020(abgerufen am 21. April 2021 )
  7. Robert Nisbet, John Elder, Gary Miner Handbuch für statistische Analysen und Data Mining-Anwendungen (Academic Press) Seite 35
  8. (in) Gavin Harper , "  Methoden für Data Mining HTS  " , Drug Discov. Heute , vol.  11, n os  15-16,August 2006, p.  694-699 ( PMID  16846796 , DOI  10.1016 / j.drudis.2006.06.006 , online lesen ).
  9. „  CRISP-DM 1.0  “ ( ArchivWikiwixArchive.isGoogle • Was ist zu tun? ) (Zugriff am 9. April 2013 ) .
  10. „  CRISP-DM SIG  “ ( ArchivWikiwixArchive.isGoogle • Was ist zu tun? ) (Zugriff am 9. April 2013 ) .
  11. „  KDD-Prozessmodell  “ ( ArchivWikiwixArchive.isGoogle • Was ist zu tun? ) (Zugriff am 9. April 2013 )