Der branchenübergreifende Standardprozess für Data Mining ( CRISP-DM ) ist ein Data Mining- Prozessmodell, das einen häufig verwendeten Ansatz zur Lösung von Domänenproblemen beschreibt .
Umfragen aus den Jahren 2002, 2004, 2007, 2014 und 2020 zeigen, dass dies die Hauptmethode von Data Minern ist. Diese Methode wurde von einem Konsortium aus den Unternehmen NCR, SPSS und Daimler-Benz entwickelt. Der Prozess definiert eine Hierarchie, die aus Hauptphasen, allgemeinen Aufgaben, speziellen Aufgaben und Prozessinstanzen besteht.
CRISP-DM unterteilt den Data Mining- Prozess in sechs Hauptphasen:
Die CRISP-DM-Methode wurde 1996 entwickelt. 1997 wurde sie als EU-Projekt entwickelt, das vom ESPRIT- Programm finanziert wurde . Das Projekt wird von vier Unternehmen geleitet: ISL, NCR Corporation , Daimler-Benz und OHRA. Dieser Kern des Konsortiums bringt unterschiedliche Erfahrungen in das Projekt ein: ISL, das später erworben und in SPSS Inc. integriert wurde, produziert seine gleichnamigen Predictive Analysis-Softwarepakete, die jetzt in die IBM-Gruppe integriert sind. Der Computergigant NCR Corporation gründete die auf Data Warehouses spezialisierte Division Teradata und ein eigenes Data Mining-Softwarepaket. Daimler-Benz hatte ein großes Team von Data Minern. OHRA , eine Versicherungsgesellschaft, hatte gerade damit begonnen, das Potenzial für den Einsatz von Data Mining zu untersuchen.
Die erste Version der Methode wurde 1999 unter der Versionsnummer CRISP-DM 1.0 veröffentlicht.
Im Juli 2006Das Konsortium kündigt an, an einer zweiten Version von CRISP-DM zu arbeiten. Das26. September 2006CRISP-DM SIG trifft sich, um Verbesserungen für CRISP-DM 2.0 und die daraus resultierende Roadmap zu besprechen. Schon seit22. Juni 2011Die Website leitet zu einer Seite auf der IBM Site weiter, die SPSS gewidmet ist.