Inhoudsopgave
Snelle samenvatting
CRISP-DM (Cross-Industry Standard Process for Data Mining) is een procesmodel met zes fasen dat de volledige levenscyclus van een data science-project beschrijft: van businessbegrip tot en met uitrol. Gepubliceerd in 1999, is het sindsdien uitgegroeid tot de meest gebruikte methodologie voor data science-projecten wereldwijd. De meerwaarde voor moderne organisaties zit niet in het model zelf, maar in wat het voorkomt: projecten die technisch kloppen maar businessmatig nergens naartoe leiden.
Kernpunten:
- CRISP-DM bestaat uit zes fasen: businessbegrip, databegrip, datavoorbereiding, modellering, evaluatie en uitrol.
- Volgens ScienceDirect (Procedia Computer Science, 2021) is het model de de facto standaard voor data mining-projecten, onafhankelijk van sector of tool.
- De Europese AI Act (van kracht per 1 augustus 2024) stelt eisen aan datakwaliteit die nauw aansluiten op de CRISP-DM-fasen voor datavoorbereiding en -governance.
- Teams die CRISP-DM combineren met agile projectmanagement behalen in de praktijk de beste resultaten.
- Twentynext hanteert CRISP-DM als leidend procesmodel, juist omdat het de businessvraag centraal stelt en niet de technologie.
Introductie (Copilot implementatie)
Stel je een data manager voor bij een middelgrote productiefaciliteit. Het bedrijf besluit te investeren in een voorspellend onderhoudsmodel. Een extern bureau levert na drie maanden een model op met een technisch indrukwekkende nauwkeurigheid. Maar bij implementatie blijkt dat de onderhoudsplanners de output niet begrijpen, de data uit het productiesysteem niet consistent is aangesloten, en de businessvraag onderweg van richting is veranderd. Het model belandt in een la.

Dit scenario herhaalt zich bij talloze organisaties. Niet omdat de Data Science ontbreekt, maar omdat het projectproces onvoldoende gestructureerd is. Hier ligt de werkelijke meerwaarde van CRISP-DM: het dwingt teams om vóór de eerste datastap de businessdoelstelling helder te definiëren, en om na de laatste modelstap terug te kijken of die doelstelling ook echt is behaald.
Twentynext past CRISP-DM toe als procesruggengraat voor data science-trajecten, juist omdat het model businessvraag en technische uitvoering aan elkaar koppelt. Naarmate organisaties ook generatieve AI willen inzetten, wordt die koppeling alleen maar belangrijker: een AI-toepassing zonder heldere businesscontext is een kostbare demonstratie, geen duurzame oplossing. Zie ook hoe besluitvorming op basis van data structureel misloopt zonder deze koppeling.
Dit artikel is gegenereerd met LaunchMind — probeer het gratis
Start nuWaarom businessbegrip de meest onderschatte fase is (Services)
De eerste CRISP-DM-fase, businessbegrip, bepaalt de kwaliteit van alles wat daarna komt. Toch is dit de fase die teams het vaakst overslaan of afraffelen.

De valkuil van de verkeerde vraag
Een operationsmanager bij een logistiek bedrijf vraagt om een model dat levertijden voorspelt. Prima. Maar wat is het doel achter die voorspelling? Klanten proactief informeren? Personeelsplanning optimaliseren? Boetes bij overschrijding vermijden? De keuze bepaalt welke data relevant is, welke nauwkeurigheidsdrempel acceptabel is, en hoe de output in bestaande processen wordt opgenomen. CRISP-DM verplicht dit gesprek vóór de eerste datastap.
Zoals Data Science PM het formuleert: een goed project begint met een grondig begrip van wat de klant daadwerkelijk wil bereiken. Dat klinkt voor de hand liggend, maar in de praktijk gaan teams vaak direct naar de data zodra er voldoende toegang is.
Businesscriteria als toetssteen voor het eindresultaat
CRISP-DM vraagt in de eerste fase ook om het vastleggen van meetbare businesscriteria. Dat zijn geen technische metrics zoals AUC of RMSE, maar criteria als: hoe groot mag de foutmarge zijn voordat een beslissing in de praktijk onjuist uitvalt? Welke KPI's veranderen als het model werkt? Dit voorkomt dat het projectteam technisch succes viert terwijl de businesswaarde uitblijft.
Twentynext ziet dit patroon vaak terugkomen bij organisaties die voor het eerst met Data Science aan de slag gaan: de focus ligt op de technologie, niet op de businessuitdaging. Door CRISP-DM systematisch te volgen, wordt die volgorde omgekeerd.
Zelf aan de slag:
- Formuleer de businessvraag in één zin zonder technische termen. Lukt dat niet, dan is de vraag nog niet scherp genoeg.
- Benoem minimaal twee meetbare succescriteria die in businesstaal uitdrukbaar zijn, niet in modelprestaties.
- Controleer of alle betrokken stakeholders het eens zijn over de definitie van succes vóór de eerste datastap wordt gezet.
- Leg vast welke beslissing in de organisatie verandert als het model werkt. Ontbreekt die beslissing, stop dan het project.
Datavoorbereiding: de fase die het meeste tijd kost en de minste aandacht krijgt
In de praktijk besteedt een data scientist bij de meeste organisaties doorgaans meer dan de helft van de projecttijd aan het verzamelen, opschonen en transformeren van data. Toch is datavoorbereiding de fase die in projectplanningen systematisch wordt onderschat.
Data zit zelden waar je denkt
Een typisch scenario: een BI-manager bij een zakelijke dienstverlener wil klantgedrag analyseren over de afgelopen drie jaar. De data blijkt verspreid over een CRM-systeem, een facturatieplatform en meerdere Excel-overzichten die door accountmanagers worden bijgehouden. Alleen al het samenvoegen van deze bronnen kost weken, en de kwaliteitsverschillen tussen systemen vereisen uitgebreide validatie.
CRISP-DM maakt dit zichtbaar in de databegripfase en stuurt het team terug naar de businessfase als de datakwaliteit de gestelde businesscriteria niet haalt. Dat is geen zwakte van het model, maar een sterkte: beter een project herzien dan een model bouwen op onbetrouwbare data.
De link met de EU AI Act
Dit aspect wordt actueler nu de EU AI Act (Verordening (EU) 2024/1689) van kracht is. Artikel 10 van de AI Act verplicht aanbieders van hoog-risico AI-systemen te werken met hoogwaardige datasets voor training, validatie en testen. De vereiste aandacht voor dataverzamelingsprocessen, datavoorbereiding en mogelijke vooroordelen in de data sluit direct aan op de CRISP-DM-fasen voor databegrip en datavoorbereiding. Wie CRISP-DM consequent toepast, legt daarmee automatisch een dossier aan dat aansluit op wat toezichthouders straks verwachten.
Zelf aan de slag:
- Breng alle databronnen in kaart vóór de modellering start. Gebruik een eenvoudige inventarisatietabel met bron, formaat, eigenaar en updatefrequentie.
- Definieer per databron een minimale kwaliteitsdrempel: hoeveel ontbrekende waarden zijn acceptabel?
- Leg transformaties en samenvoegstappen vast in een datawoordenboek. Dit versnelt latere iteraties en vereenvoudigt auditbaarheid.
- Vergelijk de beschikbare dataperiode met de tijdshorizon van de businessvraag. Een model op twee jaar data dat beslissingen over vijf jaar moet ondersteunen, bevat altijd een aanname die uitgelegd moet worden.
Evaluatie en uitrol: het zwakste punt van de meeste data science-projecten
Een systematische literatuurstudie gepubliceerd in Procedia Computer Science (2021) concludeert dat de meeste gepubliceerde CRISP-DM-studies geen uitrolfase bevatten. Dat is veelzeggend: de gemeenschap die CRISP-DM het meest gebruikt, slaat structureel de laatste stap over.

Een model zonder uitrol heeft geen businesswaarde
Het evaluatiemoment in CRISP-DM is bewust tweelaags: eerst technische modelevaluatie (klopt het model statistisch?), dan businessevaluatie (lost het model de oorspronkelijke businessvraag op?). Die twee vragen hebben verschillende antwoorden. Een model kan technisch uitstekend presteren en toch de verkeerde businessvraag beantwoorden, of de output kan zodanig zijn gepresenteerd dat gebruikers hem niet kunnen toepassen.
Twentynext legt bij trajecten voor klanten nadrukkelijk de koppeling tussen evaluatie en uitrol. Meer informatie over hoe Twentynext data science-projecten aanpakt is beschikbaar via de projectenpagina. De uitvraag naar eindgebruikers staat daarin centraal: hoe komt de modeluitkomst in het werkproces terecht? Wie neemt op basis van de output een beslissing? Hoe wordt het model onderhouden als de onderliggende data verandert?
CRISP-DM als cyclisch model, niet als eindpunt
Een cruciaal kenmerk van CRISP-DM is de cyclische opzet. Na uitrol begint het proces opnieuw: de geleerde lessen over data, aannames en gebruikersgedrag voeden de volgende iteratie. Dit maakt het model bijzonder geschikt voor AI-toepassingen waarbij het model periodiek opnieuw getraind moet worden op nieuwe data.
Voor klanten in de Brainport-regio die werken met complexe productiedata of kennisintensieve processen, past Twentynext dit cyclische principe toe door na de eerste uitrolronde een evaluatiemoment in te bouwen met de eindgebruikers, niet alleen met de IT-afdeling.
Zelf aan de slag:
- Plan de businessevaluatie apart van de technische modelevaluatie. Betrek een domeinexpert die de businesscriteria uit fase 1 kan toetsen aan de modeluitkomst.
- Documenteer minimaal drie concrete gebruikssituaties: wie gebruikt de output, wanneer, en welke actie volgt erop?
- Stel bij uitrol een monitoringfrequentie in. Bij de meeste voorspellende modellen is een kwartaalreview een bruikbaar startpunt, afhankelijk van hoe snel de onderliggende data verandert.
- Gebruik de terugkoppeling van eindgebruikers in de eerste zes weken na uitrol als input voor de tweede CRISP-DM-cyclus.
CRISP-DM versus andere aanpakken: wat past wanneer?
| Kenmerk | CRISP-DM | SEMMA (SAS) | KDD | Agile Data Science |
|---|---|---|---|---|
| Startpunt | Businessvraag | Modelering | Data-exploratie | Sprint planning |
| Businessfocus | Hoog (fase 1 verplicht) | Laag (start bij data) | Laag (academisch) | Variabel |
| Iteratiemogelijkheid | Ingebouwd cyclisch | Beperkt | Beperkt | Hoog |
| Geschikt voor AI Act-compliance | Ja (audit trail) | Gedeeltelijk | Nee | Afhankelijk van invulling |
| Teamgrootte | Klein tot middelgroot | Klein | Klein | Middelgroot tot groot |
| Adoptiedrempel | Laag | Laag (toolgebonden) | Hoog | Middelgroot |
CRISP-DM heeft niet de meest formele projectmanagementstructuur: het model gaat er impliciet van uit dat een klein, hecht team samenwerkt. Voor grotere teams adviseren practitioners om CRISP-DM te combineren met een agile coördinatiemethodiek, zoals scrum of kanban. Die combinatie, een gedeeld iteratiritme met de inhoudelijke diepgang van CRISP-DM, levert in de praktijk de meest betrouwbare resultaten op.
Praktijkvoorbeeld: CRISP-DM bij een generatieve AI-implementatie
Stel je een IT-manager voor bij een middelgrote zakelijke dienstverlener met een team van ongeveer 150 medewerkers. Het bedrijf wil generatieve AI inzetten om contractanalyse te versnellen. De wens is helder: juridische medewerkers moeten sneller door contracten heen kunnen. Maar wat betekent sneller? Welke risico's moeten het model identificeren? Welke uitkomst is onacceptabel?

Zonder CRISP-DM start een team hier direct met het selecteren van een taalmodel en het verzamelen van contracten. Met CRISP-DM begint het team met een gestructureerde sessie rondom businessbegrip: welke beslissing wordt versneld, wat is de acceptabele foutmarge bij een gemiste risicoclausule, en hoe wordt de uitkomst in het werkproces opgenomen?
De databegripfase onthult dat contracten in drie formaten aanwezig zijn, waarvan één alleen als scan beschikbaar is. De datavoorbereiding omvat daarmee ook een OCR-stap die in de tijdlijn niet was voorzien. De evaluatiefase met juridische eindgebruikers laat zien dat de samenvatting bruikbaar is, maar dat de risico-indeling een extra validatielaag vraagt voordat een medewerker er op vertrouwt.
Dit is precies de meerwaarde die Twentynext ziet bij AI-implementaties die via CRISP-DM verlopen: de structuur dwingt realistisch plannen en voorkomt dat een technisch werkend systeem in de praktijk niet wordt gebruikt. Voor organisaties die zich oriënteren op een eerste AI-implementatie biedt de aanpak van Twentynext voor AI-implementaties een startpunt dat businessvraag en techniek van meet af aan verbindt.
In Nederland gebruikte in 2024 doorgaans meer dan één op de vijf bedrijven met tien of meer medewerkers al minstens één vorm van AI-technologie, zo blijkt uit CBS-data. Dat maakt een gestructureerde implementatieaanpak niet optioneel, maar noodzakelijk om AI-investeringen daadwerkelijk te laten renderen.
Belangrijkste inzichten
CRISP-DM voegt drie concrete dingen toe aan moderne data science-projecten:
- Richting vóór uitvoering. Door de businessvraag als verplicht startpunt te hanteren, voorkomt CRISP-DM dat teams maanden werken aan een model dat het verkeerde probleem oplost.
- Traceerbaarheid. Elke fase produceert gedocumenteerde beslissingen. Dat maakt projecten herhaalbaar, auditeerbaar en beter aanpasbaar als de businesscontext verandert.
- Een realistisch uitrolplan. De uitrolfase dwingt teams na te denken over wie de output gebruikt, hoe, en wat er moet gebeuren als het model wordt bijgesteld.
Voor senior professionals die meer willen weten over carrièremogelijkheden rondom deze methodiek, is het relevant te lezen waarom data engineers voor een gespecialiseerd bureau als Twentynext kiezen boven een grote organisatie: de CRISP-DM-aanpak biedt structuur én ruimte voor methodische groei.
Veelgestelde vragen
Wat zijn de zes fasen van CRISP-DM?
CRISP-DM beschrijft zes opeenvolgende en iteratieve fasen: businessbegrip, databegrip, datavoorbereiding, modellering, evaluatie en uitrol. De fasen zijn niet strikt lineair: teams keren regelmatig terug naar eerdere stappen zodra nieuwe inzichten dat vereisen. Dit cyclische karakter maakt het model geschikt voor zowel klassieke data mining als moderne machine learning- en AI-projecten.
Waarom is CRISP-DM nog relevant nu generatieve AI opkomt?
Generatieve AI vergroot de behoefte aan structuur in plaats van deze te verkleinen. Grotere modellen vergen hogere datakwaliteit, duidelijkere businesscriteria en een doordacht uitrolplan. De EU AI Act stelt bovendien expliciete eisen aan datakwaliteit en governance voor hoog-risico AI-systemen, eisen die direct aansluiten op de datavoorbereidings- en evaluatiefasen van CRISP-DM. Wie zonder gestructureerde aanpak een generatief AI-systeem implementeert, loopt zowel kwaliteits- als compliancerisico.
Hoe past Twentynext CRISP-DM toe in data science-projecten?
Twentynext hanteert CRISP-DM als procesruggengraat bij data science- en AI-implementaties, met als aanpassing dat de businessbegripfase altijd samen met de klant wordt doorlopen, niet alleen door het technische team. Dit voorkomt dat projecten starten vanuit beschikbare technologie in plaats van vanuit de businessuitdaging. Klanten in Brainport en andere regio's profiteren van deze aanpak doordat het eindresultaat aansluit op bestaande processen en besluitvormingsstructuren.
Wat zijn de bekendste beperkingen van CRISP-DM?
De voornaamste beperking van CRISP-DM is dat het geen volwaardig projectmanagementmodel is: het gaat impliciet uit van een klein, hecht team en biedt geen rolverdeling of coördinatiemechanisme voor grotere projecten. Practitioners raden daarom aan CRISP-DM te combineren met een agile aanpak zoals scrum of kanban. Een tweede beperking is dat het model geen expliciete aandacht besteedt aan ethiek, bias en privacy, thema's die bij AI-toepassingen inmiddels verplicht onderdeel zijn van het projectproces.
Hoe verschilt CRISP-DM van SEMMA en KDD?
SEMMA (ontwikkeld door SAS) start direct bij de data en richt zich vooral op modelbouw, waardoor de businesscontext minder centraal staat. KDD (Knowledge Discovery in Databases) is meer academisch van aard en richt zich op het ontdekken van patronen zonder expliciet de link te leggen met vooraf gedefinieerde businessdoelstellingen. CRISP-DM onderscheidt zich doordat het de businessvraag als verplicht startpunt hanteert, waardoor technische uitkomsten altijd worden getoetst aan een vooraf vastgesteld businesscriterium.
Conclusie
CRISP-DM is geen garantie voor een succesvol data science-project. Het is een procesmodel dat de kans op succes vergroot door de juiste vragen op het juiste moment te stellen. Dat is een nuance die ertoe doet: wie het model als checklist behandelt, haalt er minder uit dan wie het als denkraamwerk gebruikt.
Voor organisaties die AI willen implementeren, niet alleen experimenteren, biedt CRISP-DM een structuur die zowel businesswaarde als compliance ondersteunt. De combinatie van een heldere businessfase, gedocumenteerde datapreparatie en een concrete uitrolstap maakt projecten herhaalbaar en toetsbaar, precies wat toezichthouders en interne stakeholders verwachten.
Twentynext past dit model consequent toe, voor klanten in Brainport en daarbuiten, omdat de ervaring leert dat structuur in het projectproces betere resultaten oplevert dan de snelste route naar het eerste model.
Bronnen
- meest gebruikte methodologie voor data science-projecten — Datascience-pm
- ScienceDirect (Procedia Computer Science, 2021) — Sciencedirect
- EU AI Act (Verordening (EU) 2024/1689) — Digital-strategy
- CBS-data — Cbs
- What is CRISP DM? — Data Science PM
- A Systematic Literature Review on Applying CRISP-DM Process Model — ScienceDirect (Procedia Computer Science)
- AI Act | Shaping Europe's digital future — Europese Commissie (digital-strategy.ec.europa.eu)
- Increasing use of AI by business — CBS (Centraal Bureau voor de Statistiek)


