Data Science als containerbegrip 

25 januari 2022 | Kristian Cörvers

Een van de meeste vragen die ik krijg van mensen om mij heen is:
"Wat doe jij nou precies?"

Als ik dan vertel dat ik Data Scientist ben, blijft het voor velen vaak nog steeds een vaag begrip. Voor de mensen om mij heen snap ik dat, maar in het bedrijfsleven merk ik dat de term "Data Science" gebruikt wordt voor vrijwel alles wat met data te maken heeft.

Door de groeiende populariteit van (big) data worden alle termen te pas en te onpas gebruikt wat veel onduidelijkheid wekt. Dit leidt tot verwarrende omschrijvingen in (externe) aanvragen, waardoor het vaak niet duidelijk is naar welk rol of welk specialisme de klant op zoek is. Waar het meest naar gezocht wordt zijn vooral Data Scientists, Data Engineers en BI Specialisten, maar worden vaak niet juist benoemd.

Een Data Engineer is bijvoorbeeld verantwoordelijk voor het verzamelen, verwerken en bovenal ervoor zorgen dat de data bruikbaar wordt. Dit is een hele belangrijke rol, want zonder goede data, geen goede analyses.

Zodra de data eenmaal beschikbaar is, komt de BI Specialist aan bod. Deze maakt de data inzichtelijk door middel van Dashboards die voornamelijk KPI’s monitoren, zodat het bedrijf te allen tijde inzage heeft hoe het bedrijf ervoor staat. In mijn optiek moet ieder bedrijf hiermee beginnen alvorens ze met Data Science aan de slag gaan.

Een Data Scientist gaat vervolgens verder dan dat. Wat meestal wordt verstaan onder Data Science is dat het om Artificial Intelligence (AI) gaat. Een verzamelnaam wat erg populair is geworden. Het behoort zeker bij Data Science, alleen is het maar een relatief onderdeel hiervan. Een Data Scientist probeert in essentie zoveel mogelijk impact te creëren met behulp van data. Dit kan dus echt van alles zijn! Zo’n 80% van de tijd gaat zitten in het verzamelen van data, opschonen van data, data inzichtelijk maken met bijvoorbeeld visualisaties om vervolgens dit allemaal te vertalen naar de business. De overige 20% wordt besteed aan het ontwikkelen en testen van voorspel- en of beschrijvende- modellen.

Er zit dus wel degelijk een verschil in de rollen binnen het data landschap. Her en der is er ook zeker overlapping, maar ieder heeft zijn eigen specialisme. Ze hebben elkaar nodig en vullen elkaar aan. Het is dus belangrijk om goed na te denken over welke specialisme of rol je als bedrijf op zoek bent, om zo de juiste match van vraag en aanbod te realiseren.