Data Governance
Big data, 4 redenen waarom minder meer is Laatst bijgewerkt: 10 mei 2016

In mijn gesprekken met bedrijven over hun datastrategie begint me meer en meer op te vallen dat zich een onbegrensde verzamelwoede meester heeft gemaakt van veel organisaties. Onder het motto ‘meer is beter’ worden alle gegevens die maar enigszins relevant lijken te zijn, verzameld en bewaard. Want stel je voor dat je wat mist dat je later nodig hebt! Opslag van data kost ook amper iets meer, dus waarom weggooien als ik het kan opslaan op een goedkoop Hadoop cluster in een mooi data lake? Heb ik het later nodig, dan vis ik het er dan weer uit.

Klinkt logisch toch?

Laat me je overtuigen van het tegendeel. Ik pleit er namelijk voor om minder data op te slaan. Uiteindelijk zal dat je namelijk veel meer opleveren. Minder data opslaan is verstandiger, goedkoper, veiliger en waardevoller!

Data explosie

Steeds meer bedrijven realiseren zich dat informatie hun belangrijkste bezit is. Hoe meer data we verzamelen, hoe meer we kunnen leren van de verbanden en trends in die data. Zo begrijpen we bijvoorbeeld steeds beter het gedrag van onze klanten zodat we beter op dat gedrag kunnen inspelen, wat goed is voor zowel de klant als ons. Als wij dat niet doen, dan doet de concurrent het wel. Een logische redenering op het eerste gezicht. Veel organisaties waar ik mee spreek, hanteren deze aanpak, maar hebben vaak nog geen enkel idee wat ze met al die data willen gaan doen. Ze verzamelen alles wat los en vast zit, in de hoop dat die data in de toekomst van grote waarde zal zijn. De hype rondom big data, de opkomst van cloud platformen en de lage prijzen van opslagcapaciteit wakkeren de verzamelwoede nog verder aan. Het is immers gemakkelijker en goedkoper dan ooit om data te verzamelen. Niet alleen data van binnen de organisatie, maar ook steeds meer informatie uit externe gegevensbronnen (denk ook aan open data). En het houdt niet op. Met de opkomst van het internet of things gaan de hoeveelheden beschikbare data nog veel explosiever toenemen.

 

Big data

     Bron: IDC 2014  

We verdrinken

In de praktijk zie ik echter dat bedrijven uiteindelijk maar een zeer beperkt deel van hun gegevensverzameling nuttig gebruiken en vooral veel tijd en geld besteden aan het verzamelen, bewerken, opslaan en beheren van de enorme hoeveelheid gegevens. Soms krijg je het gevoel dat ze aan het verdrinken zijn in hun data. En dat gaat dus de komende jaren alleen maar erger worden! Het lijkt eerlijk gezegd nogal op die mensen met een ziekelijke verzameldrift die we allemaal weleens op de televisie hebben gezien. Ze leven midden in een berg – voornamelijk nutteloze – rommel waardoor ze de spullen die er echt toe doen niet meer kunnen vinden.

Strenge wetgeving

Alles verzamelen wat je denkt ooit nodig te hebben, is niet alleen zonde van je tijd en geld, het is zelfs risicovol. Veel organisaties zijn zich nog veel te weinig bewust van de – bestaande en toekomstige – wetgeving m.b.t. het verzamelen van gegevens. Met name als het gaat om persoonsgegevens en privacygevoelige informatie. Terwijl recente schandalen, waarbij gevoelige informatie op straat kwam te liggen, ons toch met de neus op de feiten hebben gedrukt. Het verzamelen van gegevens brengt een enorme verantwoordelijkheid met zich mee richting je klanten én je stakeholders! Het is niet voor niets dat de overheid steeds strenger wordt. Per 1 januari 2016 is de wet bescherming persoonsgegevens (wbp) aangepast. Er is een meldplicht bij datalekken opgenomen in de wet en de boetebevoegdheden van het CBP zijn aanzienlijk uitgebreid. Bovendien is in april 2016 de nieuwe General Data Protection Regulation (GDPR) aangenomen door het Europese parlement. Europese wetgeving die de regels overzichtelijker maakt, maar ook veel strenger gaat toezien op de privacy van burgers.

Meer informatie over de GDPR en de ingangsdata vind je hier.

Veranderingen

De GDPR wordt toegepast vanaf mei 2018. Bedrijven hebben dus nog twee jaar om de benodigde aanpassingen door te voeren met betrekking tot technologie, processen en medewerkers. En die aanpassingen zullen aanzienlijk zijn, want de GDPT introduceert een aantal grote veranderingen:

  • Boetes bij overtreding kunnen oplopen tot 4% van de omzet, tot een maximum van € 20 mljn
  • Datalekken moeten binnen 72 uur gerapporteerd worden (in Nederland is dit nu al zo)
  • Publieke organisaties en bedrijven die op grote schaal persoonlijke data verzamelen, zijn verplicht een data protection officer in dienst te hebben
  • Privacy requirements moeten onderdeel zijn van de ontwikkeling van nieuwe producten en diensten
  • Burgers krijgen specifieke nieuwe rechten zoals “the right to be forgotten” en “right to data portability”

Meer informatie over de gevolgen van de GDPR vind je hier.

Smart data

Minder is dus inderdaad beter! In alle opzichten. Het is verstandiger: je focust op de dingen die er toe doen en minimaliseert complexiteit. Het is goedkoper: het scheelt je een boel werk. Het is veiliger: wat je niet hebt, kun je niet kwijtraken of verkeerd gebruiken. En het is waardevoller: meer (bedrijfs)resultaat met minder data. Slim bedenken welke data je verzamelt en die data slim inzetten, dat is waar het om gaat. Ik noem dat een ‘smart data strategie’. Eerst goed nadenken over de vragen die voor jouw business van belang zijn en over de impact van wet- en regelgeving op jouw situatie. Kijk daarbij ook goed naar de houdbaarheidsdatum van je gegevens: wanneer is data niet meer correct of relevant? Pas als je dat allemaal in beeld hebt, kun je bepalen welke data je wilt verzamelen en analyseren om antwoorden te geven op de vragen die voor jouw van belang zijn. Ben je bezig of van plan een smart data strategie uit te werken? Denk dan aan de volgende zaken:

  • Maak onderscheid tussen data met en data zonder persoonsgegevens
  • Let op! Gegevens die nu anoniem zijn, kunnen later (in combinatie) weer persoonsgegevens worden
  • Bedenk dat toestemming tot verwerken van gegevens later weer ingetrokken kan worden
  • Weet altijd welke data er waar gebruikt wordt binnen je organisatie en zorg dat het gebruik van databronnen rechtmatig is
  • Voer een ‘need to know’ beleid
  • Wees transparant. Vertel je klanten wat je met hun gegevens doet en gaat doen
  • Houd je aan de wet en zet de waarborg van de rechten van alle betrokkenen voorop, de opportunities die de data bieden komen pas daarna!

In mijn volgende blog post zal ik verder ingaan op een hieraan gerelateerd onderwerp: data governance in de wereld van big data en self service analytics. Denk jij ondertussen na hoe je zorgt dat je niet verdrinkt in jouw big data?


Whitepaper
DOWNLOAD