Smart Analytics
Waarom vertel je me niet wat ik wil weten? Laatst bijgewerkt: 22 september 2016

Jaren geleden studeerde ik af op een beslissingsondersteunend systeem voor de diagnose varkenspest, daarna werkte ik als usability expert bij een start-up die pushberichten stuurt op basis van je locatie en verdiepte ik me als product owner in alles over klantenservice en nu werk ik vanuit Kadenza als smart information consultant bij een bedrijf voor hypotheekadministratie. Mijn achtergrond maakt mij een vreemde eend in de bijt in de wereld van data warehouses, data vaults, ETL en tooling als PowerBI, Qlik en Tableau. Ik benader namelijk alles vanuit de bruikbaarheid voor de eindgebruiker vanuit principes uit cognitie en informatieverwerking. Gestalt theorie, besliskunde, gebruikersinterviews, prototyping, informatieontwerp en user testing. Sinds ik in de wereld van analyse en visualisatie werk, grijp ik nog steeds, met succes, terug op deze principes. Uiteindelijk verschillen website, software, webapplicaties en BI oplossingen immers niet zoveel van elkaar; het zijn allemaal digitale, beslissingsondersteunende systemen.

Graag daag ik daarom iedere BI professional uit om eens een paar boeken uit mijn boekenkast te lezen, want alleen zo ontstaat wat ik ‘human-centered BI’ noem. In deze eerste blog post over dat onderwerp introduceer ik daarom graag een oude bekende…

De DIKW-piramide

Ik kan me nog herinneren dat ik in één van mijn eerste colleges op de universiteit de DIKW-piramide (Data, Informatie, Kennis & Wijsheid) gepresenteerd kreeg; een nog steeds relevante kijk op informatieverwerking. De piramide is ook een prima kapstok voor human-centered design. De classificatie ‘data – informatie – kennis – wijsheid’ brengt data en eindgebruikers bij elkaar. Data kun je steeds een stapje verder verrijken, waardoor de informatiewaarde toeneemt en de data geschikt wordt voor verschillende soorten beslissingen. Tegelijkertijd neem je beslissingen over de verrijking van die data zelf, die de ruwe data kunnen vertroebelen of gevoelig maken voor misinterpretatie. Het blijft daarom altijd belangrijk om goed in de gaten te houden wat je aan het doen bent.

Blog Kadenza

De piramide toont je de basisbegrippen Data, Informatie, Kennis en Wijsheid met een schaal van verleden naar toekomst.

  • Data legt vast wat er gebeurd is, denk aan sensordata of webshopbestellingen
  • Informatie geeft organisatie en duiding aan data waardoor je inzicht krijgt waarom iets gebeurd is, denk aan een trendlijn of gemiddelden voor je webbestellingen uitgesplitst naar type klant
  • Kennis brengt de data van het verleden naar vandaag door context toe te voegen zodat je weet wat die informatie betekent voor jouw situatie, denk aan een benchmark van de verkoopcijfers met je concurrenten.
  • En wijsheid is The Holy Grail! Die brengt jou met je data naar de toekomst zodat je er op kunt acteren, met goede modellen kun je bijvoorbeeld scenario’s doorrekenen  of voorspellen wat de verwachte verkopen worden

Sinds mijn studie loop ik vooral rond tussen programmeurs (en Star Trek liefhebbers) die zich vooral druk maken over ruwe data en die analyse graag overlaten aan gebruikers en data scientists (meer over de definitie van een data scientist in deze blog post van Jasper de Vries) en die vinden dat kleurgebruik en visualisaties maar afleiden van de echte data. Ik vind dat ik als specialist juist gebruik moet maken van de enorme schat aan mogelijkheden die analyse- en visualisatietools mij bieden. Zodat ik écht iets kan bieden aan – de snel groeiende groep – mensen die behoefte hebben aan kennis, informatie & wijsheid op maat uit de ruwe data, op een manier die perfect aansluit bij hun denken en doen. Ik wil geen lijstjes en bestanden opleveren met daarin weliswaar de data om het antwoord op de vraag te vinden, maar niet het antwoord zelf. Ik wil het mijn ‘klant’ zo makkelijk mogelijk maken en hem ondersteunen bij de beslissingen die hij moet nemen. Ik wil niet onderaan de piramide staan kijken, maar ik wil helemaal naar de top!

Een simpel privé voorbeeld hoe de piramide werkt, waarmee je nog geld kunt verdienen ook!

Case: welke brandstof is het voordeligst?
Zelf liep ik laatst tegen de volgende situatie aan: mijn man en ik hebben afgelopen jaar afwisselend gewone en budget benzine getankt. Hij vroeg zich af welke variant nu voordeliger was en wat hij in het vervolg zou gaan tanken. De goedkope benzine kost weliswaar minder, maar misschien rij je er ook wel minder kilometers mee. En ja, wij zijn zo’n stel dat de tankbonnen bewaart en hierop de kilometerstand noteert. Want wij zijn dol op data en de wijsheid die dat oplevert!

Data

De ingeklopte tankbonnetjes: data
Oké, bonnetjes inkloppen dus. Dit levert een Excel sheet op met per rij de gegevens van één tankbeurt. In principe heb je hiermee alle data voorhanden om uit te zoeken welke benzine voordeliger is, maar werkt dat handig? Nee, niet echt. Kijk zelf maar, weet jij nu welke benzine je voortaan gaat tanken?

Blog usability Kadenza

Vind je het net als ik lastig om hier snel je antwoord in te vinden, dan is dat heel normaal. Er zijn namelijk nogal wat stappen te nemen om met deze data het antwoord te vinden.

Allereerst vraag je je af naar welk antwoord of getal je nu precies op zoek bent. Wat willen we eigenlijk weten? We willen weten welke benzine het voordeligst is, dus met welke benzine we zo goedkoop mogelijk zo ver mogelijk kunnen rijden. Met andere woorden: we willen de gemiddelde kosten per kilometer vergelijken voor de verschillende types brandstof.

Om dit te berekenen willen we per tankbeurt weten wat het verbruik is. Hoeveel kilometer is er gereden op die tank? Nu we erover nadenken zijn de kilometers van de ritstand die bij de tankbon horen, niet de kilometers die gereden zijn op de benzine die op die bon staat, maar op de benzine die op de vorige bon stond.

Verder willen we de data kunnen vertrouwen. Aangezien de tankbeurten van elkaars data afhankelijk zijn is het belangrijk om te zorgen dat er geen ongewenste effecten optreden. Als we een kilometerstand missen op een regel, hoe gaan we daar dan mee om? Als er tankbeurten lijken te missen tussen twee tankbeurten, dan moeten we dat ook goed afhandelen. Laten we dat eens verwerken in een nieuw overzicht. We voegen een kolom met het verbruik toe. Hiermee hebben we de data bewerkt en een eerste stap gezet naar informatie. Verder voegen we een check toe voor missende tankbeurten en lege velden.

Blog usability Kadenza

Weet jij nu welke benzine je voortaan gaat tanken? Nog steeds een lastige vraag, toch?

Informatie

Een vergelijking van de kosten per kilometer per brandstoftype: informatie
In plaats van jou zelf te laten zoeken, kan ik je ook het antwoord geven op je vraag door de data te aggregeren en alvast de gemiddelde kosten per kilometer uit te rekenen voor de types benzine.

 

Blog usability Kadenza

Euro 95 is dus blijkbaar net iets voordeliger dan de andere twee brandstoffen. Toch is die € 0,01 verschil niet heel overtuigend en ik geloof niet dat ik op basis daarvan mijn tankgedrag ga veranderen. Dus reken eens om, wat scheelt me dat ongeveer per jaar?

  • Op basis van de rijgegevens kunnen we berekenen hoeveel kilometers deze persoon per jaar rijdt en hiervoor de verschillen in brandstofkosten laten zien
  • We kunnen het aantal kilometer als variabel invoerveld toevoegen zodat deze persoon het zelf in kan voeren en de aantallen kan zien veranderen
  • We kunnen standaard het gemiddelde aantal kilometers per jaar scrapen van de website van het CBS en die tonen als startpunt

Blog usability Kadenza

De data hebben we nu bewerkt tot informatie en hiermee hebben we de vraag beantwoord. Nu weet je wat je morgen gaat tanken toch?

Kennis

Tank- en rijgedrag uit het verleden toegepast op de brandstofprijzen van vandaag: kennis
We hebben een mooie stap gezet. Zijn we klaar, of kunnen we de data nog verder verrijken om onze gebruiker nog beter te helpen met zijn vraag? Na de voldoening bij de vorige stap begint het meteen alweer te knagen. We baseren de informatie op data uit het verleden en alleen op de tankbeurten van mijn gezin. Maar wat nu als de benzineprijzen veranderen?  Je hebt nu alleen informatie over dat wat er in het verleden waar was. Dat betekent niet dat die waarheid blijft gelden. En heb je wel genoeg data om conclusies te kunnen trekken? Met een grotere dataset wordt de uitkomst betrouwbaarder. En misschien zijn er nog wel meer soorten brandstof die nog voordeliger zijn.

Laten we het wat breder bekijken en de sprong maken naar vandaag. We pakken de data van al onze collega’s erbij. Dat zijn soortgelijke rijders als wij. Verder pakken we van alle tankstations in Nederland de huidige brandstofprijzen erbij. Is met die data uit het verleden die keuze vandaag ook nog het voordeligst? Op basis van het eerder berekende verbruik kunnen we met de huidige prijzen nieuwe kosten per kilometer berekenen. Op basis van de gegevens van onze collega’s komen er ook nog nieuwe alternatieven bij die ook voor jou interessant kunnen zijn. Verder pakken we je agenda erbij en pakken we het tankstation bij jou in de buurt.

 

Blog usability Kadenza

 

Blog usability Kadenza

 

Je ziet in dit geval dat het verschil tussen Euro 95 en Blue One 95 vandaag de dag kleiner is dan dat het was op basis van de gegevens van de afgelopen twee jaar. Op jaarbasis scheelt het nu nog maar een kleine €70 als je kiest voor Euro 95. Verder zie je in het overzicht met de literprijzen van jouw tankstation dat de prijs van Euro 95 is gestegen, terwijl die van Blue One 95 juist gedaald is. Als die trend doorzet, is het wellicht over een paar dagen weer voordeliger om Blue One 95 te tanken.  En met het toevoegen van de gegevens van je collega’s is er een benzine optie bijgekomen!

Wijsheid

Een tankadvies voor morgen op basis van jouw agenda en locatie: wijsheid
En dan nu voorbij vandaag. Ik sta nu in Amersfoort en ga naar huis. Ik kan nog 200 km rijden op deze tank. Waar en wanneer kan ik het beste tanken en welke brandstof?

We zouden een model kunnen maken van jouw rijgedrag in combinatie met jouw auto, de gereden benzine, de routes die je genomen hebt en de afspraken in je agenda. Verder kunnen we de correlatie onderzoeken tussen de olieprijzen en de brandstofprijzen van de tankstations in jouw omgeving. Met een predictive model op basis van de de olieprijzen kan dan voorspeld worden wat elk tankstation voor benzineprijs zal hanteren. Je agenda kan erbij gepakt worden om jouw toekomstige rijgedrag mee te nemen. Met een blik wat verder de toekomst in kun je besluiten om met een halfvolle tank nu nog te profiteren van een lage benzineprijs als je voorziet dat deze op jouw route omhoog zal gaan. En stel nu dat ik volgende week in Laren zit en niet in Amersfoort, wat is dan het tankadvies?

Blog usability Kadenza

Stel je voor dat benzinestations de mogelijkheid hebben om in dit stadium een persoonlijke aanbieding te doen om daarmee jouw gedrag te beïnvloeden. En voor je het weet is er met deze wijsheid een nieuwe start-up geboren!

Je zult begrijpen dat voor ons gezin de ontwikkelkosten niet meer opwegen tegen onze eigen baten, maar je kunt je nu wel voorstellen dat er voor bedrijven andere vraagstukken zijn waar de juiste wijsheid heel veel geld kan opleveren. De DIKW piramide is een prima denk-model om niet te blijven kijken naar de ruwe data, maar altijd te proberen meer wijsheid uit die data te halen.

Hoe zit dat in jouw organisatie? Worden besluiten daar op basis van data genomen, of met wijsheid?

In een volgende blog post meer over visualisatie en interactie!


Whitepaper
DOWNLOAD