Power BI kan als volledige “self-service” tool gebruikt worden, maar ook inprikken op bestaande “datasets”.
Wat is een dataset
Een dataset is een datamodel (verzameling aan tabellen en onderlinge verwijzingen) dat klaar staat voor analyse. Allerlei logica kan vooraf ingebouwd worden, zodat je door een paar klikken nieuwe vragen kunt stellen. Een paar termen die hier veel bij voorkomen:
- Measures (ook wel metingen of meetwaarden) zijn de cijfers die je wilt analyseren.
- Vaak zijn dit eenvoudige, logisch optelbare waarden (zoals “aantal verkochte schroefjes”)
- Een dataset maakt het echter ook mogelijk om meer geavanceerde measures vorm te geven, bijvoorbeeld:
- Percentage van budget
- Aantal schroefjes in magazijn
- Aantal verkochte schroefjes in het jaar, opgeteld tot aan de weergegeven datum
- Door een dataset goed te definiëren, kun je ervoor zorgen dat ook ingewikkelde measures correct te berekenen langs allerlei dimensies.
- Dimensies zijn de “assen” waarlangs je de metingen uitsplitst
- In de vraagstelling hoor je vaak per:
- Aantal verkopen per jaar
- Aantal geweldsdelicten per stadsdeel per maand
- Hoeveelheid huisvuil per straat
- Deze per definities zijn meestal dimensies:
- Stadsdeel
- Periode (maand/jaar/datum)
- Productcategorie
- etc.
Datasets maken het ook mogelijk om het ontsluiten en modelleren van data door andere personen te laten doen dan het maken van de rapporten zelf. Maar ook wanneer je alles helemaal zelf doet, maak je altijd onder water een dataset aan.
Voordat we met deze dataset van start kunnen, moet je de dataset op jouw eigen Power BI-omgeving klaarzetten. Neem daarvoor de volgende stappen:
Let op: het is belangrijk dat je geen Power BI-vensters meer open hebt staan na deze stappen!
Je hebt zojuist een Power BI dataset voor jezelf klaargezet. Dit was een stukje voorbereiding dat we nu zelf moesten doen, maar normaal gesproken kan dit ook door iemand anders gebeuren. Bijvoorbeeld door iemand uit een Business Intelligence- of Data Engineering-team, die data heeft klaargezet die breed gebruikt wordt op diverse plekken in de organisatie.
De casus
In deze cursus kijken we naar een fictief bedrijf dat Microsoft vaak gebruikt als voorbeeld in haar cursussen: AdventureWorks.
AdventureWorks verkoopt fietsen en fietsonderdelen - zowel direct aan klanten als via distributeurs. Ze hebben een kantoor in Nederland, en verkopen fietsen in de V.S., Duitsland en Spanje - zowel via de diverse distributeurs als direct via de website aan klanten.
Doordat we ingeprikt hebben op een bestaande dataset, kunnen we gebruikmaken van kwalitatief hoogstaande data. Deze is al gecontroleerd op missende waarden, inconsistentie en andere zaken waar we vaak tegenaan lopen wanneer we zelf data inladen. Ook is in het datamodel aangegeven hoe de verschillende relaties tussen de tabellen liggen, en zijn er meestal measures aangemaakt waarin berekeningen “klaarstaan” die voor onszelf vaak lastiger zijn. We kunnen dus eenvoudig data uit meerdere tabellen combineren - de dataset zorgt voor de juiste interacties.
In deze eerste verkenning gaan we data van AdventureWorks bekijken. Specifiek kijken we naar de Internet Total Sales (het totaalbedrag aan verkopen via internet) en de Internet Total Tax amt (de hoeveelheid belasting die ze afdragen via internetverkopen). Om een gevoel te krijgen hoe de data eruit ziet, maken we hier enkele doorsnijdingen mee.
We gaan nu twee Power BI visualisaties maken:
Deze is redelijk eenvoudig:
Zoals je ziet, gaat deze grafiek eigenlijk automatisch goed. En hoewel de hoeveelheid tabellen en kolommen erg groot kan zijn, kun je eenvoudig zoeken in de lijst met velden.
Omdat Total Children een numerieke waarde is, maakt Power BI hier automatisch een zogenaamde measure van: een meetwaarde die optelbaar is. Je ziet dus de som van alle kinderen van alle klanten nu weergegeven naast de betaalde belasting. Wanneer je het sigma-teken Σ ziet staan voor een veld, is dit een indicatie dat Power BI het als measure kan gebruiken (hoewel de dataset het niet expliciet als measure heeft aangeboden!)
Hiermee geven we aan dat “Total Children” niet een veld is dat we willen optellen, maar dat we op de as willen zetten, om erlangs uit te splitsen. Het resultaat is nu als volgt:
Stel dat we nu een extra uitsplitsing zouden willen doen naar het aantal kinderen dat nog thuis is (Number of Children at Home), dan zien we in de Data-lijst ook hier een sigma-teken voor staan.
We kunnen er echter ook expliciet aangeven hoe Power BI dit veld toevoegt aan een grafiek:
Klik op één van de landen in de eerste grafiek. Zoals je ziet verandert de andere grafiek mee.
Aangezien Power BI nieuw is binnen Adventure Works, is je leidinggevende bijzonder benieuwd wat er allemaal mee mogelijk is. Hij heeft onder andere veel gehoord over de geografische weergaves die er standaard in aanwezig zijn, en heeft jou gevraagd eens één en ander mee uit te proberen.
Hieronder staan op een iets hoger niveau de stappen om een rapport te maken. Dit is bewust (zodat je ervaring met de tool vergroot wordt) - maar tegelijkertijd is het heel normaal dat je ergens niet uitkomt. Dan helpt het niet om lang te zitten tobben - vraag gerust om hulp!
Om te ontdekken wat een Card visual is, zul je de namen van de tooltips moeten verkennen. De naam van een visual wordt weergegeven als tooltip wanneer je de cursor er enige tijd op laat rusten:
Het eindresultaat kan er bijvoorbeeld als volgt uit zien:
Hier vind je het eindpunt van deze opdracht: 02-Solution
Hier vind je de Walkthrough video
De volgende module is Module 3: Visuals en interactie.
Hieronder vind je een overzicht van alle modules: