Open data overheid: Brandstofprijzen analyseren – Deel 1

Open data Nederland

Op het dataportaal van de Nederlandse overheid staan mooie datasets om te analyseren: https://data.overheid.nl. Veel, of volgens mij zo goed als alle, datasets zijn web services, data die dus automatisch wordt ververst. Zo is er ook een dataset waar de prijzen van de brandstofprijzen in Nederland worden bijgehouden. Needless to say dat we hier mee moeten spelen. Dit heb ik gedaan met een experimentje waarvan je het volledige resultaat kunt vinden op mijn website. Op die plek kun je de bijbehorende code zien, mocht je zelf ook aspiraties hebben om de dataset te analyseren. 

Eerste stappen open data analyse

Zoals ik in de titel aangeef, is dit deel 1 van het experiment en ga ik nog niet echt diep hier. In dit deel doe ik:

  • Data ontsluiting (vooral terug te zien in de code);
  • Data bewerking (vooral terug te zien in de code);
  • Data visualisatie.

Dit geeft al wat leuke resultaten, maar er is meer uit te halen. De uitkomsten uit het eerste deel presenteer ik in ieder geval hier. Nogmaals, voor het volledige resultaat van dit eerste deel kun je naar mijn pagina gaan.

Eigenschappen van de dataset open data brandstofprijzen Nederland

Op 12 februari 2016 had deze dataset de volgende eigenschappen. Ik noem specifiek deze datum omdat het feit dat deze data set een webservice is, het zo goed als dagelijks verandert. Het meest recente datapunt is van 8 februari 2016. De dataset bevat:

  • 3691 rijen;
  • 13 kolommen;
  • Ieder datapunt/rij geeft een dag met de prijsstanden van de betreffende brandstof weer;
  • Voor de kolomnamen en datatypes (dus voor de echte nerds) adviseer ik je naar het uitgebreide verslag te gaan.

 

Visualisaties open data brandstofprijzen Nederland

Prijsschommelingen per type brandstof Nederland

Voor iedere brandstof-type de prijsstanden over de afgelopen periode weergegeven. Er is een gecalculeerde variabele aangemaakt die het verschil in prijs ten opzichte van de vorige dag weergeeft. Deze dimensie wordt in deze grafiek aangegeven in kleur en grootte van de datapunten. 

Voor Benzine en Diesel kun je zien dat in de periode 2007 -2009 de prijzen aardig schommelden. Dat is tegenwoordig iets stabieler. Over het algemeen zien we dat we nu op een vrij laag prijsniveau staan, zo goed als gelijk aan het niveau van 2010. Naast deze opmerkingen is deze plot nog niet zo spannend.

Grafiek prijsontwikkeling brandstoffen afgelopen jaren

 

Grafiek brandstofprijzen per dag Nederland

Helaas heb ik hier geen superuitkomst die aangeeft welke dag het goedkoopst is om benzine te tanken. Heel scherp zou je kunnen zeggen dat vrijdag lichtjes de meest voordelig dag is. Echter geven deze, nog niet echt uitgebreide, visualisaties daar geen geen duidelijk antwoord op. Ook bij het uitproberen van een bosplot-grafiek of punten-staafdiagram zien we geen opvallende dingen. Ik laat de grafieken voor de andere twee brandstoffen even achterwege in deze post.

Prijzen benzine weekdagen

 

Minimum maximum en gemiddelde prijzen per type brandstof per dag in de week
Prijzen benzine verdeeld per dag in de week

Prijsstanden per maand

Als we de prijsstanden bekijken per maand over de afgelopen maanden, kunnen we iets meer conclusies trekken:

Gemiddelde minimum en maximum prijzen per brandstof per maand
(Vooral) de medianen, minima en maxima liggen in de warmere maanden hoger t.o.v. de andere maanden. De prijzen zijn in de lente- en zomermaanden hoger dan de andere maanden. Dit geldt in ieder geval voor Benzine vrij sterk. Dit is voor Diesel iets minder. Voor LPG zien we een hele andere ontwikkeling. Vooral in de zomermaanden wordt de spreiding van de prijs op een lager niveau.

Om de uitspraak die we gedaan hebben over de prijs van benzine beter te bekijken (een boxplot is vrij samenvattend), plotten we alle datapunten per maand. Dit doen we alleen even voor benzine. Hier zien we hetzelfde: lage prijzen komen in de lente en zomermaanden minder vaak voor dan in de andere maanden.

Brandstofprijzen verdeeld over de kwartalen

Tja, wat we voor de maanden zien, zien we natuurlijk op een hoger niveau ook terug in kwartalen. Voor de gezelligheid toch maar even een boxplot-grafiek over de kwartalen.

Minimum maximum en gemiddelde prijs per type brandstof per kwartaal

Op kwartaal-niveau is het nog beter te zien: Voor benzine is de mediaan van Q4  net iets hoger dan het minimum van Q3. Voor diesel is dit effect minder, en bij LPG valt dit effect zo goed als weg.

Brandstof prijzen open data Nederland: Verschil in prijzen weekend en werkdagen.

Ook hier ben ik je het antwoord nog voor schuldig, maar ik ga er zeker achteraan! Nogmaals, dit is deel 1. In deel twee zit ik veel dichter op de statistiek en databewerkingen. Hier toch alsnog de visualisatie (alleen voor benzine).

Prijzen benzine afgelopen jaren tijdens het weekend en werkdagen

 

Zijn we echt wijzer geworden van deze post?

Misschien geen uitkomsten die uw leven zullen veranderen, maar wel een paar observaties. 

Neem gerust contact met me op als je vragen hebt. Wil je het experiment zelf doen en daarbij de code gebruiken of er mee verder wilt gaan? Vork die handel dan op Github waar ik een repository heb met het rauwe script.

Alvast een fijn weekend!

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit /  Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit /  Bijwerken )

Verbinden met %s

Deze site gebruikt Akismet om spam te bestrijden. Ontdek hoe de data van je reactie verwerkt wordt.

%d bloggers liken dit: