Snel en gemakkelijk CBS data gebruiken met Python

Published on July 10th, 2020

CBS PythonHeb je interesse in de data van het Centraal Bureau voor de Statistiek (CBS) en
ben je Python gebruiker? Dan zit je gebakken! Het is tegenwoordig namelijk mogelijk om razendsnel je gewenste data op te vragen. In deze blog post leg ik kort uit hoe je dit kunt doen. Let’s go, CBS & Python!

Download voordat je begint de cbsodata package van PyPi. Dit kun je doen met het volgende commando in the command line (Windows) of terminal (MacOS/Linux):

pip install cbsodata

Vervolgens kun je op de website van StatLine zoeken naar interessante datasets. Mocht je het niet kennen: “StatLine is de databank van het CBS. Het CBS biedt een schat aan cijfers over de Nederlandse economie en samenleving. Van inflatie tot bevolkingsontwikkeling, de informatie is overzichtelijk gerubriceerd op thema en gratis beschikbaar voor iedereen.” Voor dit voorbeeld gebruiken we de huizenprijzen index in Nederland: 

https://opendata.cbs.nl/statline/#/CBS/nl/dataset/84064NED/table?ts=1594388779565

Negen van de tien keer willen we deze data in tabel formaat hebben. Daarom gebruiken we ook de Pandas package. Hier kunnen we gemakkelijk DataFrames mee creëren. De code: 

import cbsodata
import pandas as pd

huizenprijzen = pd.DataFrame(cbsodata.get_data('84064NED'))
huizenprijzen = huizenprijzen[['Perioden', 'PrijsindexVerkoopprijzen_1']]

print(huizenprijzen.tail())

In totaal heb je dus eigenlijk maar handjevol regels code nodig. In dit voorbeeld passen we alleen nog een filter toe omdat de output anders wat lang wordt. Waarschijnlijk wil je zelf ook nog wat bewerkingen en/of berekeningen doen. De output van dit korte script is:

PeriodenPrijsindexVerkoopprijzen_1
2019 2e kwartaal130.4
2019 3e kwartaal132.7
2019 4e kwartaal134.6
2019131.7
2020 1e kwartaal137.5

Het zal als geen verassing komen dat we de afgelopen jaren een flinke stijging in de huizenprijzen hebben gezien. Laten we hopen dat de overheid het woningtekort terug kan dringen. CBS heeft natuurlijk nog veel meer interessante data. CBS  & Python gaan heerlijk samen, dus leef je uit!

Mocht je hulp nodig hebben bij het werken met Python, neem dan gerust een kijkje bij het cursus aanbod of privé-begeleiding.

Happy coding!

PS: andere overheidsinstanties zoals RDW en DUO publiceren ook datasets. Heb je interesse in blogs hierover, laat het weten via de comments.

Leave a Reply

Your email address will not be published. Required fields are marked *