Heb je interesse in de data van het Centraal Bureau voor de Statistiek (CBS) en
ben je Python gebruiker? Dan zit je gebakken! Het is tegenwoordig namelijk mogelijk om razendsnel je gewenste data op te vragen. In deze blog post leg ik kort uit hoe je dit kunt doen. Let’s go, CBS & Python!
Download voordat je begint de cbsodata package van PyPi. Dit kun je doen met het volgende commando in the command line (Windows) of terminal (MacOS/Linux):
pip install cbsodata
Vervolgens kun je op de website van StatLine zoeken naar interessante datasets. Mocht je het niet kennen: “StatLine is de databank van het CBS. Het CBS biedt een schat aan cijfers over de Nederlandse economie en samenleving. Van inflatie tot bevolkingsontwikkeling, de informatie is overzichtelijk gerubriceerd op thema en gratis beschikbaar voor iedereen.” Voor dit voorbeeld gebruiken we de huizenprijzen index in Nederland:
https://opendata.cbs.nl/statline/#/CBS/nl/dataset/84064NED/table?ts=1594388779565
Negen van de tien keer willen we deze data in tabel formaat hebben. Daarom gebruiken we ook de Pandas package. Hier kunnen we gemakkelijk DataFrames mee creëren. De code:
import cbsodata import pandas as pd huizenprijzen = pd.DataFrame(cbsodata.get_data('84064NED')) huizenprijzen = huizenprijzen[['Perioden', 'PrijsindexVerkoopprijzen_1']] print(huizenprijzen.tail())
In totaal heb je dus eigenlijk maar handjevol regels code nodig. In dit voorbeeld passen we alleen nog een filter toe omdat de output anders wat lang wordt. Waarschijnlijk wil je zelf ook nog wat bewerkingen en/of berekeningen doen. De output van dit korte script is:
Perioden | PrijsindexVerkoopprijzen_1 |
---|---|
2019 2e kwartaal | 130.4 |
2019 3e kwartaal | 132.7 |
2019 4e kwartaal | 134.6 |
2019 | 131.7 |
2020 1e kwartaal | 137.5 |
Het zal als geen verassing komen dat we de afgelopen jaren een flinke stijging in de huizenprijzen hebben gezien. Laten we hopen dat de overheid het woningtekort terug kan dringen. CBS heeft natuurlijk nog veel meer interessante data. CBS & Python gaan heerlijk samen, dus leef je uit!
Mocht je hulp nodig hebben bij het werken met Python, neem dan gerust een kijkje bij het cursus aanbod of privé-begeleiding.
Happy coding!
PS: andere overheidsinstanties zoals RDW en DUO publiceren ook datasets. Heb je interesse in blogs hierover, laat het weten via de comments.
Wonderful presentation of python with useful example in the same time. It helps us to understand the basic python information and how it works. Subscribed your blog.