16 oktober 2019 582 woorden, 3 min. gelezen

Datamining: waar in Frankrijk worden de meeste bedrijven opgericht?

Door Pierre-Nicolas Schwab Gepromoveerd in marketing, directeur van IntoTheMinds
Waar in Frankrijk worden de meeste bedrijven opgericht? Dit is een essentiële vraag om zicht te krijgen op de dynamiek in de verschillende Franse departementen. Met behulp van INSEE-gegevens (Franse site) wilden we u een eenvoudig antwoord geven. Helaas zitten […]

Waar in Frankrijk worden de meeste bedrijven opgericht? Dit is een essentiële vraag om zicht te krijgen op de dynamiek in de verschillende Franse departementen. Met behulp van INSEE-gegevens (Franse site) wilden we u een eenvoudig antwoord geven. Helaas zitten de gegevens, zoals zo vaak het geval is, vol verrassingen en vereist het krijgen van een goed (en mooi) resultaat enige moeite.
Als u geïnteresseerd bent in business intelligence en vooral het gebruik van Tableau (Franse site), biedt dit artikel u de kans om te leren hoe u een kwantiele visualisatie kunt maken.

Oorsprong van de gegevens

Zoeken naar kwaliteitsgegevens over Franse bedrijven? Op INSEE, natuurlijk. Zoals gewoonlijk is er niets beters dan de Nationale bureaus voor de statistiek om gegevens over een markt te vinden.
INSEE biedt u maandelijkse gegevens voor de verschillende soorten bedrijven: maatschappijen, micro-ondernemingen, eenmansbedrijven. De kers op de taart is dat de gegevens over een zeer lange periode beschikbaar zijn (sinds 2000).
Wees echter voorzichtig bij de analyse ervan, want micro-ondernemingen bestaan pas sinds 2009.

Geografische visualisatie van gegevens

création d'entreprises dans les départements français en 2017

Visualisatie van de oprichting van bedrijven in de Franse departementen via een kleurverloop in Tableau (gegevensbron: INSEE, 2017).

Het lijkt misschien gemakkelijk om de territoriale dynamiek op een eenvoudige manier in beeld te brengen, maar zoals vaak het geval is wanneer de verschillen groot zijn, was het resultaat teleurstellend. Het gebruik van het standaard kleurverloop dat in de tabel wordt voorgesteld, leidt onvermijdelijk tot een kaart zonder significante verschillen. Aangezien de Parijse regio een zeer groot deel van de nieuwe bedrijven voor haar rekening neemt, staan de andere regio’s aan de onderkant van de kleurgradiënt en verschillen ze dus niet van elkaar. De dataminingoefening zou dus een mislukking zijn als we hier zouden stoppen.
We moesten dus een truc toepassen om de verschillen tastbaar en zichtbaar te maken, en de territoriale en temporele dynamiek zinvol te maken.

Kwantiele visualisatie

Création d'entreprises dans les départements français en 2018.

Oprichting van bedrijven in de Franse departementen in 2018. Kwartiele visualisatie. Gegevensbron: INSEE.

De truc die we toepasten is gebaseerd op een kwantiele visualisatie (in dit geval kwartielen) die we al met succes hadden gebruikt in een andere datamining-oefening (visualisatie van de ondergronds economie). De waarden van startende bedrijven worden in 4 klassen (‘buckets’) ingedeeld: de laagste 25%, 25-50%, 50-75%, de hoogste 75%.
En al dadelijk worden de verschillen duidelijker.
Sommigen zullen beweren dat het eenvoudiger zou zijn geweest om een 4-inch kleurverloop te gebruiken. En sommige verschillen zouden inderdaad, duidelijker naar voren zijn gekomen. Maar zolang de intervallen gelijk verdeeld zijn, blijven de grote verschillen hun uitwerking hebben en is het resultaat visueel teleurstellend. Een visualisatie per kwartiel heeft daarom veel meer betekenis en voorkeur.

Resultaten

De resultaten zijn zoals gewoonlijk beschikbaar in onze tab Tableau Public (Frans). Voor degenen die het resultaat direct willen zien zonder naar Tableau te gaan, hebben we een kleine gif-animatie gemaakt. U zult merken dat de rangschikking van de afdelingen uiteindelijk van jaar tot jaar weinig verandert. De regio’s die het meest of minst geschikt zijn voor de oprichting van bedrijven blijven dezelfde. Uiteraard speelt de bevolkingsdichtheid noodzakelijkerwijs een rol in het aantal opgerichte bedrijven. Het zou logisch zijn om te verwachten dat de dichtstbevolkte afdelingen ook de afdelingen zijn die de meeste bedrijven creëren. De volgende oefening zal dus bestaan uit een analyse van het aantal startende bedrijven per inwoner en het opsporen van de meest dynamische afdelingen.

Lees zeker ons volgende artikel om hierop een antwoord te krijgen.



Posted in big data.

Plaats uw mening

Je e-mailadres zal niet getoond worden. Vereiste velden zijn gemarkeerd met *