De Opdracht
Ahold Delhaize publiceert een jaarverslag dat operaties beslaat over 19 merken en ongeveer 384.000 medewerkers wereldwijd. Het jaarverslag 2025 vereiste een rigoureuze, auditbare analyse van genderloonkloof — niet alleen een ruw cijfer voor de loonkloof, maar een decompositie die structurele factoren (functieniveau, anciënniteit, geografie) scheidt van het onverklaarde residu waar regelgevers en investeerders daadwerkelijk om geven. Naast de loonanalyse vereiste het rapport merkbewegings- en functieniveau-analytics om de raad en externe stakeholders een compleet beeld te geven van interne mobiliteit en personeelssamenstelling.
Wat Is Opgeleverd
Vier werkstromen voedden het uiteindelijke rapport:
- Genderloonkloof-analyse — OLS-regressiemodellen met controle voor functieniveau, anciënniteit, merk, land en functie, gevolgd door een Blinder-Oaxaca-decompositie die de verklaarde en onverklaarde componenten van de loonkloof isoleert. Het hoofdresultaat: een ongecorrigeerde gemiddelde kloof van 13,64% versmalt tot 1,24% gecorrigeerd zodra structurele factoren in aanmerking worden genomen — gedaald van 1,36% in het voorgaande jaar.
- Merkbewegingsanalyse — het volgen van medewerkersstromen tussen de merkenportefeuille van Ahold Delhaize over de rapportageperiode, wat laat zien waar interne mobiliteit plaatsvindt en waar niet.
- Functieniveau-analyse — het in kaart brengen van verticale en laterale progressie binnen de gradingstructuur van de organisatie, met inzicht in promotiesnelheid en retentie op elk niveau.
- Data-integratiepijplijnen — de plumbing die het bovenstaande mogelijk maakte: het binnenhalen, opschonen en harmoniseren van HR-data uit meerdere bronsystemen over merken en geografieën heen naar één analytische laag.
De resultaten verschijnen op pagina 316 van het jaarverslag 2025, waarin expliciet wordt verwezen naar de Blinder-Oaxaca-methodologie.
Hoe Het Is Gebouwd
De kernbeperking was auditbaarheid. Elk getal in een openbaar jaarverslag is onderhevig aan externe assurance, wat betekent dat de analytische pijplijn deterministisch, reproduceerbaar en gedocumenteerd moest zijn op een niveau waarop een auditor elk gepubliceerd cijfer kon herleiden naar brondata en methodologie.
Blinder-Oaxaca-decompositie werd gekozen boven eenvoudigere op regressie gebaseerde correcties omdat het een schoon tweedelig antwoord geeft: hoeveel van de ruwe kloof wordt verklaard door observeerbare verschillen in kenmerken (de "endowments"-component), en hoeveel blijft onverklaard (de "coefficients"-component). Dit is de standaard die de academische literatuur hanteert en wat geavanceerde stakeholders verwachten.
PySpark op Azure Databricks verwerkte de schaal. Met honderdduizenden records over meerdere merken, geografieën en compensatiestructuren had de datavoorbereiding — valutanormalisatie, FTE-correctie, outlier-behandeling en feature engineering — een gedistribueerde rekenlaag nodig. De statistische modellering zelf draaide in pandas en statsmodels zodra de data was geaggregeerd op het juiste niveau.
Reproduceerbaarheid werd afgedwongen via geversioneerde notebooks, geparameteriseerde pijplijnen en een duidelijke scheiding tussen datavoorbereiding, modellering en rapportagelagen. Elke analist kan de volledige pijplijn opnieuw uitvoeren tegen de data-extractie van volgend jaar met één parameterwijziging.
Waarom Het Belangrijk Is
Genderloonkloof-analyse is basisvereiste voor een Fortune-500-jaarverslag. Wat ertoe doet is of de methodologie verdedigbaar is. Een eenvoudige mediaan-van-medianen-vergelijking nodigt uit tot de vraag "maar heb je gecorrigeerd voor...?" — de Blinder-Oaxaca-aanpak beantwoordt die vraag voordat hij wordt gesteld.
Het gecorrigeerde cijfer van 1,24% is niet zomaar een getal voor het rapport. Het geeft de organisatie een precies, gedecomponeerd beeld van waar residuele verschillen bestaan, welke factoren ze veroorzaken en waar gerichte interventies de hoogste impact zouden hebben. Dat is het verschil tussen compliance-rapportage en actiegerichte analytics.
