Optimaliseren RCMCost Modeling voor Rijkswaterstaat.

De kracht van NLP in infrastructuur.

Door een unieke samenwerking tussen Rijkswaterstaat – het Nederlandse Ministerie van Infrastructuur en Waterstaat – en Cmotions, en met behulp van NLP-technieken, variërend van trefwoordselectie tot Generatieve AI, konden we hun RCMCost-model optimaliseren, waardoor ze betere schattingen en kostenbeheer kunnen uitvoeren.

Rijkswaterstaat heeft onder andere als verantwoordelijkheid het onderhoud van de primaire infrastructuur, zoals de weg- en waterbouw. Om bij het onderhoud van assets (denk aan bruggen, wegen en vaarwegen) een goede afweging te kunnen maken tussen kosten, prestaties en risico’s, gebruikt Rijkswaterstaat een tool genaamd RCMCost. Met invoergegevens in deze tool kunnen zij het verwachte onderhoud per locatie bekijken.

De aanleiding.

Rijkswaterstaat heeft Cmotions benaderd met de vraag om de data die de input vormt voor hun RCMCost model te stroomlijnen. Geaggregeerde analyses over veel vergelijkbare locaties stelt Rijkswaterstaat in staat om betere inschattingen te maken en de kosten te beheersen. De registraties van kosten en omschrijving per object zijn echter niet gestandaardiseerd; personen binnen de organisatie vullen de onderhoudsinterface op verschillende manieren in.

Dit is waar de complicatie optreedt: met honderden locaties, meerdere niet-gestandaardiseerde registratievelden en tientallen verschillende experts die de registraties invullen, is de analyse van kosten van de locaties tijdrovend en beperkt. De RCMCost modelling experts van Rijkswaterstaat en data scientists van Cmotions werkten samen aan de ontwikkeling en implementatie van een data driven oplossing om de inputdata van het RCMCost model te automatiseren en standaardiseren.

De oplossing.

Cmotions heeft verschillende Natural Language Processing (NLP)-technieken geïmplementeerd en geëvalueerd om de input voor het RCMCost-model te standaardiseren.

Eerst is een verkennende data-analyse (EDA) uitgevoerd om potentiële patronen en termen te vinden die vaak voorkomen. Op basis van deze veelvoorkomende termen konden we onze tekstuele input beperken door één term te selecteren. Bovendien konden we deze tekstuele entiteiten koppelen aan de eigenschappen van het model om de kostenanalyse veel efficiënter te maken.

Vervolgens gebruikten we een techniek voor semantische gelijkenis om tekstvelden te identificeren en te koppelen die inhoudelijk op elkaar lijken. Het doel van deze stap is om verschillende termen samen te voegen en ze te labelen met een gestandaardiseerde versie. Technieken voor semantische gelijkenis kijken naar de betekenis van termen in plaats van naar de letterlijke manier van schrijven, waardoor woorden die er misschien niet hetzelfde uitzien maar wel dezelfde betekenis hebben, kunnen worden gegroepeerd. Als je meer wilt weten over semantische gelijkenis en hoe het werkt, geeft de volgende blog een goed overzicht.

Tot slot werd een meer geavanceerde techniek gebruikt voor velden waar de tekstuele variëteit erg groot was en de resultaten op basis van semantische gelijkenis nog steeds niet nauwkeurig genoeg waren. Met behulp van Generatieve AI waren we in staat om deze verscheidenheid aan waarden in kaart te brengen naar een klein aantal gestandaardiseerde waarden. Large Language modellen hebben een diep begrip van taal en kunnen worden gebruikt om zinvolle categorisatie van woorden of zinnen te identificeren. In ons geval hielp dit bij het identificeren van een set waardevolle groepslabels en beschrijvingen voor functies die onderdelen van infrastructurele locaties hebben.

De uitkomst.

In totaal hebben we met behulp van NLP-technieken, variërend van trefwoordselectie tot generatieve AI, gestandaardiseerde labels toegevoegd aan de tekstvelden die als invoer voor het RCMCost-model gebruikt worden. Rijkswaterstaat gebruikt deze resultaten om waarden te standaardiseren voor efficiënte RCMCost modelleringsanalyses en om de gestandaardiseerde waarden te definiëren om in de toekomst in hun interface te gebruiken.

De sleutel tot het succes van het project is de nauwe samenwerking tussen de bedrijfsexperts van Rijkswaterstaat en de NLP-experts van Cmotions, de iteratieve aanpak en de brede set van NLP-technieken die in aanmerking werden genomen en uiteindelijk zijn toegepast.

Ontdek wat we ook voor jouw organisatie kunnen betekenen.