Moderne industrieën zijn steeds meer afhankelijk van een complexe interactie tussen sociale en technische factoren. De verbeteringen en ontwikkelingen in deze industrieën zijn duidelijk gericht op nieuwe technologieën als Big Data, Robotica, Sensortechnologie, Internet of Things en Machine learning en minder op de sociale factoren.
De focus veranderde in de loop van de tijd van ‘het behouden of herwinnen van een dynamisch stabiele toestand’ naar het vermogen om ‘de vereiste prestaties vol te houden’. Assets moeten onder allerlei omstandigheden functioneren. Het onderhoud van systemen die van deze nieuwe technologieën zijn voorzien, zal complexer zijn, terwijl de werkcultuur en kennis veel moeilijker aan te passen zijn. Besluitvorming op managementniveau op basis van Big Data (zoals bij PdM) over stops, preventieve acties zorgen duidelijk voor een grotere afstand tussen de onderhoudsafdelingen en de productiesystemen. De toenemende implementatie van MMS (Maintenance Management System) dicht de informatiekloof tussen productiesystemen en de ERP-systemen (Enterprise Resource Planning).
Door besluitvorming op basis van slijtagepatronen (trillingsfrequentie), tot Tag-ID-gelabelde componenten (reserveonderdelen), via geautomatiseerde instructies op de werkvloer, plannen, via ERP-systemen tot business intelligence op management level zal de mens-machine relatie veranderen. Tegelijkertijd nemen slimme beslissingsondersteunende systemen de allerlaatste behoefte weg voor managers om onderhoudspersoneel persoonlijk te zien. De manier waarop een typische onderhoudsafdeling is georganiseerd, draagt bij aan de complexiteit.
Auteurs van Lean-productie erkennen dat menselijke factoren (Womack et al, 1990) en Human Resource Management net zo belangrijk onderdeel van Lean als Just-In-Time, Total-Quality-Management en Total-Productive-Maintenance. Toyota’s concept Jidoka beschrijft de mens-machinerelatie vanuit technisch oogpunt. Cross-functionele training van het personeel, zelfsturende werkteams en empowerment van werknemers worden benadrukt als de sleutel tot succes in JIT, TQM en TPM (MacDuffie, 1995; White et al. 1999). Bovendien benadrukken sociotechnische systemen de noodzaak om eenvoudige en flexibele organisaties met complexe kennisintensieve banen op te bouwen, in plaats van complexe organisaties met eenvoudige en gespecialiseerde banen.
Categorie: Storingsonderzoek
Modelleren en voorspellen
De term “Wiener-proces” verwijst naar een wiskundig concept dat bekend staat als een stochastisch proces of een stochastisch proces in continue tijd. Het is vernoemd naar Norbert Wiener, een Amerikaanse wiskundige. In de wiskunde is een Wiener-proces een soort willekeurig proces dat de continue, willekeurige beweging van een deeltje vertegenwoordigt. Het wordt vaak gebruikt om verschillende verschijnselen te modelleren op gebieden zoals natuurkunde, financiën en techniek. Een Wiener-proces, ook wel Brownse beweging genoemd, heeft verschillende belangrijke eigenschappen. Het is een continu proces met onafhankelijke en normaal verdeelde stappen. Bovendien heeft het een gemiddelde van nul en groeit de variantie lineair met de tijd. Het Wiener-proces heeft talloze toepassingen gevonden. Bij onderhoud wordt het gebruikt om de willekeurige storingen in de loop van de tijd te modelleren.
De Poisson-verdeling is een waarschijnlijkheidsverdeling die het aantal gebeurtenissen beschrijft dat plaatsvindt binnen een vast tijds- of ruimte-interval, gegeven de gemiddelde mate van voorkomen. De Poisson-verdeling wordt vaak gebruikt om zeldzame gebeurtenissen te modelleren die onafhankelijk van elkaar plaatsvinden, met een bekende gemiddelde interval. Er wordt van uitgegaan dat de gebeurtenissen met een constante interval plaatsvinden en willekeurig verdeeld zijn. Enkele voorbeelden van verschijnselen die kunnen worden gemodelleerd met behulp van de Poisson-verdeling zijn het aantal storingsmeldingen dat binnen een bepaalde periode wordt ontvangen. De waarschijnlijkheidsmassafunctie van de Poisson-verdeling wordt gegeven door de formule: P(X = k) = (e^(-λ) * λ^k) / k! waarbij X de willekeurige variabele is die het aantal gebeurtenissen vertegenwoordigt, λ de gemiddelde mate van voorkomen is en k het aantal waargenomen gebeurtenissen is. De Poisson-verdeling heeft verschillende nuttige eigenschappen, zoals het feit dat het gemiddelde en de variantie van de verdeling beide gelijk zijn aan λ. Dit maakt het een handig hulpmiddel voor het modelleren en analyseren van situaties waarbij zeldzame gebeurtenissen of voorvallen betrokken zijn.
Blaming the Black Swans
Een ‘Black Swan’ is een metafoor voor een fenomeen dat zich bij verrassing voordoet. Toen de uitdrukking werd bedacht, werd aangenomen dat de zwarte zwaan niet bestond en moet deze opnieuw worden geïnterpreteerd nadat zwarte zwanen waren ontdekt. Het belang van de metafoor ligt in de analogie ervan met de kwetsbaarheid van elk systeem. Een reeks conclusies die een veronderstelde, onderliggende logica volgden, wordt mogelijk ongedaan gemaakt. Een ‘Black Swan’ (Taleb) is daarom een onverwachte gebeurtenis met mogelijk grote gevolgen. Dergelijke fenomenen, die als extreme uitschieters worden beschouwd, spelen vaak een veel grotere rol dan een gewone gebeurtenissen. De term impliceert het idee dat een (tot dan toe) onmogelijkheid later zou kunnen worden weerlegd.
Een ‘Black Swan’-gebeurtenis heeft drie attributen: zeldzaamheid, extreme ‘impact’ en retrospectieve (hoewel niet prospectieve) voorspelbaarheid. Een ‘Black Swan’ is een incident dat willekeurig en onverwacht plaatsvindt en wijdverspreide gevolgen heeft. De gebeurtenis had kunnen worden verwacht op basis van de beschikbare, relevante gegevens, maar waren waren geen mitigerende risico-beperkende programma’s of onderhoudstaken voorzien.
Maar niet alle zwarte zwanen blijken zwart te zijn!
Een typische gebeurtenis die door verschillende experts onterecht een ‘Black Swan’ werd genoemd, was de black-out van het Nederlandse 112-netwerk op 24 juni 2019. 112 is een veelgebruikt alarmnummer om hulpdiensten (ambulance, brandweer, reddingsdiensten, politie). In werkelijkheid is 112 vaker getroffen door een storing. In 2012 was dat meerdere keren het geval. Volgens KPN (de netbeheerder) ging het om geïsoleerde incidenten, ook tijdens onderhoudswerkzaamheden. Veel is er ondertussen niet veranderd, op 14 april 2023 was er ook een dergelijke storing. Op 28 augustus 2024 was er opnieuw een landelijke storing in alarmeringssysteem hulpdiensten, 112 was wel bereikbaar.
Zo’n belangrijk netwerk kan en zal uiteindelijk willekeurige storingen vertonen. Wat deze black-out echter onderscheidt van een ‘Black Swan’ is dat het had kunnen worden voorzien en dat er daarom vooraf mitigerende maatregelen konden worden genomen. Het uitvallen van zo’n netwerk heeft namelijk verstrekkende ontwrichtende maatschappelijke gevolgen. Het mogelijk niet of niet tijdig uitvoeren van onderhoud kan niet worden gebruikt om een storing aan te merken als een ‘Black Swan’. Meer in het algemeen negeert en minimaliseert een model effect van gebeurtenissen die ‘buiten het model’ vallen. Een vast model houdt rekening met de ‘known unknowns’, maar negeert de ‘unknown unknowns’.De rol van onderhoud is dus niet om gebeurtenissen te voorspellen die onvoorspelbaar zijn, maar als middel tot mitigatie tegen negatieve gebeurtenissen. De robuustheid van een systeem moet centraal staan bij het voorkomen van zwarte zwanen door kwetsbare plekken te identificeren om de zwarte zwanen wit te maken.
Voorspellend onderhoud
Voorspellend onderhoud (PrM-Predictive Maintenance) kan het best omschreven worden als een reeks activiteiten die als gevolg van veranderingen in de fysieke toestand van een asset worden ondernomen om het risico van falen te voorkomen. PrM zelf kan worden verdeeld in methoden (sensoren) om beginnend falen (bijv. slijtage) te detecteren en algoritmen, gebaseerd op statistische data (sensoren) voor het voorspellen van falen.
Het gebruik van de sensoren als indicator voor het vaststellen van conditie en dus het juiste moment van interventie (CBM-Condition Based Maintenance) kan continue of periodiek ondersteund worden. De conditie van componenten wordt dan via algoritmes en patronen beoordeeld. Falen kan dan vroegtijdig worden herkend en vervolgens kunnen corrigerende maatregelen worden gepland. Ongeplande uitval (zo is de belofte) kunnen worden vermeden en zowel personeel als middelen kunnen effectiever worden ingezet.
De eerste stap van PrM-is data-acquisitie. Sensoren genereren informatie (trillingen, temperatuur, capaciteit) over de toestand van de componenten. Verschillende sensoren, ultrasone sensoren, vibratiesensoren en akoestische emissiesensoren, zijn ontworpen om verschillende gegevens te genereren.
Daarna zijn er twee stappen nodig om de signalen van sensoren af te handelen. De ene is signaalverwerking, die de signaalkenmerken en -kwaliteit verbetert. De technieken in signaalverwerking omvatten o.a. filteren, versterking, datacompressie, validatie en ruisonderdrukking. De volgende stap is om die bewerkte signalen juist die gegevens te extraheren die kenmerkend en passend zijn voor een beginnend falen.
De volgende stap is om op basis van die date beslissingen te nemen over onderhoudsacties. De beslissingen kunnen ondersteuning worden met een: fysiek model, statistisch model, gegevens of een combinatie (hybride) model. De meest gebruikte methode is de vergelijking met historische gegevens (data gedreven) om het falen te identificeren en te evalueren. Wanneer historische gegeven ontbreken worden modelgebaseerde technieken gebruikt om de conditie te evalueren. Deze technieken zijn alleen bruikbaar na een analyse en kennis van de asset. Er moet namelijk eerst een model van de bestaande werkelijkheid (actuele conditie en conditieverloop) worden gemaakt.
Technieken voor het ondersteunen van onderhoudsbeslissingen kunnen worden verdeeld in: diagnose en prognose. Diagnose richt zich op detectie en identificatie van falen en het moment wanneer deze zich voordoen. De prognose richt zich op het voorspellen van falen voordat deze zich voordoen. In de praktijk is het echter niet eenvoudig om prognose en diagnose toe te passen vanwege het gebrek aan procedures, gegevens en kennis, om de modellen te creëren. Wat nu nog ontbreekt zijn technieken als kunstmatige intelligentie, neurale netwerken, fuzzy logic-systemen.
Resnikoff’s conandrum
De belangrijkste bron van betrouwbaarheid zijn de prestaties van de apparatuur en daarmee de onderliggende componenten. Om gegevens uit apparatuur te kunnen verzamelen moeten de gegevens over storingsmodi onder steeds dezelfde bedrijfsomstandigheden worden gegenereerd. Dat betekent dat bij veranderende omstandigheden, zoals preventieve ingrepen, de data over faalpercentage worden aangepast.
Rondom de kwaliteit van de componentdata is er nog veel te doen. De betrouwbaarheid van componenten is in belangrijke mate afhankelijk van een breed scala aan omgevings- en operationele factoren. Daarom zijn de eventueel meegeleverde fabrikantgegevens op zijn best gemiddelde waarden met bepaalde betrouwbaarheidsniveaus. De meeste gegevens bevatten alleen uitvalpercentages, testrapporten zijn vaak niet aanwezig of beschikbaar voor besluitvormers op het gebied van onderhoud.
De informatie die het meest nodig is, zijn gegevens over kritieke storingen. Kritieke storingen gaan gepaard met verliezen (b.v. dodelijke slachtoffers, productie). In veel organisaties is het echter niet duidelijk welke verliezen acceptabel zijn. Onderhoud moet dus alle mogelijke verliezen voorkomen gedurende de geplande operationele levensduur van het asset. Dit leidt tot onderhoudsbeleid dat is ontworpen zonder goed te weten welke storingen het beleid moet voorkomen.
Dit is de achtergrond van de misvatting achter De Resnikoff’s Conundrum. Resnikoff stelt dat als ernstige storingen bij het eerste ontwerp zijn uitgesloten, er nooit geschikte data voor analyse zal zijn. De berekende kans op verliezen is in de fase voorafgaand aan het ontwerp zeer klein gemaakt.
Wanneer storingsgegevens de effecten van huidige en eerdere onderhoudspraktijken bevatten, zou het punt van mogelijke storing (P) vóór het punt van functionele storing (F) liggen. De onderhoudsinterval zou dus korter zijn dan MTBF. Uitval wordt voorkomen en dus zou het interval waarschijnlijk langer zijn dan wanneer er geen preventief onderhoud zou zijn uitgevoerd. Evenzo veroorzaakt het optreden van een storingsmodus corrigerende maatregelen die op hun beurt het optreden van andere storingsmodi kunnen voorkomen.
Wanneer dergelijke gegevens worden verzameld, is het waarschijnlijk niet dat de steekproefomvang voldoende is om betrouwbaar te zijn. Zelfs als de gegevens nauwkeurig zouden zijn, is de benadering met de betrouwbaarheidstheorie omslachtig. De meeste organisaties hebben onvoldoende competent personeel om gegevens in modellen te vatten. Modelleren is nog complexer als verschillende systemen en componenten bevatten. Het modelleren van gegevens is vooral lastig als de gebruiker geen ervaring heeft statistiek, kansverdeling, functies, programmeren of programmasimulaties. Zonder de juiste programmatuur is het zelfs onmogelijk resultaten te begrijpen en analyseren.