Michelberger Pál (szerk.)

Bizonytalanság és biztonság

Fejezetek a mérnöki kockázatmenedzsmentből


3.5. Megbízhatóság, hibatűrés és redundancia – a rendszerek megbízhatóságának növelése (megengedhető hibák, redundáns rendszerek típusai, korlátai és alkalmazásai)

A különböző rendszerek és technológiák eltérő mértékben tolerálják a hibákat. Egyes helyzetekben a meghibásodás csupán kellemetlenséget okoz, máshol viszont azonnali, súlyos következményekkel járhat. Például egy autóval közlekedve bármikor félreállhatunk az út szélére, ha a motor meghibásodik, és ezzel elkerülhetjük a további kárt vagy balesetet. Ezzel szemben egy repülőgép az óceán felett nem tud „megállni” – egy kritikus hiba esetén nincs lehetőség azonnali biztonságos megállásra, így a tervezés során a hibák megelőzése, illetve hatásuk minimalizálása létfontosságú.
Ez a különbség határozza meg, milyen szigorúan kell alkalmazni a mérnöki tervezési módszereket és kockázatelemzést. Vannak hibatűrő rendszerek, ahol a meghibásodás nem vezet közvetlen veszélyhez, így elegendő lehet a rendszeres karbantartás és a gyors hibaelhárítás. Ilyen például egy gyártósor egy részegysége, amelynek kiesése „csak” termeléskiesést okoz. Más rendszerek azonban kritikus biztonsági rendszerek, ahol a meghibásodás közvetlenül emberéleteket veszélyeztethet, ezért itt redundanciát, vészhelyzeti protokollokat és szigorú minőségbiztosítási módszereket kell alkalmazni.
A repülésben például a redundáns rendszerek alapkövetelménynek számítanak: egy utasszállító repülőgépnek több, egymástól független hidraulikarendszere, kommunikációs csatornája és elektromos táplálása van, hogy egyetlen hiba ne vezethessen katasztrófához. Hasonló elvet követ az orvosi intenzív ellátásban használt lélegeztetőgépek tervezése is, ahol egy áramszünet esetén azonnal átveszi a működést a tartalék rendszer.
A kockázatelemzés itt nem pusztán hasznos eszköz, hanem alapvető tervezési követelmény. Segítségével megkülönböztethetők a megengedhető hibák (amelyekkel együtt lehet élni, és kezelhetők a fellépésük után) és a nem megengedhető hibák (amelyeket már a tervezés során ki kell zárni vagy a lehető legkisebbre kell csökkenteni).
A megbízhatóság és a hibatűrés két olyan alapfogalom, amely a biztonságtechnikában és a kockázatkezelésben szorosan összekapcsolódik, de nem ugyanazt jelentik. Megbízhatóság alatt azt értjük, hogy egy rendszer, eszköz vagy folyamat a tervezett körülmények között, adott ideig képes hiba nélkül ellátni a feladatát. Ez mérhető például üzemidővel, hibák közötti átlagos idővel (MTBF – Mean Time Between Failures) vagy a hibamentes működés valószínűségével. A magas megbízhatóságú rendszerek ritkán romlanak el, de ez nem feltétlenül jelenti azt, hogy hiba esetén is működőképesek maradnak.
A hibatűrés ezzel szemben azt fejezi ki, hogy a rendszer akkor is képes a működését folytatni, ha egy vagy több eleme meghibásodik. Ez a képesség nem feltétlenül jár együtt magas megbízhatósággal – lehet, hogy egy rendszer gyakrabban hibásodik meg, de a hibatűrő kialakítás miatt a felhasználó ebből semmit nem vesz észre. Például egy repülőgép egyik hajtóműve meghibásodhat, de a gép tovább repül a másikkal, és biztonságosan leszáll.
A gyakorlatban a megbízhatóság és a hibatűrés együtt adja a rendszer biztonságát. Ha egy rendszer nagyon megbízható, de nem hibatűrő, akkor egy ritka, de kritikus hiba végzetes lehet. Ha pedig hibatűrő, de nem megbízható, akkor a gyakori hibák ellenére is működőképes maradhat, de karbantartási költségei magasak lesznek. Az ideális megoldás az, ha a kettő egyszerre van jelen: a rendszer ritkán romlik el, és ha mégis, akkor is képes ellátni a feladatát.
Jó példa a légiforgalmi irányító rendszerek működése: ezeknek rendkívül magas megbízhatósággal kell üzemelniük, hiszen egy leállás akár több száz repülőgép biztonságát veszélyeztetheti. Ugyanakkor hibatűrésük is kiemelkedő, mert több független szerver, kommunikációs csatorna és tartalék energiaforrás biztosítja, hogy egyetlen meghibásodás se állítsa le a forgalomirányítást. Hasonló elv érvényesül a banki tranzakciós rendszerekben is, ahol a megbízható működés mellett redundáns adatközpontok és automatikus átállás gondoskodik arról, hogy egy szerverhiba ne okozzon szolgáltatáskiesést.
A kockázatkezelés szempontjából a megbízhatóság növelése csökkenti a hibák előfordulásának esélyét, a hibatűrés pedig mérsékli a hibák következményeit. Együtt alkalmazva ezek a módszerek jelentősen hozzájárulnak a biztonságos, üzembiztos és gazdaságosan fenntartható működéshez.
A redundancia a kockázatkezelés egyik kulcsfogalma, amely azt jelenti, hogy egy rendszerben a kritikus funkciókat nem egyetlen elemre bízzuk, hanem több, egymást helyettesíteni képes megoldással biztosítjuk. Ez a módszer növeli a rendszer megbízhatóságát, mert egyetlen hiba nem okozza az egész rendszer leállását vagy működésképtelenségét. A redundancia elvét számos iparágban alkalmazzák, különösen ott, ahol a hibák következményei súlyosak vagy helyrehozhatatlanok lehetnek.
A repülésben például a navigációs rendszerek, a repülésirányító számítógépek és a hidraulikus kormányrendszerek többszörözve vannak jelen. Egy utasszállító repülőgép akár három különálló, független navigációs számítógéppel is rendelkezik, amelyek folyamatosan összevetik az adatokat, és ha az egyik hibát észlel, a másik átveszi a feladatát. Az űriparban ennél is szigorúbb a megközelítés: az űrhajó létfenntartó rendszereinek több egymástól független tartalék megoldása van, mert az űrben nincs lehetőség külső segítségre.
A redundancia nemcsak fizikai eszközökre vonatkozhat, hanem folyamatokra és emberi erőforrásokra is. Egy ipari üzem karbantartási csapatában például nemcsak egyetlen szakember ismeri a kritikus gépek javítását, hanem többen is képesek erre, így betegség vagy szabadság esetén sincs fennakadás. Az informatikában az adatszerverek tükrözése (mirroring) tipikus példa: ha az egyik szerver meghibásodik, a másik azonnal átveszi a szerepét, a felhasználó ebből semmit sem vesz észre.
Fontos azonban, hogy a redundancia nem ingyenes: több eszköz, több karbantartás, több képzés, nagyobb üzemeltetési költség. Éppen ezért a redundanciát ott célszerű alkalmazni, ahol a meghibásodás kockázata és következménye indokolja a többletbefektetést. A gazdasági szempontok figyelembevételével tervezett redundancia megtalálja az egyensúlyt a biztonság és a költséghatékonyság között. Ha jól alkalmazzák, a rendszer ellenállóbbá válik a váratlan eseményekkel szemben, és képes folytatni a működést még egy kritikus hiba esetén is.
A redundancia tehát az egyik legfontosabb mérnöki és biztonságtechnikai eszköz a kritikus rendszerek megbízhatóságának növelésére. Lényege, hogy egy adott funkciót nem egyetlen elem vagy rendszer lát el, hanem több, egymástól független, azonos feladatot végző komponens. Ha az egyik meghibásodik, a másik azonnal átveszi a szerepét, így a teljes rendszer működőképes marad. A redundancia nem csökkenti a hiba bekövetkezésének valószínűségét, hanem annak hatását mérsékli – ezáltal a kritikus hibák kockázata drasztikusan csökken.
Bár a redundancia jelentősen növeli a biztonságot és a megbízhatóságot, nem csodaszer, és vannak korlátai, valamint buktatói. Az egyik legnyilvánvalóbb korlát a költség: minden pluszkomponens, rendszer vagy folyamat extra beruházást, karbantartást és működtetést igényel. Ez nemcsak pénzügyi, hanem logisztikai terhet is jelent. További probléma lehet a komplexitás növekedése. Egy bonyolult, többszörözött rendszerben nehezebb a hibakeresés, több a potenciális hibapont, és nagyobb az esély arra, hogy a karbantartás során az egyik alrendszer véletlenül befolyásolja a másikat. Létezik egy pszichológiai buktató is: ha a személyzet tudja, hogy több tartalék van, hajlamos lehet kevésbé szigorúan követni az eljárásokat vagy kevésbé figyelni a megelőzésre – ezt hívják biztonsági paradoxonnak.
A redundancia ráadásul nem véd minden hibatípus ellen. Ha a hibát nem egy konkrét alkatrész meghibásodása okozza, hanem például egy hibás tervezési koncepció, szoftverhiba vagy emberi tévedés, akkor a többszörözés sem biztos, hogy megakadályozza a balesetet. Ha ugyanaz a hiba mindegyik tartalékrendszert érinti – például egy azonos szoftverhiba minden redundáns számítógépben –, akkor a biztonság illúzióvá válik.
Ugyanakkor számos területen a redundancia bizonyítottan életmentő. Az Apollo-programban a holdra szállások során a létfontosságú rendszerek – például a kommunikáció, az energiaellátás és a navigáció – több szinten redundánsak voltak. Az Apollo–13 katasztrófájánál, amikor az űrhajó egyik oxigéntartálya felrobbant, a tartalék rendszerek és a kreatív áttervezés tették lehetővé, hogy az űrhajósok biztonságban visszatérjenek.
A metrórendszerekben a redundancia a biztonsági irányítórendszerekben jelenik meg: több, egymástól független vezérlőközpont figyeli a forgalmat, és ha az egyik központ vagy kommunikációs csatorna kiesik, a másik azonnal átveszi a feladatát. Ez nemcsak a balesetek megelőzését szolgálja, hanem a szolgáltatás folytonosságát is biztosítja.
A bankok és pénzügyi rendszerek esetében a redundancia leginkább az adatbiztonságban és az üzletmenet-folytonosságban nyilvánul meg. A kritikus ügyfélszámla-adatbázisokat nemcsak több szerveren, hanem földrajzilag elkülönített adatközpontokban tárolják, így egy helyi áramszünet, tűz vagy kiberincidens nem bénítja meg az egész rendszert.
Összességében a redundancia akkor működik jól, ha a tervezés során figyelembe veszik a korlátait, rendszeresen tesztelik a tartalék megoldásokat, és nem hagyják, hogy a biztonsági háló jelenléte csökkentse az éberséget. Ha ez sikerül, a redundancia valódi biztonsági erőforrás, nem pedig hamis biztonságérzet.
 

Bizonytalanság és biztonság

Tartalomjegyzék


Kiadó: Akadémiai Kiadó

Online megjelenés éve: 2026

ISBN: 978 963 664 195 5

A Bizonytalanság és biztonság című tanulmánykötet 6 mérnökvégzettségű, Óbudai Egyetem Bánki Donát Gépész és Biztonságtechnikai Mérnöki Karán dolgozó oktató közös munkája. Karunk gépész-, mechatronikai- és biztonságtechnikai képzésre járó hallgatói képzésük során megismerkednek a kockázatmenedzsment alapjaival, módszertani hátterével, és elsajátítják a kockázatértékeléshez és -kezeléshez szükséges elméleti hátteret. A könyv nem egyetemi tankönyvnek készült, de ott is használható. Fontos célunk volt a 8 tanulmányt tartalmazó kötet közreadásával, hogy a különböző szakterületek képviselői lássák a műszaki beruházási és fejlesztési projektek, az információbiztonság, a minőségbiztosítás, a karbantartás, a munka- és tűzvédelem kockázatmenedzsmentjének néha eltérő, de integrálható sajátosságait.

A gazdálkodó szervezetek életében szükség van egységesen alkalmazott kockázatmenedzsment szabályokra, hiszen a kockázati eseménynek több, eltérő eredetű kiváltó oka és több következménye is lehet. Eltérő skálákon történő értékelésük zavart okozhat kockázatok felismerésében és kezelésében is. A mérnöki kockázatok mellett a szervezeteknél többek között megjelennek stratégiai, piaci és pénzügyi vagy akár biztosítási kockázatok is. A könyv terjedelme nem teszi lehetővé, hogy ezekkel is foglalkozzunk, de fontos felhívni a figyelmet, hogy a kockázatmenedzsment nemcsak a mérnöki feladat…

Hivatkozás: https://mersz.hu/michelberger-bizonytalansag-es-biztonsag//

BibTeXEndNoteMendeleyZotero

Kivonat
fullscreenclose
printsave