?

基于參數貢獻度的硬件安全分析方法在列控系統中的應用

2021-09-18 00:46
鐵道通信信號 2021年8期
關鍵詞:貢獻度控系統完整性

高 鶯

列車運行控制系統(以下簡稱“列控系統”)是集計算機、通信、控制、信號技術為一體,確保列車安全高效運行的系統,具有典型的計算機系統結構。例如,測速測距傳感器、加速度傳感器等傳感輸入信息,需要通過計算機系統,將列車的運行距離、速度、加速度等處理成能夠被車載處理器識別的二進制信息,以便控制列車運行速度,確保行車安全;車載的各種制動實施信號、車門的關閉且鎖閉信號等,也需要處理成二進制信息,以便及時實施制動或開/關門操作;另外,列控系統與司機、調度、維護等相關人員進行的人機交互,也需要由計算機系統完成。為此,本文通過分析計算機系統的安全特征來驗證列控系統的安全性。

一些研究機構針對計算機系統(尤其是航空、軍工等行業)各種組件的失效類型進行了總結和討論,并形成了國際標準或商用數據庫[1]。其中,很多標準按照失效致因機理的差別,將計算機系統的失效分為隨機性失效和系統性失效[2]。系統性失效主要是由于系統需求和硬件設計錯誤導致的,需要在設計和實施階段采用質量控制和檢查流程等手段避免發生或及時予以糾正,可以看作是確定事件,只能進行定性分析;而隨機性失效可以看作是一個或一系列隨機事件,具有不確定性,在已知硬件元器件的失效率、失效模式和隨機失效出現次數等基礎上,可以對其量化,因此可以進行定量分析[3]。本文著眼于列控系統硬件安全性的定量分析,針對可能影響定量分析結果的參數,利用蒙特卡洛采樣法對輸入參數進行采樣,得出不同的采樣值,再對比分析不同參數對列控系統硬件安全性的影響。

1 系統安全分析原理

隨著計算機事故致因機理及信號系統的復雜性不斷提高,軌道交通行業的安全理念也不斷發生轉變,“危險”成為系統安全理念的核心。諸多國際標準中定義“危險”為“系統運行過程中,真實存在或可能出現的條件,這種條件下可能引發某個或一系列意外事件,導致人員傷亡、設備/財產損失、環境破壞、職業疾病的惡劣后果”[4]。危險不是系統的靜止狀態,而是系統行為與運行環境的耦合作用,即系統在某種環境或前因后果下的特定輸出。列控系統是否安全,與設備的工作環境、子系統間接口、線路參數等緊密相關。系統安全保障的主線是在整個運行過程中對系統危險進行跟蹤控制,其核心過程見圖1[5]。

圖1 系統安全保障核心過程

由于“安全”是相對的,因此可以用具體的量值表示危險程度,找出導致事故發生的潛在危險,并且用具體的數值來表示其發生的可能性,計算由其導致事故發生的概率和嚴重程度,制定對策和措施,從而預防事故的發生。

《電氣、電子、可編程電子安全相關系統的功能安全》(IEC 61508)中規定了在低要求模式、高要求模式或連續模式下,需要分配給一個安全相關系統安全功能的目標失效概率區間。鐵路信號系統屬于“高要求模式或連續模式”,其量化指標為“每小時危險故障的平均頻率(PFH)”。同時,“安全完整性”定義為“在規定的條件下和規定的時間內,安全相關系統成功實現所要求的安全功能的概率”。為了量化安全完整性,IEC 61508 提出了安全完整性等級(Safety Integrity Level, SIL)的概念,用于衡量系統是否具備達到所要求的安全功能的能力。SIL 分為5 個等級,SIL4 為最高等級,SIL0為最低等級,SIL值越高,安全相關系統在執行安全功能時失效的可能性越小,每一級SIL對應一個PFH的取值范圍[6]。本文用SILXU表示SIL的等級,且為每一級SIL的上限。

2 列控系統安全計算機結構

本文選用列控系統安全計算機二乘二取二結構作為分析對象。該結構依據IEC 61508、EN 50129和EN 50128 標準,基于分層思想設計,邏輯上分成應用軟件層、安全計算機軟件層、實施多任務操作系統層和硬件層,如圖2所示[7]。

圖2 列控系統安全計算機二乘二取二結構

FTSMU 容錯及安全管理(Fault Tolerant and Safe Management Unit)機制是保證列控系統安全計算機安全性的基礎?;诖_定性原則設計,要求安全計算機在正確的時間執行正確的動作,并產生正確的結果,否則判錯而導向安全。列控系統安全計算機接收的應用數據通過以太網外網,分別發送給通信控制器A 和B,二取二的A 系處理單元1 和2、二取二的B系處理單元3和4承載的列控應用軟件,在FTSMU A 系和B系的控制下,通過冗余的以太網內網,讀取通信控制器A和B中的應用數據并進行處理[8]。

3 基于參數貢獻度的PFH分析方法

IEC 61508-6 提供的幾種安全苛求系統的PFH常用計算方法,均可以將PFH表示為參數MTTR、λD、β、βD、DC的 函 數 , 即PFH=Φ(MTTR,λD,β,βD,DC)[6]。其中:MTTR為系統平均故障恢復時間;λD為單位時間內(每小時)危險側的失效概率,可以表示為λD=λDU+λDD;λDU表示未檢測到的危險側失效概率;λDD表示檢測到的危險側失效概率;β為未檢測到的共因失效因子;βD為檢測到的共因失效因子;DC為診斷覆蓋率 , 與λDD、λDU的 關 系 為λDU=λD(1-DC),λDD=λD·DC。

蒙特卡洛采樣法是常見的用來分析隨機變量不確定的方法,本文采用蒙特卡洛采樣法獲得PFH計算中需要抽樣的樣本值。

定義1:設x為隨機變量,其累積分布函數為F(x),則其逆函數為[9]

通過逆變換算法獲得隨機變量x的樣本值:①根據隨機變量x的概率密度函數,計算其累計分布函數F(x);②求F(x)的反函數F-1(x);③設置隨機變量Z,Z在(0,1)范圍內服從均勻分布,即Z~Uniform(0,1);④令Z=F(x),通過隨機數發生器獲得隨機數Z;⑤計算樣本值X,X=完成隨機變量x的樣本抽樣。

假設PFH計算中輸入的參數MTTR,λD,β,βD,DC都是不確定的,將它們依次表示為X1,X2,X3,X4,X5,通過蒙特卡洛采樣法均勻采樣n次,獲得輸入參數的數據樣本Xi,即Xi=(xi1,xi2,…,xin),i=1,2,3,4,5;用Yi表示輸出數據樣本,即PFH的樣本,將輸入參數的數據樣本Xi代入PFH=Φ(MTTR,λD,β,βD,DC)可獲得輸出數據樣本Yi,并得到輸出樣本分布fY(y)=(Y1,Y2,…,Yn)[10]。

定義2:FY為輸出數據樣本中PFH高于SILXU的累積分布概率,則

定義 3:FY|Xi=xˉi為在Xi=xˉi條件下的輸出數據樣本中PFH高于SILXU的累積分布概率,則

利用式(3)可以計算輸入參數Xi的不確定性,對系統的安全完整性等級影響的貢獻度Ci:

式中,ΔF=FY-FY|Xi=xˉi。

圖3 表示消除了輸入參數的不確定性后,ΔF的3種典型情況,具體說明如下。

1)ΔF=FY,此時Ci=1,輸出數據全部分布在規定的SILX 區域內,見圖3(a)。表明輸入參數不確定導致硬件安全完整性等級不確定的概率為100%,即輸入參數完全影響硬件安全完整性等級。

2)ΔF=0,此時Ci=0,輸出數據不在SILX區域內的部分累積分布與輸入參數不確定時的累積分布相同,見圖3(b)。表明輸入參數不確定導致硬件安全完整性等級不確定的概率為0,即輸入參數對硬件安全完整性等級沒有影響。

3) 0< ΔF< 1,此時 0<Ci<1,輸出數據不在SILX 區域內的部分累積分布大于輸入參數不確定時的累積分布,見圖3(c)。表明輸入參數的不確定導致硬件安全完整性等級不確定性的概率為0~100%,即輸入參數對硬件安全完整性等級有積極影響。

圖3 ΔF典型情況

通過上述3 種典型情況分析可知:Ci值越大,相應的輸入參數對硬件安全完整性等級的影響越大。

4 實例應用及分析

在列控系統安全計算機二乘二取二結構下,分析MTTR,λD,β,βD和DC這 5 個輸入參數對硬件安全完整性等級影響的貢獻度。假設各輸入參數服從均勻分布,通過蒙特卡洛采樣法得到輸入數據的樣本,每次采樣獲得樣本個數為10 000,各輸入參數取值為:MTTR~U(0.5,24);λD~U(5e-8,1e-6);β~U(0.02,0.2);βD~U(0.01,0.1);DC~U(0.9,0.99)。

4.1 MTTR對SILX的影響

令λD、β、βD、DC不變,通過蒙特卡洛采樣法,分別獲得MTTR在不確定條件下的PFH輸出數據樣本及其累積分布函數,見圖4。假定二乘二取二結構硬件的安全目標為SIL4,即SIL4U=1e-8。由圖4 可知,MTTR不確定時,PFH輸出數據不在SIL4 區域內部分的累積分布與MTTR確定時的情況相同,即CMTTR=0,則MTTR不會對硬件的安全完整性等級的取值產生影響。

圖4 MTTR在不確定條件下對硬件SIL影響的貢獻度分析

4.2 λD 對 SILX 的影響

令MTTR、β、βD、DC不變,分別獲得λD在不確定條件下的PFH輸出數據樣本及累積分布函數,見圖5。假定2 乘2 取2 結構硬件的安全目標為SIL4,由圖5 可知,λD不確定時,PFH輸出數據全部分布在規定的SIL4 區域內,即CλD=1,可知λD完全影響硬件的安全完整性等級。如果希望硬件的安全完整性等級達到SIL4,首先需要控制好λD的取值。

圖5 λD在不確定條件下對硬件SIL影響的貢獻分析

4.3 β 對 SILX 的影響

令MTTR、λD、βD、DC不變,分別獲得β在不確定條件下的PFH輸出數據樣本及累積分布函數,見圖6。假定安全目標為SIL4,由圖6可知,β不確定時,PFH輸出數據不在SIL4 區域內部分的累積分布大于β不確定時的累積分布。同時,根據公式(4),通過Python 工具進行計算可得Cβ=0.8610,可知β對硬件的安全完整性等級有積極影響。如果希望硬件的安全完整性等級達到SIL4,需要關注β的取值。

圖6 β在不確定條件下對硬件SIL影響的貢獻分析

4.4 βD對SILX的影響

令MTTR、λD、β、DC不變,分別獲得βD在不確定條件下的PFH輸出數據樣本及累積分布函數。假定安全目標為SIL4,則βD不確定時,PFH輸出數據不在SIL4 區域內部分的累積分布與MTTR確定時相同,CβD=0,可知βD不會對硬件的安全完整性等級的取值產生影響,其對SIL 影響的貢獻分析曲線與圖4類似。

4.5 DC對SILX的影響

令MTTR、λD、β、βD其他輸入參數不變,分別獲得DC在不確定下的PFH輸出數據樣本及累積分布函數。假定安全目標為SIL4,DC不確定時,PFH輸出數據不在SIL4 區域內部分的累積分布大于β不確定時的累積分布。通過Python工具計算可得,CDC=0.8568,可知DC對硬件的安全完整性等級有積極影響,其對SIL 影響的貢獻分析曲線與圖6 類似。如果希望硬件的安全完整性等級達到SIL4,需要關注DC的取值。

綜合上述分析結果,可得到各輸入參數在二乘二取二結構下對硬件安全完整性等級影響的貢獻度大小,如表1所示。

表1 二乘二取二結構中輸入參數對硬件SIL影響的貢獻度

通過表1 可知:在二乘二取二結構下,CλD>Cβ>CDC>CMTTR/CβD,即λD對 SILX 的影響最大,β和DC有一定影響,λD和MTTR幾乎沒有影響。這是因為:λD指向危險側失效概率,表示的失效是導向危險的,因此在系統安全性中是最需要關注的指標;β指向沒有檢測到的共因失效,由于是沒有檢測到的失效,所以有潛在的風險,也是需要關注的;DC指向能夠檢測到的危險側失效率,因此對安全性的影響比λD和β小。相比之下,βD指向可以檢測到的共因失效,貢獻度比β??;MTTR是系統平均故障恢復時間,在系統可靠運行周期中所占比重很小,因此對系統安全性的影響最小。

5 結束語

本文以安全完整性等級作為衡量列控系統安全性的指標,分析了二乘二取二結構中不同輸入參數對其安全性的影響。為了避免單一的分析結果缺乏說服力,采用蒙特卡洛分析法對所有的輸入參數進行采樣,得出一組不同的采樣值,再逐一分析每一個參數在其他輸入參數不變的條件下,對列控系統安全完整性等級的貢獻度。該分析結果對列控系統研發人員在設計產品的性能指標及參數的選擇方面具有一定的參考意義。定量的安全分析能夠為控制隨機性失效,識別產品中的安全薄弱環節,找到影響安全指標的關鍵部件提供參考依據,指導設計進行針對性優化和失效防護。

猜你喜歡
貢獻度控系統完整性
關于防火門耐火完整性在國標、英標、歐標和美標中的比對分析
關于DALI燈控系統的問答精選
多型號車控系統統型設計實踐
基于單片機的智能門控系統
數字電視播控系統關鍵技術探究
ELM及IS/OS完整性對年齡相關性黃斑變性預后視力的影響
更正說明
班級貢獻度
榆林體育文化對“絲綢之路經濟帶”建設的貢獻度研究
鄉村旅游對經濟增長貢獻度分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合