陳鵬崗, 方健軍, 王科
(1.西安交通大學第二附屬醫院,陜西,西安 710000;2.煙臺市中醫醫院,山東,煙臺 264000;3.山東理工大學,計算機科學與技術學院,山東,淄博 255000)
伴隨著網絡基礎設施的建設與通信行業的快速發展,信息化在各行各業得到了廣泛的應用,促進了社會的進步與經濟的快速發展。與此同時,網絡安全問題也成為了各行各業都必須面對的問題,木馬病毒、黑客攻擊使得網絡安全面臨新的挑戰[1]。醫院網絡化建設對提升醫院的就診效率、患者滿意度發揮著至關重要的作用,確保醫院網絡安全對維護醫院正常運轉具有至關重要的意義。
傳統的網絡安全評估可以分為定量評估和定性評估2類,伴隨著人工智能技術的快速發展,出現了智能化的網絡安全評估方法。模糊法、德爾菲法、歷史比較法是最為常見的定性評估方法,回歸分析法、聚類算法、決策樹模型、因子分析法是最為常見的定量評估方法。不論是定量評估法還是定性評估法,在對網絡安全的評估中受到主觀因素影響比較大,這導致網絡安全評估的科學性與嚴謹性不足?;谌斯ぶ悄芗夹g的智能化網絡安全評估方法,能有效地解決網絡安全評估科學性與嚴謹性不足的問題,使得網絡安全評估結果更加客觀、合理[2]。相關向量機(Relevance Vector Machine,RVM)是一種新的監督學習算法,在網絡安全評估中具有廣泛的應用,但核函數的寬度對網絡安全評估的性能影響比較大[3]。本文采用蝙蝠算法(Bat Algorithm,BA)優化RVM模型,并將其應用于醫院網絡安全量化評估中。將醫院網絡安全量化評估結果和傳統RVM模型對比,驗證所提出BA-RVM網絡安全量化評估的有效性,這為醫院開展網絡安全量化評估提供了新的思路。
為了更好地維護網絡安全,國家制定了相關的標準與技術要求,有效地確保網絡傳輸信息的準確性、完整性、可用性,同時避免非法訪問。建立網絡安全評估模型就是要在此基礎上,按照科學、公開、合理的原則開展網絡安全評價。對網絡安全評估的重點是網絡安全事件的影響范圍與危害程度,包含系統風險、資金風險、設備風險等多個方面的內容,具體計算式為
網絡安全級別=R(L(T,V),R(Ia,Va))
(1)
式中,R為網絡安全風險計算函數,L為網絡安全出現的預測值,T為網絡安全威脅,V為網絡安全可靠度,Ia為網絡安全出現風險后業務應用情況,Va為網絡安全出現風險后設備資產本身的可抵抗程度。
文獻[4]從資產、脆弱性、威脅等3個角度建立醫院網絡安全評估模型,具體如圖1所示。
圖1 網絡安全評估模型
醫院網絡安全水平的量化評估預測和評價指標的選擇之間具有十分密切的關系,科學選擇評價指標有助于提高醫院網絡安全水平量化評估的準確度。如果評價指標選擇比較多,那么信息就會產生冗余和干擾,同時量化評估的效率也比較低;如果評價指標選擇比較少,那么就會導致不能獲取足夠的信息,影響量化評估的精度。本文采用層次分析法建立醫院網絡安全量化評估的評價指標,具體如圖2所示。
圖2 醫院網絡安全評價指標體系
(2)
式中,N為樣本數據個數,wi為設置權重值,w0為偏置,K(x,xi)為核函數。
建立RVM模型要求目標函數必須是相對獨立的,同時目標函數本身包含噪聲,即
yn=f(xn,w)+εn
(3)
式中,εn為噪聲。
對應似然函數計算式為
(4)
式中,y=[y1,y2,…,yN]T,w=[w1,w2,…,wN]T,φ=[φ(x1),φ(x2),…,φ(xN)]T,φ(xN)=[1,K(xn,x1),K(xn,x2),…,K(xn,xN)]T。
傳統方法是采用最大似然法來求解最優權值,但是往往會出現過度擬合的情況。為了避免在求解最優權值的過程中過度擬合,本文采用稀疏貝葉斯(Spare Bayesian)公式計算權重w所對應的先驗概率的條件分布,即
(5)
利用貝葉斯公式來計算未知參數對應的后驗概率,即
(6)
聯合以上各式,權重w所對應的后驗概率計算式為
(7)
其中,Σ=(δ-2φTφ+A)-1,A=diag(α0,α1,…,αN),μ=δ-2ΣφTy。
利用delta函數計算樣本數據的相似性,通過樣本數據的相似計算來有效解決相關聯向量向超參數進行學習轉化和后驗概率存在的模式化問題,確保參數α取得最大值的計算式為
(8)
進行循環迭代估計,得到
(9)
式中,μi為第i個平均后驗權重,Σij為第i個相對角的具體元素。
采用RVM模型對醫院網絡安全量化評估預測的性能與核函數寬度g之間具有密切的關系,為了更好地提高RVM模型對醫院網絡安全量化評估預測的性能,采用BA算法對核函數寬度g進行優化。定義目標函數為
s.t.g∈[gmin,gmax]
(10)
BA是依據蝙蝠借助回聲實施定位的生物學原理提出的群體智能優化算法,提出BA群體智能優化算法基于以下3個方面的假設[6]。
假設1:蝙蝠群體內所有的個體均通過回聲定位來進行距離的感知。
假設2:蝙蝠群體內個體的行動軌跡過程為個體在Xi位置,以Vi速度進行隨機無目的的飛行,在整個飛行過程中采用固定頻率fmin、可變波長λ和響應A0進行獵物的搜索,同時蝙蝠個體在飛行的過程中會自動地發射出脈沖頻率以及進行波長調整。脈沖波長的調整依賴于蝙蝠個體和獵物之間的距離,頻度r在區間[0,1]范圍內調整。
假設3:在使用BA智能優化算法之前預先設定獵物回聲的上限值Amax和下限值Amin。
設定目標函數minf(X),X=(x1,x2,…,xd)T,采用BA求解的步驟[7]如下。
步驟1:參數初始化
初始化蝙蝠種群規模NP,標識蝙蝠種群每一個個體的初始位置Xi(i=1,2,…,NP),設置搜索脈沖對應頻率范圍[fmin,fmax],脈沖速率r0,最大聲音值A0,脈沖速率增強系數γ和聲音響應衰減系數α。
步驟2:脈沖頻率、速度以及蝙蝠位置更新
對脈沖頻率、速度以及蝙蝠位置進行實時動態更新,即
(11)
式中,t為循環迭代次數,β為區間[0,1]上的隨機向量,X*為當前全局最優解的坐標位置。
步驟3:獲得最新解
由隨機函數生成隨機數rand,如果隨機數rand>ri,那么選擇最優解集中的任意值,同時在最優解附近生產局部最優解,同時結合隨機擾動方程獲得最新解,即
Xnew=Xold+εAt
(12)
式中,Xnew為最新解,Xold為原始解,ε為區間(-1,1)上的隨機數,At為完成t次迭代運算相應結果的平均值,即平均響應值。
步驟4:脈沖響應與頻率更新
如果滿足rand (13) 步驟5:算法終止條件判斷 判斷是否滿足BA的終止條件:如果滿足算法終止條件,那么輸出解即為最優解;如果不滿足算法終止條件,那么返回步驟2。 采用BA智能優化算法對RVM參數進行優化,得到用于醫院網絡安全量化評估預測的BA-RVM模型。具體流程如下。 (1)對BA智能優化算法初始化,同時將醫院網絡安全量化數據樣本按照4∶1的比例分為訓練樣本和測試樣本,采用訓練樣本對BA-RVM模型進行訓練,采用測試樣本求證BA-RVM模型的有效性。 (2)計算目標函數適應參數值,采用式(10)計算蝙蝠種群每一個蝙蝠個體的個體適應度值。 (3)判斷是否滿足BA設定的終止條件。如果滿足BA設定的終止條件,那么輸出的解作為核函數的最優寬度g*,得到優化后的RVM模型,采用訓練樣本完成對醫院網絡安全的量化評估;如果不滿足BA算法設定的終止條件,那么跳轉到第(4)步。 (4)采用頻率調整公式獲得最新解以及所對應的蝙蝠速度與位置坐標。 (5)對接受新解與否進行邏輯判斷。如果接受新解,則執行步驟(6);如果不接受新解,則執行步驟(4)。 (6)更新蝙蝠響應和發射頻率,跳轉到步驟(2)。 基于BA-RVM模型的醫院網絡安全量化評估流程[8-9]如圖3所示。 圖3 基于BA-RVM的醫院網絡安全量化評估算法流程圖 實驗數據來源于某三甲醫院2011—2020年網絡安全量化評價數據,對數據進行歸一化處理,同時過濾噪聲,網絡安全評價指標得分如表1所示,網絡安全最終得分如表2所示。 表1 2011—2020年網絡安全評價指標得分 表2 2011—2020年網絡安全最終得分 為了更好地評價算法的性能,采用均方根誤差(Root Mean Square Error,RMSE)和平均絕對誤差(Mean Absolute Error,MAE)作為衡量指標,RMSE和MAE計算式為 (14) (15) RMSE反映了模型預測值和實際值的離散程度,MAE反映了模型的誤差。RMSE和MAE值越小,那么模型的預測精度越高、性能越穩定。 當滿足醫院網絡安全評價指標的實際值和預測值相等時,將醫院網絡安全評價結果設置為1,該結果值是識別醫院網絡安全是否在高風險區的極限值之內。本文設定的醫院網絡安全級別評價標準如表3所示。 表3 網絡安全評判標準 將由網絡安全專家打分獲得的11組數據樣本進行劃分,前7組數據樣本為訓練樣本,后4組數據樣本為測試樣本。設定BA的種群規律為10,最大迭代次數為100,脈沖速率為0.5,搜索脈沖范圍為0-2,聲音最大響應值為0.25,響應衰減系數值為0.9,所對應的脈沖速率增強系數為0.05。分別采用RVM模型和BA-RVM進行醫院安全量化評估預測,評價結果如圖4所示,評價相對誤差如圖5所示,同時給出2種模型的RMSE和MAE,如表4所示。 表4 不同算法結果對比 (a)RVM 由圖4可知:不論是采用RVM模型還是BA-RVM模型,第1組和第2組的實際得分和預測得分相差均比較小,而第3組和第4組的實際得分和預測得分相差均比較大;采用BA-RVM模型的預測得分和實際得分相差比較小,而采用BA-RVM模型的預測得分和實際得分相差比較大。 由圖5可知,通過得分相對誤差可以非常直觀地看出采用BA-RVM模型的預測得分和實際得分相對誤差明顯小于采用RVM模型的預測得分和實際得分相對誤差。 (a)RVM 由表4可知,BA-RVM算法的RMSE和MAE值均小于RVM算法,即BA-RVM模型相對于RVM模型,其預測精度更高、性能更穩定,即基于BA-RVM模型的醫院網絡安全量化評價預測具有更高的精度和穩定性,為醫院網絡安全量化評估提供了新的方法。 醫院網絡安全量化評估預測對提升網絡安全性具有至關重要的意義,本文提出了一種基于BA-RVM模型的醫院網絡安全量化評估預測方法,從資產、脆弱性、威脅等3個角度建立了醫院網絡安全量化評價指標體系,同時采用BA對RVM模型核函數寬度進行優化,并將優化后的RVM模型應用于山東省某三甲醫院的網絡安全量化評估預測中。將預測結果和傳統RVM模型的預測結果進行對比,指出BA-RVM模型對醫院網絡安全量化評估預測精度更高,模型性能更穩定,是醫院網絡安全量化評價的一種新方法。3.3 BA-RVM流程
4 實證分析
4.1 數據來源
4.2 評價指標
4.3 結果分析
5 總結