?

基于告警加權的智能光網絡故障診斷算法*

2018-12-20 06:50藍明超
湘潭大學自然科學學報 2018年4期
關鍵詞:置信度事務關聯

楊 劍,藍明超

(國防科技大學 信息通信學院,陜西 西安 710106)

隨著智能光網絡規模的不斷擴大,對故障診斷也提出了更高的要求[1-3].開展故障診斷研究,需要從告警數據分析入手,告警關聯技術可以進行告警相關性分析,挖掘根源告警,進而診斷故障[4-6],因此是進行故障診斷的常用方法.目前,通過告警關聯進行故障診斷已有多種研究方法,比如文獻[7]提出的基于改進BP神經網絡的故障診斷法;文獻[8]提出的基于層次分析法的網絡故障診斷系統架構;文獻[9]提出的基于模糊推理的網絡故障診斷法等.但是上述方法仍然存在著以下問題:首先,多數告警關聯分析算法都是挖掘根源告警,但僅僅分析根源告警無法提取出完整的故障信息,而且挖掘出的根源告警有可能出現多個共存的情況;其次,在進行故障診斷時,主要是通過網絡維護人員結合自身經驗給出故障原因,這種方法不僅耗費人力,也存在效率及準確度低下的問題;最后,由于智能光網絡新增控制平面,導致告警數據庫會同時接收來自三個不同平面上的告警,在這種情況下,運用上述方法準確診斷故障是非常困難的.針對當前研究存在的問題,本文提出一種基于告警加權的故障診斷算法,其核心思想是保留告警關聯關系的所有置信度,采用大數定理的方法對告警事件進行加權處理,再在此基礎上進行多告警組合下的原因分析,最后根據不同概率的原因組合進行故障診斷.采用這種算法可以結合智能光網絡的故障特點,提高告警分析的方向性和有效性,為故障診斷提供幫助,更具實用性和優越性.

1 基于大數定理的告警加權處理

1.1 大數定理基本概念

大數定理是概率論中關于大量隨機現象的極限定理,通過用“頻率”收斂于“概率”來使大量隨機事件的數據結果趨于頻率穩定性,達到數據處理最優化的目的[10].大數定理的簡單定義如下:

假設存在一組相互獨立且同分布的隨機變量X1,X2,X3,…,Xn,設它們的方差存在,記為σ2,又設它們的公共均值存在,并記為μ,則對于任意給定的ε>0,有如下公式:

1.2 基于大數定理的告警加權基本思路及步驟

在告警關聯中,通過告警關聯性分析可以得到不同支持度與置信度下的強關聯告警關聯規則,規定最小支持度和最小置信度有助于挖掘根源告警,要想確定頻繁告警事務集中各告警的權重,只需規定最小支持度,篩選出頻繁項集,保留頻繁項集下各告警關聯關系的所有置信度.這樣做的目的主要有以下兩個方面:一方面,通過規定最小支持度可以將海量告警數據中的頻繁項集篩選出來作為確定告警權重的目標事務集;另一方面,保留告警關聯關系中所有的置信度可以比較一個告警事務集中所有告警事件間的關聯關系,以此確定各個告警事件的權重.

大數定理的告警加權處理的核心思想就是將告警權重頻率化,即根據告警關聯規則的置信度和告警級別,將告警事務集作為一個集合,每個告警事件作為一個隨機事件,通過大規模的模擬計算將每個告警事件在這個集合中出現的頻率數值作為權重進行處理.其步驟主要分為三步:① 收集數據.收集的數據包括一個強關聯告警,事件的所有屬性,分為已知條件告警和對應產生的關聯告警,以及產生關聯告警的置信度,同時確定告警關聯事件中所有告警事件的告警級別,按緊急、主要、次要、提示分別量化處理.② 隨機生成事件,每次生成兩個以上告警事件,如果兩個事件相同的話,判定為一個事件合并去重,根據各個告警關聯關系的置信度并結合各告警事件量化的告警級別進行變化,多次計算,統計各告警事件的出現次數.③ 多次重復步驟②,綜合統計各個告警事件的出現頻率,得到各個告警事件的概率,用概率代替頻率,將獲得的概率數值作為各個告警事件的權重.

基于大數定理的告警加權處理的思路圖如圖1所示.通過告警加權不但可以為告警關聯事件中的各個告警賦予不同權重,同時也為該關聯條件下同一告警級別的告警優先級提供了參考,這樣不僅把每個告警事件按權重進行了排序,更為后期在通過告警原因進行故障定位時,給出了每個告警分析的重要程度,有利于更準確地診斷網絡故障.

2 基于告警加權的智能光網絡故障診斷算法基本思路

基于告警加權的智能光網絡故障診斷算法的思路圖如圖2所示.該算法設計思路可以分為3個步驟:① 收集告警事務集,建立告警加權模塊.依據基于大數定理的告警加權處理,首先將收集到的告警事務集中每個告警進行加權排序,分析比較告警事務集中各告警的重要程度.② 獲取告警原因及概率.依據每個告警的詳細告警信息,分析每個告警可能產生的告警原因,并確定每個告警原因所占的比重.在告警原因比重的確定中,可以通過告警信息說明中的原因比重分配,也可以通過前期網管人員處理單個告警問題時的數據記錄進行確定,如果這些信息因為某些因素無法獲取,則可以在告警原因的比重分配中采取等概率方法進行分配.③ 產生多告警組合下原因分析結果,進行故障診斷.結合不同權重下的告警事件以及每個告警事件的原因分配概率進行多告警組合下的原因組合,依據古典概型得到不同原因組合下的概率,最后根據不同概率下的原因組合進行貝葉斯推理確定故障原因進而進行故障診斷.

3 算法實現及分析

表1 某告警關聯關系表Tab.1 An alarm correlation table

實驗采用的仿真數據來源于中部地區五省兩市的智能光網絡告警數據.通過前期對告警數據進行告警相關性分析,挖掘出大量保留所有置信度下的頻繁告警事務集,分別對這些告警事務集進行故障定位分析.以其中一個告警事務集為例,該告警事務集中各告警事件及相互關聯關系下的置信度如表1所示.各個告警事件的告警級別及產生每個告警事件的原因如表2所示.

根據上述表格的信息,該告警關聯關系共有3種告警事件,6種告警關聯規則,9種告警原因.按照算法流程,首先通過告警加權模塊確定各告警的權重,輸入各告警關聯關系及對應的置信度,進行權重計算,得到的該告警事務集下各告警事件的權重結果如表3所示.

表2 告警級別及告警原因表Tab.2 Alarm levels and causes list

通過權重可以看出,在此告警事務集下,TU_AIS告警是比重最大的告警,其次是R_LOS告警,最后是LTI告警.因此,在對這些告警進行分析時,TU_AIS告警是重點分析對象,因而需著重分析引發其告警的原因,并結合其他兩個告警的原因進行多告警分析故障診斷.

表3 告警事件權重Tab.3 Alarm event weight

表4 部分原因分析及概率表Tab.4 Partial cause analysis and probability table

確定好告警權重之后,進入多告警組合原因分析模塊進行原因分析.通過告警原因表可以看到,該告警事務集中每個告警分別對應4種告警原因,本次實驗對告警原因取等概率進行分配,即產生告警的每種原因均為0.25.隨后進行多告警組合下原因分析,當這3種告警同時發生時,同時產生這3種告警的部分原因分析及概率如表4所示.

通過對告警加權處理進行告警原因分析得到的結果可以看出,根據不同概率下的原因分析進行故障診斷,不僅將多個告警信息提取出來合并到一條信息,而且克服了對根源告警分析時無法完全獲取故障信息的問題,為通過智能光網絡告警進行故障定位提供了參考.

綜上可知,本文提出的基于告警加權的故障診斷算法不僅對告警事務集中各個告警事件進行了加權處理,解決了告警分析的優先級問題,而且可以根據各個權重下的告警事件的原因得到不同概率的告警原因組合,解決了故障診斷的準確性問題.同時,該算法可以適應智能光網絡的故障特點,克服傳統方法的缺陷,具有實用性和優越性.

猜你喜歡
置信度事務關聯
一種基于定位置信度預測的二階段目標檢測方法
硼鋁復合材料硼含量置信度臨界安全分析研究
不懼于新,不困于形——一道函數“關聯”題的剖析與拓展
河湖事務
系統可靠性評估與更新方法
“一帶一路”遞進,關聯民生更緊
正負關聯規則兩級置信度閾值設置方法
奇趣搭配
基于OCC-DA-MCP算法的Redis并發控制
智趣
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合