?

基于改進決策樹算法的電能計量裝置故障自動化診斷系統

2024-03-06 05:32趙書函
自動化與儀表 2024年2期
關鍵詞:算例決策樹電能

張 馳,王 棟,趙書函

(國網甘肅省電力公司信息通信公司,蘭州 730000)

電網當中電能計量裝置作為進行電量結算的重要電力設備,對其運行狀態以及故障監測是保障電網系統穩定運行的關鍵一步[1]。目前對電能計量裝置的故障監測主要通過人工巡檢的方式實現,存在不能及時發現故障、存在較長巡檢周期等問題[2-5]。本文通過結合改進決策樹算法的電能計量裝置故障自動化診斷系統設計,實現信息化、精細化、自動化的電能計量裝置故障監測,以實現降本增效、提高故障檢測精確度的目的。

1 電能計量裝置故障監測

1.1 電能計量裝置在線監測

電能計量裝置的主要構成包括電流互感器(CT)、電壓互感器(PT)以及電能表等[6]。電能計量裝置在線監測的整體系統流程如圖1 所示。

圖1 電能計量裝置在線監測整體流程Fig.1 Overall process of online monitoring of the electric energy metering device

1.2 電能計量裝置的數據挖掘

數據挖掘過程對大量數據進行收集分析[7],首先提取數據特征,建立工程模型,而后對采集信息比對,從而判斷電能計量裝置是否存在故障。數據挖掘的整體流程如圖2 所示。

圖2 數據挖掘整體流程示意圖Fig.2 Schematic diagram of the overall data mining process

1.3 決策樹算法

在數據挖掘算法中,決策樹算法屬于監督學習算法的一種[8],其結構如圖3 所示。

圖3 決策樹結構示意圖Fig.3 Decision tree structure

圖3 中,不同節點表示不同對象,分叉路徑表示相應可能出現的特征值。

2 決策樹算法

2.1 決策樹算法簡述

決策樹算法通常分為CART、C4.5 以及ID3。CART 決策樹以二叉樹結構為基礎,C4.5 決策樹以多叉樹結構為基礎,ID3 決策樹無法進行剪枝以及缺失值的處理。在電能計量裝置系統運行中,數據包括相應的缺失值,因此通過C4.5 決策樹進行具體系統研究。

2.2 選擇數據特征

設集合D 為對應的樣本數據集合,樣本數據的容量用∣D∣表示,樣本數據中包含的類Ck的個數為K,k=1,2,…,K,類Ck中的樣本數量為∣Ck∣。對于某一個數據特征A,其中包含的取值個數為n,也即{a1,a2,…,an},依據數據特征取值對數據樣本集合進行劃分,得到的子集D1,D2,…,Dn的個數為n。對于某個子集Di,其中包含的樣本數量為∣Di∣,對于某個子集中屬于某個類的樣本集合表示Dik,其對應的樣本數量表示為∣Dik∣。

可以將經驗熵表示為

式中:H(D)為相應的經驗熵。某一數據特征在特定條件下的經驗熵表示為

式中:A 為對應的數據特征;D 為特定條件。數據特征對于特定條件下訓練集產生的信息增益表示為

式中:g(D,A)為相應的信息增益。由此得到對應信息增益比表示為

式中:gR(D,A)為對應信息增益比?;嵯禂当硎緸?/p>

數據特征針對訓練集對應基尼系數表示為

式中:Gini(D,A)為數據特征針對訓練集對應基尼系數。D1={(x,y)∈D∣A(x)=a},D2=D-D1。

2.3 決策樹算法及剪枝

CART 決策樹算法中,將停止對節點樣本個數進行計算法的閾值、特征集A 以及數據的訓練集合D 作為對應的輸入,將決策樹T 作為輸出。CART決策樹算法通過由根節點不斷遞歸進行二叉樹的構建。

為避免決策樹過于復雜可能導致對應的過擬合情況,需要對決策樹進行剪枝,從而簡化復雜決策樹,避免過擬合情況出現。

3 算例仿真及分析

算例仿真采用某電網在線監控系統當中的電能計量裝置數據作為實驗數據,結合C4.5 具體的模型構建流程如圖4 所示。

圖4 結合C4.5 系統模型構建流程示意圖Fig.4 Schematic diagram of the construction process based on the C4.5 system model

圖4 中對應的電能計量裝置運行狀態的參數如表1 所示。

表1 電能計量裝置運行狀態參數設計Tab.1 Design of parameters of operating status of electric energy metering device

3.1 數據預處理

3.1.1 運行數據融合

在電能計量裝置當中,對二次回路當中三相壓降相關的特征參數δ(′)以及f(%)進行融合,融合后得到合成誤差。

系統運行的三相電壓以及電流對應的測量值變差可以通過式(7)以及式(8)進行求?。?/p>

3.1.2 分析特征相關性

運行數據融合之后得到新的特征數據,對系統中包含的里變量做出獨熱編碼,而后對數據特征屬性進行相關性分析,依據相關性大小進行決策樹當中特征屬性的選擇。

3.2 算例仿真

3.2.1 運行狀態

電能計量裝置在正常運行狀態下,其各項運行參數指標如下:電能表的有功變差在0.1%以內,有功誤差在0.16%以內,等級為0.2S;電能表的無功變差在1%以內,無功誤差在1.6%以內,等級為2;二次壓降的合成變差在0.06%以內,合成誤差在0.16以內;二次回路中電壓互感器的負荷為2.5 VA~80%,電流互感器的負荷為3.75 VA~80%,三相電流對應監測的變差在10%以內,電壓對應監測的變差在2%以內。

3.2.2 算例設計

算例在Anaconda 環境中實現,使用python 語言,機器學習數據庫采用sklearn。通過CART 算法與C4.5 算法做出對比,驗證設計系統的可行性,數據集所得結果如表2 所示。

表2 電能計量裝置數據集Tab.2 Data set of energy metering devices

表2 中通過K 折交叉驗證的方式,將數據隨機分配為10 組,其中1 組為驗證集,9 組為訓練集,之后進行重新隨機選取,一次進行交叉驗證。

3.3 仿真結果分析

3.3.1 C4.5 仿真結果

結合C4.5 算法進行故障自動化診斷系統仿真后得到的可視化結果,從根節點的分割方式來看,先通過二次壓降的C 相進行劃分,其對應的變差為X9,對應的信息增益比為1.5。其中1 組104,對應的value=[28,33,43],即正常值為28,預警值為33,故障值為43;另一組103,對應value=[28,70,5],即正常值為28,預警值為70,故障值為5。1 組104 中,依據二次壓降A 相的變差繼續進行劃分,2 組103中,依據電能表對應的無功誤差繼續進行劃分,其他層次依次類推劃分。

3.3.2 CART 仿真結果

結合CART 算法進行故障自動化診斷系統仿真后得到的可視化結果。根節點以X19 即三相電壓監測的一致性進行分割,對應基尼系數為0.625,一組16,對應value=[16,0,0],即正常值為16,預警值為0,故障值為0;另一組191,對應value=[40,103,48],即正常值為40,預警值為103,故障值為48。而后一次進行向下分割。

3.4 工程調參及結果對比

在不同決策樹對應的深度中,通過對參數進行調整,比較2 種算法的準確率。其中決策樹深度與準確率的關系如表3 所示。

表3 決策樹深度對準確率影響Tab.3 Influence of decision tree depth on accuracy

決策樹深度與預測準確率的關系如圖5 所示。

圖5 決策樹深度與準確率關系Fig.5 Relationship between decision tree depth and accuracy

結合圖5 與表3,CART 算法與C4.5 算法均能保證決策樹的預測準確率,且深度越深,能夠得到越高的準確率。但是決策樹的同等深度下,CART 算法的準確率相對更高,因此系統設計中采用CART算法。

結合CART 算法的故障監測系統與人工判讀的方式進行對比,其比較結果如表4 所示。由表4可知,決策樹算法在快速高效的同時,能夠更大程度地提高對故障判斷的準確率。

表4 人工判讀與CART 算法檢測系統對比Tab.4 Comparison between manual interpretation and CART algorithm detection system

4 結語

在電能計量裝置的在線監測系統中,引入了改進的決策樹算法,以期提高電能計量裝置的故障診斷效率以及精確度。通過算例驗證,基于改進決策樹算法的電能計量裝置故障自動化診斷系統能夠對電能計量裝置進行實時分類預測,通過算例模型進行數據比對,精確識別運行狀態,及時提供預警和故障信息。算例結果表明,該辦法能夠實現比人工判定更高的精確度,同時效率更高。

猜你喜歡
算例決策樹電能
蘋果皮可以產生電能
電能的生產和運輸
一種針對不均衡數據集的SVM決策樹算法
海風吹來的電能
決策樹和隨機森林方法在管理決策中的應用
澎湃電能 助力“四大攻堅”
基于決策樹的出租車乘客出行目的識別
基于振蕩能量的低頻振蕩分析與振蕩源定位(二)振蕩源定位方法與算例
互補問題算例分析
基于CYMDIST的配電網運行優化技術及算例分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合