?

基于改進梯度提升決策樹的10 kV及以下配電網線損率預測

2023-09-06 01:00陳世炳潘晶晶林金山
系統仿真技術 2023年2期
關鍵詞:損率網線低壓配電

陳世炳, 潘晶晶, 王 斌, 林金山, 羅 雁

(海南電網有限責任公司,海南 ???70203)

隨著網絡、通信、傳感器、物聯網等技術飛速發展,電網領域也迎來了黃金發展時代。然而隨著電網應用領域不斷拓寬,綠色及可持續發展理念不斷深入人心,10 kV 及以下低壓配電網中“線損”問題越發突出[1-2]。然而,目前10 kV 及以下低壓配電網存在數據量大,可用特征少,且數據質量參差不齊等問題[3-4]。

為此,眾多學者對10 kV及以下低壓配電網線損率計算方法進行了研究。文獻[5]基于專家系統設計了一套臺區線損異常智能診斷系統。文獻[6]基于用電信息采集系統建立了臺區線損分析平臺。上述計算方法較傳統計算方法結果更加精確,但收集大量的操作數據和結構數據需要時間和人力。文獻[7]基于數據驅動提出了一種臺區線損評估方法。然而,該方法需要建立復雜的計算模型,因此會犧牲部分計算精度。

近年來,人工智能算法在電力系統中得到了廣泛的應用,如SVM[8]、BP神經網絡[9]、深度學習[10]等為預測線損率提供了新的途徑。然而,這些方法很大程度上依賴于大量的數據。當數據質量不高或數據維數較大時,將嚴重影響線損率預測結果。為此,本文提出了一種基于梯度提升決策樹[11](Gradient boosting decision tree,GBDT)的10 kV 及以下低壓配電網線損率計算方法,以解決數據存在異常值的情況下線損率預測不高的問題。

1 模型介紹

1.1 特征選取

考慮到10 kV 及以下低壓配電網中有大量與線損率相關的特征,一旦特征選取標準不合理,將嚴重影響線損率計算結果。GBDT 是一種經典的計算智能算法,該算法可為10 kV 及以下低壓配電網眾多特征選取提供參考依據。

令特征為j,則其重要性程度可根據j在GBDT 的平均重要性計算,故

式(1)中,為特征j的全局重要性程度,M為樹的數量,為特征j在第m個樹中相對重要性程度。

計算公式如下所示:

式(2)中,J為樹中葉子節點個數。J- 1為非葉子節點個數。vt為與節點t有關的任意特征。為劃分節點t后的均方損失。B(?)為布爾函數,當其參數為真,則B(?) = 1;否則B(?)= 0。需注意

為實現特征選擇的一致性,本文使用Spearman 相關系數過濾無關變量。Spearman系數可評估2個變量之間的關系是否可以用單調函數來描述。因此,有

式(3)中,di表示每個觀測值之間的差異,n為樣本數。

1.2 數據聚類

本研究采用基于密度的帶噪空間聚類算法(Density-based spatial clustering of applications with noise,DBSCAN)對數據進行聚類,實現數據異常檢測。DBSCAN 是一種典型的可處理帶有噪聲數據的聚類算法。

令C={(X1,Y1),…,(Xn,Yn)}為數據點集,其中Xi={x1,x2,…,xm}。聚類數據點集C的過程可描述為

步驟1:初始化ε和MinPts,其中ε為掃描半徑,MinPts為最小樣本個數。

步驟2:確定任意數據點之間的歐幾里德距離Dhi,即

式(4)中,Sk為標準距離。

步驟3:?Xi,搜索在其掃描半徑內的任意數據點構建核心簇。

步驟4:確定數據集中孤立的數據點,并將這些數據點組成新群。

步驟5:重復上述過程,直至執行完任意數據點劃分為核心簇的過程。

步驟6:劃分過程結束,如果存在任意數據點不屬于任意核心簇,則將這些數據點標記為異常點或噪聲數據。

2 基于改進的GBDT線損預測模型

傳統GBDT 是一種典型的串行計算模型,存在計算效率低、易過擬合等缺陷。為此,本文提出了一種改進的GBDT模型實現并行計算,以提高模型預測性能,同時加速模型訓練效率,避免過擬合。

改進的GBDT 模型中,預測值為所有樹模型預測值的加權和,因此有

式(5)中,Xi={(x1,x2,…,xm)}為由特征構成的向量。m為模型中所有樹的個數。fi(X)為樹i模型的預測值。

令M表示最大迭代次數,L[]y,f(x) 為模型計算時的損失,c為任意無窮小常數。因此,第m個決策樹構建過程如下。

步驟1:確定當前模型損失,并計算其負梯度,即

步驟2:計算fm-1(X),同時以最小損失線性估計每個葉子節點的梯度rms(s= 1,2,…,S,s是第m個樹的葉子節點個數),則在下次評估時更新權重以減少損失。因此,該計算過程如下所示:

步驟3:模型更新,其更新公式如下所示:

式(8)中,v為學習率。I(x∈rms)為指標函數,當X∈rms時,該值取1;否則取0。

步驟4:循環至最大迭代次數M,至此可得到預測的線損率。

3 仿真與分析

為了驗證本研究所提方法的有效性,本章以10 kV 及以下低壓配電網的數據為例,選取1446 個實例樣本進行仿真與分析。需注意,每個樣本應包含功率因數、電表數量、線路總長度、平均負荷率、主線橫截面積和供電功率6個電氣特征。

3.1 構建特征庫

首先,對1446 個實例樣本進行數據預處理操作,初篩部分不合格數據。其次,結合GBDT 相對重要性和Spearman 相關系數對所有電氣特征進行評估,選取均方誤差最小的特征構建特征向量,最終統計結果如圖1所示。由圖1可以看出,供電功率和主線橫截面積始終是重要的特征,功率因數和電表數量2 個特征貢獻程度相對較低。因此,本研究將功率因數及電表數量2 個特征略去,最終選取線路總長度、平均負荷率、主線橫截面積和供電功率建立特征庫。

圖1 不同方法特征貢獻對比統計結果Fig.1 Comparative statistical results of feature contributions of different methods

3.2 低壓配電網的分類

表1 所示為不同特征聚類中心統計結果。其中聚類1 表示4 個指標占比最大;聚類2 次之;接下來是聚類3;聚類4中各指標占比最小。

表1 特征聚類中心統計結果Fig.Statistical results of feature clustering centers

3.3 仿真結果與分析

圖2 所示為支持向量回歸(Support vector regression,SVR)、隨機森林回歸(Random forest regression,RFR)與本研究所提模型的預測誤差對比結果??梢钥闯?,SVR 的預測曲線誤差最大,其次是RFR,而本研究所提方法誤差最小。與SVR 和RFR 相比較,本研究所提方法的均方誤差分別降低了2.24%和0.86%。

圖2 不同模型預測誤差對比結果Fig. 2 Comparison of prediction errors of different models

4 結 語

本研究對10 kV 及以下低壓配電網線損預測方案進行了研究與分析,提出了一種基于改進GBDT 的10 kV 及以下低壓配電網線損預測模型。該模型結合GBDT相對重要性和Spearman相關系數對所有電氣特征進行評估,選取均方誤差最小的特征構建特征向量。進一步利用基于密度的帶噪空間聚類算法對10 kV 及以下低壓配電網數據進行分類,解決數據集中數值離散性造成的評估精度低問題。本研究所提方法對10 kV及以下低壓配電網線損預測具有一定的借鑒作用。

猜你喜歡
損率網線低壓配電
我國水庫淤損情勢分析
低壓配電網接地方式及與剩余電流保護的配置探究
關于如何降低配網線損的研究
無功補償極限線損率分析及降損措施探究
供電企業月度實際線損率定量計算方法
加強配網線損管理 提高企業經濟效益
工廠供電系統低壓配電保護電器的選擇研究
網線與網線頭區別以及網線的接法
改進等效容量法在含風電配網線損計算中的應用
中低壓配電網能效管理系統設計及其實現
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合