?

灰狼算法優化SVR的10kV配網線損率預測研究

2024-03-25 02:04楊正宇沈志強鄭成源
計算機技術與發展 2024年3期
關鍵詞:損率灰狼殘差

楊正宇,沈志強,鄭成源

(1.云南電力試驗研究院(集團)有限公司,云南 昆明 650217;2.云南電網有限責任公司臨滄供電局,云南 臨滄 677000;3.云南電網有限責任公司電力科學研究院,云南 昆明 650217)

0 引 言

電網的線損率是一個綜合性、全面性的評價指標,其不僅可以反映一個單位或一個區域的供電經濟性,也可以間接反映供電的技術條件和管理水平[1]。有效控制線損率、降低線路損耗、實現電網經濟運行是電力企業現代化管理的核心內容[2],因此,對線損率進行準確預測,及時對高損線路進行巡檢維護,有利于降低供電成本,保證電網經濟穩定地運行。

近幾年來,有關配電網線損、線損率的計算與預測研究變得愈發活躍[3-7]。傳統常用的統計線損的理論計算方法有均方根電流法、平均電流法等。雖然線損的理論計算在一定條件下能夠取得較好的效果,但是由于理論計算條件較為理想,現實中部分電力數據較難獲取等問題,實際來說并不具有代表性。隨著計算機、人工智能技術的發展及其在電力系統中的運用,許多新的方法被用于線損計算中[8-9]。

該文以10 kV配電網運行數據為基礎,對原始數據進行必要的預處理操作,以馬氏距離為異常值的判定標準,采用卡方分布確定異常閾值,對原始數據中的異常值進行剔除,為下文的建模分析打下基礎。然后通過主成分分析對所選特征進行降維處理,利用灰狼優化算法具有強搜索性、強遍歷性的優點與支持向量機回歸模型相結合,對支持向量機回歸模型的懲罰因子c和核函數g進行優化[10-11]。之后將處理好的特征量作為輸入建立模型,最終通過云南電網某供電所真實電力數據對模型的預測效果進行驗證。

1 GWO-SVR模型數學理論

1.1 支持向量機回歸

相比于約束較為嚴格的SVM分類,回歸則比較寬松[12-13]。對于回歸問題,給定訓練數據D={(x1,y1),(x2,y2),…,(xm,ym)},需要構建一條以f(x)為中心,寬度為2ε的隔離帶,當訓練樣本落入此隔離帶時,認為預測是正確的,即僅當f(x)與y之間的差異絕對值大于ε時才計算損失。在圖1中,認為落入兩條虛線中的樣本殘差為零,也就是它們的誤差是可以容忍的。需要做的就是找到這兩條合適的虛線邊界,目的是使在虛線外的樣本到虛線的直線距離ζ最小,最后再對區域外的點進行回歸,其中損失函數如式1所示:

圖1 支持向量機回歸原理

(1)

式中:z為數據點到f(x)的距離;ε為誤差閾值。

s.t.f(xi)-yi≤ε+ξi

(2)

在此基礎上引入拉格朗日乘子并對其求偏導,并將結果帶入SVR對偶問題,可得出SVR解的公式為:

(3)

徑向基核函數(RBF)是常用的核函數,其函數表達式為:

K(xi,xj)=exp(-r‖xi-xj‖2),r>0

(4)

式中:r為函數的寬度參數,控制了函數的徑向作用范圍。

1.2 灰狼優化算法的數學描述

在灰狼優化算法中,狼群中每一頭灰狼代表了種群的一個潛在解。為了描述灰狼的社會等級,將α狼的位置視為最優解;將β和δ狼的位置分別作為優解和次優解;w狼的位置作為其余的候選解。在GWO算法中,由α,β,δ引導狼群搜索,而w跟隨前面的3種狼?;依莾灮惴ǖ脑砣鐖D2所示。

圖2 灰狼優化算法原理

灰狼狩獵時需要包圍獵物,包圍的數學描述為:

(5)

式中:t為當前迭代次數;A和C為協同系數向量;XP為獵物的位置;X為灰狼的位置。該文引入一種隨迭代次數增加而線性變化的收斂因子α,向量A和C與收斂因子α的計算方式如下:

(6)

式中:α的分量在迭代過程中從2線性減少到0,it為當前的迭代次數,Maxit為設置的最大迭代次數,r1,r2是[0,1]之間的隨機向量。

在狩獵階段中狩獵通常由α狼引導,β和δ也可能偶爾參與狩獵行為,在每次迭代過程中,保留迄今為止獲得的最優的三個解(α,β,δ的位置),迫使其他狼(w)根據最優的搜索位置采用以下公式對它們的位置進行更新:

(7)

式中:Dα,Dβ,Dδ分別表示當前候選灰狼與最優三條狼之間的距離,C1,C2,C3,A1,A2,A3皆為系數向量,Xα,Xβ,Xδ分別為三種狼的原始位置,X1,X2,X3分別為三種狼更新后的位置。

為了描述接近獵物,根據式6,通過逐漸減少α的值,A的值也隨之波動。當A的隨機值在[-1,1]中時,搜索狼可以是候選狼的當前位置和獵物之間的任何位置?;依侵饕鶕?β和δ狼的位置搜索,為了模擬搜索的分散性,利用A大于1或A小于-1的隨機值來迫使搜索狼遠離獵物,這樣會使GWO算法強調勘探,更有利于全局搜索。

1.3 GWO-SVR預測模型

基于GWO-SVR的線損率預測流程包括數據預處理、初始化種群、灰狼位置尋優等過程,具體步驟如下:

(1)數據預處理:對數據的預處理環節是分析研究的首要步驟,包括缺失值填補、異常值分析刪減等操作,同時利用PCA對原始數據進行降維處理。

(2)設定算法初始值:此處所需設定的參數包括種群規模、最大迭代次數、數據維度以及SVR中核函數g以及懲罰因子c(取值范圍)。

(3)模型中導入訓練集數據,初始化種群,以適應度作為評價函數值,不斷更新灰狼的位置信息,尋找參數最優的灰狼坐標。

(4)以最大迭代次數為運行的截止條件,當運行次數達到設定值后,得到支持向量機回歸最優參數,代入回歸預測模型。

(5)模型中導入測試集數據,利用相應指標對模型的預測效果進行評價。

GWO算法優化SVR模型的流程如圖3所示。

圖3 GWO算法優化SVR模型流程

2 數據預處理

2.1 基于馬氏距離的異常值檢驗

在所獲取的真實電力數據中,一般來說會存在數據重復以及數據缺失的情況,若不經過數據的清洗而直接使用的話效果往往會適得其反。該文采用“熱卡填充法”對原始數據中的缺失值進行填補,對于離群值采用刪除相應值并采用缺失值的填補辦法對其值進行修正處理。所收集的數據特征如表1所示。

表1 模型輸入輸出特征類型

與目前常用的聚類方法歐氏距離不同,馬氏距離可以應對高維線性分布的數據中各維度間非獨立、同分布的問題[14]。對于一個均值為μ=(μ1,μ2,…,μp)T,協方差矩陣為Σ的多變量矢量x=(x1,x2,…,xp)T,其馬氏距離為:

(8)

馬氏距離也可以定義為兩個服從同一分布并且其協方差矩陣為Σ的隨機變量:

(9)

該文所采用的數據均來自云南電網某供電所,共涉及10條10 kV配電線路共計1 200組電力數據,根據置信水平α=0.95對應卡方分布置信區間,以輸入特征量確定檢驗的自由度為7(輸入模型的特征個數),通過卡方分布計算可得卡方檢驗閾值為14.07。由于馬氏距離服從卡方分布,筆者認為馬氏距離大于14.07的數據即為異常值并予以剔除,達到提高樣本質量的目的?;隈R氏距離的異常樣本檢測的結果示意圖如圖4所示。

圖4 馬氏距離的異常樣本檢測的結果

2.2 數據降維處理

數據降維具有減少數據維度和需要的存儲空間、節約模型訓練計算時間、去掉冗余變量,提高算法的準確度等優點[15-16],其通過一定的手段和方法,降維重組成一組新的維度較少的主成分綜合指標,作為替代指標中原本的主成分數據集。表2給出了實際線損率數據經過 PCA 算法處理之后的前4個主成分的特征占比累計貢獻率。

表2 總方差解釋

PCA處理之后原始數據被重新組合成新的互不相關的特征量。由表2可知,前4個主成分的累計特征占比為95.878%,大于90%,也就是說明原始數據中絕大部分有效信息被成功提取。因此,選用這4個新的主成分數據來對原來所選的7維數據進行替代。經過數據重構后的主成分因子荷載如表3所示。

表3 主成分因子荷載

2.3 GWO-SVR預測模型初始參數的選擇

SVR模型具有能處理高維非線性問題的優點,但是相應的運算和存儲量都會有很大的消耗。在群智能優化算法中,種群數量的取值一般為20~40,粒子數量越多,搜索范圍越大,越容易找到全局最優解,但相應的算法運行時間也越長。為了保證模型的運算效率,該文初始種群規模選擇20,并且限制迭代次數最大為100代。

在支持向量機模型中,當所選參數趨于無窮大時,代表著不允許出現分類誤差的樣本存在,因為這將是一個過擬合問題,當所選參數趨于0時,不再關注分類是否正確,只要求間隔越大越好,那么將無法得到有意義的解且算法不會收斂。因此,灰狼優化算法針對的目標即SVR模型的參數(懲罰因子c和核函數g)需要在運算中給予限制,文中設定參數的取值范圍在0.01至100之間。

文中初始數據設定情況如表4所示。

表4 算法初始化參數設定

3 實驗結果及分析

3.1 預測模型評價指標

常用的評價指標包括均方根誤差、平均絕對誤差和相對誤差,其計算方式如下所示:

(10)

(11)

δ=(fi-yi)*100%

(12)

式中,m代表數據集的樣本總量,fi和yi分別代表真實值和預測值。在模型運算結果的分析中,經常使用上述指標來評價所建立模型的優劣程度,預測結果的評價指標越小,說明測試集的預測精度越準確,也從側面反映了所建模型是理想的。因此,將上述的評價指標用于之后的預測模型的性能評價之中。

3.2 基于支持向量機回歸的線損率預測結果分析

文中使用留出法(Hold-Out)以8∶2的比例劃分訓練集以及測試集。經過支持向量機回歸所得到的預測結果如圖5所示。

圖5 SVR模型預測值與真實值對比

通過圖5可以看出,圖中兩條線分別代表線損率測試集的預測值以及真實值,在圖中兩線表現出重合度忽高忽低的畫面,說明所建立的SVR模型雖然能在一定程度上對線損率進行預測,但是預測性能還有待提高。為了進一步描述模型的預測性能,文章引入了預測殘差以及相對誤差,如圖6和圖7所示。通過預測殘差可以看出,在模型的預測過程中線損率殘差雖然圍繞0值上下波動,但是部分測試樣本的波動范圍過大,相對誤差表現出其最大相對誤差為27.4%。通過利用上述所建立的評價指標計算可知,支持向量機回歸預測模型的均方根誤差為0.389 1,平均絕對誤差為0.330 5。

圖6 SVR模型預測殘差

圖7 SVR模型預測相對誤差

3.3 灰狼算法優化支持向量機的線損率預測

文中選用均方誤差作為優化的適應度函數值,其適應度函數(目標函數值)如式13所示:

(13)

式中,m代表數據集的樣本總量,yi和yj分別是真實值和預測值,適應度值越小說明模型的擬合程度越高。根據表4所設定參數對模型賦予初值,經過10次仿真運算求平均得到模型的適應度曲線如圖8所示。

圖8 GWO-SVR模型適應度曲線

由圖8可以看出,在迭代次數設置為100次的情況下,模型經過20次搜索就能達到一個最優值附近,同時在搜索前期經過少數幾次搜索就能尋找到更優的值,逐漸向最優值逼近,體現了灰狼優化算法的搜索性強,搜索范圍廣且利于跳出局部最優的優點,這也滿足在模型建立時低成本、省時間的要求。使用GWO-SVR模型對實際線損率測試集數據進行仿真的結果如圖9所示。

圖9 GWO-SVR模型預測值與真實值對比

如圖9所示,將GWO-SVR的線損率預測結果可視化,在200個測試集樣本進行測試過程中,可以看到在樣本實際測試的過程中的折線圖基本重合,代表著預測值與實際值較為接近。圖10為測試數據的殘差,可看出測試數據的殘差值圍繞0上下波動,且大多數預測殘差都在0值附近,說明預測的效果較為理想。根據上文所提及的評價指標來看,預測模型均方根誤差為0.233 2,平均絕對誤差為0.195 8。圖11為預測模型的相對誤差,圖中顯示最大的相對誤差為14.4%,相對于原本的支持向量機模型來說,GWO-SVR模型具有更優異的預測性能,均方根誤差與平均絕對誤差相對于單一的SVR模型分別降低了0.155 9和0.134 7,并且最大相對誤差都在15%以內。

圖10 GWO-SVR模型預測殘差

圖11 GWO-SVR模型預測相對誤差

為了驗證文中模型在10 kV配電網線損率預測方面的優異性能,表5為該模型與傳統預測模型SVR、BP神經網絡、ABC-SVR對于同一樣本的預測結果比較,可以看出GWO-SVR模型具有最高的預測精度以及最快的運算速率。

表5 各模型運算結果對比

4 結束語

提出基于灰狼算法優化支持向量機回歸的10 kV配電網線損率預測方法,利用主成分分析法對經過預處理之后的數據進行降維,在提取數據有效信息的情況下減少模型的復雜程度,最終利用灰狼優化算法對支持向量機回歸的懲罰因子c和核函數g進行優化。通過仿真實驗,繪制出模型的預測值與實際值的對比圖,最后從模型的評價指標出發,對比文中4類模型對于10 kV配電網線損率的預測性能,驗證了所建立的模型在10 kV配電網線損率預測方面的有效性。

猜你喜歡
損率灰狼殘差
我國水庫淤損情勢分析
基于雙向GRU與殘差擬合的車輛跟馳建模
基于殘差學習的自適應無人機目標跟蹤算法
基于遞歸殘差網絡的圖像超分辨率重建
谷谷雞和小灰狼
灰狼的大大噴嚏
無功補償極限線損率分析及降損措施探究
灰狼和老虎
供電企業月度實際線損率定量計算方法
平穩自相關過程的殘差累積和控制圖
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合