?

電力計量數據驅動的電力故障預測方法研究

2022-11-09 08:23付卿卿
微型電腦應用 2022年10期
關鍵詞:源域權重計量

付卿卿

(貴州電網有限責任公司, 貴州,貴陽 550002)

0 引言

隨著我國經濟的發展和社會的進步,我國終端數據的接入量和采集量逐漸地上升,尤其是電力計量數據的積累呈現高儲備的趨勢。每天僅電力計量數據的積累就高達上億,故障問題也隨之頻繁發生,因此需要有效的電力故障診斷模型從儲備的電力計量數據中挖掘潛在的規律,科學準確地預測電力故障問題。電力故障的有效預測也可以幫助企業提高電網的運行效率,節約維護過程中所需的成本。針對該領域的研究正處于發展的階段,部分專家學者[1-2]利用回歸分析法建立預測模型,從多因素預測角度出發,分析因素變量間的相關性,判定不同因素對電力故障的影響。也有部分專家[3-4]學者從電力計量數據的角度出發,利用電力計量數據得到計量系統網絡阻抗與電流互感器一次、二次側短路故障之間的關系,將得到的規律應用在故障檢測中,但是并沒有真正地實現預測智能化,更好的還是將規律和主觀經驗判斷相結合,再將判斷后的經驗用于預測。還有部分專家學者[5-6]利用人工智能技術建立診斷模型,旨在從海量的電力計量數據中挖掘潛在的規律,但是模型更多是在理論上構建,并未真正地實現故障的診斷,也未真正地將模型搭建起來。

綜上可知,目前利用電力計量數據實現電力故障的預測是一種大的趨勢,主要集中在知識經驗判斷、數據理論模型分析等方面。這些診斷方法十分依賴人工操作和專家的經驗,而采集海量的數據時,電力計量終端極容易出現問題,故障情況經常發生。因此,本研究利用優化的Tradaboost回歸算法建立電力故障預測模型,從大量的電力計量數據中挖掘潛在的規律,實現電力計量數據驅動。

1 故障分析

電力計量數據的獲取主要通過電度表、電壓互感器、電流互感器,并獲取二次側電流。對于高壓電力計量系統故障性質深入分析可知,將故障分為直接可診斷的故障和間接可診斷的故障。直接可診斷的故障即直接通過電力儀表的測量結果,判斷是否可以直接發生,并不需要深入的研究潛在的故障特性。間接診斷的故障指電力計量數據長期儲存后,通過相應的模型算法可以實現對故障的提前預測,因為電力計量數據是多維度數據的綜合,因此可以在主觀觀測不到的情況下實現提前預測的功能。根據高壓電力計量系統的結構,對計量回路的多個參數進行檢測和電力實時監測樣本的采集。將歷史數據和實時監測的數據輸入神經網絡預測模型中,實現對監測情況的提前預測,對故障問題進行處理和分析。

2 LR優化Tradaboost回歸算法

在積累了大量的電力計量數據的基礎上,為解決Tradaboost算法權重初始化策略,利用LR()算法進行優化,為得到源域中與目標域數據分布類似的數據集,以類似度為標準對數據進行權重初始化,本文引入LR算法來優化Tradaboost源樣本權重初始化步驟,將數據先通過LR算法進行篩選。LR算法的本質是二分類概率輸出器,通過LR算法分類后,可以認為更加靠近決策邊界的源域數據與目標域數據類似程度更高。假設源域數據分布為a,標記為0,目標域數據分布為b,標記為1。訓練LR模型,將得到分類概率,這個概率即可作為源域數據與目標域數據特征分布的類似程度。因此,LR被分類器判定為b的源域數據的初始權重更大。

原始Tradaboost算法是分類模型,子學習器為弱分類器,本文涉及的電力故障預測是回歸問題,因此需要子學習器換成SVR回歸器代替弱分類器。定義訓練集為(xi,yi),i=1,…,l,是xi∈Rn,l為數據總量,n為影響因素維數,xi∈Rn為輸入值,yi=R為輸出期望值。其目標回歸函數為

f(x)=ωφ(x)+b

(1)

式中,φ(x)為輸入空間到特征空間的非線性映射,ω為權重向量,b為優化參數。再添加回歸損失函數ε,如式(2),SVR即可進行回歸預測。

(2)

如式(2)損失函數所示,若預測值與期望值的絕對差小于ε,即視預測值為正確,反之則認為預測錯誤。SVR算法引入了松弛變量ξi和懲罰系數C,優化目標函數如式(3):

(3)

引入拉格朗日乘子法可得式(3)最優解:

(4)

算法的步驟如下。

輸入:SVR回歸器,Ds,Dt,Test,μ,ρ,H。

輸出:預測故障發生的程度,基于目標域的強回歸器f(x)。

Step 1 源域樣本權重初始化。合并源域和目標域訓練集Ds和Dt,對訓練集數據進行歸一化。調用LR算法進行Tradaboost源樣本權重初始化,為源域中同目標域數據分布類似的數據賦予更大的初始權重。

Step 2 初始化源域樣本更新方式?(s),ns為源域樣本總量。

(6)

Step 3 設置迭代次數H。Forth=1,2,3,4,…,H。

Step 6 計算暫定強學習器f(x)在目標域訓練集Dt上的誤差εi。

Step 7 重置Dt樣本權重更新方式。

(7)

Step 8 計算暫定強學習器f(x)在源域訓練集Dt上的誤差εi,更新合并訓練集樣本權重ωi+1。

(8)

ωi+1=ωi+1?(t+1)

(9)

Step 9 得到的源域樣本權重如小于樣本排除參數值μ,則排除該樣本,不參與下一次迭代。

Step 10 迭代次數m>M,結束循環,輸出最終強學習器。

3 實例應用

將電力計量數據輸入到LR-Tradaboost算法中,再將目標域前20組數據和源域全部數據合并成訓練集對模型進行訓練,將目標域后7組數據作為測試集驗證模型預測性能。為驗證傳統機器學習模型在電力故障預測問題上的適用性,將不同方法下的訓練結果進行對比。SVR算法訓練集為目標域前20組數據,測試集為目標域后7組數據。同時,為驗證LR-Tradaboost算法在預測性能方面的作用,利用針對回歸問題的Tradaboost-R2算法同LR-Tradaboost算法的訓練結果作以比較,Tradaboost-R2算法的訓練集和測試集與LR-Tradaboost算法相同。選用回歸算法評價指標均方根誤差RMSE以及R2作為算法訓練結果的評價指標,對比不同算法測試集預測結果的均方根誤差以及R2來對模型進行對比和評價,實現算法預測性能的驗證。見表1。

表1 電力計量數據發生異常的真實值與預測值對比表

為了對比LR-Tradaboost算法和Tradaboost-R2算法的學習效率,在2種算法的訓練過程中,每隔10次迭代過程,分別計算2種算法得到的暫定強學習器的R2,得到算法的收斂程度。圖1為LR-Tradaboost算法和Tradaboost-R2算法的回歸收斂速度的對比圖。由圖1得到,LR-Tradaboost算法在迭代次數為50時已經收斂,模型分數R2達到了0.81,之后的迭代過程中R2不再增加?;诘玫矫黠@的收斂程度變化趨勢和減少計算工作量的考慮,本研究采用每10次迭代計算一次算法R2,實際上LR-Tradaboost算法的收斂發生在迭代次數40到50的閉區間內,并非在第50次迭代后達到收斂。由圖2可得,Tradaboost-R2算法在進行50次迭代后,模型分數僅為0.21,且仍處于上升趨勢,事實上Trada-boost-R2算法在100到110次迭代之間才完成收斂。對比2種算法的收斂速度,發現LR-Tradaboost算法的收斂速度幾乎是Tradaboost-R2算法的2倍,證明了LR-Tradaboost算法在利用電力計量數據預測電力故障上效果更好,基于LR的優化權重初始化策略有效提高了算法性能及效率。

圖1 算法回歸收斂對比圖

4 總結

本研究主要利用電力計量數據結合優化Tradaboost回歸算法實現電力故障的預測,提出了LR算法優化權重初始化策略的LR-Tradaboost算法,同Tradaboost-R2算法預測結果和收斂速度作對比,LR-Tradaboost預測誤差比Tradaboost-R2少,而收斂速度LR-Tradaboost幾乎是Tradaboost-R2的2倍,故LR-Tradaboost算法在電力故障預測中效果較好。

猜你喜歡
源域權重計量
CPMF-I 取樣式多相流分離計量裝置
權重望寡:如何化解低地位領導的補償性辱虐管理行為?*
計量檢定在食品行業中的重要性
CPMF-I 取樣式多相流分離計量裝置
基于參數字典的多源域自適應學習算法
權重常思“浮名輕”
為黨督政勤履職 代民行權重擔當
權重漲個股跌 持有白馬藍籌
從映射理論視角分析《麥田里的守望者》的成長主題
基于因子分析的人力資本計量研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合