?

基于遺傳算法的輸變電設備數據補全*

2023-10-07 03:48龍玉江
電子技術應用 2023年9期
關鍵詞:適應度染色體遺傳算法

龍玉江,衛 薇,舒 彧

(貴州電網有限責任公司信息中心,貴州 貴陽 550003)

0 引言

近些年來,大數據、物聯網以及云計算等數字技術的出現,促進了第四次工業革命的更進一步發展,同時也更好地提高了信息數據的收集、儲存以及共享的效率,使生產方式以及經濟形態發生了整體上的變化,在這樣的背景下,數字經濟也成為了我國實現高質量發展的最主要動力之一[1]。

為滿足和適應社會化、個性化、服務化、智能化、綠色化等制造發展的需求和趨勢,世界各國相繼提出了各自國家層面的制造發展戰略,這些制造發展戰略的共同目標之一就是要實現制造的物理世界和信息世界的互聯互通和智能化操作,進而實現智能制造[2]。而運用數字孿生技術對輸變電系統建立相應的數字化模型,通過多維虛擬模型和融合數據雙驅動,將物理對象的數據和虛擬模型進行動態的交互,實現對物理對象的監控、仿真、預測等實際功能,并在一定程度上做到物理對象和虛擬模型的共生。

輸變電設備是用于電力系統中輸送和變換電能的設備,它們的應用場景主要包括以下幾個方面:

(1)電網輸電:輸變電設備在電網中的主要作用是將發電廠產生的電能輸送到各個地方的用戶。輸電線路需要經過多個變電站進行電壓變換和分配[3]。

(2)城市供電:城市供電主要包括對大型工業、商業和住宅區的供電,輸變電設備在城市供電中扮演著重要的角色。城市中的變電站通常會根據不同區域的需求進行電壓變換和分配。

(3)新能源接入:隨著可再生能源的逐漸發展,輸變電設備在新能源接入中也發揮著越來越重要的作用。例如,太陽能和風能發電站需要輸變電設備將電能送入電網。

當一個地區的輸變電設備負責管理和運行的輸配電網規模較大時,需要采集大量的數據來實時監控電力系統的運行狀態和故障情況[4]。在這種情況下,數據采集和傳輸的可靠性和準確性對于保證電力系統的穩定運行和可靠性至關重要。例如,一個大型的城市可能有數百個變電站和千余個配電站,每個站點都需要安裝傳感器和通信裝置來采集數據,以便進行實時監控和控制。然而,由于地形、氣候等環境因素以及設備的運行狀況不可避免地會出現一些問題[5],這些問題可能導致數據采集和傳輸的中斷或錯誤,從而導致采集的數據含有大量的缺失值以及異常數據等,進而影響電力系統的穩定運行。

對于異常數據目前常采取刪除操作,使得該采樣時間點數據缺失。數據缺失破壞了在線監測數據時間序列的連續性,一定程度上改變了其數據特征及變化趨勢,甚至出現關鍵的極值點及躍變點缺失的情況。傳統的三比值法或者神經網絡、支持向量機、灰色系統理論等各種智能診斷分析技術均會因數據缺失而無法對設備狀態進行評價或者因評估依據不符合實際情況,難以對設備狀態進行準確評價,無法充分發揮在線監測系統的作用[6]。

在缺失數據恢復領域,很多相關的算法已經被提出[7]。Stoica 和Li Jian 提出了一種基于最小二乘法的迭代自適應缺失數據恢復方法(Missing-data Iterative Adaptive Approach,MIAA)[8]。該方法使用迭代算法估計信號的頻域表達和協方差矩陣來重構出缺失點的值。MIAA 方法特別適用于含有較多低頻分量的信號,但是當信號含有較多高頻分量時,其處理效果并不理想。Stankovi? 的研究團隊提出了幾種基于壓縮感知(Compressed Sensing,CS)技術的凸優化缺失點重構方法[9]。這些方法可以有效地處理高頻分量,但是仍然存在不足:這些方法都是基于極其簡單的仿真信號,而實測信號的形式往往要復雜得多,如大量跳變點或頻域內不稀疏等[10]。

本文采用一種基于遺傳算法的缺失數據重構算法。該方法首先對變換域隨機賦值,然后通過實現稀疏域中系數向量最小化達到缺失點恢復的效果。

1 基于遺傳算法的數據補全方法

1.1 遺傳算法原理

遺傳算法的基本思想在于通過對生物進化過程中遺傳選擇、基因變異、適者生存等法則的量化和模擬,來達到尋求問題最優解的目的。

(1)算法原理

遺傳算法不同于其他求解最優解的算法,該算法可以自行檢索、獲取和指導優化的搜索空間,進而自適應地調整搜索方向。該算法通過概率化的策略直接對結構對象進行尋優操作,突破了其他方法在建立數學模型過程中由于特定函數的設置所帶來的求導和對函數連續性的局限性[11],最終達到尋求問題最優解的目的。

(2)實現步驟

首先,對算法進行參數初始化。預先設定遺傳代數閾值,將隨機產生的種群作為問題的初代解,并對種群中的個體進行編碼。

其次,進行適應度計算:對種群中個體的適應度進行計算,并將該指標作為后續測評個體優劣等級的主要標準。

接著,以上述過程中計算所得適應度的計算結果為依據,對子代繁衍過程的父體與母體進行選擇,以此不斷淘汰適應度低的個體。

最后,復制選出的父體與母體基因,通過交叉、變異等算子產生出子代。

重復上述適應度計算、選擇、交叉、變異的過程,直至迭代次數達到遺傳代數上限或設定解的閾值,程序結束。

遺傳算法算法原理如圖1 所示。

圖1 遺傳算法流程框圖

值得注意的是,對種群中個體進行編碼的方式有很多種,較常用的是二進制編碼方法,現在使用非二進制編碼的也逐漸增多。而適應度函數(fitness function)又稱為適應值函數,可以用來評價一個染色體的好壞。

(3)算法特點

遺傳算法突破了其他方法對目標函數求導和函數連續性限制的局限性,在不斷迭代更新的過程中,保留了每代的優秀基因,也增加了變異后基因的多樣性,從而提高了找到最優解的概率。遺傳算法的魯棒性、容錯性相對較強,減小了陷入局部最優解的風險,但是該算法的實時性較差并且計算速度相對較慢,對于維數較高的問題很難處理和優化。

1.2 基于遺傳算法的缺失數據重構方法設計

在現有樣本定義的約束下,稀疏信號重構可以考慮為對稀疏域中系數向量的最小化。假設一個長度為M的系數信號x(n),有MA個可用的樣本,即在隨機位置上有M-MA個缺失樣本。用x表示由所有信號[12]樣本組成的向量。假設信號在變換域內是稀疏的[13],而信號變換由變換矩陣Ψ定義,X=[X(0),X(1),…,X(M-1)]由X=Ψx計算的變換系數組成。假設可用樣本的位置為n,則存在以下包含關系:

用Xcs表示在隨機位置上由可用樣本組成的向量。則可用樣本經過變換后得到的測量向量ycs可表示為:

其中,Φ表示一個隨機測量矩陣,Acs是將變換矩陣的逆去除缺失樣本位置所對應元素形成的矩陣?;趬嚎s感知的重構算法試圖找到一組丟失樣本值使得系數向量的稀疏度最優,這可表述為以下優化問題:

應用遺傳算法可以求解優化上述問題。在文獻[11]和文獻[14]中給出了詳細的GA 概述和實現細節。用染色體來代表缺失樣本值,保持可用樣本的值不變,隨機改變缺失樣本值來獲取最優的適應度函數值,即最小化稀疏度度量,此時適應度值最小,缺失位置點的值也得到了恢復。

該算法設置可以簡單地描述如下。首先,假設一個包含90 個個體的初始種群。將其分為3 個亞種群,每個亞種群包含30 個個體。缺失樣本的集合通過雙精度編碼形成初代染色體。每個染色體的初始值需要在可用樣本集中的最小值和最大值定義的范圍內均勻分布并隨機選擇。然后,對采取以下步驟迭代500 次:每個個體的適應度計算為所分析信號的變換向量的L1-范數[15],其缺失樣本值等于個體的染色體??捎玫臉颖颈3植蛔?。對于觀察到的一代中的每個個體,計算以下形式的信號的變換系數:

其中,Y為信號y(n)的變換系數向量;||Y||1表示向量Y的L1-范數;h(n)為染色體值,即缺失樣本的可能值,代表GA 群體中的個體。通過選擇函數為下一代選擇親代,在經過交叉、變異產生子代,將親代和子代的適應度值排序挑選出新的親代,單次迭代結束。當迭代次數至500 次,算法停止輸出最優解。

2 實驗驗證

在實驗驗證過程中,分別選取不同數目的正弦工頻信號的疊加信號以擬合實測數據。以下4 組實驗中,均設置信號長度為128,缺失樣本數為80,即有37.5%的信號樣本可用。通過隨機缺失數據點的方式以擬合實測數據沒有明顯的周期性而且在變換域中稀疏度不一定滿足要求、容易出現一些跳變點的特性。在實驗過程中,設置信號的稀疏度為8,遺傳算法迭代500 次,初始種群大小為90 個染色體,種群每個染色體都是服從均勻分布的,每次交叉和變異產生的新染色體組和初代染色體組放在一起進行排序選取適應度值(L1-范數)最低的染色體組作為本次進化的優勝者,然后進行下一次迭代。

2.1 實驗1

在實驗1 中,設計了一個單頻正弦信號y1(n),其解析表達式如下:

500 次迭代后會得到最好的信號重建結果。重建結果如圖2 所示,從圖2 可以看出,經過數據重構缺失樣本點處的值得到了很好的恢復。另外在實驗過程中,采用均方根誤差(MSE)對重建效果進行評估,均方誤差是反映估計量與被估計量之間差異程度的一種度量,其公式如式(7)所示,其中,M為信號長度,x(n) 為原始信號,xrec(n)為重建信號,為便于衡量和比較,采用分貝值作為評估結果。各采樣點誤差如圖3 所示??梢钥闯龈鞑蓸狱c重構誤差都很小,經過計算,實驗1 中重建MSE 為-4.836 9 dB,滿足設計誤差需求。

圖2 信號重建結果

圖3 重構誤差1

2.2 實驗2

在實驗2 中,設計了一個二分量的疊加信號y2(n),其各分量x2(n)、x3(n)及y2(n)解析表達式如下:

500 次迭代后會得到最好的信號重建結果。重建結果如圖4 所示,從圖4 可以看出,經過多次迭代后數據重構缺失樣本點處的值得到了很好的恢復。各采樣點誤差如圖5 所示,可以看出各采樣點重構誤差都很小,按照式(7)獲得的重建MSE 為-11.31 dB,滿足設計誤差需求。

圖4 信號重建結果2

圖5 重構誤差2

2.3 實驗3

在實驗3 中,設計了一個四分量的疊加信號y3(n),其各分量x3(n)、x4(n)、x5(n)、x6(n) 及y3(n) 解析表達式如下:

500 次迭代后會得到最好的信號重建結果。重建結果如圖6 所示,從圖6 可以看出,經過多次迭代后數據重構缺失樣本點處的值得到了很好的恢復。各采樣點誤差如圖7 所示,可以看出各采樣點重構誤差都很小,按照式(7)獲得的重建MSE 為-7.784 7 dB,滿足設計誤差需求。

圖6 信號重建結果3

圖7 重構誤差3

2.4 實驗4

在實驗4 中,利用前文所述的6 個分量信號進行疊加,得到信號y4(n),其解析表達式如下:

500 次迭代后會得到信號重建結果,其結果如圖8 所示,從圖8 可以看出,經過多次迭代后數據重構缺失樣本點處的值得到了很好的恢復。各采樣點誤差如圖9 所示,各樣本點的重構誤差較小,按照式(7)獲得的重建MSE 為-22.06 dB,滿足設計誤差需求。

圖8 信號重建結果4

圖9 重構誤差4

3 結論

本文針對輸變電設備在數據傳輸方面的數據缺失問題,提出了一種基于遺傳算法和壓縮感知的數據補全方法,通過遺傳算法選擇進化的個體,即選出與適應度函數匹配度最高的染色體來模擬進化的自然過程,最小化稀疏度度量,從而恢復缺失數據。同時用例子對本文提出的方法進行了驗證,通過原始數據與補全數據數據質量的對比,重建均方誤差滿足設計誤差需求,實驗效果良好,驗證了該數據補全方法的有效性與準確性。

猜你喜歡
適應度染色體遺傳算法
改進的自適應復制、交叉和突變遺傳算法
多一條X染色體,壽命會更長
為什么男性要有一條X染色體?
基于自適應遺傳算法的CSAMT一維反演
一種基于遺傳算法的聚類分析方法在DNA序列比較中的應用
基于遺傳算法和LS-SVM的財務危機預測
能忍的人壽命長
基于空調導風板成型工藝的Kriging模型適應度研究
基于改進的遺傳算法的模糊聚類算法
再論高等植物染色體雜交
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合