?

基于EMD-AO-DELM 的光伏功率預測算法

2024-01-31 07:36趙葵銀王田宇黃瑋杰司孟嬌林國漢
關鍵詞:天鷹學習機分量

曹 哲,趙葵銀,王田宇,黃瑋杰,司孟嬌,林國漢

(湖南工程學院 電氣與信息工程學院,湘潭 411104)

0 引言

光伏發電作為一種新能源發電,目前得到廣泛應用.但受太陽輻射強度、溫度、濕度和云量等因素的影響[1],光伏發電波動性會影響光伏電力系統的安全性和穩定性,同時給光伏并網調度過程帶來挑戰.通過光伏發電歷史數據對光伏發電功率進行預測,從而保證電網系統安全運行,這對完成電力系統調度十分重要[2].

針對光伏發電功率的預測技術,主要分為直接預測方法和間接預測方法.前者是對光伏歷史數據信息進行訓練學習,通過預測算法進行未來功率預測.后者則采用分步預測的方式,可分為對未來日照輻射以及未來功率預測兩個部分[3].文獻[4]提出一種基于經驗模態分解(EMD)與極限學習機(ELM)組合功率預測方法,但未能充分考慮光伏電站輸出功率受到的環境影響因素.文獻[5]提出了一種基于煙花算法(FWA)的改進BP 神經網絡光伏預測方法,該方法對于短期的光伏數據預測具有良好的精確度.但BP 神經網絡存在收斂速度慢和易陷入局部極值的問題.文獻[6]提出一種將卷積神經網絡(CNN)和雙向長短時記憶網絡(BiLSTM)結合的預測算法,但該方法測試樣本類型過于單一,未能測試不同季度及天氣下的預測精度.

針對上述研究存在的問題,本文提出了一種基于經驗模態分解(Empirical Mode Decomposition,EMD)—天鷹優化算法(Aquila Optimizer,AO)—深度極限學習機(Deep Extreme Learning Machine,DELM)的組合光伏功率預測模型.利用經驗模態分解(EMD)將光伏初始功率數據分解為數量不同的本征模態函數(IMF),針對DELM 網絡初始權重和閾值隨機輸入的特點,利用AO 優化算法對初始權重進行優化,利用優化的DELM 對每個模態分別建模預測,最后將各個模態分量的預測結果進行疊加求和,得到最終的預測結果.

1 理論基礎

1.1 EMD(經驗模態分解)

經驗模態分解(EMD)[7-9]是一種基于信號局部特征的信號分解方法.其吸收了小波變換多分辨率的優點,克服了小波變換中選擇小波基和確定分解尺度的困難,因此更適合于非線性非平穩信號的分析,是一種自適應的信號分解方法.EMD 假定任何復雜信號都是由簡單的特征模態函數(IMF)組成的,并且每個IMF 之間是相互獨立的.這種EMD可以將不同規?;蜈厔莸臅r間序列數據逐步分解成其組成部分,并將一系列具有相同規模特征的數據序列產生一系列具有相同尺度特征的數據序列,通過這些數據序列,非平穩的非線性數據被轉化為平穩的線性數據,與原始數據序列相比,分解后的序列具有更好的規律性.這對識別隱藏的關系有很大的幫助,可以提高預測的準確性[10-12].

其具體分解步驟如下[13]:

(1)對于初始時間序列x(t),取其所有極大值點與極小值點,所有極大值點相連作為上包絡線,所有極小值點相連作為下包絡線,記m(t)為上、下包絡線的均值.令原始序列x(t)與均值m(t)相減,得到首個分量h1(t)=x(t)-m(t);

(2)將h1(t)視作初始時間序列,記m1(t)為h1(t)的上、下包絡線的均值,重復步驟(1),得到第二個分量h2(t);

(3)將上述步驟不斷重復n次,直到h(t)是一個本征模態函數或剩余分量rn(t)呈現單調性,終止分解過程.

至此,初始時間序列x(t)可通過n個本征模態分量hi(t)與一個剩余分量rn(t)之和來表示,如式(1)所示:

1.2 AO(天鷹優化算法)

Laith Abualigah 等人在2021 年提出的天鷹算法是一種新穎的元啟發式優化算法,其靈感來自于北美洲的天鷹(Aquila)對不同種類獵物的四種狩獵行為.在攻擊獵物之前,天鷹針對不同的獵物種類靈活地切換其狩獵策略.該數學模型簡要描述如下[14]:

第1 步:擴大探索

天鷹在地面上高飛,廣泛探索捕獵空間,一旦確定了獵物的區域,就會采取垂直俯沖的方式進行捕獵.這種行為的數學表示方法為

式中,Xbest(t)代表迄今為止獲得的最佳位置;XM(t)表示當前迭代中所有天鷹的平均位置;t和T分別為當前迭代和最大迭代次數;N是種群大??;rand是0 到1 之間的隨機數.

第2 步:縮小探索階段

這是天鷹最常用的捕獵方法.它在選定的區域內下降并圍繞獵物飛行后,采用短距離滑翔的方式來攻擊獵物.位置更新公式表示為

式中,XR(t)代表天鷹的隨機位置;D是維度大??;LF(D)代表Levy 飛行函數,其表示如下:

式中,Γ為伽馬函數;s和β是分別取0.01 和1.5的常數;u和ν 是0 和1 之間的隨機數;y和x用于呈現搜索中的螺旋形,其計算方法如下:

式中,r1是1 到20 之間的搜索周期數;D1由從1到維度大小D的整數組成;且ω=0.005.

第3 步:擴大開發階段

在第三階段中,當獵物的區域被大致確定后,天鷹垂直下降,進行初步攻擊.天鷹利用選定的區域來接近和攻擊獵物.這種行為的數字表示如下:

式中,α、δ是固定為0.1 的開發調整參數;UB、LB是上界和下界.

第4 步:縮小開發階段

天鷹根據獵物逃跑的軌跡追逐獵物,然后攻擊地面上的獵物.該行為的數學表示如下:

式中,X(t)是當前位置;QF(t)表示用于平衡搜索策略的質量函數值;G1表示天鷹在跟蹤獵物過程中的運動參數,是[-1,1]之間的隨機數;G2表示追逐獵物時的飛行斜率,從2 到0 線性遞減.

1.3 ELM(極限學習機)

極限學習機(Extreme Learning Machine,ELM)的模型由輸入層、隱含層和輸出層三部分組成,是一個典型的單隱含層的前饋神經網絡(Single-hidden Layer Feed-forward Neural Network,SLFN),其網絡具有學習速度快、泛化能力強等優點[15].

ELM 的模型結構如圖1 所示,其中,輸入層含q個節點,隱含層含n個節點,輸出層含e個節點,隱含層激活函數為g(x),常用的函數有sigmoid、hard-lim、sin 等[16].

圖1 ELM結構

假設樣本為xi∈RN×Rq,yi∈RN×Re(i=1,2,…,N),其中,隱含層的輸出為式(9),隱含層輸出矩陣和ELM 網絡輸出之間的關系可由式(10)表示.

根據式(9)和式(10),有

其中,ai=(ai1,ai2,…,ain)T是連接第i個輸入節點和隱含層的權重;bi是第j個隱藏節點的閾值;νi=(νj1,νj2,…,νjn)T是連接第j個隱藏節點和輸出層的權重;H是神經網絡的隱含層輸出矩陣.輸入權重aij和隱含層的閾值bj隨機選??;輸出權重V可以通過解方程組的方式得到[17].

使用ELM 獲得輸出權重可以分為三個步驟:

(1)隨機選擇0 和1 之間的數值來設置輸入權重aij和隱含層的閾值bj;

(2)計算隱含層輸出矩陣H;

(3)計算輸出權重V:

其中,H+表示輸出矩陣H的廣義逆矩陣.

與傳統的基于梯度的前饋神經網絡算法不同,極限學習機網絡隱含層在訓練過程中隨機產生輸入權重和閾值.因此,計算輸出權重只能采用廣義逆矩陣理論.而ELM 是一種單隱層結構,在面對數據量大且維度較高的輸入數據時,其捕捉數據的有效特征的能力不足.因此,更多學者采用DELM 算法,作為ELM 的一種衍生算法,DELM 解決了只有一個隱含層的極限學習機無法捕捉數據的有效特征的問題.

1.4 ELM—AE(極限學習機—自動編碼器)

極限學習機自動編碼器(ELM-AE)是一個人工的神經網絡模塊,在深度學習領域中得到廣泛使用,是一種無監督方式學習樣本的結構.其主要特點在于網絡的輸出和輸入結果一致.ELM-AE 的模型如同ELM,同樣由一個輸入層、一個隱含層和一個輸出層三部分組成[18],其模型結構如圖2 所示.構建的ELM-AE 在訓練過程中隱含層節點的權重和閾值隨機產生,并具有正交性,從而使得ELMAE 的泛化能力得到了一定程度的優化.為進一步提高模型的泛化能力和魯棒性,在求解權重系數的過程中引入正則化參數,目標函數被設定為[19]

假設給定N個不同的樣本,xi∈RN×Rq(i=1,2,…,N),ELM-AE 隱含層的輸出可以表示為式(15),那么隱含層的輸出矩陣與輸出層的輸出之間的數學關系可以表示為

對于等維ELM-AE 表示,輸出權重V的計算方法是:

其中,H是ELM-AE 隱含層輸出矩陣;X是ELM-AE 的輸入矩陣.

深度極限學習機(DELM)通過疊加極限學習機—自動編碼器(ELM-AE)構建多層網絡結構來提高網絡的表達能力,是極限學習機和自動編碼器結合的新結構.

DELM 應用ELM-AE 對模型進行逐層訓練.i隱含層的輸出與(i-1)隱含層的輸出之間的數值關系可以表示為

1.5 DELM(深度極限學習機)

ELM-AE 用于構建深度極限學習機DELM 的基本單元,然后利用ELM-AE 的輸出權值初始化整個DELM[20].DELM 的理念是通過最小化重建誤差使輸出無限接近于原始輸入,通過層層迭代訓練,學習原始數據的高級特征.

ELM-AE 在編碼器處將輸入映射到隱含層特征向量,在解碼器處從特征向量重建原始輸入[20].從結構的角度看,DELM 相當于連接多個ELM.與ELM 相比,DELM 能更全面地捕捉樣本特征,提高處理高維輸入的準確性.DELM 通過ELM-AE 逐層進行無監督訓練和學習,最后連接到最后一層輸出層進行有監督訓練.該系統的參數不需要同時調整[21].DELM 網絡的結構如圖3 所示,DELM 各隱含層的輸入權重通過ELM-AE 初始化,并進行分層無監督訓練.在這整個過程中,DELM 不需要反向微調.

圖3 DELM結構圖

假設在模型有Y個隱含層的情況下,根據上文所述ELM-AE 理論,通過輸入數據X可以得到權重矩陣V1與隱含層的輸出矩陣H1.將H1作為下一個ELM-AE 的輸入與目標輸出.以此類推,逐層訓練,可以得到Y層的輸出權重矩陣VY和隱含層的輸出矩陣HY.其中每個ELM-AE 的輸出權重用來初始化整個DELM.在ELM-AE 訓練過程中,輸入層權重和閾值是隨機生成的正交隨機矩陣;同時,ELM-AE 無監督訓練過程采用最小二乘法更新參數.在這個過程中,只有輸出層權重參數被更新,而輸入層權重和閾值保持不變,每個ELM-AE 的隨機輸入權重和隨機閾值都會對DELM 的預測精度造成影響.由于初始權重對于整個模型的預測結果起到更關鍵的作用,因此,本文針對DELM 的輸入權重利用AO 算法進行優化.

在本文中,利用天鷹優化算法的全局優化能力,可在訓練誤差較小時找到深度極限學習機的輸入權重,從而提高深度極限學習機的泛化能力,提高DELM 的預測精度.

2 EMD-AO-DELM 預測模型的建立

2.1 光伏發電影響因素分析

光伏發電效率的影響因素眾多,主要分為主觀因素和客觀因素.其中,主觀因素包括氣溫、濕度、云量、降水量、光照輻射度等不可控的氣象因素;客觀因素包括光伏陣列安裝地形條件、光伏板傾角與朝向等,往往起到決定性作用的是氣象因素[22].輸入樣本因素過多會降低預測精度并使預測模型變得復雜和冗余.為探究氣象因素與光伏功率的相關性,以便選取最優因素作為輸入,在此處引入Pearson 相關系數,用來衡量兩個數據集合是否在一條線上,并衡量定距變量間的線性關系.

式中,r>0 表示兩者之間呈正相關,r<0 表示兩者之間呈負相關;xi與yi分別代表兩個因素第i個的值;xˉ和yˉ分別表示兩個因素的平均值.

根據Pearson 相關系數,整理出表1.

表1 各氣象因素相關系數

由表1 可知,光照總輻射和散射輻射與光伏功率呈現高度正相關,相對濕度和大氣壓與光伏功率呈現負相關,因此,選取散射輻射和總輻射這兩項作為DELM 初始輸入數據.

2.2 AO-DELM模型的建立

AO-DELM 模型的主要思想是:將DELM 初始輸入權重作為AO 算法的初始種群位置,并將適應度函數設置為訓練集和測試集的均方誤差之和,其表示如下:

AO-DELM 預測模型流程如下:

(1)進行數據清洗,將歷史光伏功率數據中一些采樣時發生錯誤導致的異常值剔除;

(2)對清洗后的樣本數據進行歸一化處理;

(3)初始化AO 算法參數,包括種群規模,最大迭代次數T,探索和開發參數α、δ;

(4)初始化種群位置X、初始的種群適應度、最佳個體;

(5)按序進行擴大探索階段、縮小探索階段、擴大開發階段、縮小開發階段,并不斷更新種群位置;

(6)計算更新種群的適應度,得到當前最佳個體位置和適應度,并比較當前最佳個體與到第t代找到的最佳個體適應度,保留較優的個體位置;

(7)判斷是否達到最大迭代次數或者求解條件,若是,則輸出最優值,若否,則返回步驟(5);

(8)將最后優化后的權重值結果輸入到DELM模型中.

其結構流程圖如圖4 所示.

圖4 AO-DELM結構流程圖

2.3 EMD-AO-DELM 模型的建立

光伏功率數據是非線性非平穩的離散數據,傳統線性時序模型方法存在較大的局限性,直接對其進行預測建模具有較大的誤差.因此,采用EMD 對光伏發電功率曲線進行分解,從而將原始環境信號中存在的不同尺度波動或趨勢逐級分解出來.對分解后的IMF 分量分別進行AO-DELM 建模分析,再將各IMF 分量預測結果進行疊加求和得到最終的預測值[22].

具體步驟為:

(1)采用EMD 對光伏歷史數據進行分解,得到一組IMF 分量;

(2)將各IMF 分量分別建立AO-DELM 模型,對各個分量進行預測;

(3)疊加各子序列的預測結果并驗證模型預測的準確性.

采用EMD 方法將光伏歷史數據分解為n個不同特征的IMF 分量以及一個余量Res,其中5 月份各IMF 序列如圖5 所示.IMF 分量能夠體現出原始數據的局部特征,更好地反映其周期項、隨機項以及趨勢項,準確反映出原始數據的特性.

圖5 EMD分解序列

其中,IMF1-IMF5 呈現不平穩、振蕩的曲線,屬于隨機項;IMF6-IMF7 呈現平滑、頻率降低、周期性的趨勢,屬于趨勢項.因此,EMD 分解可凸顯原始光伏發電功率序列局部特征.EMD-AODELM 預測模型流程圖如圖6 所示.

2.4 評價指標

為了驗證本預測模型的有效性與準確性,采用MAPE與RMSE兩者作為誤差指標.

式中,yoi是樣本中第i個真實值(observed);ypi是樣本中第i個預測值(predicted).兩者數值越小,精度越高.

3 實例分析

本文的樣本數據均采集于青海某光伏電站,采集5月份共31天光伏輸出功率數據,采集步長為5 min.

3.1 異常數據清洗

在光伏電站實際采樣過程中,會產生一些異常數據.異常數據會導致預測模型擬合度變差、泛化能力減弱.因此,必須對其進行清洗.

對異常數據的檢測采用3σ 準則原理:

式中,X表示光伏功率初始數據;表示光伏功率初始數據平均值.

在統計學上,3σ準則是在正態分布中距平均值小于一個標準差、二個標準差、三個標準差以內的百分比,更精確的數字是68.27%、95.45%及99.73%.

3.2 數據歸一化

不同數據單位量程不一,這對模型的擬合速度造成影響,且不利于模型訓練.為提升模型預測精度,對初始光伏功率數據進行歸一化,將歸一化后的功率值保持在[0,1].其中,歸一化公式如下:

式中,yi代表歸一化后的數據;xi代表原始功率數據值.

3.3 仿真結果

本文采用MATLAB R2022a 對所提出控制策略進行仿真分析,在本文所建立的預測模型中,設置DELM 模型隱含層層數為2;隱含層節點數分別為5,5;AO 最大迭代次數為200;種群數量為20;正則化系數設置為無窮大.公平起見,作為對比的DELM 模型參數隱含層層數為2;隱含層節點數分別為5,5.

將5 月數據按19∶1 分別劃分為訓練集和測試集,并進行歸一化處理.其中測試集取每日8 點至19 點,日出之后時間段晴天和復雜天氣各一天,分別進行仿真驗證,步長為5 min.

預測仿真結果如圖7 所示.

圖7 預測仿真結果

綜合圖7 和表2 來看,晴天預測精度最高,主要是因為日照相對穩定,且光照呈現有規律的正態分布.復雜天氣預測精度相對較差是因為日照不穩定且無規律,降水與云量較多,影響到光伏面板接收日照輻射.晴天數據呈現典型的正態分布,符合實際功率情況,預測模型準確無誤.

表2 誤差指標數據

綜上所述,通過仿真圖以及表2 誤差分析,本文提到的EMD-AO-DELM 模型相較于初始DELM模型,預測精度得到顯著提升,模型穩定性更好,各項指標明顯優于其余兩種算法,能夠勝任實際光伏功率預測需求,更好地配合光伏并網調度工作.

4 結論

本文分析了5 月份的光伏發電預測情況,對光伏發電影響因素進行了相關性分析,并對光伏歷史發電功率進行了EMD 分解,對每個IMF 分量分別輸入AO-DELM 模型,最后將各分量結果進行求和以得到預測結果.進而提出了一種基于EMDAO-DELM 的光伏功率預測模型,通過仿真結果分析,得到如下結論:

(1)在光伏發電影響因素當中,光照總輻射和散射輻射與光伏功率呈現正相關,對最后的預測結果起到關鍵性作用;氣壓和濕度與光伏功率呈現負相關,在實際功率預測中,不宜作為輸入數據.

(2)針對光伏功率具有波動性和隨機性的特點,對歷史光伏功率數據進行了EMD 分解,各分量之間相互獨立,分別進行預測,最后進行疊加求和.仿真結果表明,采用EMD 分解方法后的預測效果更好.

(3)本文實驗方法在晴天以及復雜天氣的預測表現均優于DELM 模型.其中,晴天預測精度最高,這與日照輻射呈有規律的正態分布、日照輻射較為穩定有關.

猜你喜歡
天鷹學習機分量
奇怪森林
“天鷹”妙計斗軍艦
帽子的分量
圖解美國TA-4J天鷹教練攻擊機
極限學習機綜述
論《哈姆雷特》中良心的分量
基于極限學習機參數遷移的域適應算法
分量
分層極限學習機在滾動軸承故障診斷中的應用
項目管理方法在天鷹探空火箭研制項目中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合