?

基于改進獵人獵物算法的VMD-KELM短期負荷預測*

2024-01-15 06:57魯英達
電氣工程學報 2023年4期
關鍵詞:獵人獵物模態

魯英達 張 菁

(上海工程技術大學電子電氣工程學院 上海 201620)

1 引言

近代社會在工業革命后對電力能源的需求不斷增加,為了制訂更加理想的電力能源供應計劃,電力負荷預測是目前研究常用的方法。電力負荷預測按周期可以分成短期、中期、長期。短期電力負荷預測是確保電網系統平穩高效運行的重要內容之一,是電力供需平衡的基礎,在提高國家電力行業的經濟效益和社會穩定發展等方面扮演著十分重要的角色[1]。

目前,關于提高短期負荷預測精度的研究已經在國內外成為熱點,其主要方法是傳統數學統計學方法和基于機器學習的預測方法。參考各個文獻分析,當前機器學習的方法包含單一模型算法與組合模型算法,單一模型例如:人工神經網絡、隨機森林、支持向量機和極限學習機等,由于單一模型的預測性能低下,所以考慮采用多種模型組合來提高短期負荷預測精度[2-5]。首先,考慮到電力負荷具有隨機性、非平穩的特性,采用信號降噪分解對原始數據進行預處理。常見的分解方法有經驗模態分解(Empirical mode decomposition,EMD)、小波變換和變分模態分解(Variational mode decomposition,VMD)等[6-8]。文獻[6]和文獻[7]分別使用EMD 和小波變換對實際負荷序列進行分解,分解后得到的子序列分別建模預測得到最終的結果,獲得了較高的預測精度。但EMD 分解存在明顯模態混疊的現象,在一定程度上會影響模型的預測性能。小波變換僅適用于平穩的時間序列,針對實際負荷序列沒有適應性。VMD 是一種完全非遞歸自適應的分解方法,在測量噪聲和避免模態混疊現象方面具有明顯優勢[8]。

核極限學習機(Kernel extreme learning machine,KELM)是一種新型人工智能預測模型,它是在極限學習機(Extreme learning machine,ELM)的基礎上引入了核函數思想,進而有效克服了ELM因隨機生成初始權值和閾值導致輸出穩定性低下的問題,提高了輸出穩定性,但其預測性能通常受參數選擇的影響[9]。進而研究人員發現采用啟發式算法優化模型參數對模型的預測能力有明顯提升。人們通過研究如灰狼、螞蟻、麻雀等生物的生活習性,提出了許多啟發式優化算法,常見的啟發式算法有粒子群算法[10]、灰狼算法[11]和麻雀算法[12]等。其中2022 年提出的獵人獵物算法(Hunter-prey optimizer, HPO)是較為新型的智能優化算法,對解決單峰問題和多峰問題具有足夠的探索和開發能力,與其他優化算法相比,HPO 算法的性能更優越[13],但其存在易陷入局部最優解和不同求解變量初始值邊界相同的缺點。

針對上述方法存在的不足,本文采用VMD 對實際負荷序列分解處理,再加入灰色關聯分析,對模型的輸入輸出變量進行關聯度分析,增加數據的關聯度,在KLEM 模型的基礎上使用改進的獵人獵物算法對其參數尋優。研究表明,本文所提模型相對于其他傳統模型預測精度有所提高,更符合負荷短期預測的實際需要。

2 預測模型相關原理

2.1 核極限學習機

KELM 模型是在ELM 的基礎上延伸建立的,ELM 模型中的隨機映射被替換成了核映射,通過把低維問題轉換到完整的內積空間里解決,可以極大地減少網絡的復雜性,與ELM 相比具備更強的學習泛化能力和穩定性。

ELM 算法采用隨機生成各個神經元連接權值和閾值,這會導致算法的波動和不穩定,所以在ELM 算法中當映射函數h(x)為未知時,引入核函數,KELM 的數學描述如下

式中,H表示隱含層輸出矩陣;K(xi,xj)表示核函數,本文采用RBF 核函數,即

式中,g為核參數??梢缘玫終ELM 的輸出函數表達式為

式中,β為輸出權值矩陣;T為目標輸出矩陣;I為單位矩陣;C為正則化系數。

綜上,KELM 的核參數g和正則化系數C是影響預測性能的重要因素。

2.2 變分模態分解

電力負荷序列是一種隨機的非平穩信號,經過VMD 分解,可以獲得具有不同頻率特征的趨勢成分和波動成分。因此本文選取此方法將歷史負荷數據分解為多個不同頻率相對穩定的子序列,從而有效降低負荷序列復雜度高和非線性強的非平穩性[14]。

各個功率模態分量uk的頻譜通過希爾伯特轉換被傳送至基帶,并將其與一個指標對應的估計中心頻率ωk相對應,最終通過解調信號高斯平滑度來估算該帶寬,從而將該約束的變分問題表達為

式中,uk代表第k個功率模態分量;ωk代表功率模態分量的中心頻率;δ(t)代表單位沖擊函數。同時,采用二次懲罰算子及拉格朗日乘子達到排除以上因素限制的目的,將式(4)的最小化問題轉變為式(5)的無約束優化問題。

式中,α代表懲罰算子,在時間序列信號中混有噪聲可保證其重構后的精度;λ代表拉格朗日乘子;?表示卷積算子。

隨后更新功率模態分量uk,即

式中,i和n都是代表不同參數取得的任意值;ω表示信號從時間域向t頻率域變換的符號;、和是傅里葉變換后的u、f(ω)、λ(ω)。

最終,以式(6)同樣的方式更新與,即

式中,τ表示噪聲容限的參數。

當滿足特定的判別精度δ后,終止循環迭代。

式中,ε表示收斂進度。最終,將原功率序列分解為k個窄頻段IMF。

2.3 獵人獵物算法及其改進

2.3.1 獵人獵物算法

獵人獵物優化算法(HPO)是2022 年提出的一種新的基于種群的優化算法。該方法的基本假定如下:當獵人們在搜尋獵物時,因為獵物經常是成群的,所以獵人很有可能會從最遠的地方(遠離平均群體位置)中挑選一只獵物。獵人找到想要的獵物后,就會追逐獵物。與此同時,獵物也在尋找食物,并在獵人的追逐攻擊中逃脫,到達一個安全的地方,這兩個過程中即伴隨著獵人位置與獵物位置的更新。最后根據適應度函數,將該安全區域(即目標搜索點)作為最優獵物的區域,以此為基礎,完成了整個搜尋。獵人獵物算法的數學描述如下。

獵人與獵物位置初始化

式中,xi表示獵人或者獵物;rand(1,d)是[0,1]之間的隨機數;d表示尋優變量的個數;ub、lb表示成員活動區域的邊界,即表示尋優變量大小的上界和下界。群體中每個成員的初始位置由式(10)在指定搜索空間中隨機生成。

式(11)表示獵人獵物搜索算法的機制。獵人追逐獵物

式中,x(t)表示獵人當前時刻的位置;x(t+1)表示獵人下一時刻的位置;P是獵物的位置;μ是獵人與獵物所有位置距離的平均值;Z是算法的自適應參數;R1和R3是兩個隨機向量,范圍在[0,1];R2是0~1 內的隨機數;C是探索和求解之間的平衡參數,它的值在迭代過程中從1 減小至(1-n),M代表迭代的最大值;IDX 代表滿足條件(P==0)的向量的索引值。

獵人與獵物的位置更新

式(13)為所有獵人獵物的平均距離μ的計算公式,在歐氏距離計算公式的基礎上,利用式(14)計算出每個搜索代理與平均位置的距離,與位置均值距離最大的搜索代理認為是要被獵殺的獵物。

如果每次迭代都考慮與平均位置μ距離最大的搜索代理,則該方法的收斂速度會很慢。按照捕獵的情況,如果獵人捕捉到了獵物,就代表著獵物已經死去,而下一次,獵人會轉移到新的獵物位置。為解決此問題,獵人獵物算法提出了一個遞減機制,即

式中,N表示搜索代理的數量;round 是四舍五入函數。在算法開始時,kbest的值等于N,最后一個距離搜索個體平均位置最遠的搜索個體被選擇為獵物,并被獵人捕獲。假定最好的安全地點就是最佳全局位置,因為它會給獵物更大的存活概率,而獵人可能會選擇另一個獵物。式(16)用于更新獵物位置,即

式中,x(t)表示獵物當前位置;x(t+1)表示獵物下一時刻的位置;T表示全局搜索的最優位置;cos 函數及其輸入參數允許下一個獵物位置定位在全局最優的不同半徑和不同角度上。在獵人獵物算法如何選擇獵人和獵物這個問題上,結合式(11)和式(16)提出式(17)和式(18)進行判斷,即

式中,R5為[0,1]內的隨機數,如果R5值大于0.1,則認為搜索代理為獵物,根據式(17)更新搜索代理的下一個位置。否則,搜索種群將被視為獵人,根據式(18)更新下一個位置。

2.3.2 引入初始化種群混沌策略

在搜索空間中均勻地分配初始種群,可以有效地提高算法的全局搜索能力和優化效率。標準HPO算法中種群位置是隨機初始化的,可能會出現種群多樣性低的風險,且可能會發生一個問題的所有變量都是相同的上下界。而混沌映射生成的混沌序列,具有非線性和不可預測性等特征。本文采用Singer映射初始化HPO 種群。作為混沌映射的典型形式,Singer 映射具有參數簡單、分布均勻等優點,它的數學描述如下

式中,φ∈ (0.9,1.08)。

生成序列Ti∈ (1,0),用于初始化HPO 種群位置,即更新式(10)為

2.3.3 引入萊維飛行策略

針對獵人獵物優化算法后期易陷入局部最優的缺點引入萊維飛行策略。萊維飛行可以增強算法的全局搜索能力,提高群體搜索的多樣性,使搜索算法跳出局部最優的情況變為可能,其特征是搜索范圍遠近交替的隨機飛行[15]。其位置更新的數學描述如下

式中,l表示控制步長的權重;Levy表示服從萊維分布的路徑,步長計算公式如下

式中,u和v滿足正態分布,u~N(0,),v~N(0,σv2)。σu和σv定義如下

式中,η取值為1.5。

雖然萊維飛行策略可以實現位置的更新,但并不能保證新解的適應度優于原解,因此使用貪心機制來比較原解和新解的適應度,以保留適應度更好的解。

式中,X(t)表示最終解;fit(x′(t))表示由萊維飛行得到的新解;fit(x(t))為獵人獵物算法計算的解。

2.3.4 改進前后算法性能對比

選取3 個基準函數測試改進后的獵人獵物算法性能,采用單峰函數f1、多峰函數f2及固定多維函數f3分別評估算法局部搜索能力、全局搜索能力和跳出局部最優解的能力。測試時設置種群數目均為30,維度為30,最大迭代次數為300,每個函數獨立運行10 次求其均值與標準差。函數表達式及改進前后性能比較結果分別如表1 及表2 所示。不同函數測試結果如圖1~3 所示。

圖1 f1 函數尋優過程

圖2 f2 函數尋優過程

圖3 f3 函數尋優過程

表1 基準測試函數

表2 算法性能比較

由表2 可以看出,在精確度與魯棒性方面LHPO算法效果更佳。圖1~3 可以更為直觀地對比兩者收斂過程中的具體表現。在處理單峰函數上,LHPO算法在保證收斂速度的同時具有很強的跳出局部最優解的能力;在處理多峰函數上,LHPO 算法的收斂速度雖不及HPO 算法,但其搜索結果更接近全局最優;在處理固定多維函數上,LHPO 算法獲得最優解需要的迭代次數更少。

3 建立預測模型

3.1 改進獵人獵物算法優化核極限學習機

KELM 預測性能受核參數g和正則化系數C的影響。在KELM 訓練學習過程中,核參數g具有調節經驗風險比例和置信區間的作用,而正則化系數C用于控制訓練誤差所占比例的范圍,假若核參數和正則化系數選擇不當,則會使KELM 的泛化能力大大減弱,從而導致網絡輸出不穩定,因此對KELM核參數和正則化系數進行優化十分必要[16-17]。

本文采用LHPO 算法對KELM 參數進行尋優,詳細優化步驟如下所示。

(1) 根據需要設置種群數量、最大迭代數和搜索范圍。

(2) 根據式(20)使用混沌策略初始化種群位置。

(3) 根據式(7)和萊維飛行策略式(21)計算適應度值,并記錄最佳位置。

(4) 根據式(12)更新平衡參數C和自適應參數Z。

(5) 根據R5的值更新位置,若R5>0.1,根據式(17)更新獵物位置,否則根據式(18)更新獵人位置。

(6) 根據式(24)對比算法得到的原解和萊維飛行尋找的新解,并輸出最佳解。

(7) 更新個體的位置和適應度值,判斷是否達到最大迭代次數,若是則輸出最優解,否則返回步驟(3)。

(8) 將得到的尋優結果代入KELM。

3.2 構建VMD-LHPO-KELM 預測模型

VMD-LHPO-KELM 模型的預測流程如圖4 所示。具體步驟如下所示。

圖4 VMD-LHPO-KELM 負荷預測流程圖

(1) 對歷史負荷數據進行預處理,對異常值進行更改。

(2) 對環境因素和負荷序列進行灰色關聯分析,將關聯系數高的因素作為輸入因素,剔除較為不相關的因素,重新構建數據集,并且確定訓練集和測試集。

(3) 采用VMD 對負荷序列分解為k個子序列[IMF1, IMF2, …, IMFk]。

(4) 對每個子序列分別建立KELM 模型。

(5) 利用LHPO 算法對KELM 模型的參數進行優化,建立LHPO-KELM 模型。

(6) 將各個子序列預測結果進行疊加重構,得到最終結果。

(7) 對模型預測的結果進行評估。

4 實際案例仿真

4.1 試驗評估指標

為了使預測結果更為直觀,評估模型輸出的預測值與實際電力負荷值準確度,本文建立如下指標。

式中,均方根誤差(Root mean squared error,RMSE)數值越小越好;平均絕對百分比誤差(Mean absolute percent error,MAPE)數值越小越好;平均絕對誤差(Mean absolute error,MAE)數值越小越好;si表示實際值;表示預測值;n表示電力負荷數據的數量。

4.2 數據描述及數據預處理

本文仿真選取2008 年3 月1 日至6 月1 日澳大利亞某城市共93 天的歷史電力負荷數據。數據采集間隔為30 min,一天可分為48 個樣本點,共計4 464條數據。2008 年3 月1 日至5 月28 日的數據為訓練數據,2008 年5 月29 日至6 月1 日的數據為測試數據,測試集作為最后的模型評估不會參與到訓練過程中。預測出2008 年5 月31 日至6 月1 日的電力負荷情況,最后進行結果比較和誤差分析。

本文采用的數據集特征向量包括實際負荷、實時電價、露點溫度、濕度、濕球溫度和干球溫度,6個維度的數據采樣間隔均為30 min,特征參數如表3 所示。

表3 特征參數

工作日與周末的電力負荷數據有較大的不同,在試驗時需要區別對待,因此對于日期類型的影響則采用數字進行規范化處理,如表4 所示。

表4 日期類型表

由于負荷數據龐大的數據量包含許多冗余項,數據集的復雜程度大大影響著電力負荷預測的效果,所以本文決定對數據集進行預處理,使用灰色關聯對負荷數據和環境因素以及經濟因素進行相關性分析。

灰色關聯分析方法(Grey relation analysis,GRA),是根據因素之間發展趨勢的相似相異程度,為衡量因素間關聯程度提供了量化的度量[18-19]。本文對4 464 個樣本點的輸入特征與實際負荷數據進行灰色關聯分析。其比較序列與目標序列之間的關聯系數如下

式中,P表示負荷數據與影響因素的關聯系數;β為灰色分辨系數,取值范圍在0~1,本文選取β=0.5。如圖5 所示為實際電力負荷和環境因素經GRA 分析后生成的熱力圖。表5 為計算所得影響因素與負荷之間的灰色關聯系數,系數越接近1 說明相關性越強。

表5 灰色關聯度

由表5 可知,干球溫度和電價與電力負荷的關聯系數分別為0.78 和0.83,具有強相關性,緊隨其后的是濕球溫度,相關系數為0.73。而相對露點溫度和濕度為弱相關特征,因此將干球溫度、濕球溫度和電價三個相關性較強的因素作為輸入特征。

為了驗證GRA 算法的重要性,分別使用KELM以及經過GRA 算法處理的KELM,對測試樣本中2008 年5 月29 至30 日的數據進行預測。最后將上述2 種模型的結果與真實值進行比較,并進行誤差分析。

如圖6 所示為比較引入GRA 算法前后KELM預測結果與實際負荷值變化趨勢,對于未優化的KELM 模型,核參數g=1 000,正則化系數C=100,可以發現經過GRA 處理的模型比未經過處理的模型更接近實際值。如表6 所示為GRA 算法處理的KELM 的MAPE、MAE 和RMSE 的值分別為0.297、231.65 和295.71,意味著經GRA 處理的KELM 具有更高的預測精度,表明了GRA 算法預處理的有效性。但單一模型KELM 的預測性能有限,在負荷變化較大的峰谷周圍,單一模型負荷預測誤差大,其預測精度并不能滿足實際短期負荷預測的要求。因此,需要采用多模型組合進一步提高預測精度。

圖6 灰色關系算法預處理前后KELM 與實際值對比

表6 灰色關系算法預處理前后KELM 誤差分析

4.3 試驗結果分析

本文采用滑動窗口[20-21]的方式來進行訓練和預測,窗口長度為兩天,即以前96 個時間點的數據作為“特征”,下一個時間點為“標簽”。將“特征”數據代入模型中獲取下一時刻負荷預測值,同時,窗口向前滑動一個時間點,將預測值加入這一窗口,生成相同序列長度的新窗口,當窗口中的數據全為預測值時,用真實數據覆蓋重置窗口,重新啟動該過程。

考慮到電力負荷是非平穩且波動的時間序列,對訓練集里89 天的原始負荷數據采用VMD 將其分解為K個不同的模態,降低序列的復雜程度。分解個數K對分解效果影響較大,本文選取求取模態分量的中心頻率ω的方法來判定K的值。當VMD 的懲罰因子α=1 000,收斂準則容忍度τ=1×10-7,試驗得到K的取值與中心頻率的關系,如表7 所示。

表7 不同K 值下模態的中心頻率

當K值一定時,如果模態之間的中心頻率增長幅度不大,則認定這兩個模態相似。從表7 可以得到,當K=5 時,模態4 和模態5 的中心頻率由16.680至19.880 增加了19.18%,此刻中心頻率相似,故本文選取K=4 對原始數據分解,分解過后的數據如圖7 所示。

圖7 VMD 分解

由圖7 可以看出,IMF1具有非平穩性,振幅波動較大;IMF2具備良好的周期性,但整體振幅過大;IMF4分量振幅較小,易把握其變化規律。

為充分體現改進獵人獵物算法的優越性,用LHPO 算法、HPO 算法、麻雀算法(Sparrow search algorithm,SSA)、鯨魚算法(Whale optimization algorithm,WOA)和哈里斯鷹算法(Harris hawks optimization,HHO)分別對KELM 模型的參數進行尋優,并對測試集進行仿真。對LHPO 算法參數設置為最大迭代數30,種群規模30,其余算法參數設置與LHPO 一致。選用式(25)作為適應度函數,5種算法的適應度變化曲線如圖8 所示。

圖8 各算法適應度曲線

如圖8所示,相較于SSA與HHO,HPO和LHPO收斂速度明顯提升,LHPO 算法在5~7 代之間收斂,HPO 算法和WOA 算法在7~10 代之間收斂,HHO算法在15~17 代之間收斂,SSA 算法在20~35 代之間收斂。LHPO 算法使用了種群混沌與萊維飛行策略,使之能跳出局部最優,如圖7 所示,也可以看出LHPO 算法相比HPO 算法和SSA 算法等具有更高的收斂精度。因此,可以得出LHPO 有更好的收斂精度,相比一般的算法具有較快的收斂速度。

為了驗證本文所提VMD-LHPO-KELM 模型的預測準確度,對測試集中最后兩天5 月31 日至6月1 日進行預測,對相同的輸入數據另外建立4 種組合模型,分別為VMD-HPO-KELM、VMD-SSAKELM、VMD-WOA-KELM 和LHPO-KELM。對比LHPO 算法、HPO 算法和WOA 算法以及SSA 算法,種群規模N=50,最大迭代次數Tmax=100,維度d=2,核參數g和正則化系數C的搜索范圍為[10-2,103],得到各個模型預測的效果如圖9 所示。再建立傳統測模型SVR、LSTM 與本文所提模型進行對比,預測的效果如圖10 所示。

圖9 組合模型預測結果對比

圖10 單一模型預測結果對比

如圖9 所示,本文所提VMD-LHPO-KELM 與LHPO-KELM、VMD-HPO-KELM、VMD-WOAKELM 和VMD-SSA-KELM,這5 個預測模型整體的預測曲線走勢與實際負荷曲線幾乎相同。但仔細觀察后,可發現本文所提VMD-LHPO-KELM 模型預測效果更好,其預測值與實際值更加接近。當僅采用SVR 和LSTM 方法預測時,由于歷史數據的復雜程度高,預測的誤差整體偏大,如圖10 所示,SVR 和LSTM 的預測曲線在電力負荷劇烈變化時,預測曲線很難跟上實際負荷曲線。

為了使預測結果更為直觀,采用RMSE、MAPE和MAE 這3 個指標對預測模型進行評估,結果如表8 所示。從最終計算結果看,VMD-LHPO-KELM比LHPO-KELM 效果更好,MAPE 從2.610%下降至0.665%,這說明了VMD 分解削弱負荷序列的非平穩性,降低預測復雜程度具有改善KELM 模型預測能力的實用性。VMD-HPO-KELM 中的HPO 算法的尋優能力比VMD-WOA-KELM 和VMD-SSAKELM 中的WOA 與SSA 算法表現更好,各項誤差指標都有明顯下降。說明HPO 的尋優能力要優于WOA 和SSA,反映在預測結果上就是具有更高的精度。而改進后的LHPO 尋優能力進一步提高,VMD-LHPO-KELM 的預測精確度也進一步提升,相比VMD-HPO-KELM 模型,本文提出的VMDLHPO-KELM 在 MAPE、RMSE 和 MAE 比VMD-HPO-KELM 分別下降了0.665%、57.46 kW 和55.23 kW。如圖11~13 所示,在預測性能表現上,VMD-LHPO-KELM是幾個預測模型中效果最好的,證明了本文所提預測模型的有效性及可以滿足短期負荷預測的需要。

圖11 模型預測誤差RMSE 對比

圖12 模型預測誤差MAE 對比

圖13 模型預測誤差MAPE 對比

表8 各模型預測結果對比

5 結論

本文采用種群混沌策略和萊維飛行策略對HPO 算法進行改進,并將LHPO 與VMD、KELM組合,設計出一種基于VMD-LHPO-KELM 短期負荷預測模型,同時將本文所提模型與其他預測模型進行對比,仿真試驗得出以下結論。

(1) 針對歷史電力負荷序列隨機性、非平穩性的特征,采用VMD 方法對其進行平穩化處理,分解得到若干個子序列,分解的子序列相對穩定,與LHPO-KELM 模型相結合可以有效提高預測的準確性。

(2) 對KELM 模型因參數人為選擇不恰當造成預測能力差的問題,采用LHPO 算法用于優化KELM 參數。結果表明,LHPO 可以為KELM 尋得更優參數解,有效提高模型預測能力。與HPO、WOA 和SSA 相比,LHPO 算法優化過后的KELM模型對電力負荷預測效果最好,說明本文提出的LHPO 算法尋優能力更強。

(3) 本文所提模型將歷史負荷數據預處理、預測模型參數優化以及預測誤差評估相結合,進行短期電力負荷預測的研究,有利于取得較好的預測效果。

猜你喜歡
獵人獵物模態
蟒蛇為什么不會被獵物噎死
可怕的殺手角鼻龍
不聽勸告的獵人
霸王龍的第一只大型獵物
你是創業圈的獵人還是獵物
國內多模態教學研究回顧與展望
怪獸獵人③
基于HHT和Prony算法的電力系統低頻振蕩模態識別
由單個模態構造對稱簡支梁的抗彎剛度
多模態話語模態的協同及在外語教學中的體現
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合