?

基于多維氣象信息時空融合和MPA-VMD的短期電力負荷組合預測模型

2024-03-04 09:08王凌云李世春
電力自動化設備 2024年2期
關鍵詞:分量氣象負荷

王凌云,周 翔,田 恬,楊 波,李世春

(1.三峽大學 電氣與新能源學院,湖北 宜昌 443002;2.國網武漢供電公司,湖北 武漢 430015)

0 引言

短期電力負荷預測對電網供需平衡具有重要意義,有助于對能源進行有效規劃和調度,減少能源浪費[1]。隨著可再生能源、儲能等在電力系統中占比的增加,用電模式趨于復雜化,電力負荷非線性、非平穩的特征愈加明顯,短期電力負荷預測難度加大[2]。因此,需提出新的預測方法,滿足短期電力負荷精準預測的需求。

氣象作為電力負荷的一個主要影響因素,會使得電力負荷受到熱慣性的影響,并且不同地區的影響程度不同[3]。在市級地區傳統電力負荷的預測流程中,一般將全市全天的氣象信息作為影響因素[4],沒有考慮區域內不同地區氣象信息的差異性對電力負荷的不同影響,因此,有必要根據區域內不同氣象站的氣象信息與電力負荷在時間和空間2 個維度的相關性特征建立短期電力負荷預測模型[5]。常用的相關性分析方法有皮爾遜、肯德爾算法等,但是這些算法主要應用于線性分析,對非線性電力負荷與多維氣象信息的分析效果不佳[6]。近年來,Copula 理論已經被應用于諸多領域復雜問題的研究中,具有形式靈活多變、不受邊際分布限制等優點,可以客觀、定量、準確地分析非線性相關性,為多維氣象信息的時空融合(spatio-temporal fusion,SF)提供方法依據[7]。

目前,機器學習技術已被應用于電力負荷預測中,預測模型根據模型數量可分為2 類。一類預測模型是單一預測模型,該類模型利用相關性分析提取與電力負荷耦合程度較高的影響因素,再利用最小二乘支持向量機(least squares support vector machine,LSSVM)[8]、長短期記憶(long short-term memory,LSTM)網絡[9]等進一步提取數據特征,從而得到電力負荷預測值。LSSVM 具有解決非線性問題的優勢,被廣泛應用于電力負荷預測領域。LSTM 網絡解決了循環神經網絡(recurrent neural network,RNN)的長期依賴問題,可顯著提高預測精度與效率。由于電力負荷具有非線性、非平穩性等特點,單一預測模型結構具有局限性,因此,難以達到理想的預測精度。另一類預測模型是融合信號處理與多種預測方法優點的分解-預測-重構模型,該類模型是現階段研究的重點[10?14],可發揮分解算法的優勢,將非線性、非平穩性的電力負荷數據分解為一組較平穩的分量,在保持原始序列特征的同時,降低預測模型的輸入復雜度,并融合多模型預測的優勢,對各分量采用不同的預測方法,通過對各分量預測結果進行重構得到整體預測值,提高預測模型的泛化性與預測精度。在短期電力負荷預測中,小波分解、經驗模態分解與變分模態分解(variational mode decomposition,VMD)算法受到廣泛關注[11]。小波分解對負荷數據的處理情況與母小波和分量數相關,其自適應性不強。經驗模態分解具有一定的自適應性,但在分解過程中有模態混疊的缺陷。VMD 可將負荷數據分解為不同頻率的本征模態函數(intrinsic mode function,IMF),具有自適應、非遞歸等特點,適用于建立短期電力負荷預測模型,但在VMD 過程中,參數設定繁瑣且具有主觀性,這會給分解的準確性帶來影響。文獻[12?13]提出采用優化算法對VMD 關鍵參數進行自動尋優的預測方法,取得了較高的預測精確度,但模型復雜,不適應時間序列。文獻[14]提出利用排列熵分析VMD 各IMF的復雜度并通過對IMF 進行重組得到子序列的方法,有效提升了VMD 處理時間序列的效率,但參數設定仍具有主觀性,這會對預測精確度造成影響。海洋捕食者算法(marine predator algorithm,MPA)模擬海洋中捕食者和獵物的進化演繹,在Lévy 游走和布朗游走之間選擇最佳覓食策略。相較于其他算法,MPA 具有模型參數少、不易陷入局部最優、尋優效率高等優點。

基于上述分析,本文在空間維度上,提出將多座氣象站的氣象信息與電力負荷進行SF,利用Copula理論對電力負荷與多維氣象信息進行非線性耦合分析,從而篩選重要特征。在時間維度上,采用MPA對VMD 關鍵參數進行尋優,為了兼顧不同分量的變化幅度以及適用于短期電力負荷預測,以不同頻率IMF 的加權排列熵(weighted permutation entropy,WPE)之和最小為目標函數,將原始負荷數據分解為不同分量。結合不同預測模型對各分量的預測優勢,根據預測評價指標選擇各分量所對應的模型,并重構得到整體預測值。根據實際數據進行多組算例對比,結果驗證了本文所提模型的泛化性與優越性。

1 多維氣象信息SF

1.1 基于Copula理論的相關性分析

Copula 理論沒有線性和高斯性假設,可對多變量進行非線性耦合分析,因此,采用Copula理論對電力負荷與多維氣象信息進行定量相關分析[15]。

以電力負荷和溫度為例,假設電力負荷序列為u,溫度序列為v,定義H(u,v)為兩者的聯合分布函數,兩者的邊緣分布函數分別為F(uu)和F(vv),則存在一個Copula 函數C(·)關聯聯合分布函數和邊緣分布函數,如式(1)所示。

本文選擇適用性較強的Kendall 秩相關系數法進行相關性分析,表達式如下:

式中:C(u,v)表示用Copula 函數關聯序列u和v;β為Kendall 相關性分析結果,|β|越接近于1,則各變量之間的相關性越強。

常用的Copula 函數有t-Copula、Gumbel-Copula、Clayton-Copula、Frank-Copula 以及Normal-Copula,各Copula函數適用于不同序列的相關性分析,因此,需選擇最優Copula函數進行準確分析。本文采用最小歐氏距離法來選擇最優Copula 函數,實現對氣象信息序列與負荷序列的非線性耦合分析[16]。

1.2 多維氣象信息SF步驟

為綜合分析各季節不同地區的氣象信息,本文基于Copula 理論對多維氣象信息進行SF,具體包括如下3 個步驟:①針對圖1 所示的12 個氣象信息,基于最小歐氏距離法選擇最優Copula函數進行非線性耦合分析,分別選擇各季節中影響電力負荷的主要氣象信息;②基于Copula 理論對附錄A 圖A1中不同分布氣象站的主要氣象信息與電力負荷進行時空相關性分析,得到各相關度;③選擇與電力負荷相關度最高的氣象站數據,得到氣象信息融合結果,并構造影響因素矩陣。

1.3 基于Copula理論的多維氣象信息SF

以3 — 5 月(春季)多維氣象信息SF 為例,各Copula函數的平方歐氏距離如附錄A圖A2(a)所示?;谧钚W氏距離法選擇各氣象信息序列的最優Copula 函數,得到各氣象信息以及負荷特征相互之間的關聯熱力圖,如附錄A 圖A2(b)所示。相關度越接近于1,表示相關度越高。與負荷特征間的相關度大于或等于0.3 的氣象信息可以作為負荷影響因素[17]。由圖A2(b)可知:在各氣象信息中,地表溫度與負荷特征間的相關度最高,為0.589;2 m 氣溫、降水量、露點溫度、東向風速、凈日照強度、總日照強度、紫外線強度與負荷特征間的相關度也較高。為降低輸入維度,考慮到2 m 氣溫、地表溫度與露點溫度之間以及凈日照強度、總日照強度與紫外線強度之間存在高度互相關性,可以將其分別視為一類氣象信息,并以其中與負荷特征相關度最高的氣象信息為代表,因此,選擇地表溫度、降水量、東向風速與凈日照強度作為影響負荷的主要氣象信息。根據各氣象站主要氣象信息與電力負荷時空相關度的大小進行篩選,對氣象站1 — 8 的數據進行SF,如表1 所示,選擇氣象站1的地表溫度、氣象站3的降水量、氣象站6 的東向風速與氣象站7 的凈日照強度構成影響因素矩陣。其他3 個季節的分析過程同理,本文不再贅述。

表1 各氣象站相關度Table 1 Correlation degree of each meteorological station

2 VMD與預測模型

2.1 MPA

MPA 根據種群規模v以及維度d初始化獵物矩陣P,利用式(3)對矩陣中的每個元素Xij進行初始化。

式中:Xmax、Xmin分別為解的上、下限;r為(0,1)區間內的隨機系數。

獵物矩陣P中的最優適應度個體構成頂級捕食者矩陣E,設di為迭代過程中的移動步長,tM為當前迭代次數,tMmax為最大迭代次數,RL為Lévy 游走,RB為布朗游走。將2 種游走方式和不同階段下獵物與頂級捕食者的Kronecker積作為di的影響因素。

當tM<tMmax/3 時,為高速度比階段,頂級捕食者放棄捕獵,獵物為布朗運動,數學表達式為:

式中:p取常數0.5;R為[0,1]區間內的均勻隨機數構成的矩陣;Pi、Ei分別為當前迭代次數tM的獵物位置和頂級捕食者位置“;?”為Kronecker積運算。

當tMmax/3 <tM< 2tMmax/3 時,為等速度比階段,此時種群分為兩部分:前半部分種群為Lévy 游走群體,負責開發;后半部分種群為布朗游走群體,負責探索。數學表達式為:

式中:CF為控制捕食者移動步長的自適應系數。

當tM>2tMmax/3 時,為低速度比階段,獵物與頂級捕食者均采用Lévy游走,數學表達式為:

另外,魚類聚集裝置或渦流效應使算法在迭代過程中盡可能地逃離局部極值,從而獲得了更好的尋優效果,數學表達式為:

式中:U為隨機生成的二進制向量;pF為擾動概率因子,取值為0.2;Pr1、Pr2為從獵物矩陣中隨機取出的個體。

2.2 基于MPA的VMD優化方法

VMD 可以將負荷數據分解成不同頻率的模態分量,降低非線性數據的非平穩性,其基礎理論如附錄B 所示。在VMD 初始化過程中,需要調整分解數k和懲罰因子α這2 個重要參數。若k值設置得過小,則分解不完全,會造成信息丟失;反之,則會出現過分解現象[18]。懲罰因子α主要影響各模態頻譜的帶寬以及算法的收斂程度[19]。人為設定參數會使得分解具有主觀性,本文利用MPA 來優化VMD 關鍵參數。

2.2.1 MPA優化算法測試

VMD 參數優化可視為二維函數優化問題,為驗證MPA 在該優化問題上的優勢,對式(12)中的函數進行優化實驗,該函數的三維模型如附錄A 圖A3所示。

式中:f為待優化函數;x、y為2個優化變量。

分別選取粒子群優化(particle swarm optimiza?tion,PSO)算法、麻雀搜索算法(sparrow search algo?rithm,SSA)和MPA 來尋找最小值。將3 種算法的種群規模均設置為20,以保證實驗的合理性與公平性,迭代次數設置為500;通過多次測試,將PSO 算法的個體學習因子和社會學習因子2 個參數均設置為1.5;SSA 的安全閾值ST=0.8,發現者為種群規模的20 %,警戒者數量設定為5個;MPA 中魚類聚集裝置效應系數設置為0.2。

3 種算法的尋優結果如圖2 所示。與PSO 算法、SSA 相比,MPA 的尋優速度更快,在迭代終止時,MPA 的尋優結果更接近全局最優。綜上,MPA 的尋優效果更佳,因此,采用MPA 來優化VMD 關鍵參數,以降低分解結構的主觀性,提高分解效果。

圖2 3種算法尋優結果對比Fig.2 Comparison of optimal searching results among three algorithms

2.2.2 適應度函數的設計

排列熵(permutation entropy,PE)算法可較好地反映時間序列的變化規律與復雜程度[20],因此,采用該算法構造適應度函數。

假設將序列分解為{y(1),y(2),…,y(k)}共k個分量,{s(1),s(2),…,s(N)}為包含N個IMF 的時間序列,采用相空間重構對序列進行處理,可得到重構矩陣xj,如式(13)所示。

式中:m為嵌入維數;τ為延遲時間;j=1,2,…,N-(m-1)τ。對重構矩陣進行排序后的序列為:

式中:g=1,2,…,l,并且l≤m??;jg1—jgm為一組符號序列。計算S(g)出現的概率qg,再計算序列{s(1),(s2),…,s(N)}的排列熵Hp(m),如式(15)所示。

排列熵Hp(m)的標準化形式為:

2.3 LSTM網絡預測

在LSTM 網絡中,以記憶單元替代傳統RNN 中的隱含層神經元[22],該存儲單元結構包括輸入門、遺忘門以及輸出門。LSTM 網絡結構如附錄A 圖A4所示。

各量計算公式為:

式中:ft、it、ot、ct分別為當前時刻t的遺忘門、輸入門、輸出門、內部記憶單元和臨時狀態量;fsig(?)為Sigmoid 激活函數;xt為當前時刻t的輸入信息;st-1為上一時刻的隱含層狀態;Wfx、Wix、Wcx、Wox、Wfs、Wis、Wcs、Wos為權重矩陣;bf、bi、bc、bo為偏置項。

矩陣ft、it、ot的元素均為[0,1]區間內的實數,決定了ct的遺忘比例,即決定了更新的信息與遺忘的信息,從而得到t時刻的st,即:

2.4 MPA-LSSVM神經網絡

LSSVM 中參數的選取對模型性能有很大影響[23],采用MPA 來優化LSSVM 參數。LSSVM 優化模型為:

式中:J(ω,ξi)為ω與ξi的函數,ω為權重,ξi為第i個樣本的松弛變量;γ為正則化參數;b為偏置項;φ(?)為非線性映射函數;zi、yi為訓練樣本集;n為樣本數。

利用MPA 對LSSVM 模型正則化參數γ和核函數參數σ進行迭代尋優,得到最優MPA-LSSVM 模型,優化步驟如下。

1)初始化MPA 參數,包括種群規模、位置、迭代次數等。

2)確定適應度函數并計算適應度。

3)更新參數并計算適應度,實現位置更新。

4)判斷是否達到最大迭代次數:若未達到,則轉至步驟3),直至達到最大迭代次數;若達到,則轉至步驟5)。

5)輸出最優正則化參數和核函數參數,將其代入LSSVM模型中,完成時序數據的預測。

3 SF-MPA-VMD組合預測模型

3.1 短期電力負荷預測模型

本文建立多維氣象信息SF和MPA-VMD的短期電力負荷組合預測模型總體框架,如附錄A 圖A5所示。采用Copula理論得到各季節電力負荷影響因素矩陣,結合MPA-VMD 對負荷數據分解得到的分量形成輸入矩陣,并劃分訓練集和測試集,訓練集用于訓練LSTM 與MPA-LSSVM 模型的參數,得到最優預測模型以及各分量預測值,根據評價指標選擇各分量對應的預測模型,將測試集各分量輸入對應的預測模型中,通過重構得到整體預測結果。

3.2 預測結果評價指標

將平均誤差eNPE、均方根誤差eNRMSE及平均絕對百分比誤差eNMAPE這3個誤差統計量作為預測結果的評價指標,具體表達式分別如附錄C 式(C1)—(C3)所示。

4 算例分析

4.1 基礎數據

選取湖北某地區2020 年3 月1 日至2021 年2 月28日每隔15 min采樣得到的共35 040個電力負荷數據和8 座氣象站的歷史氣象數據,數據集包含的信息如圖1 所示。根據各季節電力負荷特性,劃分3 — 5 月(春季)、6 — 8 月(夏季)、9 — 11 月(秋季)、12 月至次年2 月(冬季)這4 個時段,對每個時段劃分工作日與節假日。對于各時段的數據,均取前80 % 的數據構成訓練集,取剩余20 % 的數據構成測試集。為消除不同因素的量綱不同帶來的影響,將各數據歸一化至[0,1],根據1.3 節的多維氣象信息SF 方法構造影響因素矩陣,并與MPA-VMD 負荷分解分量組成輸入集,采用單步滾動預測方式預測未來24 h 共96 點的負荷值,每步預測未來15 min 的負荷值,將預測值作為新特征代入模型并預測下一時刻的負荷值,在得到電力負荷預測結果后再對其進行反歸一化處理。

4.2 MPA-VMD負荷序列分解

為體現利用MPA-VMD 對負荷數據進行分解的優勢,分別采用PSO 算法、SSA、MPA 對2.2.2 節構建的適應度函數尋優得到VMD 參數,將春季負荷分解為相應分量,3 種算法的初始參數設置與2.2.1 節相同。不同分解算法的結果比較如表2所示。

表2 不同分解算法的結果比較Table 2 Comparison of results among different decomposition algorithms

由表2 可知,相較于傳統VMD、PSO-VMD 和SSA-VMD,MPA-VMD的分解損失分別減少85.39 %、80.79 %和69.22 %。由上述分析可得,MPA-VMD 可以減少分解損失,在避免經驗設置參數帶來隨機性的同時,可以自適應確定VMD 最佳參數,提高分解效果。采用 MPA-VMD得到的分解序列如附錄A圖A6所示。

4.3 短期電力負荷預測結果

4.3.1 基于SF-MPA-VMD的組合預測

以春季電力負荷預測為例,將訓練集輸入LSTM、MPA-LSSVM 模型中,得到各分量預測值,各預測模型的評價指標如表3所示。

表3 各預測模型的評價指標Table 3 Evaluation indexes of each forecasting model

由表3 可知:對于IMF1、IMF2分量,MPA-LSSVM模型的各指標值均優于LSTM模型;對于IMF3— IMM9分量,LSTM 模型的各指標值均優于MPA-LSSVM 模型。因此,綜合考慮3 個評價指標,對于IMF1、IMF2分量,使用MPA-LSSVM 模型,對于IMF3— IMF9分量,使用LSTM 模型?;谏鲜龇椒?,得到春季工作日2020 年5 月20 日負荷各分量的預測值如附錄A圖A7所示,將各分量的預測值進行重構得到整體電力負荷預測值,如圖3所示。

圖3 SF-MPA-VMD組合預測電力負荷值Fig.3 Power load values obtained by combined forecasting of SF-MPA-VMD

4.3.2 與其他模型的對比

為驗證本文模型的有效性,設計如下3 組對比實驗來預測2020 年5 月20 日的負荷值。為保證實驗的客觀性,預測結果均為多次預測的平均值。

1)對比實驗1。

為驗證多維氣象信息SF 對電力負荷預測精度的影響,將進行特征選擇和SF 的氣象數據作為2 組影響因素,將其與MPA-VMD 得到的分量構成LSTM預測模型的輸入矩陣,得到MPA-VMD-LSTM 與SFMPA-VMD-LSTM 的預測結果,2 種模型的評價指標對比如表4所示。

表4 2種模型的評價指標對比Table 4 Comparison of evaluation indexes between two models

由表4 可知,相較于MPA-VMD-LSTM,SF-MPAVMD-LSTM 的eNRMSE降 低13.375 MW,eNMAPE降 低0.470 %,eNPE提升2.524 %,證明了多維氣象信息SF提高預測精度的有效性。

2)對比實驗2。

為驗證利用MPA-VMD 對負荷進行分解的有效性,分別采用PSO-VMD、SSA-VMD、MPA-VMD以及經驗設置VMD參數處理負荷數據,得到4組分解結果,并將其分別與經多維氣象信息SF構成的影響因素矩陣作為LSTM 預測模型的輸入,得到SF-PSO-VMDLSTM、SF - SSA - VMD - LSTM、SF - MPA - VMD - LSTM 與SF-VMD-LSTM 的預測結果,評價指標對比如附錄A表A1 所示。由表可知,經PSO 算法、SSA、MPA 優化VMD 參數后,預測模型的性能得到進一步提升,相較 于SF-PSO-VMD-LSTM、SF-SSA-VMD-LSTM、SFVMD-LSTM,SF-MPA-VMD-LSTM 的3 個評價指標均最優,這說明MPA-VMD方法可有效提升預測精度。

3)對比實驗3。

為驗證組合預測模型的優勢,將經多維氣象信息SF構成的影響因素與經MPA-VMD得到的負荷分量構成LSTM 預測模型、MPA-LSSVM 預測模型、LSTM 與MPA-LSSVM 組合預測模型的輸入矩陣,分別得到SF-MPA-VMD-LSTM、SF-MPA-VMD-MPALSSVM、SF-MPA-VMD-MPA-LSSVM-LSTM 的預測結果,預測效果對比如圖4所示。

圖4 電力負荷預測效果對比Fig.4 Comparison of power load forecasting effect

3 組對比實驗中各模型的評價指標對比如附錄A 表A2所示。由圖4和表A2可知,與其他預測模型相比,本文模型的預測結果更接近真實值,從3 個評價指標的角度,本文模型也更優。

4)模型泛化能力測試。

為了驗證本文模型的泛化能力,分別選取2020年5 月12 日和16 日的數據作為春季工作日與節假日的預測樣本,分別選取2020年8月27日和29日的數據作為夏季工作日與節假日的預測樣本,分別選取2020年11月24日和28日的數據作為秋季工作日與節假日的預測樣本,分別選取2021 年2 月22 日和27 日的數據作為冬季工作日與節假日的預測樣本,得到電力負荷預測結果的評價指標如附錄A 圖A8所示。由圖可知,在4 個季節工作日與節假日的預測中,本文模型的3 個評價指標均最優,充分體現了本文模型的泛化能力以及預測性能。

綜上所述,本文提出的基于多維氣象信息SF 和MPA-VMD 的短期電力負荷組合預測模型具有良好的穩定性與泛化能力,顯著提高了電力負荷的預測精度。

5 結論

為提高電力負荷的預測精度,本文考慮負荷與氣象信息在時間和空間2 個維度的特征。在時間維度上,設計一種MPA-VMD 短期電力負荷組合預測模型。在空間維度上,將多座氣象站的氣象信息與電力負荷進行SF,根據區域內氣象信息進行電力負荷預測。根據實驗結果的對比分析,得到以下結論。

1)基于Copula理論對多座氣象站的氣象數據與電力負荷進行SF,并采用最小歐氏距離法選擇最優Copula 函數,以對各季節氣象信息序列與負荷序列進行非線性耦合分析,有效降低了特征維度,提高了預測效率與精度。

2)MPA 的尋優能力和尋優速度均優于PSO 算法和SSA,能夠有效避免在尋優過程中陷入局部最優。與利用PSO 算法、SSA 優化VMD 參數以及經驗設置VMD 參數相比,利用MPA 優化VMD 關鍵參數時的3 個評價指標均最優,充分說明了優化VMD 參數的必要性,證明了根據排列熵算法構造目標函數的有效性以及利用MPA優化VMD參數的優越性。

3)對4 個季節工作日與節假日的預測分析結果表明,相較于其他模型,所提模型具有更好的泛化能力與預測性能。

后續筆者將考慮在預測模型中引入氣象修正方法,進一步降低模型的輸入維度,提高預測效率、精度與普適性。

附錄見本刊網絡版(http://www.epae.cn)。

猜你喜歡
分量氣象負荷
氣象樹
《內蒙古氣象》征稿簡則
帽子的分量
論《哈姆雷特》中良心的分量
大國氣象
美麗的氣象奇觀
分量
防止過負荷時距離保護誤動新判據
主動降負荷才是正經事
負荷跟蹤運行下反應堆一回路控制系統仿真與驗證
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合