?

基于EMD-MLP 組合模型的用電負荷日前預測

2024-01-31 03:46劉璐瑤陳志剛沈欣煒吳勁松廖霄
南方能源建設 2024年1期
關鍵詞:南澳分量用電

劉璐瑤 ,陳志剛 ,沈欣煒 ,吳勁松 ,廖霄

(1.中國能源建設集團廣東省電力設計研究院有限公司,廣東 廣州 510663;2.清華大學 深圳國際研究生院,廣東 深圳 518055)

0 引言

用電負荷日前預測對電力系統的運行優化起重要作用,其精確的預測結果是制定出合理、優質調度計劃的基礎。用電負荷預測方法主要有統計學方法和基于機器學習的方法2 種[1-4]。統計學方法基于自變量、因變量之間的統計規律進行預測,其中比較典型的有狀態空間法[5]、線性回歸法[6]、Box-Jenkins法[7]、自回歸移動平均(ARMA)[8]、季節自回歸(SA)[9]、季節自回歸積分移動平均(SARIMA)[10]、門限自回歸[11]等。統計學方法對于平穩性高、周期性強的用電負荷能夠做出精確的預測。但是,當用電負荷受到天氣等復雜多因素影響時,其數據表現出較強的隨機性及非平穩性,此時,統計學方法難以獲得有效的預測結果[12]。針對實際負荷數據具有的顯著異方差、非平穩性,學者開發了自回歸條件異方差(ARCH)[13]、廣義自回歸條件異方差(GARCH)[14-15]等方法。但是只有在檢查了是否存在ARCH 效應后,才可以使用該類方法對時間序列建模預測[16]。因此,基于統計學的預測方法對負荷的非線性行為建模能力有限,靈活性不足。

針對非線性數據,人工神經網絡(ANN)、深度學習(DL)等機器學習模型則可以更好地模擬異方差性,而不需要對數據做假設檢驗,表現出了更強的數據處理能力與更高的預測精度[17-18]。研究中用于用電負荷預測的機器學習模型包括:專家系統算法[19],灰色模型[20],模糊邏輯控制器[21],貓群算法優化的誤差反向傳播神經網絡(CSO-BPNN)[22],多目標粒子群算法優化的BP 神經網絡(MOPSO-BPNN)[23],蟻群優化的廣義回歸神經網絡(ACO-GRNN)[24],粒子群優化的最小二乘支持向量機(PSO-LS-SVM)[25],深度置信網絡(DBN)[26],長短時記憶循環神經網絡(LSTM)[27-28],Attention 機制改進的LSTM[29],卷積神經網絡(CNN)[30]等。以上機器學習模型通過對訓練算法、模型結構參數進行優化,使得預測準確度得到一定程度的改善,但卻缺少在預測之前對數據進行分解,導致預測精度仍有待提升[31]。

小波變換是一種有效的數據分解方法,研究[32-34]采用小波分解方法對原始用電負荷數據去噪,然后使用機器學習模型對剩余分量建模預測,獲得了比未經小波分解的單一模型更高的預測精度。然而,不同的小波基函數其時頻特性存在差異,因此對同一信號選用不同的基函數進行處理所得的結果往往差別很大,這增加了該方法在實際使用中的復雜程度[35]。學者們提出了經驗模態分解(Empirical Mode Decomposition,EMD)、集合經驗模態分解(Ensemble Empirical Mode Decomposition,EEMD)及變分模態分解(Variational Mode Decomposition,VMD)等更高效的方法在預測之前對負荷數據分解[36]??紫橛竦萚37]采用EMD 將原始負荷數據分解為多個固有模態函數(IMF)分量,并采用基于最小二乘支持向量機(LSSVM)的方法對每個IMF 分量分別建立預測模型,最后將分量預測結果疊加得到最終預測值。鄧帶雨等[38]采用EEMD 的方法將原始電力負荷分解為多個IMF 分量,使用多元線性回歸(MLR)和門控循環單元神經網絡(GRU)對各分量分別進行預測并疊加,預測精度明顯高于其他未經數據分解的單一預測模型以及基于小波變換的組合預測模型。梁智等[39]、劉雨薇等[40]采用VMD 技術與DBN、LSTM等模型結合以對用電負荷預測,與未采用數據分解的單一預測模型比較,MAPE 和RMSE 指標均有不同程度的改善。

現有將EMD、EEMD、VMD 與機器學習模型結合預測的研究,大多是對每個分量逐個預測,然后將各分量預測結果累加作為最終預測值。然而,在此過程中各分量預測誤差會逐漸積累,導致最終的負荷預測誤差增大。此外,由于分解分量較多,對每個分量分別預測導致了計算量繁重的問題,分量越多計算任務越繁重,這極大地限制了該方法的實際應用。因此,本文考慮對多分量進行重構,以精簡預測對象、減少預測次數,以期在降低建模難度的同時提高預測精度。

本文提出一種將EMD 與MLP 結合預測的新方法,首先利用EMD 將原始用電負荷分解為多個分量,并采用極值點劃分法將各個分量重構為高頻和低頻兩個成分以精簡預測對象,然后對二者分別預測并將它們的預測結果疊加作為最終的用電負荷預測值。利用澳大利亞電力市場(Australian National Electricity Market,NEM)多組實測電力負荷數據進行試驗,對比分析驗證本文方法在提高模型預測精度上的有效性。

1 EMD-MLP 組合模型

1.1 多層感知機

1)多層感知機原理

多層感知器(Multi-Layer Perceptron,MLP)為層級結構,包括輸入層、隱含層和輸出層。在MLP 中,各層神經元節點之間通過一定的權重連接,每個節點的輸入由連接到它的前面各個節點的輸出加權確定(輸入層除外)。引入激活函數,對隱藏層中各節點輸入進行非線性變換。通過多層疊加,MLP 可逼近任意連續函數,解決非線性回歸問題。

MLP 神經網絡訓練過程的目標是通過調整激活函數、訓練函數、隱含層數、隱含層神經元數量等超參數,找到使損失函數最優的權值和閾值集。

2)預測評價指標

為定量檢驗MLP 模型預測準確性,采用3 種預測評價指標:平均絕對誤差、平均絕對百分比誤差與均方根誤差。

(1)平均絕對誤差(Mean Absolute Error,MAE)是用來比較預測值和真實值之間絕對偏離程度的指標,表示為式(1):

式中:

Pf,t——t 時刻的用電負荷預測值;

Pm,t——t 時刻的用電負荷真實值;

N ——數據集樣本數目。

(2)平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)是表征預測值與真實值之間相對偏離程度的指標,表示為式(2):

(3)均方根誤差(Root Mean Squared Error,RMSE)是衡量預測值與真實值之間偏差離散程度的指標,表示為式(3):

1.2 經驗模態分解

經驗模態分解(EMD)是一種針對非線性非平穩信號的時頻分析方法,由黃鍔等人提出。EMD 理論認為任一復雜的時間信號是由若干個相互不同的本征模態函數(Intrinsic Mode Function,IMF)組成的,可采用一定的方法將復雜的時間信號分離成具有物理意義的從高頻到低頻的有限個獨立分量,即基本時間信號。用電負荷時間序列可以看作是一種非平穩的信號,使用EMD 將負荷分解成多個基本信號,并分別采用多個模型建??色@得更準確的負荷預測結果。

EMD 過程中各個IMF 需要具備以下2 個要素:

1)在整個數據段內,極值個數與穿過時間軸的點個數相同或相差最多不超過1 個。

2)在數據段任何一處,由局部極大、極小值點形成的包絡線均值為0。

用電負荷時間序列采用EMD 方法的分解過程如下:

首先,根據原始時間信號 X(t)的局部上、下極值點,得到 X(t)的上、下包絡線。求上、下包絡線的均值,得到均值線 m1(t) 。X(t) 與 m1(t)相減,則得到:

判斷 h1(t)能否滿足IMF 所需滿足的2 項要求。若滿足,則 h1(t)就是第1 階IMF,若不滿足,則以h1(t) 為基礎,重復上述操作,得到 h1(t)的上、下包絡線的均值線(t) 。h1(t) 減去(t),得到式(5):

式中:

從 X(t) 中減去 c1(t),得到頻率較低的殘差為 r1(t),表示為式(7):

將 r1(t)看成新的信號,按照上述操作,經過多次運算能夠得到所有的 rj(t),表示為(8):

當滿足條件“ cn(t) 或 rn(t)小于給定的誤差”,或“殘差 rn(t)為單調函數,不能再從中提取IMF”時,EMD 對時間序列的分解過程停止。X(t)最終分解成式(9)形式:

1.3 基于多分量重構的EMD-MLP 組合模型構建

本文提出的基于多分量重構的EMD-MLP 組合預測模型示意圖如圖1 所示,包含數據分解、分量重構、特征選擇、模型訓練與測試步驟。

圖1 EMD-MLP 預測模型示意圖Fig.1 Schematic diagram of the proposed EMD-MLP combination model

首先,采用EMD 方法對原始用電負荷數據進行分解,形成多個本征模態分量(IMF1,IMF2······ IMFN,殘差)。傳統采用EMD 分解方法的預測模型對每一個分量分別預測,再將其結果疊加作為最終預測值。然而此方法存在一些問題,首先,對每個分量分別進行預測會導致建模計算量的增加;其次,對分量分別預測后進行疊加可能會引入預測誤差的累積,從而限制了預測精度。

為解決這些問題,本文提出多分量重構手段,也即將經過EMD 分解后的分量根據其平穩程度進行劃分,并進行重構。具體而言,對各模態分量采用極值點劃分法進行劃分,對劃分后的分量進行疊加重構,形成高頻成分(High Frequency Component,HFC)與低頻成分(Low Frequency Component,LFC)。

使用MLP 模型對用電負荷數據中的高頻與低頻成分分別進行預測,建立的模型分別記為M-HFC,M-LFC。為了篩選出最優輸入特征,采用皮爾遜相關系數法對候選特征進行分析。使用訓練集對M-HFC,M-LFC 分別進行訓練調參,優化模型結構。最后,使用訓練好的模型在測試集上對用電負荷數據的高頻成分和低頻成分分別預測。將M-HFC,M-LFC 的預測結果 OH,OL等權值求和,得到用電負荷預測值。

2 數據處理

2.1 負荷數據分解及分量重構

本研究使用的負荷數據集從南澳電力市場獲取[41],時間范圍為2018 年1 月1 日至2018 年12 月31 日,以及2019 年1 月1 日至2019 年12 月31 日,每步15 min(如圖2、圖3 所示)。

圖2 2018 年南澳用電負荷時間序列圖Fig.2 Time series of electrical load in South Australia in 2018(step length: 15 min)

圖3 2019 年南澳用電負荷時間序列圖Fig.3 Time series of electricity load in South Australia in 2019(step length: 15 min)

基于2018 年、2019 年南澳原始負荷數據的EMD 分解結果分別如圖4、圖5 所示。

圖4 原始負荷序列的EMD 分解結果(2018 年南澳用電負荷數據集)Fig.4 EMD decomposition results of original load series from South Australia in 2018

圖5 原始負荷序列的EMD 分解結果(2019 年南澳負荷數據集)Fig.5 EMD decomposition results of original load series from South Australia in 2019

采用極值點劃分法[42]對經EMD 分解后的各個分解分量進行重構。該方法首先求出各IMF 分量的極大、極小值個數,然后根據極值的個數對各IMF分量劃分并重構。極值個數反映出分量的波動程度?;跇O值點劃分法將各分量重構為高、低頻2 個成分。表1 給出了基于2018 年、2019 年南澳用電負荷數據得到的各分量極值點個數。選擇一個合適的ρ作為區分高、低頻成分的閾值,本文選擇 ρ=100。因此,基于2018 年、2019 年數據,得到各分量中的IMF1-IMF9 重構后形成HFC,此成分波動頻率較高,代表短期波動,IMF10-IMF15 疊加重構為LFC,此成分波動頻率較低,變化平緩,代表長期趨勢。各分解分量的重構結果如圖6、圖7 所示。

表1 各分解分量極值點個數Tab.1 The number of extreme points of each component

圖6 2018 年南澳用電負荷的分解分量重構結果Fig.6 The reconstructed high-frequency and low-frequency components of electrical load in South Australia in 2018

圖7 2019 年南澳用電負荷的分解分量重構結果Fig.7 The reconstructed high-frequency and low-frequency components of electrical load in South Australia in 2019

2.2 基于皮爾遜相關系數法的特征選擇

為了對d 日t 時刻用電負荷的高頻、低頻成分進行預測,首先分別選取他們的歷史值作為候選輸入特征[43-44],包含前1 日(d-1)至前7 日(d-7)同一時刻t 的歷史值(記為)。

此外,一些天氣因素,例如空氣溫度,也能影響到用電負荷的大小。本文采用預測日d 的日最高溫度、日平均溫度、日最低溫度預測值(記為)作為另一組候選輸入特征。使用的氣溫數據與負荷時間范圍相同,為2018 年1 月1 日至2018 年12 月31 日 及2019 年1 月1 日 至2019 年12 月31 日。日最高、日平均、日最低溫度數據為每天記錄一次。2018 年與2019 年的南澳州阿德萊德市溫度時間序列如圖8、圖9 所示。

圖8 2018 年南澳阿德萊德溫度時間序列Fig.8 Temperature time series of Adelaide,South Australia in 2018

圖9 2019 年南澳阿德萊德溫度時間序列Fig.9 Temperature time series of Adelaide,South Australia in 2019

對于候選特征,采用皮爾遜相關系數法進行最優輸入特征的選取[45]。皮爾遜相關系數用于度量輸入變量x 和輸出變量y 之間的線性相關性,其值介于-1 與1 之間。兩個變量之間的皮爾遜相關系數定義為兩個變量之間的協方差和標準差的商,表示為式(10)。當相關系數為1 時,x 和y 完全正相關,當相關系數為-1 時,x 和y 完全負相關。相關系數的絕對值越大,相關性越強;相關系數越接近于0,相關度越弱。相關系數位于0.7~1.0 屬于強相關,0.4~0.7為中等程度相關,0.2~0.4 為弱相關,0.0~0.2 為極弱相關或無相關。

式中:

rx,y——皮爾遜相關系數;

cov(x,y) ——x 和y 的協方差;

σx——變量x 的標準差;

σy——變量y 的標準差;

xi——第i 個樣本的輸入變量;

yi——第i 個樣本的輸出;

各候選特征與高頻、低頻成分間的相關性檢驗如表2 所示。選取相關系數絕對值大于0.4 的特征向量集合(加下劃線標注),分別作為M-HFC 與MLFC 的最優輸入特征。

表2 各候選特征與負荷高頻、低頻成分之間的相關系數(基于2018 年、2019 年南澳用電負荷數據訓練集)Tab.2 Correlation coefficients between the candidate features and HFC,LFC (Based on the training data of South Australia electrical load in 2018 and 2019)

3 試驗結果

試驗中采用了2 份初始數據集,分別為2018 年1 月1日至2018 年12 月31 日及2019 年1 月1日至2019 年12 月31 日的南澳用電負荷及氣溫數據集。每份初始數據集劃分為兩個子數據集:前2/3 初始數據集作為初始訓練集,后1/3 初始數據集作為測試集。初始訓練集又進一步劃分為訓練集(前1/2 初始訓練集)與驗證集(后1/2 初始訓練集),以確定預測模型超參數。測試集用來檢測模型的泛化性能,不允許參與預測模型訓練。

M-HFC 與M-LFC 的輸入層、輸出層神經元數目與相應訓練集的輸入、輸出維數相等,根據表2,基于2018 年數據訓練集的模型M-HFC 與M-LFC的輸入層神經元個數為7 和3,輸出層神經元數目為1 和1?;?019 年數據訓練集的模型M-HFC與M-LFC 的輸入層神經元個數為7 和4,輸出層神經元數目為1 和1。

M-HFC 與M-LFC 的最優超參數是通過在對應的訓練集上訓練得到的。需要調整的超參數有激活函數、訓練函數、隱含層層數、隱含層神經元數目、學習速率、迭代次數、迭代目標。超參數的選取方法為,設定一個超參數調整范圍/可選項,通過誤差反饋迭代一定次數找到最優。MLP 神經網絡的可選激活函數包括對數S 型函數,雙曲正切函數,線性整流函數??蛇x用的訓練函數包括小批量梯度下降法(Mini-Batch Gradient Descent,MBGD)、批量梯度下降法(Batch Gradient Descent,BGD,也叫最速梯度下降法)、隨機梯度下降法(Stochastic Gradient Descent,SGD)、動態自適應學習率的梯度下降算法(Adaptive Gradient Descent,Adagad)等。隱含層數、隱含層神經元數目的調節范圍分別為1~2 與2~100,學習率調節范圍為0.01~0.1,迭代次數調節范圍是100~2 000,迭代目標調節范圍為0.000 01~0.01?;?018 年、2019 年數據集的M-HFC 與M-LFC 模型在相應訓練集上的最優超參數如表3 所示。

表3 M-HFC 與M-LFC 在相應訓練集上的最優超參數(基于2018 年、2019 年南澳用電負荷數據訓練集)Tab.3 Optimal hyper-parameters of M-HFC and M-LFC (Based on the corresponding training data from South Australia electrical load in 2018 and 2019)

為了驗證本文提出的EMD-MLP 組合模型預測性能,在數據集上建立另外3 種模型,分別是持續性模型(PERSISTENCE)、單一MLP 模型(MLP)與傳統EMD 組合模型(EMD-N)進行對比分析。持續性模型是最簡單的預測模型,同時具有不錯的預測性能,因而常常用作基準模型。持續性模型假設預測時刻的用電負荷 yt與預測窗口L 之前的用電負荷相同,將直接作為預測值,描述為式(11)。單一MLP 模型不經過EMD 分解,直接對用電負荷預測。傳統EMD 組合模型首先將用電負荷經EMD 分解為多個分量,然后對各個分量分別預測,最后將所有分量的預測結果疊加作為用電負荷預測值。

基于2018 年、2019 年南澳電力負荷數據測試集,本文提出的EMD-MLP 組合模型與持續性模型、單一MLP 模型、傳統EMD 組合模型的泛化誤差箱型圖如圖10、圖11 所示。結果顯示,在4 種模型中,EMD-MLP 模型的預測誤差不僅平均值更低,分布也更集中,表明本文提出的EMD-MLP 組合模型不僅可提高預測準確度,也具有更好的穩定性。圖12、圖13 為基于4 種預測模型的用電負荷預測值與真實值在局部測試集上的對比圖,該圖也顯示EMDMLP 組合模型預測值與真實值更貼近。

圖10 絕對百分比誤差(APE),絕對誤差(AE)與平方誤差(SE)的箱型圖(2018 年)Fig.10 Boxplots of APE,AE and SE based on the test dataset in 2018

圖11 絕對百分比誤差(APE),絕對誤差(AE)與平方誤差(SE)的箱型圖(2019 年)Fig.11 Boxplots of APE,AE and SE based on the test dataset in 2019

圖12 4 種模型負荷預測值與真實值對比(2018 年部分測試集:2018 年11 月1~10 日)Fig.12 Comparison of forecasted and actual values of load regarding the four models (part of the test dataset in 2018:Nov,1,2018~ Nov,10,2018)

圖13 4 種模型負荷預測值與真實值對比(2019 年部分測試集:2019 年11 月11~20 日)Fig.13 Comparison of forecasted and actual values of load regarding the four models (part of the test dataset in 2019:Nov,11,2019~ Nov,20,2019)

對誤差箱型圖10 和圖11 中的絕對百分比誤差、絕對誤差在全測試樣本上取平均值,對平方誤差在全測試樣本上取平均值再開方,得到4 種模型(EMDMLP 組合模型、持續性模型、單一MLP 模型、傳統EMD 組合模型)的MAPE、MAE、RMSE3 個誤差指標的結果?;?018 年、2019 年數據測試集,這些誤差指標結果如圖14 所示。對于持續性模型,在2018 年、2019 年的數據集上,MAPE 分別為12.98%與15.68%,MAE 分別為148.5 MW 與173.7 MW,RMSE 分別為207.1 MW 與271.2 MW。而單一MLP 模型在這兩個數據集上的MAPE、MAE 和RMSE 分別降至12.52%、137.6 MW、187.8 MW 以及14.68%、151.0 MW、206.7 MW。這證明采用多影響因素作為輸入的MLP 相比簡單的持續性模型可以提高預測精度,表明了采用MLP 建模的必要性。

圖14 4 種模型在南澳電力負荷不同數據測試集上的預測誤差(2018 年和2019 年)Fig.14 Forecast errors of the four models based on the test data of South Australia electrical load in 2018 and 2019

相比單一MLP 模型,EMD-N 和EMD-MLP 模型進一步提高了預測效果,表明將EMD 分解與MLP 結合進行預測的性能更具優越性。而與傳統的EMD 組合模型相比,本文提出的EMD-MLP 組合模型預測精度更高。在2018 年和2019 年的數據集上,MAPE、MAE 和RMSE 分別進一步降低至10.60%、119.8 MW、157.3 MW 和12.37%、132.1 MW、179.5 MW。因此,本文提出的將EMD 與MLP 結合的新方法通過將EMD 分量重構后進行預測,避免了傳統EMD組合預測方法中誤差累加的問題,有效提高了預測精度。同時,本章提出的方法相比傳統EMD 組合預測方法,能夠實現數據壓縮,極大地降低了計算量,提高了預測效率。

為了驗證所提出模型的魯棒性,選取另一場景下,即塔斯馬尼亞電力市場2018 年、2019 年的用電負荷數據進行模擬。相應的用電負荷數據展示于附圖S1、附圖S2,空氣溫度數據展示于附圖S3、附圖S4?;谙鄳柧殧祿x取出的模型最優輸入特征見附表S1。經過訓練后模型的最優超參數見附表S2。各模型在相應測試數據集上的泛化誤差列于表4。結果顯示,基于多分量重構的EMD-MLP 組合模型相比其他基線模型在MAPE、MAE 和RMSE上都表現出更好的泛化性能。

表4 各模型在塔斯馬尼亞電力市場2018 年和2019 年用電負荷數據測試集上的泛化誤差Tab.4 Forecast errors of different models on the test dataset of electrical load in Tasmania electricity market in 2018 and 2019

綜上所述,本文提出的將EMD 與MLP 結合的新方法有效提高了預測精度,并且在不同數據集上具有魯棒性,在用電負荷預測領域具有一定的使用價值與應用潛力。

4 結論

本研究提出了一種將經驗模態分解與多層感知機結合用于電力系統用電負荷日前預測的新方法。該方法將原始負荷信號分解為多個本征模函數分量,并采用極值點劃分法將這些分量重構為高頻和低頻兩個成分,對它們分別建模預測并將其預測結果疊加作為最終的用電負荷預測值。為驗證所提出的EMD-MLP 組合模型在提高預測精度方面的有效性,使用澳大利亞南澳以及塔斯馬尼亞電力市場2018年和2019 年的實測用電負荷數據進行試驗。通過與持續性模型、單一MLP 模型以及傳統EMD 組合模型進行外推預測效果對比,所提出的EMD-MLP組合模型在泛化誤差上表現最優,驗證了該模型在用電負荷預測精度方面的優越性。

此外,本文所提方法將多分量重構合并為個數較少的分量并對這些分量進行預測,相比傳統的EMD 分解后對各分量分別預測的方法,具有以下實際意義:(1)該方法通過精簡預測對象減少了預測計算量與模型復雜度,提高了預測效率與模型可調節性,可以方便地在實際應用中進行日前、實時預測;(2)通過將分量合并為個數較少的分量,該方法減少了預測過程中的噪聲和干擾,可有效提高預測模型的穩定性和準確性。因此,提出的EMD-MLP 組合預測新方法在電力系統能量管理中具有重要的應用前景,為實現電力系統的運行優化提供了可靠基礎。

附錄

圖S1 2018 年塔斯馬尼亞用電負荷時間序列圖Fig.S1 Time series of electrical load in Tasmania in 2018 (step length: 15 min)

表S1 各候選特征與負荷高頻、低頻成分之間的相關系數(基于2018、2019 年塔斯馬尼亞負荷數據訓練集)Tab.S1 Correlation coefficients between the candidate features and HFC,LFC (based on the training data of Tasmania electrical load in 2018 and 2019)

(劉璐瑤)

猜你喜歡
南澳分量用電
用電安全
帽子的分量
用煤用電用氣保障工作的通知
安全用電知識多
用電安全要注意
論《哈姆雷特》中良心的分量
南澳的驕傲
分量
海島尋蹤 南澳海防遺址調查記
基于瞬時對稱分量法的三相四線制D-STATCOM控制研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合