?

基于EWT-CNN-BiGRU 的多特征電力負荷預測模型

2024-03-18 05:13孫夢覺鄧安明周植高
科技創新與應用 2024年7期
關鍵詞:步長卷積神經網絡

保 富,孫夢覺,鄧安明,周植高

(1.云南電網有限責任公司信息中心,昆明 650000;2.云南云電同方科技有限公司,昆明 650000)

隨著電力市場進一步改革,電力行業成為了實現“雙碳”目標的關鍵領域,而電力負荷作為時序數據的觀測目標,在各個時間單位對所有對應的特征狀態值都有詳細記錄,通過分析不同特征變量與電力負荷數據之間的內在聯系,可實現對電力負荷的預測,這對電力系統的有效運行、合理調度及可持續發展都具有重要意義[1]。

針對電力負荷的傳統時間序列預測模型主要圍繞基于統計學的方法展開[2],例如貝葉斯算法、自回歸移動平均模型、馬爾可夫鏈等?;诮y計的預測算法具有模型構造簡單、運算速度較快的特點,但對于非線性及不穩定的歷史數據,該類型方法存在無法實現較高預測精度的問題。隨著計算機算力的逐步提升,基于機器學習的時序數據預測模型逐步發展并得到了普遍應用?;跈C器學習的預測模型需要投入大量的數據對模型進行訓練學習,且目前尚未提出一套針對優化神經網絡泛化性的建模標準與參數調整理論,但神經網絡可通過增加訓練數據量來提升預測精度,深度挖掘各類樣本特征之間的潛在關系,對提取線性與非線性數據的特征具有較優能力。近年來,研究人員將數據預處理與預測模型相結合,或將多個預測模型進行組合融合,進一步實現了對時序數據預測精度的提升。

卷積神經網絡(Convolutional Neural Networks,CNN)對于捕獲多維數據中的潛在特征具有優秀的能力,可有效解決原始時序數據帶來的不確定性問題,據此,Wang 等[3]提出了用于實現風力發電預測的CNN 模型;Hong 等[4]使用了CNN 徑向基函數神經網絡(Radial Basis Function Neural Network,RBFNN)混合模型對時序風電數據實現了預測;文獻[5]將CNN 與長短期神經(Long Short-Term Memory,LSTM)網絡進行融合,實現了對短期電價的預測;文獻[6]提出了一種基于LSTM 結合極限梯度提升(XGBoost)的短期電力負荷預測方法。為進一步實現對原始數據的深層次挖掘,研究人員對投入神經網絡進行訓練的原始時序數據進行處理與分析;文獻[7]利用小波分解(Wavelet Decomposition,WD)將風速原始數據分解為若干個平穩的子序列,再通過自回歸滑動平均(Auto-Regressive Moving Average,ARMA)模型實現對風速的預測,該模型降低了對單一變量的預測難度;Xiong 等[8]基于經驗模態分解和支持向量回歸(SVR)理論,提出了針對電力需求的預測框架;文獻[9]提出了基于變分模態分解(Variational Mode Decomposition,VMD)結合CNN 融合門控循環單元(Gated Recurrent Unit,GRU)的混合模型,提高了對時序風電短期預測的準確率;張未等[10]針對短期電力負荷提出了一種基于VMD-LSTM 神經網絡結合輕量級梯度提升機(Light Gradient Boosting Machine,LightGBM)的預測模型;文獻[11]通過優化基于鯨魚算法的注意力機制結合雙向門控循環單元的混合策略,提出了一種短期電力預測模型。

1 理論基礎

1.1 經驗小波變換

經驗小波變換(Empirical Wavelet Transform,EWT)是一種用于非平穩信號分析的自適應信號分解方法[12]。該方法解決了小波分解導致結果中出現與輸入信號無關的濾波組現象,同時與經驗模態分解(Empirical Mode Decomposition,EMD)相比,EWT 方法解決了由于時域信號不連續導致的模態混疊現象,可剔除無關的信號特征,實現更具有一致性的信號分解。以一組離散的正弦波信號為例,其仿真信號的表示形式如式(1)

式中:x(n)為輸入信號的離散形式;Ah為振幅;fh為組成輸入信號的頻率;φh為初始相位角;H為輸入信號波中不同頻率成分的數量,其取值范圍在[0,π]之間,根據傅里葉級數,可將公式(1)表示如下

在此基礎上,可將EWT 分解模式視作一組包含了H個頻譜濾波器的濾波器組,該濾波器組包含了1 個低通濾波器(Lowpass Filter,LPF)及(H-1)個帶通濾波器(Bandpass Filter,BPF)。EWT 的分解方法如下。

首先將輸入的離散信號進行傅里葉變換(Fourier Transform,FT),即

式中:ω為頻率;X(jω)為經傅里葉變換的輸入信號,其輸出結果范圍在[0,π]之間。在輸出信號ωmax=[ω1,ω2,…,ωi,…,ωH]中標記局部頻率最大值ωH,根據信號集[ω1,ω2,…,ωi,…,ωH]獲取對應的濾波帶寬,即Δ=[Δ1,Δ2,…,Δi,…,ΔH-1],其中。

其次,通過經驗尺度函數?1(ω)與經驗小波函數ψi(ω)實現(H-1)個帶通濾波器的自適應性質,其中經驗尺度函數?1(ω)的計算公式如式(4)所示

經驗小波函數ψi(ω)的計算方式如公式(5)所示

式中:γ為常量系數;β(γ,ω,Δi)為變換函數,其表達式如式(6)所示

根據式(4)與式(5)生成自適應濾波器邊界值,即

最后,對式(7)的輸出結果進行傅里葉逆變換(Inverse Fourier Transform,IFT),得出時域小波近似系數與細節系數,即

式中:x1(n)為小波近似系數,即低通濾波器的輸出結果;xi(n)為小波細節系數,即帶通濾波器的輸出結果。

1.2 卷積神經網絡

卷積神經網絡(Convolutional Neural Network,CNN)實現了權重共享的概念,無論在執行分類任務還是回歸任務中都有較出色的表現。CNN 通過卷積運算從不同鄰域內提取數據的局部優勢,從而深度挖掘數據特征以實現目標預測[13]。CNN 模型主要由輸入層、隱藏層及輸出層組成,其中隱藏層又包含了卷積層、池化層、全連接層。

卷積層作為CNN 的核心單元,具有提取關鍵特征及縮減模型以便提高計算速度的功能,是決定預測結果精確度的關鍵所在。其具體計算公式如式(9)所示

式中:Cj為第j層卷積輸出結果;At為卷積層的輸入;?為卷積符號;ReLu 為激活函數;wi為權重矩陣;bi為偏置矩陣。

池化層則可為卷積運算壓縮數據,并剔除不必要的信息,本文在CNN 中使用了最大池化算子。全鏈接層則將卷積運算中提取的特征進行整合,以便獲取最終的預測結果。

1.3 門控循環單元

門控循環單元(Gated Recurrent Unit,GRU)神經網絡與長短期記憶神經(LSTM)網絡在處理時間序列任務上都有良好的表現,但相較于LSTM,GRU 單元具有更簡單的結構,同時,在收斂速度、參數更新和泛化方面都具有較優的表現,能有效捕捉時序數據之間的依賴關系,因此,本文采用GRU 作為對電力負荷實行預測的神經網絡方法[14]。

GRU 的核心結構由2 部分組成:重置門(Reset gate,Rt)與更新門(Update Gate,Zt),其中,重置門Rt用于控制當前時刻t輸入的信息保留量,重置門被允許丟棄與預測結果無關的信息,當Rt趨近于0 時,t時刻之前的隱藏信息將被丟棄,保留t時刻對應信息,反之,當Rt趨近于1 時,該神經網絡單元將把過去的信息視作有用信息。

更新門Zt用于控制過去時刻的信息保留量,當Zt接近于0 時,代表對過去的信息遺忘得越多,當Zt趨近于1 時,代表對于過去的信息記憶得越多[15]。GRU 的網絡結構如圖1 所示。

圖1 GRU 結構圖

GRU 模型的計算過程如公式(10)、(11)、(12)與(13)所示

式中:σ 為Sigmoid 激活函數;W和U為線性變換的權重;xt為當前時刻t的輸入;⊙為內積符號;tanh 為雙曲正切函數;ht-1和ht分別對應t-1 時刻和t時刻的隱藏層狀態。

1.4 雙向門控循環單元

由于發電負荷數據具有較強時序性,在模型訓練過程中,時刻t-1 所對應的數據與時刻t+1 所對應的數據都將對時刻t的預測結果產生較大影響。為進一步提高本文針對電力負荷預測模型的準確性,本文在預測模型中運用雙向門控循環單元(Bidirectional Gated Recurrent Units,BiGRU)。BiGRU 將傳統的GRU 神經元劃分為正向傳輸狀態與反向傳輸狀態,分別通過向前計算組件與向后計算組件計算實現,二者分別對應根據歷史數據更新隱藏狀態和根據未來數據更新狀態的功能,其計算公式如(14)、(15)、(16)所示

2 EWT-CNN-BiGRU 的預測架構

本文為優化電力負荷預測結果,提出了基于EWT-CNN-BiGRU 的混合預測模型,其預測流程如圖2 所示。

圖2 EWT-CNN-BiGRU 預測模型流程圖

本文模型實現預測的具體流程如下。

步驟1,準備數據集。本文采用的預測模型其實質為數據驅動的監督學習模型,通過最小化損失函數達到盡可能準確的預測結果。增加投入訓練的歷史數據數量可進一步優化預測結果的精確率,本文設定訓練集與測試集的比率為8∶2。

步驟2,關鍵特征選擇。通過計算皮爾遜相關系數、距離相關系數或互信息熵,可實現對強關聯性時序特征的篩選。

步驟3,EWT 分解。根據EWT 對關鍵特征進行分解變換,獲得m 組子序列,作為本文預測模型的特征變量。

步驟4,CNN-BiGRU 預測。使用CNN-BiGRU 模型對m 組子序列與關鍵特征原始數據進行訓練學習,形成預測模型,獲取最終預測結果。

3 實驗詳情

本節分別從數據集介紹、模型評價指標、模型參數設定、預測模型實現及結果分析5 個方面進行分析與闡述。

3.1 數據集介紹

本文使用的數據集來自于德國某聯合循環電廠(Combined Cycle Power Plant,CCPP)[16],該電廠被設定為滿負荷工作。該數據集包含了9 568 條時間序列數據樣本,時間間隔為1 h,含有平均溫度(Average Temperature,AT)、環境平均壓力(Average Pressure,AP)、相對濕度(Relative Humidity,RH)和真空效果(Vacuum,V)4 個特征,待預測的目標變量為滿負荷電力輸出(PE)。

3.2 模型評價指標

為了評價本文所使用的預測模型的準確性,本文采用了均方根誤差(Root Mean Square Error,RMSE)、平均絕對誤差(Mean Absolute Error,MAE)、絕對百分比誤差(Mean Absolute Percentage Error,MAPE)及擬合優度(Goodness of Fit,R2)4 個指標對本工作任務進行評估。

3.3 模型參數設定

本小節內容將對本文模型中使用的特征選擇、數據清洗及時間步長參數設定進行介紹說明。

3.3.1 特征選擇

本文使用皮爾遜相關系數對數據集中與預測目標具有強相關性的特征進行選擇。

在本文使用的數據集中含有4 個特征:平均溫度(AT)、環境平均壓力(AP)、相對濕度(RH)和真空效果(V)。通過計算該四維特征與電力負荷(PE)數據的皮爾遜相關性系數,得到了四維特征與預測目標的關系熱圖,如圖3 所示。該熱圖的顏色越深,則代表2 個變量的相關性越強,反之代表二者的相關性較弱。通過圖3 可知,環境平均壓力特征與電力負荷輸出的相關性系數為0.52,為與預測目標相關性系數的最大值,因此,環境平均壓力特征變量被選擇作為模型的輸入參數。

圖3 皮爾遜系數相關性熱力圖

3.3.2 數據清洗

本文使用的實驗數據來自于循環電廠所收集的樣本,為排除數據集中的異常樣本對預測模型產生的負面影響,對投入訓練的數據進行數據清洗。

3.3.3 時間步長參數設定

根據實驗,時間步長參量數值對預測模型的效果具有直接影響,若時間步長太短,會導致EWT 分解效果不佳,預測模型參數數量過多,輸入變量的特征無法被模型完全學習,相反,時間步長過長會導致預測結果精度不夠的現象。本文時序數據的原始采集頻率為1 h,即默認時間步長為1 h,為測試不同時間步長對EWT分解效果與預測結果精度的影響,本文設定了不同時間步長的滑動時間窗口,滑動步長為1,分別為1 h、2 h、4 h、5 h 和6 h 五種參數設置進行了實驗,通過綜合考慮EWT 分解效果與預測精度,本文選定時間步長參數為2,以此展開后續實驗。

3.4 預測模型實現

本小節內容將以CCPP 數據集為例,對本文預測模型的實現進行詳細介紹。

3.4.1 EWT 分解

通過3.3.1 小節中的特征選擇,將環境平均壓力特征變量作為EWT 分解的對象。EWT 需盡可能分離更多數量子序列為CNN-BiGRU 提供更多特征,同時需確保子序列之間的模態差異性。通過測試確定當CCPP 的環境平均壓力變量分解為4 組子序列時,能滿足上述要求。分解的原始數據和子序列如圖4 所示,可見該4 組子序列都保留了原始特征變量的波動特性,同時未出現模態混疊的現象。其中,子序列1 反映了原始特征變量的變化趨勢,可見該子序列的波動頻率較平穩;而子序列4 反映了局部波動趨勢,可見該子序列的波動頻率較大。

圖4 EWT 分解結果

3.4.2 CNN-BiGRU

多層CNN-BiGRU 網絡可以更深層次挖掘目標變量特征,有助于提高預測的精度,但過于復雜的結構可能會帶來過擬合現象的產生,因此,模型結構與參數選擇對降低預測結果誤差具有重要影響作用。

本文分別對2×CNN-1×BiGRU、3×CNN-2×BiGRU、4×CNN-3×BiGRU 及5×CNN-4×BiGRU 4 種不同的多層網絡結構進行了實驗,實驗結果見表1,通過對比實驗,可確定針對該數據集的最優神經網絡結構為2*CNN-1*BiGRU。該結構神經網絡的其他參數設定為:逐步衰減學習率,SDG 優化器,步長為50,迭代次數為120。

表1 不同參數的多層CNN-BiGRU 預測模型結果比較

3.5 結果分析

為證明針對短期電力負荷預測所使用的CNNBiGRU 模型性能,本文使用LSTM、CNN-LSTM 與CNN-GRU 3 種神經網絡預測模型與CNN-BiGRU 預測模型使用相同數據樣本進行了對比實驗,實驗結果如圖5 所示,其對應的4 個誤差指標結果,即RMSE、MAE、MAPE及R2見表2。

表2 不同模型的預測結果

圖5 不同電力負荷預測方法的結果對比

在CCPP 電力負荷數據集下,LSTM、CNN-LSTM、CNN-GRU 和CNN-BiGRU 的MAPE分別為1.016%、1.105%、0.270%和0.130%,故上述4 種預測模型的預測結果都存在一定誤差,但CNN-BiGRU 預測模型較為穩定,其誤差率相較于其他3 種方法較低,說明本文模型能在目前已有的預測模型上繼續提升精度,在電力預測上具有較好的表現。

4 結束語

本文針對電力負荷提出了一種基于經驗小波變換的卷積神經網絡融合雙向門控循環單元預測模型。該模型通過皮爾遜系數提取關鍵特征,對關鍵特征進行經驗小波分解,并通過卷積神經融合雙向門控循環單元網絡對分解的子序列與原始數據進行訓練,以獲取最終的預測結果。通過使用德國某聯合循環電廠采集的數據對本文模型進行了實驗,實驗結果表明,本文提出的模型具有較高的預測精度。

猜你喜歡
步長卷積神經網絡
基于Armijo搜索步長的BFGS與DFP擬牛頓法的比較研究
基于3D-Winograd的快速卷積算法設計及FPGA實現
神經網絡抑制無線通信干擾探究
從濾波器理解卷積
基于傅里葉域卷積表示的目標跟蹤算法
基于神經網絡的拉矯機控制模型建立
復數神經網絡在基于WiFi的室內LBS應用
基于逐維改進的自適應步長布谷鳥搜索算法
基于支持向量機回歸和RBF神經網絡的PID整定
一種新型光伏系統MPPT變步長滯環比較P&O法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合