?

基于經驗模態分解的多模型融合售電量預測模型

2021-07-25 05:12張強歐淵沈曉東唐冬來
科技創新導報 2021年6期
關鍵詞:經驗模態分解深度學習

張強 歐淵 沈曉東 唐冬來

摘? 要:售電量預測的精度是影響售電公司利潤的一個重要因素。傳統售電量預測方法難以解決售電量數據序列的趨勢性、周期性與隨機性等問題。為此,本文提出一種多模型融合的售電量預測方法。首先,采用基于經驗模態分解方法將日和月度售電量分解為高、中、低頻分量,構建三種獨立的基模型,分別對不同頻分量進行預測;然后,基于歷史數據和同期的外部因素,包括時間和天氣條件等數據,獨立訓練基模型,再將各基模型的輸出進行融合獲得售電量預測數據。本文采用均方根誤差和平均絕對百分誤差作為評價標準。實驗結果表明,本文所提融合模型對比傳統單模型有更高的預測精度,且相比現有預測算法,融合模型預測更加準確和穩定。

關鍵詞:經驗模態分解? 多模型融合? 售電量預測? 深度學習

中圖分類號:TU 47 ? ? ? ? ?文獻標識碼:A? ? ? ? ? ? ? ? ? 文章編號:1674-098X(2021)02(c)-0037-06

A Model Fusion Electricity Sales Forecasting Model Based on Empirical Modal Decomposition

ZHANG Qiang1? OU Yuan1? SHEN Xiaodong2*? TANG Donglai1

(1.Aostar Information Technologies Co., Ltd., Chengdu, Sichuan Province, 610041 China; 2.College of Electrical Engineering, Sichuan University, Chengdu, Sichuan Province, 610065 China)

Abstract:The precision of electricity sales forecast is an important factor affecting the profit of electricity sales companies. It is difficult to solve the trend, periodicity and randomness of data series of electricity sold by traditional forecasting methods. Therefore, this paper proposes a multi-model fusion method for electricity sales prediction. Firstly, daily and monthly electricity sold were decomposed into high, medium and low frequency components by empirical modal decomposition method. Three independent base models were constructed to predict different frequency components respectively. Then, based on the historical data and external factors of the same period, including time and weather conditions, the independent training base model was used, and then the output of each base model was fused to obtain the forecast data of electricity sales. In this paper, root mean square error and mean absolute percentage error are used as evaluation criteria. Experimental results show that the proposed fusion model has higher prediction accuracy than the traditional single model, and the fusion model is more accurate and stable than the existing prediction algorithms.

Key Words: Empirical modal decomposition; Multi model fusion; Electricity consumption forecast; Deep learning

隨著新一輪電改的逐步深入,電力交易市場進一步放開,售電市場逐步放開,產生了很多售電公司,但由于目前國內尚未建立成熟的電力現貨市場機制,偏差電量考核成為了影響售電公司利潤的一個重要因素[1]。目前,降低偏差電量的方法多采用精確感知用戶行為、可控負荷調整[2]和基于市場交易的方式。但是,可控負荷的調整和基于市場交易的方式,可操作性差,主要還是停留在概念層面, 且能調整的幅度較小。在電力市場背景下,更加精確的用戶行為感知,將會最小化購售電偏差,降低由于偏差考核較大所帶來的懲罰費用,提高自身收益[3-4]。

傳統的用戶行為感知研究主要著眼于負荷預測。節點負荷與運行狀況緊密相關,直接受到氣候條件等外部因素的影響,故當前的負荷預測主要通過分析外部因素及節點的歷史負荷數據以實施預測。按照其所采用的預測算法,可以分為兩類:基于統計的方法和人工智能方法?;诮y計分析的方法,主要采用多元回歸分析、自回歸和滑動平均模型(ARMA)等技術進行?;谌斯ぶ悄芗夹g的算法,包括傳統的機器學習方法,即通過特征工程構造并提取相應的特征,并通過支持向量機等機器學習模型進行負荷預測;以及深度學習算法,即基于LSTM、GRU等神經網絡架構進行特征的自主學習并實施預測。上述提到的應用于負荷預測的方法基本都是單一模型,文獻[5-6]提出使用模型組合的方式來提高預測精度并增強模型泛化能力,融合的方法主要是采用簡單的均值計算。然而各個模型對預測結果的作用是不同的,采用取平均的方法不能體現出這一點。

上述方法可用于日前或月前預測,但無法滿足售電市場中年度雙邊協商交易和月度集中競價交易對不同時間維度的預測需要。本文提出一種多模型融合的售電量預測方法。采用基于經驗模態分解方法將日和月度售電量分解為高、中、低頻分量,構建三種獨立的基模型,分別對不同頻分量進行預測?;跉v史數據和同期的外部因素,包括時間和天氣條件等數據,獨立訓練基模型,再將各基模型的輸出進行融合獲得售電量預測數據。

1? 基于經驗模態分解的日和月度售電量分解

日和月售電量受溫度變化、環境變化、節假日、季節變化、產業發展以及經濟結構變化等外部環境因素的影響,呈現出明顯的趨勢性、周期性與隨機性。針對這三種特性采取不同的預估方法能減少各分量之間的相互影響。因此本文經驗模態分解法(empirical mode decomposition, EMD )對日和月用電量序列進行分解,針對各分量不同特征進行處理。

經驗模態分解能夠有效地分解非平穩、非線性的時間序列,與傳統分解方法相比的優點在于:在分解序列之前不必預先設置基函數,在實際的分解過程中對任何類型的非平穩、非線性信號都能夠得到較好的分解結果,并且具有很高的信噪比。EMD算法認為信號由不同的IMF分量組合而成,并且這些分量同時具備線性和非線性特點。EMD分解的步驟如下。

(1)求出原始信號的極大值和極小值,而后按照找到的極大值和極小值得到上下的包絡線和。

(2)計算均值m(t)和差值d(t):

(1)

(2)

(3)如果d(t)滿足IMF上述所必需的兩個條件,則將其作為第一個IMF分量,記做c1,如果不符合條件重新執行前兩個步驟,直到符合IMF分量的必要條件。將第一個IMF分量c1從信號中分離出來,可以得到殘余序列r1。

(3)

(4)將殘余序列r1重新進行步驟1和步驟2,當rn單調或者小于預先設置的的常數值時,結束分解,此時的原始信號會被分解成n-1個IMF分量ci并得到最終的殘余分量rn,并且這些IMF分量包含了原始信號中的局部特征信息。EMD分解的完整過程可以由式(4)表示。

(4)

2? 各融合模型

2.1 基于注意力機制的長短時記憶網絡模型

LSTM網絡是一種改進的時間循環神經網絡(RNN),用于處理時序信號。LSTM基本單元主要由輸入門、輸出門、遺忘門組成。在基本單元處理信息的過程中,最重要的是單元狀態的傳遞,即圖1中上方從ct-1到ct的水平線,它將信息從上一個單元傳遞到下一個單元。

LSTM單元根據t-1時刻記憶單元狀態值ct-1、隱藏層t-1時刻輸出值ht-1和t時刻輸入值,計算t時刻隱藏層輸出值ht。

Attention Model是一種模擬人腦注意力的機制模型,其目的是使神經網絡有選擇地關注輸入特征,并將學習到的特征權重保存賦值給下一個時間步長的輸入向量,利用權值矩陣分配注意力,從而突出關鍵輸入特征對負荷預測的影響。

本文采用的注意力機制模型的第二層LSTM節點的輸出值表示Attention結構的輸入特征序列,也作為Attention第一層隱藏層中的狀態值;表示當序列點經過注意力系數加權后的向量,是Attention最后一層隱藏層中所保存的向量,也是Attention層的輸出。

2.2 隨機森林模型

隨機森林是Beriman在2001年提出的一種基于Bagging算法的機器學習集成算法。隨機森林算法步驟如下:

(1)假設有無功負荷原始數據集A,則有放回的從A中隨機采樣生成n個訓練集;

(2)利用每個訓練集ai組成其對應的決策樹,在決策樹的每個節點有M個特征,隨機從這M個特征中選取出m(mM)2)個特征作為當前節點的分裂特征集,在每個節點上根據Gini系數選取最優特征對該節點進行分裂;

(3)決策樹形成的過程中每個節點都要按照步驟2來分裂,假設重復以上步驟k次,構造k棵最優決策樹組成隨機森林;

(4)使用隨機森林進行決策,假設y代表輸出的負荷預測值,ti表示單棵決策樹,R為隨機森林模型,則決策公式為:

(5)

匯總每個決策樹對數據集的預測結果,得票數最多的預測值為最后的預測結果。隨機森林的隨機性體現在每顆數的訓練樣本是隨機的,樹中每個節點的分類屬性也是隨機選擇的。有了這兩個隨機的保證,隨機森林就不會產生過擬合的現象了,并且實現簡單,計算資源開銷小。

2.3 XGBoost模型

XGBoos是一種廣泛使用的集成學習算法,是對傳統的Boosting算法的改進。傳統思路是結合多個弱學習器,每個弱學習器是一個CART回歸樹,然后對其輸出線性求和從而優化模型。XGBoost模型表示如下所示:

(6)

式中,為第i個樣本的預測值;K為樹的數目,L為樹的集合空間;表示第i個數據點的特征向量;對應第k棵樹獨立的樹的結構q和葉子節點權重w的相關狀況。

3? 基于經驗模態分解的多模型融合模型

具體的建模步驟如下:

(1)運用EMD分解算法得到多個不同的子序列。

(2)依據將序列分為高、中、低頻三類。

(3)分別使用基于注意力機制的長短時記憶網絡模型、隨機森林和XGBoost對高、中、低頻序列進行預測,分別得到各個子序列的預測結果。

(4)疊加并重構各個子序列的預測結果,得到實際的預測結果。

4? 算例分析

本文實驗設備為Windows10 64位操作系統,處理器為Intel(R) Core(TM)i5-8400 CPU @ 2.80GHz,內存為8GB,硬盤4T,GPU顯卡GTX1080Ti11G。軟件架構采用基于TensorFlow框架的Keras深度學習工具進行開發。Keras支持現代人工智能領域的主流算法,包括前饋結構和遞歸結構的神經網絡,也可以通過封裝參與構建統計學習模型。

4.1 數據準備

本文實驗使用某省電力市場2018年交易數據作為基礎樣本,參考廣東電力市場月度偏差電量考核方式。

時間規則包括三個方面:首先,工業用電是當今電力系統的主要負荷,由于政策因素,法定節假日的工業用電與其他時間極為不同,對售電量預測結果會產生一定的影響。本文中對于節假日和非節假日,分別用1和2表示;其次,以周為單位時段,工業、商用和民用用電均在一定程度上表現出周期性。本文使用0、1表示周六、周日,2~6表示周一到周五。最后,受用電習慣影響,一天之中白天的負荷遠高于夜間。本文將單日分為22:00~6:59和7:00~21:59,分別用1和2表示。以上三個尺度的信息構成了售電量的時間特征。

天氣信息也是影響預測精度的關鍵外部因素,包括溫度條件和氣象條件兩類:溫度條件包括平均溫度、最高溫度和最低溫度。氣象條件包括濕度、風速、氣壓和天氣類型。本文中所采用的天氣數據均來源于中國氣象網。

本文使用的輸入數據包含的特征如表1所示。在訓練模型時候我們用向量來表示t時刻的數據點,其中包含了表1中所述的12個特征,然后用一個輸入序列來預測相應的售電量輸出序列,yt表示t時刻未來時刻的售電量。

4.2 數據預處理

本文采用min-max數據標準化將原始數據進行歸一化處理,縮小其動態范圍,如式(7)所示。

(7)

式中,q*為標準化后的售電量;,分別為數據中的最大值和最小值。

4.3 誤差指標

本文采用平均相對誤差(mean absolute percentage error, MAPE)和均方根誤差(root mean squard error, RMSE)用以評判模型預測的準確性,計算公式為:

(8)

(9)

式中:為預測值;yt為實際值;N為總的樣本個數。

4.4 EMD分解

通過對原始的售電量時間序列進行經驗模態分解,逐步分離出了11組IMF分量與1組殘余分量,分解結果如圖1所示。

從圖1的分解結果中可以看出,對于不同頻率的IMF分量,頻率較低的序列平穩性大大提高,波動性較低。對于高頻的IMF分量,其隨機性和波動性十分明顯,無明顯規律可言。針對每個分量序列,可以通過大小將其大致分為高、中、低頻三類。

4.5 驗證融合模型的預測性能

為驗證本文所提出融合模型在進行短期售電量預測的性能,本節以2018年的數據作為訓練集。

圖2為訓練好的3個基模型和融合模型在測試集上的預測曲線圖??捎^察到,隨機森林RF的預測曲線比真實值偏高,XGBoost的預測曲線比偏低,Attention-LSTM的曲線擬合的程度最好。

本文選擇支持向量機回歸SVR模型[7]和人工神經ANN網絡模型[8]與本文的融合模型進行橫向對比,SVR和ANN模型結構與參考文獻中相同。如圖3和圖4所示為三個模型在測試集上的MAPE和RMSE對比??梢钥吹饺诤夏P偷腞MSE和MAPE值都是最優。

4.6 驗證融合模型的穩定性

模型在不同時間長度上的預測情況可以反映其穩定性的強弱。因此為了驗證本文所提融合模型的穩定性,選取數據集中12月份的第一天以及當月分別建立天測試集和月測試集,使用本文方法進行預測。實驗結果如表2所示,可以看到在兩個測試集上本文所提的融合模型的RMSE和MAPE都最優,表明本文方法進行預測的預測精度和穩定性都更強。

5? 結語

售電量預測的精度是影響售電公司收益的主導因素。本文提出一種多模型融合的售電量預測方法。采用基于經驗模態分解方法將日和月度售電量分解為高、中、低頻分量,構建三種獨立的基模型,分別對不同頻分量進行預測?;跉v史數據和同期的外部因素,包括時間和天氣條件等數據,獨立訓練基模型,再將各基模型的輸出進行融合獲得售電量預測數據。實驗結果表明,本文提出的融合模型相比各基模型的預測精度有較大提升,且穩定性高。另外相比ANN和SVR售電量預測算法,本文方法預測的結果更優。

參考文獻

[1] 趙博石,嚴宇,劉永輝,等.基于區域發電成本核準的跨區跨省電力交易偏差電量定價方法[J].電網技術,2016,40(11):3334-33418.

[2] Abdulaal A, Moghaddass R, Asfour S. Two-stage discrete-continuous multi-objective load optimization: An industrial consumer utility approach to demand response[J]. Applied Energy, 2017, 206(15):206-221.

[3] 白登輝.計及偏差電量考核機制的人工神經網絡售電量預測模型[J].電工電能新技術,2020,39(6):58-66.

[4] 喻小寶,譚忠富,馬佳樂,等.計及需求響應的售電? 公司正偏差電量考核優化模[J].電力系統自動化,2019,43(7):120-128.

[5] 劉文霞,龍日尚,徐曉波,等.考慮數據新鮮度和交叉熵的電動汽車短期充電負荷預測模型[J].電力系統自動化,2016,40(12):45-52.

[6] LI ZHIYI,LIU XUAN,CHEN LIYUAN.Load interval forecasting methods based on an ensemble of Extreme Learning Machines[C]//Proceedings of 2015 IEEE Power & Energy Society General Meeting.Denver,CO,USA: IEEE,2015:1-5.

[7] A BRACALE, G CARPINELLI, P De FALCO, T HONG. Short-term industrial reactive power forecasting. International Journal of Electrical Power & Energy Systems, vol. 107, pp. 177-185, May, 2019.

[8] J N FIDALGO, and J. A. P. LOPES. Load forecasting performance enhancement when facing anomalous events. IEEE Transactions on Power Systems, vol. 20, no. 1, pp. 408-415, Feb, 2005.

猜你喜歡
經驗模態分解深度學習
網絡被入侵后的信號檢測系統設計與優化
網絡不穩定節點的動態特征挖掘模型
HHT和HMM在血細胞信號識別中的應用
有體驗的學習才是有意義的學習
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合