毛文杰,毛 弋
(湖南大學電氣與信息工程學院,中國 長沙 410082)
灰色系統理論[1]自誕生以來,引起了各領域學者的關注與重視。因其原始數據少,預測精度較高的特點被廣泛應用于經濟管理及工程技術等各個領域的數據預測工作中?;疑A測模型是該理論在實際問題中的具體化應用成果,其研究對象是“小樣本,貧信息”的不確定性系統,通過按一定的方式對原始數據序列進行處理,生成規律性更強的算子,從而把握系統運行的內部規律和發展趨勢。多年來,學者對灰色系統理論進行不斷研究和完善,在數據預處理[2]、算子構建[3]、背景值優化[4]、時間響應函數優化[5-8]及迭代基值優化[9,10]等方面均提出了改進與創新,豐富了其內涵,在傳統GM(1,1)模型的基礎上拓展出GM(1,N),GOM(1,1),Verhulst和DGM(1,1)等諸多新型模型,進一步增強灰色系統理論的適用性。
其中,謝乃明等提出DGM(1,1)模型[11],將離散方程和連續方程的轉換過程省略,避免了擬合過程帶來的誤差。隨后其又提出初值點優化求解過程[12],將誤差平方和最小作為目標函數,新增一個修正值,改進模型計算過程過度依賴原始初值點的弊端。為了更好地探究遞減序列之間的內部聯系,基于新息優先理論,宋中民等提出了反向累加理論[13],建立GOM(1,1)模型,并在后來學者的研究中拓展出其離散模型,為數據的逆向聯系研究開辟了新的方向。組合預測是結合同一問題從不同角度及層次出發延伸各預測方法優點,通過線性或非線性的組合將其結果或中間過程進行結合的預測方法,克服了單一預測方法預測信息不全面的缺點,進一步提高了預測精度。目前,將單一預測模型結果進行加權結合的組合預測模型應用最為廣泛,按權重求取方式又可分為定權組合預測和變權組合預測[14,15],張鵬[16]通過對兩種類型方法進行比較分析,得出結論:變權組合預測更適用于隨時間變化的數據序列。
本文以文獻[7]中含線性時變參數的反向累加離散灰色模型為基礎,對模型進行調整修改,作為組合模型的反向累加計算部分。由于文獻[12]中的NDGM(1,1)模型在結構上與其類似,因此作為組合模型的正向累加計算部分。在此基礎上加入迭代基值優化過程,構建新息LT-DGOM(1,1)模型和新息NDGM(1,1)模型。最后將兩部分結果進行變權組合并在未來數據預測中加入等維新息的誤差平方均值替代過程。通過對實際數據進行模擬預測分析,證明該方法具有較好的預測效果。
設等時距原始非負序列:
X(0)={x(0)(1),x(0)(2),…,x(0)(n)}。
通過原始數據累加得到一次累加生成序列:
X(1)={x(1)(1),x(1)(2),…,x(1)(n)},
稱
x(1)(k+1)=β1x(1)(k)+β2k+β3
(1)
為非齊次離散灰色模型(NDGM(1,1)模型)。令
(2)
(3)
式(3)的通式為
(4)
預測結果還原式為
(5)
(6)
為了求取使模型與數據達到最大擬合程度的β4值,需要設定一個判定擬合程度最優的目標以期獲得最優值。在這里可以以誤差平方和最小為目標函數建立方程
(7)
將式(4)和(6)代入式(7)中,并對Q(β4)進行求導得
(8)
(9)
(10)
將式(6)和(10)代入式(3)中可得到初值優化的NDGM(1,1)模型(簡稱新息NDGM(1,1)模型)的時間響應遞推函數。
x(1)(k)=β1x(1)(k+1)+β2(k+1)+β3
(11)
為改進含線性時變參數的反向累加離散灰色模型(LT-DGOM(1,1)模型)。令
(12)
式(12)通式為
(13)
預測結果還原式為
(14)
(15)
將修正初始值及式(13)代入式(15)中,并求導得
(16)
(17)
(18)
由此構建的模型稱為新息LT-DGOM(1,1)模型。
電力負荷數據是一組具有較強關聯性的序列,相鄰的數據之間具有重要的參考意義,而含線性時變參數的正向累加離散灰色模型和反向累加離散灰色模型是從不同方向探究一組原始序列的相鄰數據關聯性的方法,通過將這些不完全明確信息轉化成具有一定規律的算子,從不同的角度建立模型對數據進行擬合和預測。
正向累加模型和反向累加模型都具有其合理性,但是在不同數據下適應性有所區別。為了進一步提高模型的泛化能力,采用變權組合預測法將兩種模型結合。
(19)
對于單項預測模型結果的權系數計算可分為兩個部分——可觀測期部分和預測期部分。
可觀測期(k=1,2,…,n),即與歷史數據同時期的擬合部分。在此期間,實際值與模型預測值之間的誤差可以通過計算直接得到,因此,可以利用誤差來計算權重以修正預測值。常用的方法為方差倒數法,即根據各個單項預測模型的誤差平方和的倒數在所有模型誤差平方和的倒數之和中所占比重賦予相應的權重,以保證精度高的模型獲得更大的權重。該方法的缺陷在于,誤差平方和最小不代表在每個時間點的誤差都最小,因而不能保證每個時間點的權值都能得到合理分配。于是延伸出了隨時間點變化的方差倒數法,即以各時刻單項預測模型預測數據與觀測數據之間的誤差平方倒數在該時刻各單項預測模型誤差平方倒數之和中所占比重作為權系數。這種方法一方面保證了權系數的非負性,另一方面考慮到每個時刻的特異性,保證該時刻精度高的預測結果所占權重大,有效提高精準度,即
(20)
預測期(k>n),即在歷史數據時期之后的預測部位。由于不存在觀測數據,因而無法直接測算誤差。這里可以參考趨勢外推法中的平均化思想:第一個預測值的誤差平方采用可觀測期中的各時間點的誤差平方平均值來進行替代。之后的預測值的誤差平方根據等維新息的思想采用前n維平均誤差平方替代,即以該時刻前n個時刻誤差平方的均值作為該時刻誤差平方替代值。再根據上述隨時間點變化的方差倒數法進行權重計算,即
(21)
為了驗證本文提出的組合模型的實際預測效果,下面選取2014—2021年某地區年供電量水平作為研究對象進行預測分析,原始數據如表1所示。
表1 2014—2021年某地區年供電量
為了體現本文所提出模型的優勢,選取DGM(1,1),LT-DGOM(1,1)以及本文中提到的新息NDGM(1,1)和新息LT-DGOM(1,1)模型作為比較對象,以2014—2021年某地區年供電量水平作為作為原始序列,以平均相對誤差作為衡量預測效果的標準。得到各模型模擬結果如表2所示。
表2 5種模型對某地區年供電量水平模擬結果
由表2可以看出:DGM(1,1)模型作為最原始的離散灰色模型在所有模型中預測效果表現最差,平均相對誤差為11.01%,這是因為其超參數少、過度依賴初始值。文獻[7]中的LT-DGOM(1,1)模型在加入反向累加思想以及線性時變參數之后預測效果有所提升,達到7.64%。本文中提到的新息NDGM(1,1)模型和新息LT-DGOM(1,1)模型分別在兩個方向構建算子的基礎上加入線性時變參數以及迭代基值優化過程,預測精度進一步提高,分別達到7.03%和7.09%。組合模型結合了兩者優點,通過合理賦予權重組合預測結果,進一步減小誤差,達到4.73%,在所有模型中精度最高。
為了更直觀地觀測預測效果,將實際值與各模型預測值通過MATLAB R2019b進行曲線仿真,其仿真結果如圖1所示:
圖1 擬合結果趨勢圖
從各模型擬合曲線的對比中可以看出,本文提出的組合模型更契合原始數據的變化趨勢,離散程度小,表現出更好的擬合效果及模擬精度。即表明通過將含線性時變參數的正向累加和反向累加離散灰色模型進行組合,可以結合兩種模型優點,增強模型的泛化能力,使其模擬預測效果更加顯著。表3給出在組合模型下2022—2026年間該地區年供電量預測值。
表3 2022—2026年該地區年供電量預測值
單項灰色預測模型由于在建立算子時只考慮一個方向上序列的變化關系,無法涵蓋數據的多方面信息而影響預測精度。因此,從多角度建立模型進行組合預測能結合各單項方法的優勢,彌補單項模型考慮問題中存在的不足,進一步提高了預測精度。
本文基于正向累加序列和反向累加序列從不同角度對原始序列進行分析的特點,在NDGM(1,1)模型LT-DGOM(1,1)模型的基礎上進行迭代基值優化,并用兩種信息對某地區供電量水平進行了變權組合預測。在組合預測過程中,考慮到未來預測期權系數的不確定性,采用等維新息的平均誤差平方替代計算。通過數值模擬和擬合曲線表明,組合預測模型相比其單項預測模型以及其他幾種模型具有更高的預測精度。該模型在電力負荷預測中取得了良好的應用效果,其思路也可以用于其他領域的預測工作中。
實例模擬中的該地區以旅游業為主要產業,受疫情影響,對近兩年供電量水平產生較大的沖擊,因此原始數據在2020年產生巨大降幅。如果考慮到疫情問題,只對2020年以前的數據變化曲線進行研究,將2020年及以后數據建立新的序列進行未來預測,將進一步提高精準度。