?

運用聚類算法預測地區電網典型日負荷曲線

2013-08-31 06:06翔,顧
電力與能源 2013年1期
關鍵詞:歷史數據典型聚類

李 翔,顧 潔

(1.上海市電力公司 浦東供電公司,上海 200122;2.上海交通大學 電氣工程系,上海 200240)

0 引言

電力系統負荷曲線的變化過程是一個非平穩的隨機過程。以不同的時間維度分析,負荷曲線的變化呈現1天、1周、1月以至1年的變化周期。

日負荷曲線是表示負荷需求在1晝夜內隨時間變化的特性曲線。日負荷曲線預測是根據電力負荷、經濟、社會、氣象等歷史數據,分析電力負荷歷史數據變化規律,對未來負荷的影響尋求電力負荷與各種相關因素之間的內在聯系,從而對未來某1天的日負荷曲線進行科學的預測。隨著電力系統對數據挖掘的不斷深入和信息采集功能的不斷提升,大量、豐富的歷史負荷數據為科學決策提供了依據[1-3]。

1 聚類模型

建立日負荷曲線預測的聚類模型時,主要考慮歷史數據的預處理、初始聚類中心的設置、最優聚類數目的確定等問題。

1.1 歷史數據的預處理

日負荷曲線的變化具有一定的周期性。例如:同一季節內的日負荷曲線與當日的星期類型有較強的關聯,不同年份的季節典型日負荷曲線具有很高的相似性。因此,考慮對日負荷曲線的歷史樣本進行聚類,進而對所形成的各類樣本進行變化特征挖掘,所得的結果能夠比對日負荷曲線進行獨立分析,更好地反映出本質變化規律。所以,日負荷曲線預測的聚類模型,必須建立在充分的歷史數據樣本基礎上。

目前,大多數電力系統都能夠提供包括若干年內每一天整點時刻的日類型、負荷以及溫度、降水量、濕度等氣象因素的歷史數據積累,可以據此進行建模分析。其中日類型可以分為工作日和非工作日,作為預測模型的自變量,進行建模時前者用1表示,后者用0表示。而負荷和氣象因素的絕對數據的數量級從100~103不等,計量單位也不統一,因此必須對數據的樣本先進行歸一化處理。

氣象因素的歸一化表達式為:

假設歷史數據中負荷最大值為Pmax,第h時刻的負荷為Ph(h=1,2,…,t),以Pmax采用式(2)對負荷曲線進行歸一化處理:

式中:Xh為歸一化后的負荷曲線第h時刻的值。

1.2 聚類算法的選擇

K均值聚類算法是一種常用的動態聚類算法,其實現過程是首先選擇聚類中心,對樣本作初始分類,再根據聚類準則,判斷聚類是否合理,不合理就修改聚類,直至合理為止。相對于經典的無監督聚類算法而言,K均值聚類算法具有簡化計算、加快收斂速度等特點,本文采用此算法對歷史數據進行分析。

采用誤差平方和函數作為聚類準則[4,5]:

式中:wi為類Ri的聚類中心;j為樣本編號;xj為待聚類日的相關因素構成的向量;N為樣本數;c為最初指定的聚類中心個數;dji為第j個樣本是否屬于第i類。

將dji定義為:

K均值算法可得到使誤差平方和準則取得極小值時的聚類結果。

1.3 初始聚類中心的設置

K均值聚類算法是一種基于劃分的聚類算法,目的是通過在完備數據空間的不完全搜索,使得目標函數取得最大值(或最小值)。由于局部極值點的存在以及啟發算法的貪心性,該算法對初始聚類中心敏感,從不同的初始聚類中心出發,得到的聚類結果不一定相同,并不一定保證得到全局最優解。因此,怎樣找到一組合適初始中心點,從而獲得一個較好的聚類效果并消除聚類結果的波動性,對K均值聚類算法具有重要意義。

本文采用文獻[6]介紹的解決方法:

① 算出樣本總體的算術均值;

②找出所有樣本到算術均值的最大距離max_d和最小距離 min_d;

③ 將(max_d-min_d)平均分成c等份,這樣將形成c個區間,c為聚類數目;

④ 每個樣本到均值的距離,將唯一地落在某個區間內,并據此把樣本分成c類;

⑤ 每一類的算術均值作為初始聚類中心。

經驗證,采用上述方法,可以使初始聚類中心的分布盡可能地體現數據的實際分布,獲得較好的聚類效果。

1.4 最優聚類數目的確定

設置不同的聚類數目得到的聚類結果會有所差異,為了得出最優的聚類數目,需要對不同聚類數目的聚類結果進行評價,評價的內容主要是聚類的密集性和鄰近性。

聚類密集性是一種有關聚類內方差的測量,方差越小說明數據集的同一性越高。給定一個數據集X,其簇內方差被定義為:

對聚類輸出結果c1,c2,…,cc,聚類密集性被定義為:

式中:C為聚類個數;var(ci)為簇ci的方差。

每個聚類內的成員應盡可能地接近,所以聚類密集性越小越好。但是在極端情況下,當每個輸入矢量被分為單獨的類時,聚類密集性有最小值0。

聚類鄰近性被定義為:

式中:σ為高斯常數,簡化計算時取2σ2=1;xci為聚類ci的中心;d(xci,xcj)為聚類ci中心與cj中心之間的距離。

各聚類應有效地分開,且聚類鄰近性反比于聚類間距離,所以聚類鄰近性越小越好。然而,當整個輸入矢量被聚為一個類時,聚類鄰近性有最小值0。

為了評價一個聚類系統的綜合質量,可將上述聚類密集性與聚類鄰近性組合為一種評價方法,稱作聚類綜合質量。它被定義為:

式中:ξ∈[0,1]為平衡聚類密集性與聚類鄰近性的權值。例如,Ocq(0.5)表示兩種評價有相等的權值。

顯然,聚類綜合質量越大越好。對于不同的給定聚類數目,分別算出每種聚類結果的聚類綜合質量,該指標最大的聚類結果所對應的聚類數目即為最優聚類數目。

2 聚類結果的利用

對歷史數據的聚類完成后,需要利用聚類的結果以及待預測日的相關參數預測出該日的日負荷曲線。待預測日的日類型是已知條件,其溫度、降水量、濕度等氣象因素可以通過氣象部門獲得,因此可計算待預測日的特征向量與各個類的相關程度,找出相關程度最大的類,待預測日的日負荷曲線即取為該類內每一天的日負荷曲線的平均值。

評價待預測日特征向量與各個類的相關程度可以用灰色關聯度分析法。

設參考數列為X0,被比較數列為Xi,而且

則關聯系數定義為:

式中:ΔXk=|X0(k)-Xi(k)|為第k個點X0與Xi的絕對誤差為2級最小差為2級最大差;ρ為分辨率,0<ρ<1,一般取0.5。

綜合各點的關聯系數可得出整個Xi與參考曲線X0的等權關聯度為:

3 日負荷曲線預測的聚類模型解算流程

日負荷曲線預測的聚類模型解算流程如圖1所示。

圖1 日負荷曲線預測的聚類模型算法流程圖

4 典型日負荷曲線預測算例與分析

4.1 預測結果

以上海電網為研究對象,利用該電網2005年至2008年日負荷曲線及氣象參數等歷史數據,分別預測了2009年春夏秋冬4個季節的典型日負荷曲線,其中典型日的選取是按照當地電網長期以來的慣例,即春季、夏季、秋季和冬季的典型日分別選取每年的4月15日、夏季最高負荷日、10月15日和冬季最高負荷日,上述典型日如遇上節假日或周末則相應順延。由于篇幅所限,僅給出2009年春季、夏季、秋季和冬季典型日負荷曲線的聚類模型預測結果。

圖2 春季典型日負荷曲線

圖3 夏季典型日負荷曲線

圖4 秋季典型日負荷曲線

圖5 冬季典型日負荷曲線

4.2 預測結果分析

預測結果表明:

1)大部分點的誤差在3%的允許范圍內2009年春季、夏季、秋季和冬季典型日負荷曲線表明,誤差超過3%的點和待預測日相鄰幾天的對應點相比,差別基本上小于3%,說明這些點的誤差主要是由突變因素造成的。

2)春季和秋季的預測誤差明顯小于夏季和冬季 這是因為上海地區春季和秋季的負荷特征主要為基本負荷,與氣溫、降水、濕度等氣象因素關系不大,年間變化較小。而夏季有大量的降溫空調負荷,冬季有大量的供暖空調負荷,它們均和氣象因素特別是溫度有很大關系,容易因氣象因素的突變而發生劇烈變化。

5 結論

日負荷趨勢預測是一項重要工作,也是電力系統安排日調度計劃,決定開停機計劃、經濟分配負荷及安排旋轉備用容量的基礎,還可為研究電力系統的峰值、抽水蓄能電站的容量以及發輸電設備的協調運行提供基礎數據。而日負荷曲線預測的精確度和可信度,直接影響著電力系統運行的經濟效益。

利用數據挖掘理論建立了日負荷曲線預測的聚類模型,以上海電網為研究對象,用該模型成功預測了2009年上海地區各季度典型日的日負荷趨勢曲線,并對結果進行了分析。

從結果分析可以看出,模型較為全面地考慮了對日負荷曲線有顯著影響的因素,包括日類型及氣溫、降水量、濕度等氣象因素,較為準確地得出日負荷曲線預測結果,對于電力系統的運行及規劃具有重要的參考價值。

[1]康重慶,夏清,劉梅.電力系統負荷預測[M].北京:中國電力出版社,2008.

[2]Park DC,Sahrawi M A,Marks R J,et a1.Electric Load Forecasting Using Artificial Neural network.IEEE Trans on Power Systems,1991,6(2):442-449.

[3]牛東曉,曹樹華,趙磊,張文文[M].北京:中國電力出版社,1988.

[4]程其云.基于數據挖掘的電力短期負荷預測模型及方法的研究[M].北京.重慶大學,2004.

[5]姜飛,龍子泉,林峰.模糊神經網絡在電力短期負荷預測中的應用[J].控制理論與應用,2003,22(8):23-26.

[6]艾學勇.地區電網典型日負荷曲線預測方法研究[學位論文].上海,上海交通大學,2009.

猜你喜歡
歷史數據典型聚類
用最典型的事寫最有特點的人
多項式求值題的典型解法
基于設備PF性能曲線和設備歷史數據實現CBM的一個應用模型探討
基于故障歷史數據和BP神經網絡的接地選線方案研究
典型胰島素瘤1例報道
基于K-means聚類的車-地無線通信場強研究
基于Hadoop技術實現銀行歷史數據線上化研究
用好細節材料 提高課堂實效
基于高斯混合聚類的陣列干涉SAR三維成像
基于Spark平臺的K-means聚類算法改進及并行化實現
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合