?

基于數據挖掘和LSSVM的電量大數據多維感知方法

2024-01-12 04:39岳寶強楊波李彪曲小康魏飛
微型電腦應用 2023年12期
關鍵詞:電量數據挖掘負荷

岳寶強, 楊波, 李彪, 曲小康, 魏飛

(國網山東省電力公司臨沂供電公司, 山東, 臨沂 276000)

0 引言

由于電網處于動態運行狀態,電網產生的電量大數據也處于實時變化的狀態,因此需要對電量大數據進行實時多維感知,及時發現電網出現的故障以及異常情況[1]。

文獻[2]提出了基于邊緣計算的電力數據感知自適應處理方法,設計了基于計數Bloom濾波器的邊緣節點數據自適應感知機制,能夠自動識別電力數據類別與對應字段,還設計了可移植的文件尾識別插件,能夠對數據副本管理系統的邊緣節點進行感知和自適應處理,但該方法的感知敏感度較差。文獻[3]提出了基于智能感知的電力多元數據處理方法,利用電力數據智能感知設備采集基礎電力數據,以數據集成整合的方式獲得電力多元數據集群,挖掘熱點信息數據,通過聚類、遷移等方式處理電力多元數據集,但該方法的感知結果不夠準確。

為了解決以上研究成果的不足,本文提出基于數據挖掘技術和LSSVM算法的電量大數據多維感知方法。本文的創新點在于數據挖掘技術和LSSVM算法的融合與應用,基于數據挖掘技術處理的數據,利用LSSVM算法的高維模式識別優勢,彌補傳統單維預測方法的不足,采用經驗風險極小化準則,用核函數來求解非線性回歸問題,從而獲得準確度較高的感知結果,提升電量大數據的感知性能,進而增強電量大數據的應用價值。

1 電量大數據多維感知方法設計

1.1 利用數據挖掘技術建立多維電量數據模型

圖1為關聯規則數據挖掘過程。

圖1 多維電量數據挖掘流程圖

按照圖1在給定的數據集中發現關聯規則,其任務就是發現事物之間的相關性。關聯規則可以表示為

(1)

式(1)中,Ai和Bi分別表示不同維度的數據規則。由電量數據挖掘的內容確定聚類量,進而構造相似矩陣,對隸屬度矩陣和加權指數進行初始化,直至達到式(2)所表示的約束條件。

(2)

式(2)中,變量uij表示第j個電量數據屬于第i類的隸屬度。根據實時數據挖掘的結果隨機選擇聚類中心,并更新聚類中心矩陣[4-6]。當達到最大迭代次數時,停止聚類并輸出新的電量數據矩陣,最終根據結果由隸屬度矩陣確定數據對象的所屬類別,以此作為電量數據的多個維度。進行數據感知時,要求按地區和月、年進行分析,所以在創建多維數據集時要加上地區維和時間維,且兩維度均為共享維[7]。通過數據的分類存儲,以及數據維度的添加,得出電量數據多維模型的構建結果。

1.2 多維電量大數據預處理

1.2.1 填補缺失數據

由采集的原始用電數據集確定因變量和自變量,提取缺失數據位置前后5個數據,并將10個數據組成一組,利用式(3)對電量數據中缺失的所有數據依次進行插值填補。

(3)

式(3)中,x和xi分別表示電量數據的均值和缺失值,yi表示非缺失電量數據,Ln(x)表示缺失電量數據的插值填補結果。將挖掘的所有電量數據按照式(3)進行處理,保證挖掘數據的完整性。

1.2.2 修正錯誤數據

定義電量數據錯誤的判定條件如下:

(4)

式(4)中,變量y(t-1)、y(t)和y(t+1)分別表示在t-1、t和t+1時刻的數據挖掘結果,χ1和χ2表示設置的判定閾值。若待處理數據滿足式(4)的判定條件,則將其代入式(5)進行錯誤修正處理。

(5)

根據式(5)的處理方式,將前后正常數據的平均值賦值給錯誤數據,完成對錯誤數據的修正處理。

1.2.3 數據標準化

為避免出現計算飽和現象,按照式(6)對初始數據進行歸一化處理。

y′(t)=lg(y(t))

(6)

最終得出的結果y′(t)即為標準化處理后的數據。通過對異常數據的修正與標準化處理,最終完成對多維電量大數據的預處理。

1.3 提取電量數據特征

由于電量數據時間上具有周期性的特點,需要按照周期對該時間序列進行特征提取,因此通過分析電量數據在時序上的特點,分別從趨勢性指標、變動性指標及負荷特征指標等3個方面對其進行特征提取。其中,電量上升與下降趨勢特征的量化提取結果如下:

(7)

式(7)中,at和bl分別表示低于或高于標準值的電量數據,l表示數據總量。變動性指標是指用戶用電模式前后的差異度,主要包括前r日和后r日電量平均值之間的差異,以及目標時間前后快速傅里葉變換的系數序列差,計算公式如下:

(8)

式(8)中,Y1和Y2分別表示前后r日的快速傅里葉變換系數序列。負載特性指標主要包括每天不同時段的用電數據的峰谷差、峰期負荷率、平期負荷率、谷期負荷率等,峰谷差反映了電網的調峰能力,峰期負荷率、平期負荷率和谷期負荷率分別反映了峰期負荷、平期負荷和谷期負荷的變化。以日峰谷差為例,特征指標提取結果如下:

(9)

式(9)中,Loadmax和Loadmin分別表示日電量負荷的最大值和最小值。同理可以得出其他負載特性指標的量化提取結果。

1.4 利用LSSVM算法預測多維電負荷變化量

電量數據具有增長和季節性兩種趨勢,影響因素眾多且不確定。對于季節波動數據,在未引入其他變量的情況下,單純依靠單一的電量數據建立預測模型進行預測,不能全面反映電網內外相關因素與售電量的關系,因此本文利用LSSVM算法彌補單維預測方法的不足。LSSVM算法采用經驗風險極小化準則,用核函數來求解非線性回歸的問題,對于給定的數據集(xi,yi)(見圖2),若能準確地由某一超平面分離,則該超平面的距離最大,稱為最優超平面。

圖2中,L表示最優超平面。由此,可以將原始最優化問題量化表示為

(10)

式(10)中,ω、δ和ε分別表示多維電量數據特征的權重、偏移量和誤差,κ表示算法訓練過程中的懲罰參數,N表示提取的電量特征量。通過定義不同于標準SVM的損失函數,LSSVM將不等式約束轉化為等式約束,得到了拉格朗日函數構造的結果:

(11)

式(11)中,αi表示拉格朗日乘子。通過定義LSSVM算法的核函數得出最小二乘支持向量機的函數估計為

(12)

式(12)中,H(x,xi)表示核函數,用來解決原始空間中不能線性回歸的問題。根據上述LSSVM算法的預測與迭代原理,在多維電負荷變化量的預測過程中,對相關參數進行優化后,將所提取的多維電量特征數據和最佳參數導入LSSVM算法,通過訓練得到相應的預測模型,再輸入測試數據,得到最終的電量變化預測結果為

(13)

式(13)中,Ele(t)和Ele(t+1)分別表示前后2個時刻的電量值。以式(13)的計算結果作為電量大數據的多維感知條件,與用戶的電量上限閾值進行對比,若電量感知值高于電量閾值,則判定當前存在電量越限情況,即用戶用電存在異常,否則判定該用戶處于正常用電狀態,可以執行下一時刻的數據感知。最終,將包含電量感知數據以及運行狀態的感知結果以可視化的形式輸出。

2 算例分析

為了測試本文方法的感知性能,以國網山東電力數據中臺、“網上電網”PIS2.0系統、臨沂供電公司能源大數據中心、山東公共數據開放網作為數據來源設計測試實驗。截至2021年10月,供電網的供電總面積達到了502 km2,涉及供電居民數量約41.35萬人,2021年城市最高用電負荷為1 140 000 kW,平均月供電量為61 500 kW。

2.1 準備實驗樣本數據集

根據供電網電量的數據統計信息,以日為單位建立多維樣本數據集。在時間維度上,收集研究期間各個時刻的實際電量數據,并生成波動曲線,如圖3所示。

在空間維度上,分別選擇供電區域內的4個用電用戶的用電量數據,如圖4所示。

圖4 各區域電量變化示意圖

將圖4的電量數據與圖3的時間維度數據融合,得到多維數據樣本,并平均分成4個組別,每個組別包含的電量數據量相同,以此作為驗證電量大數據多維感知是否正確的對比標準。

2.2 設置實驗運行參數

由于優化設計的電量大數據多維感知方法應用了數據挖掘技術和LSSVM算法,因此需要在開始實驗之前在實驗環境中分別設置數據挖掘和LSSVM算法的運行參數。設置樣本數據的連續挖掘時間為2 h,挖掘時間間隔為1.0 s。LSSVM算法中數據偏移量δ取值為0.5,懲罰參數κ取值為0.8,核函數選擇的是高斯徑向基核函數。此外,為了判定當前電量是否存在異常,設置用戶的電量上限閾值為1800 kW。

2.3 選擇感知性能評價指標

合理全面的擬合誤差和敏感度分析便于有效評判電量大數據多維感知方法的性能,因此選取擬合誤差作為感知性能的評價指標,其數值結果如下:

(14)

(15)

式(15)中,ΔT表示電量大數據多維感知的時間開銷。從式(15)可以看出,時間開銷與感知敏感度之間存在負相關關系,因此統計得出的時間開銷越大,證明對應感知方法的敏感度越差。

2.4 實驗過程與結果分析

將本文方法應用到研究環境中,得出測試時段的數據感知結果,其中實驗組別1的感知輸出結果如圖5所示。

圖5 電量大數據多維感知結果

同理可以得出其他組別的電量大數據多維感知結果。為了體現本文方法的性能優勢,將傳統的基于聚類算法的電量大數據感知方法作為實驗的對比方法,并保證在實際運行過程中2種方法的運行環境與處理樣本數據相同,以此控制實驗變量唯一。將2種感知方法的輸出結果與準備的樣本數據進行對比,得到反映感知精度的對比結果如圖6所示。

(a) 研究區域1

從圖6可知,本文方法得出的數據更接近設置的實際數據。將圖6中的數據代入式(14),可以得出對比方法與本文方法的平均擬合誤差分別為15.6 kW和7.2 kW,即本文方法的感知精度更高。這是因為本文通過填補缺失數據、修正錯誤數據和數據標準化等3個步驟對數據進行了預處理,從趨勢性、變動性及負荷等3個方面提取電量數據特征,為準確感知提供了優秀的數據基礎,并利用LSSVM算法預測多維電負荷變化量,根據經驗風險極小化準則,從而獲得精度較高的感知結果。

2種方法的感知敏感度測試結果如表1所示。

表1 感知敏感度性能測試數據表

通過式(15)的計算,可以得出對比方法的敏感度指數為0.207,本文方法的敏感度指數為0.595。

3 總結

為了進一步豐富供電公司電量感知方法,提高感知準確性和規范性,本文在數據挖掘和LSSVM的技術支持下,實現電量大數據多維感知方法的優化,為供電網建設提供了有益的補充,進一步加強了電網企業經營指標控制、預測研判,為供電經營決策提供了參考。

猜你喜歡
電量數據挖掘負荷
電量越低越透明的手機
探討人工智能與數據挖掘發展趨勢
四川2018年7月轉讓交易結果:申報轉讓電量11.515 63億千瓦時
基于并行計算的大數據挖掘在電網中的應用
電量隔離傳感器測試儀的研制
防止過負荷時距離保護誤動新判據
主動降負荷才是正經事
一種基于Hadoop的大數據挖掘云服務及應用
負荷跟蹤運行下反應堆一回路控制系統仿真與驗證
北斗通信在小型水電廠電量采集中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合