?

基于STM32 的異常用電行為檢測算法研究

2023-07-13 05:19徐愛蓉孫成剛李建寧
電力與能源 2023年2期
關鍵詞:損率用電聚類

黃 根,徐愛蓉,孫成剛,李建寧

(國網上海市電力公司青浦供電公司,上海 201799)

近年來,我國工商業發展迅速,城市化水平不斷提高,人們的工作生活與社會生產均離不開電能,于是電力用戶量迅速擴大。隨著能源互聯網的推進發展,電網公司的信息化程度越來越高,用電側電量數據相當龐大。因此,電力企業需要不斷提高工作效率和管理效能,才能更好地為廣大電力用戶提供更優質的服務。

在電力企業自身的不斷發展中,仍然存在某些不足之處,例如電力用戶電量數據異常問題沒有得到有效解決。若不及時處理用戶電量數據異常情況,可能會給供電企業或電力用戶帶來一些不必要的經濟損失。因此,如何從龐大的電力企業電量數據中高效、準確地檢測出異常用電數據,以供電力企業工作人員分析決策、作出處理,對提高供電服務水平和經濟效益,同時促進企業的發展與進步,有著相當重要的意義。為了及時有效地獲取電力數據信息,監測電力企業的用電情況,檢測出異常數據,需要設計一種準確率較高的異常用電檢測算法。

文獻[1]通過分析典型異常電力數據提出了一種以用戶相似性檢索為核心的檢測模型,在相似度矩陣中,利用簇中心的電力用戶,提取出有疑似異常用電的竊電用戶,并驗證了該方法的有效性與可行性。文獻[2]針對電力異常行為建立了一個大的數據庫,通過標記好的數據集與異常電力信息,實現了較低維度數據的監測,在最大互信息系數的基礎上,以快速聚類算法,提出了較強的正相關密度峰值,并測試了多種類型異常檢測行為的有效性。文獻[3]針對現有的異常電力數據,通過概率預測算法,提出了基于離線預測模型的異常識別方法,采用貝葉斯推斷模型,結合電力實測數據與電力預測數據的相關性,設計了相應的檢測方法,并驗證了該方法的實用性和有效性。本文在此基礎上,為提高異常數據的檢測精度,設計一種基于STM32 的異常用電行為檢測算法。

1 基于STM32 設計的異常用電檢測算法

1.1 基于STM32 提取電力異常數據特征

在STM32 的主控電路中,可以獲取數據采集的外圍電路,并得到更準確的電力企業異常用電數據。電力用戶之間數據行為的不同,會直接導致符合序列的周期和閾值出現較大變化,且氣候冷暖的改變、節日假期等時段與正常情況下的用電單位也存在不同之處[4]。此時的電力負荷內會有大量的無用噪聲,不但會無意義地增加電力數據的總量,還會導致原始時間序列的異常數據檢測與識別出現錯誤或遺漏,因此對電力數據進行預處理,建立負荷數據的特征空間,減少維度異常,提取特征數據,是電力異常數據檢測過程中的必要程序。首先需要清洗電力負荷數據,補全數據中缺失的部分,若不能補全,則需要將其清除,以減少大數據的總量。電力負荷數據的結構字段如表1 所示。

表1 電力負荷數據結構字段

依據表1 所示的結構字段重新整理電力數據后,可解決大部分的用戶數據缺失問題,此時就可以對異常值進行處理。當電能表檢修或更新時,所有的電力數據均會從頭開始,如果此時的電力數據沒有被及時記錄,或者中間存在時間差,導致電力記錄失效,就會出現電力數據異?,F象[5-7]。在引入大量噪聲后,補全數據的缺失值,并將觀察到的變量全部填充成均值形式,計算公式如下:

式中pd——某缺失時段的用電量均值;da——缺失時段之前的電表示數;db——缺失時段之后的電表示數;Nt——電力數據缺失的時間總數[8]。

依據式(1)填寫電力企業所缺失的用電數據,對完整的負荷序列進行特征提取,此時用戶電量的均值為

式中Wm——用戶電表中通過提取得到的電力數據;xi——某一周期內的特征提取數值;ni——日用電量的表示數[9-10]。

通過以上方法得到完整的電力企業用電數據,以此進行后續的異常用電檢測。

1.2 建立電力數據異常分類模型

通過電力數據所能得到的用電異常情況,可以分為線損異常、交流電壓異常、交流電流異常等多種類型。

(1)線損異常主要是電能在通過銅導線時由于電阻導致的損耗。普通電路的線損電量計算公式為

式中Wxs——某片電力設備中,由銅導線導致的線損電量;Wg和Ws——電力企業的供電量與經過損耗后所得到的售電量[11-12]。

線損電量與供電量之比需要在理論上不高于一定值,即線損率,若線損率超出一定值,則表明電力數據異常。通常,線損率可分為兩類:理論線損率和統計線損率。理論線損率的計算公式為

式中Pxs——某長度銅制導線下的理論線損率。

統計線損率的計算公式為

式中Ptj——統計線損率。

(2)在該電力數據異常檢測的約束條件內,依據組合事件可以判定電表開蓋的記錄參數。通過交流電壓的異常判定值可以得到電壓不平衡度以及測量時間的取值要求[13-14]。每隔3 s 可以獲取一次電力數據的離散采樣值,計算公式如下:

式中km——測量儀器的電壓不平衡度離散采樣數值;kf——某一時間周期內的采樣值;mn——該時間周期內的采樣次數。

此時可以依據離散采樣值,獲取電壓不平衡度的近似方程式:

式中Sp和Sl——線電壓與線短路容量。

(3)交流電流異??梢砸罁β蕝档牟煌_定,正常電力數據閾值一般不會低于0.85,但是當用戶的用電數據異常時,就可直接得到電流不平衡度的計算公式:

式中Ec——電流不平衡度;Imax和Imin——一段時間內的電流最大值與電流最小值[15]。

結合三類電力數據的異常情況,可以通過電力數據獲取電力企業異常用電的分類模型。

1.3 設計異常用電行為檢測算法

前面已對電力企業的數據進行預處理,補全了不完整的數據結構,然后通過這些電力數據建立了異常分類模型。在該模型中,可以通過歷史用電數據設計電力企業的異常用電行為檢測算法,如圖1 所示。

圖1 算法流程

結合圖1 中的算法流程,首先需對電力數據進行預處理,并選擇用電數據集,主要包括當前數據集和歷史數據集[16]。然后通過二者共同評估電力異常曲線,若異常曲線達到檢測閾值,則可以得到異常用電結果,否則為正常用電結果。此時的檢測算法,即為本文提出的基于STM32 的異常用電行為檢測算法。

2 試驗研究

2.1 試驗環境設置與試驗數據來源

選取Centos7 操作系統,使用Python 進行數據軟件編寫。在更新系統參數時使用Adam 算法,并利用TCN 算法進行用戶的用電行為異常檢測。劃分測試集與驗證集,作為試驗數據集的基礎分類,并通過測試集進行模型超參數的驗證,設定本試驗內最長步數為1 000。

試驗使用STM32 數據采集裝置對上海某區域實際500 名電力用戶進行用電數據采集,并建立一個用電異常數據集。該數據集中的數據存在大量的缺失現象,需要提前進行數據的預處理,提取特征數據,依據電力負荷數據結構,篩選其中能夠被使用的數據,并對其進行編號處理。數據集的原始樣本共有63 541 條,經過重新整理后的可用數據則只剩下10 356 條。將預處理后的數據隨機選擇其中約20%作為測試集,將剩余約80%作為驗證集。為了保證不平衡數據集的完整性,可以將其對模型的影響加入到隨機欠采樣處理中,并與其他幾種常用的檢測方法進行對比測試。經過前期處理后,獲取幾個帶有標簽的訓練集,各公共數據集的詳細情況如表2 所示。

表2 公共數據集樣本情況

如表2 所示,通過以上訓練集中的數據隨機生成A,B,C,D,E 5 個數據集,其中均含有正常樣本與異常樣本。

2.2 模型預測絕對誤差對比

絕對誤差可以以相對簡單的數據評估一個模型的檢測能力。在電力企業異常用電行為檢測過程中,可以先使用絕對誤差,對幾種電力企業異常用電行為檢測方法的精度進行測試。

絕對誤差的計算公式如下:

式中fae——模型內數據的絕對誤差;f′m——預測的電力企業用電量;fm——電力企業的實際用電量。

使用式(9),可得到本文方法、相似性檢索方法、相關性與聚類自適應融合技術、概率預測方法這4 種檢測方法的絕對誤差曲線,如圖2 所示。

圖2 不同模型預測絕對誤差曲線對比

在圖2 中有4 條曲線,分別代表0~100 數據點內4 種不同的異常用電檢測算法對電力企業用電數據的模型預測絕對誤差。通過對比可以明顯地看出,本文提出的基于STM32 檢測方法,其絕對誤差基本沒有超出0.2 kWh,而其他3 種方法的絕對誤差均大于本文方法的相應值。因此,相較于另外3 種常用的檢測方法,基于STM32 的檢測算法得到的用電量預測曲線波動較小,并且誤差也是同等數據點下的最低值。這表明本文算法在幾種方法中在檢測精度上更具優越性。

2.3 異常用電檢測算法對比測試

使用經過預處理的數據進行聚類處理,在分層最近鄰欠采樣的運算中,可以通過部分數據直接運算。測試中,設置決策樹的數量為10,在數據集中隨機采樣30 次,然后獲取訓練集在決策樹中的訓練結果,得到算法模型。通過接受者操作特征(ROC)曲線評價異常檢測結果,該曲線的量化方法如下:

式中DROC(AUC)——不同分類器中ROC曲線下與坐標軸圍成的面積,DROC(AUC)值越接近1,表示算法的檢測結果越好;n-和n+——樣本在少數類和多數類中的數量,一般情況下,n+的數量均大于n-,即可以在算法中任意實現公式

分別使用不同的聚類簇數作為正常樣本下的聚類參數,在不同的樣本點下,獲取電力數據在異常檢測中的ROC 曲線下與坐標軸圍成的面積,對比4 種不同的算法,得到的結果如圖3 所示。

圖3 異常用電檢測結果AUC 值

使用表2 中的數據集作為檢測算法的數據來源,分別在不同的聚類簇數下,測試異常用電的檢測效果。通過圖3 可以看出,聚類簇數k=5 時的DROC(AUC)值,明顯小于聚類簇數k=20 或者k=50時的DROC(AUC)值,可見聚類簇數越大,對異常用電的檢測效果越好。同時,對比4 種不同的檢測算法,在相同的數據集中,本文提出的基于STM32的異常用電檢測算法DROC(AUC)值明顯高于其他3種算法,表明本文算法的檢測效果更好。

通過上海某區域電力用戶用電數據實例證明了所提出算法的可行性。結合圖2 所得到的模型預測絕對誤差曲線對比結果和圖3 所得到的異常用電檢測結果,驗證了本文算法在實際用電數據的檢測環境中較其他幾種常用算法具有更高的檢測精度和準確率,能夠更好地檢測出電力企業的異常用電情況。

3 結語

本文提出了一種基于STM32 的異常用電行為檢測算法。首先對電力用戶初始數據進行了預處理,獲取了完整的電力數據,然后將所有電力數據分級分區處理,建立異常電力數據分類模型,并提出了相應的異常用電檢測算法。

通過模型預測絕對誤差曲線評價異常用電檢測精度,ROC 曲線評價異常用電檢測準確度,分別在不同的聚類簇數下不同檢測方法的DROC(AUC)值。試驗結果表明,本文所提出的算法在相同條件下得到的檢測效果更好,準確度更高,為電力企業針對異常用電行為的分析與決策提供了新思路。

猜你喜歡
損率用電聚類
我國水庫淤損情勢分析
用煤用電用氣保障工作的通知
安全用電知識多
為生活用電加“保險”
用電安全要注意
基于DBSACN聚類算法的XML文檔聚類
無功補償極限線損率分析及降損措施探究
基于高斯混合聚類的陣列干涉SAR三維成像
供電企業月度實際線損率定量計算方法
一種層次初始的聚類個數自適應的聚類方法研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合