?

違約用電與竊電的多維度智能分析經驗算法和分類算法

2023-09-29 01:28
江西電力 2023年4期
關鍵詞:分析模型降維用電

劉 松

(1.國網江西省電力有限公司鷹潭供電分公司,江西鷹潭 335000;2.上海電力大學,上海 200090)

0 引言

目前,少數電力用戶受經濟利益驅使,竊電現象屢有發生。隨著科學技術的快速發展,通過高科技手段進行竊電和違約用電的行為越來越多。這些技術手段不但隱蔽性強,而且查處困難?,F階段查處違約用電、反竊電的主要方法是安排人員進行現場巡視排查,通過儀表應景設備進行排查。傳統反竊電偵查方法普遍耗時耗力,并且準確性偏低?,F有的反竊電系統,由于接入數據源少,分析模型單一,不具備自學習功能,造成研判角度單一,無法適應針對性重點排查要求。為解決準確判斷違約用電與竊電的技術難題,文中運用經驗學習、標簽庫、知識圖譜等技術,構建針對專變、一般工商業和居民的違約用電與竊電分析模型,可準確定位違約用電和有效查處竊電行為,輔助用電稽查人員利用智能化手段開展用電治理。

1 總體設計

該算法的目標是建立經驗算法和分類算法,構建違約用電與竊電分析模型;通過各類模型訓練、驗證和完善,優化模型的計算效率,提升模型分析的準確性、及時性和可靠性;實現違約用電、竊電的處理流程與經驗算法、分類算法相互驗證、自我提升;若異常未消除,系統自動重新納入訓練,更新分析模型,實現自學習和自優化的功能。

1.1 建立基于多源數據融合的用戶標簽庫

以用電信息采集系統的數據為基礎,結合營銷系統用戶檔案、發行電量與電費,構建違約用電與竊電分析數據源,開展三方面工作[1]:一是建立海量數據存儲與計算平臺。由于違約用電和竊電分析涉及對用戶進行多維度、全方位、深層次的分析,運用分布式存儲與并行計算技術,對檔案、負荷、電量和事件等數據進行處理;二是數據預處理。建立數據清洗規則,完善計量在線監測模型,按照業務分析的需求開展數據處理和歸集工作;三是建立全省用戶的標簽庫。根據不同用戶類別的用電屬性、異常狀態、用電特性、負荷特征與變化趨勢等,構建全省專線、專公變、低壓工商業、分布式電源和居民的標簽庫,滿足數據挖掘和機器學習的需求。

1.2 建立機器學習構建違約用電與竊電分析模型

針對專線、專變和低壓工商業及居民的用電特征、違約用電與竊電行為方式及對負荷、電量的影響,結合營銷系統違約用電與竊電查處流程、計量在線監測、國家企業征信信息和用戶標簽信息,運用決策樹、邏輯回歸(Logistic regression)和支持向量機(SVM)等多種經驗學習算法,及分類器組裝方法(Bagging和Boosting)構建專線與專變違約用電分析模型、專變竊電分析模型、低壓工商業與居民竊電分析模型,通過樣本數據對各類模型進行訓練、驗證和完善,及壓力測試優化模型的計算效率,從而提升模型分析的準確性、及時性和可靠性,滿足在用電信息采集系統大數據平臺上在線分析運行的要求。

1.3 通過查處結果與經驗學習不斷地訓練、完善和提高

通過違約用電與竊電模型分析的疑似用戶進入待辦事項進行觀察,如果在設定的一段時間內,相關異?,F象沒有消除,則直接進入異常處理流程,處理結束歸檔后,系統從二方面進行工作:一是監控異常實際處理情況。如果一周內疑似用戶的異?,F象是否再次發生,如果再次發生,則重新進入異常監控與處理環節;二是針對處理結果優化分析模型。根據異常處理結果及重復發生處理結果,系統自動將分析不準確的用戶重新納入模型進行訓練,訓練后自動更新分析模型,實現機器自學習和模型自優化功能。

1.4 研發用戶違約用電與竊電分析處理軟件

基于HPLC 高頻采集、計量在線監測和用戶用電多維度統計的數據,運用分布式存儲與并行計算框架、微服務和機器學習等技術,在用采大數據平臺開發用戶違約用電與竊電智能分析軟件,具備五方面功能:一是數據集成與預處理模塊。實現用電信息采集系統內部和外部數據接入,按分析需求進行清洗、存儲、統計和歸集;二是開發違約用電與竊電分析模塊。包括專線和專變用戶違約用電分析模塊,專變與三相工商業用戶竊電分析模塊,低壓用戶竊電分析模型;三是異常工單管理模塊。包括待辦事項工單、異常處理工單、處理結果監控、異常處理結果統計分析等功能,形成多分析維度、多時間尺度、多異常類型的違約用電與竊電的統計分析模塊,多樣化對比展示;四是分析模型自學習模塊。根據異常處理的結果及一周內的系統自驗證的情況,針對分析不準確的用戶重新進行訓練和驗證及模型更新功能;五是開展全景展現模塊?;谥R圖譜、單線圖和電網GIS開發違約用電與竊電全景展現模塊,輔助操作員精準定位異常用戶,進行快速處理和排查。

2 分析模型原理

為做好違約用電與竊電有關的數據分析與預測工作,基于歷史數據和訓練內容形成知識庫,結合經驗學習實現模型的優化,形成適應業務發展的數據分析模型,知識庫需要包括知識名稱、知識類別、知識內容等最終形成違約用電與竊電知識庫,滿足運用知識圖譜展現違約用電與竊電用戶的信息,并為以后竊電工作提供參考依據。違約用電與竊電知識庫管理包括:知識編輯、知識審核和知識展示三大功能?;诖髷祿?、經驗學習技術建設的違約用電與竊電智能分析分為三步。

2.1 違約用電與竊電分析影響因素的降維方法

基于違約用電與竊電都會涉及失壓、失流、斷缺相、電能表開蓋、電能表停走等異常,及對應不同維度負荷、電量的變化,通過對影響因素梳理,基于PCA、LDA、LLE 等數據降維方法的研究理論線損影響因素降維方法。對違約用電與竊電的影響因素多種多樣,考慮到影響因素關聯程度各有不同、回歸模型的性能,對其進行降維處理,LLE 是一種非線性降維算法,它能夠使降維后的數據較好地保持原有流形結構[2],降維算法的思路可概括為:

1)對局部近臨點的選取。對于從電力公司獲取的停電故障數據集:

利用樣本點之間的在高維空間的距離尋找每個樣本點di對應的n個近臨點。

2)計算樣本點的局部重建權值,即:

式中:dij(j=1,2,…,n)為di的j個近臨點;wij是di和dij之間的權值。

3)利用權值矩陣W降維,得到低維嵌入Y。即:

式中,M=(I-W)T(I-W)。使Lagrange 乘子法,取M的值最小的d個非零特征值所對應的特征向量作為低維坐標Y。通常最小特征值幾乎為零,因此取2~(d+1)間的特征值所對應的特征向量作為輸出結果。

2.2 基于K-mean聚類方法的違約用電與竊電用戶分類方法研究

基于K-mean聚類方法研究違約用電與竊電用戶的分類方法,構建不同類別用戶的分類指標,并進行專變、專線用戶與臺區(低壓用戶把臺區作為一個參考因素)分類。K-Means算法以歐式距離作為相似度測度,采用誤差平方和準則函數作為聚類準則函數。該算法分為4 個步驟:

1)初始化:確定類別數目k和初始聚類中心點。

2)類劃分:按照式(4)計算N個樣本和k個初始中心點的距離,按照距離大小將N個樣本分配給最近的中心點,形成k個聚類。

3)聚類中心點求解:計算每類中所有對象的平均值,并以此作為k個聚類新的聚類中心。

4)收斂判斷:用式(5)判斷是否收斂。

2.3 基于多元線性回歸的違約用電與竊電分析模型研究

針對違約用電與各類竊電分析模型分類預測,分別應用多元線性回歸、支持向量回歸機等回歸方法進行疑似率求解模型的構建,并結合計量在線監測的異常關聯負荷、電量的變化,及時排查并進行疑似率計算?;诹W尤簝灮≒article Swarm Optimization,PSO)算法的支持向量回歸機(Support Vector Regression,SVR)的配電網理論線損計算方法,SVR 是支持向量機的一個子類,其特點是最終輸出函數為線性函數,因而廣泛應用于函數擬合、預測問題等領域。PSO 是一種優秀的群智能優化算法,具有收斂速度快、尋優能力強等特點[3]。在SVR-PSO 訓練過程中,利用粒子群算法動態地搜索支持向量回歸機的最優訓練參數,提高SVR-PSO 的計算精度。

如圖1所示,在SVR-PSO 訓練過程中,通過向支持向量回歸機SVR 輸入訓練樣本集和PSO 訓練參數。通過訓練,并輸入測試樣本集形成臨時預測模型,輸出預測結果,計算f值,當未達到閾值進行PSO迭代,修正PSO 上一次訓練參數。繼續PSO 訓練直到f值滿足閾值,形成最終預測模型。

圖1 SVR-PSO工作流程

3 相關算法優化

為解決違約用電和竊電數據中的樣本平衡性問題、稀疏矩陣問題,從以下幾個方面對相關算法進行優化:

1)解決樣本平衡性問題,即采樣問題。從豐富類別的樣本中隨機選取和竊電用戶相同數目的樣本,以平衡數據集。模型訓練過程中反復從未經訓練的樣本集中抽取,以能夠識別更多的樣本數據特征。此過程優勢有兩點,其一,解決樣本平衡性問題;其二,增強模型的魯棒性[4]。

2)解決稀疏矩陣問題。采用CNN 模型中池化層來解決該問題。池化(Pooling)實際上是一種形式的降采樣。其中“最大池化(Max pooling)”是最為常見的一種非線性池化函數,如圖2所示。

圖2 池化過程

它將輸入數據劃分為若干個矩形區域,對每個子區域輸出最大值。直覺上,這種機制能夠有效的原因在于:在發現一個特征之后,它的精確位置遠不及它和其他特征的相對位置的關系重要。池化層會不斷地減小數據的空間大小,因此參數的數量和計算量也會下降,這在一定程度上也控制了過擬合。其優勢在于三點:其一,特征不變形,池化操作是模型更加關注是否存在某些特征而不是特征具體的位置;其二,特征降維,池化相當于在空間范圍內做了維度約減,從而使模型可以抽取更加廣范圍的特征。同時減小了下一層的輸入大小,進而減少計算量和參數個數。其三,在一定程度上防止過擬合,更方便優化。

3)通過對CNN 模型的損失函數進行優化,將交叉熵損失函數及自定義損失函數二者之和作為模型訓練最終損失函數。經過反復訓練,根據最終分類結果概率,再結合相關業務知識進行判定。若出現用電行為可疑,則將其竊電概率映射為較大概率。

4)自學習能力的構建。從竊電用戶的數據特點以及卷積神經網絡的局部連接、權值共享、下采樣等優勢,利用卷積神經網絡分別針對專變、低壓用戶(380 V、220 V)構建反竊電模型,具體卷積神經網絡結構如圖3所示。

圖3 反竊電模型組織結構圖

反竊電模型每一層都有多個Feature Map,每一個Feature Map 中均含有多個神經元,輸入通過一種過濾器作用,提取輸入的一種特征,得到一個不同的Feature Map,其中卷積神經網絡訓練中相關參數分別為學習率為0.01、批次大小為30、訓練次數為5000次;損失函數為交叉熵損失函數以及自定義損失函數之和;神經元激勵函數選取relu,選取隨機梯度下降法;最后通過激活函數softmax輸出最終分類結果,反復訓練,選取最優分類模型。

針對低壓用戶竊電分析建立臺區線損與用戶用電關聯分析模型,分析哪些用戶在用電時候,臺區線損處于合理范圍,且不用電的時候,臺區線損屬于高損,結果卷積神經網絡分析這些用戶竊電置信度,輔助開展現場精益排查。

4 實施效果

通過該項目的實施,提升了對反竊電用戶的監測水平,提高了反竊電工作準確性,為電量電費追補提供有力的技術手段,為追補電費提供技術保證,大幅度提高了反竊電稽查工作效率,有效地提高公司整體經濟效益。在近1 年的使用過程中,反竊電工單派發率99%,違約用電工單派發率99%,反竊電反饋及時率99%,違約用電工單反饋及時率99%,征信系統推送率99.5%。完成基于知識圖譜的違約用電與竊電智能分析、全景可視化軟件一套,集成在用電信息采集系統中,成果在江西公司11 地市97 縣開展應用,已查獲違約用電與竊電案例28 件。

5 結語

違約用電與竊電的多維度智能分析經驗算法和分類算法解決了從海量數據中快速甄別定位竊電用戶,對用戶竊電時間、竊電方式、竊電地點進行準確的定位,大大提高了防竊電的技術水平和竊電處理的效率,同時降低財務成本、物資成本、人力成本;提升了監測水平和反竊電工作的準確性,為電量電費追補提供有力的技術手段和技術保證,大幅度提高反竊電稽查工作效率,有效提高電力公司整體經濟效益??蓮V泛應用于各電力公司準確判斷、定位電力專線用戶、專公變用戶、低壓工商業用戶和居民用戶違約用電及竊電的情況。

猜你喜歡
分析模型降維用電
用電安全
基于BERT-VGG16的多模態情感分析模型
混動成為降維打擊的實力 東風風神皓極
用煤用電用氣保障工作的通知
安全用電知識多
降維打擊
用電安全要注意
層次分析模型在結核疾病預防控制系統中的應用
全啟發式語言分析模型
拋物化Navier-Stokes方程的降維仿真模型
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合