?

基于二次矩陣補全的低壓配電網相序識別算法

2022-09-14 08:52洪文慧李欽豪張勇軍
電力自動化設備 2022年9期
關鍵詞:電表臺區時刻

洪文慧,李欽豪,張勇軍,楊 銀

(華南理工大學 電力學院,廣東 廣州 510641)

0 引言

低壓配電網LVDN(Low-Voltage Distribution Network)作為直接跟用戶對接的關鍵環節,其運行、維護的智能化水平與客戶滿意度密切相關[1-3]。低壓用戶的相序信息支撐著LVDN 的運行維護[4-7],對臺區線損分析、負荷精準建模、電壓質量分析有著非常重要的意義。由于用戶接入、改接等影響,臺區用戶的相序記錄錯誤較多,而通過人工排查的工作量非常巨大,采用智能化手段進行相序識別十分必要。隨著智能電表的普及應用,用戶用電信息中隱含了臺區內各個節點的拓撲連接信息,基于數據驅動的相序識別方法應運而生。

當前基于數據驅動的相序識別方法主要有擬合法、機器學習法、相關性分析法等。文獻[8]應用電流時序數據構建數學優化模型,該模型將所有電表的相序歸屬關系設為0-1 變量,目標為各相序的總電量與該相序下所有電表電量的差值最小,從而求出臺區相序關系。文獻[9]提出了一種基于用戶電壓數據的相戶識別方法,通過分析電表電壓與臺區出線端的電壓的關聯性,識別臺區相序關系。文獻[10]提出帶約束的K-均值聚類算法對用戶電壓進行聚類,并通過求解聚類中心與各相序電壓的差值最小化模型實現相序識別。數據驅動的相序識別算法效果很大程度上依賴于數據完整性。數據完整性反映測量點全時序或部分時段信息缺失情況,包括有效測量點比例和數據時序完整度。在實際工程中當數據受到電表本身功能不支持、通信丟包、通信故障等影響時往往會出現數據缺失的情況。因此,如何在數據完整性不足的情況下提高相序識別準確率,成為當前LVDN數字化發展的一個重要課題。

近年來,矩陣補全MC(Matrix Completion)方法廣泛應用于各個領域,如網絡調查、圖像處理、機器學習等。矩陣補全指的是根據矩陣中已知部分元素去估測未知部分元素的值,從而恢復出原來的矩陣,其能夠迅速恢復出與原矩陣非常相近的矩陣。矩陣補全算法包括奇異值分解SVD(Singular Value Decomposition)算法[11]、奇異值門限SVT(Singular Value Threshold)算法[12]、魯棒矩陣補全RMCOSN(Robust Matrix Completion with Outliers and Sparse Noise)算法[13]、基本次梯度下降BSD(Basic Subgradient Descent)算法[14]等。SVD 算法通過SVD 進行矩陣補全;SVT 算法通過計算大于設定閾值的奇異值進行矩陣補全[15];RMCOSN 算法通過范數最小化和跡范數最小化相結合進行矩陣補全;BSD 法通過建立基本次梯度下降算法的有限秩收斂性進行矩陣補全。相比較而言,SVT 算法僅對大于閾值的奇異值進行計算,收斂速度快、精度高[12]。通常情況下,矩陣補全算法應用于低秩矩陣時才能取得較好的補全效果[16]。而在低壓臺區,電流數據可能差異性很大,難以達到理想的補全效果。

針對上述問題,本文首先建立了基于電流擬合的相序識別模型,研究了基于SVT 算法的一次矩陣補全優化方法,對整體電流數據進行一次補全,對缺失數據進行填充;然后比較了電流矩陣中各向量的相似性,利用相似度高的向量構成新矩陣,再采用SVT 算法對該低秩矩陣進行二次補全,從而顯著提高矩陣補全效果;最后通過實際臺區算例驗證了本文算法的準確性。

1 基于電流擬合的相序識別模型

基于電流擬合的低壓配電臺區相戶關系識別是拓撲識別中的重要方法之一[4],基本原理是電路中的基爾霍夫電流定律。具體地,每個時刻下,各相總電流與該相的電表電流之和基本相等,如式(1)所示。

2 基于SVT算法的矩陣補全方法

式(5)所示的優化問題屬于凸優化,可以將其重塑為一個半定規劃,在某種意義上,這是非確定性多項式在多項式時間復雜度內遇到的問題(NP-hard)秩最小化問題中的最緊凸松弛問題:

推導得到Hk、Yk后,對Y進行SVD,首先指定奇異值個數s,然后計算前s個最大奇異值和相應的奇異向量。因此,必須確定在第k次迭代時Yk-1的奇異值個數sk。設sk=rk-1+1,其中rk-1為Hk-1在第k-1 次迭代中非零奇異值的個數,rk-1=rank(Hk-1);然后計算Yk-1的前sk個奇異值,如果這sk個奇異值中存在小于τ的奇異值,則此時的sk即為第k次迭代時Yk-1的奇異值個數,否則sk需要反復加上預定義的整數l,直至出現小于τ的奇異值為止。結合問題的特點,建議l取5。

3 應用二次矩陣補全的相序識別算法

通過采集臺區nco個用戶在N個等間隔不同時刻的電流構成用戶二維電流矩陣N,其元素N(i,j)表示用戶j在i時刻的電流數據??紤]到電流數據經常會發生數據缺失的問題,需要研究電流矩陣的補全方法,以保證相序識別效果。

一般而言,數據補全的原理是根據矩陣中行列元素的相關性進行補全,因此低秩矩陣補全的概率更高[16]。在LVDN 中,存在不少電流一直是0 的空房用戶[7];此外,受相關潛在因素(如環境溫度、電價、生活作息等)的影響,同一臺區的用電數據一般遵循某種固定的用電規律,即電流曲線在日、周、年時間尺度上呈周期性分布。因此,由相同時間間隔的電流數據構造的理想電流矩陣N∈Ri×j應滿足低秩假設,即rank(N)?min(i,j)。

3.1 二次矩陣補全策略

在某些時刻,用戶用電的電流數據相似度較高。由于低秩矩陣的補全效果更明顯,因此,原始電流矩陣中相似度高的向量可以形成一個新矩陣,在新矩陣上進行二次補全,可以提高矩陣補全的精度。

對N采用SVT算法進行一次矩陣補全得到一次補全矩陣H′,由式(16)得到H′中相似度高的M個向量。附錄A 圖A1為相似度較高的電流向量示例,圖中不同顏色的曲線表示由不同時刻數據形成的電流向量。由圖可見,所有曲線的趨勢基本一致,表明在這些時刻用戶的用電行為相似。因此,為了提高矩陣補全精確度,本文將相似度高的M個電流向量組成一個G×M維的相似向量矩陣N0,通過將N0中的

3.2 算法流程

本文提出的基于二次矩陣補全的相序識別算法流程如下。

1)采集目標臺區低壓母線和所有電表在多個時刻的電流時序數據,形成原始電流矩陣N。

2)利用SVT 算法對數據缺失的原始電流矩陣N進行一次補全得到一次補全矩陣H′,從H′中選取相似度高的M個向量,形成相似向量矩陣N0(N0?H′)。

3)將N0中的每個數據乘以修正系數wtg對N0進行修正,從而得到修正矩陣N′0;然后利用SVT 算法對N′0進行二次補全得到二次補全矩陣H0。

4)將H′中的N0部分替換為H0得到最終的補全矩陣H。

5)按照式(18)計算得到最終的補全矩陣與原始電流矩陣的相對誤差rcom。

式中:nsame為通過缺失后/補全后的數據識別正確的電表個數。

4 算例分析

4.1 算例數據

本文從廣州市某實際臺區(臺區1)的歷史負荷數據中,選取了189 個用戶在2019 年3—7 月這5 個月期間的數據作為算例樣本數據集,以1 周為周期提取1組數據,采樣間隔為15 min。臺區1的示意圖如附錄A圖A2所示。

4.2 臺區缺失電流數據補全結果分析

4.2.1 隨機數據缺失

1)矩陣補全效果。

為驗證本文算法的補全效果,對采集到的電流數據進行隨機缺失處理后再補全,算例中所有矩陣均通過仿真得到。根據式(6)對矩陣低秩性的定義,C取0.005 時,式(6)始終成立。因此,本文算例中的矩陣都具備低秩性。

對某用戶在3 月某一周的電流數據進行隨機缺失10%的處理,實際數據與采用本文算法進行補全后的數據曲線圖如附錄A 圖A3所示。由圖可見,實際數據曲線與利用本文算法進行補全后的數據曲線基本重合,表明數據缺失率為10%時本文算法的補全誤差極小,補全效果非常理想。

當電流數據缺失率在[1%,50%]范圍內變化時,本文算法的平均相對誤差折線圖如圖1 所示。由圖可見:當數據缺失率在[1%,45%]范圍內時,本文算法的平均相對誤差均在0.001以下,補全精度很高;然而當數據缺失率超過45%時,本文算法的平均相對誤差迅速變大,算法補全效果下降。鑒于45%以上的數據缺失率屬于比較極端的情況,可以認為本文算法對用戶電流數據有良好的補全效果。

圖1 數據缺失率變化范圍為[1%,50%]時,本文算法的平均相對誤差Fig.1 Mean relative error of proposed algorithm when range of data missing rate is[1%,50%]

將本文算法與已有的缺失數據補全算法——SVT 算法[12]、BSD 算法[14]進行對比分析,當數據缺失率在[1%,45%]范圍內變化時,3種算法的平均相對誤差如圖2 所示。由圖可見:利用本文算法進行二次補全后,平均相對誤差始終為最低;與SVT算法相比,本文算法的平均相對誤差降低了98%左右,表明對矩陣進行二次補全能夠明顯提升補全效果。

圖2 隨機數據缺失情況下,3種算法的平均相對誤差對比Fig.2 Comparison of mean relative error among three algorithms under random data missing condition

2)補全前后的相序識別效果。

考慮原始電流矩陣不同程度的缺失情況,利用采集到的電流數據進行仿真。在不同的數據缺失率下,采用本文算法前、后的相序平均識別準確率熱力圖分別如附錄A 圖A4(a)、(b)所示。由圖可見,采用本文算法進行補全前,相序平均識別準確率為59%~88%,補全后相序平均識別準確率提升至68%~97%。采用本文算法對3 月某一周的電流數據在不同的數據缺失率下進行補全,并對比補全后、未缺失、缺失未補全3 種情況下的相序識別準確率,結果如附錄A 圖A5所示。由圖可見,在不同的數據缺失率下,采用本文算法進行補全后,相序識別準確率均能提高12%以上。

4.2.2 某時段數據全部缺失

電表在采集或者傳輸數據的過程中,可能會出現各種故障問題,難以在短時間內修復。因此,可能出現某一時段內的用戶電流數據全部缺失的情況。鑒于此,對電流數據進行隨機時段缺失處理,即隨機連續缺失50、100、150、200、250 個時刻(數據缺失率分別為10%、20%、30%、40%、50%)的電流數據,并對比采用本文算法進行補全前后的相序識別效果。

1)矩陣補全效果。

對某用戶在3 月某一周的電流數據進行連續缺失250 個時刻的電流數據的處理,實際數據和采用本文算法進行補全后的數據曲線圖如附錄A 圖A6所示。由圖可見:實際數據和補全后數據的曲線基本重合,表明在連續缺失200 個時刻的電流數據的情況下,本文算法的補全效果良好;另外,在數據缺失時刻數由50 增加到200 的過程中,本文算法的平均相對誤差均較低,在1.88×10-4~1.7×10-2范圍內,但當連續缺失250 個時刻的電流數據,即數據缺失率達到50%時,本文算法的精度明顯下降。在實際工程中通常不會發生數據缺失率過高的情況,因此本文算法具有較高的工程實用價值。

將本文算法與SVT 算法[12]、BSD 算法[14]進行對比分析,在隨機缺失50、100、150、200 個時刻的電流數據的情況下,3 種算法的平均相對誤差如表1 所示??梢?,本文算法和SVT算法相比BSD算法,補全精度有明顯提升,然而,二次補全相對一次補全而言優勢不明顯,這是因為SVT 算法是根據矩陣中向量之間的相似性對矩陣進行補全,而原始電流矩陣在某一時段內的數據全部缺失時,矩陣中多列數據缺失(元素為0),補全時誤差大。因此,相比4.2.1節中的數據隨機缺失的情況而言,在某一時段內的數據全部缺失的情況下,利用本文算法進行二次補全時,很難找到相似向量,難以體現二次補全的優勢。

表1 某時段數據全部缺失的情況下,3種算法的平均相對誤差對比Table 1 Comparison of mean average error among three algorithms when all data in a certain period is missing

2)補全前后的相序識別效果。

當原始電流矩陣發生不同程度的時段數據缺失時,采用本文算法前、后的相序平均識別準確率熱力圖分別如附錄A 圖A7(a)、(b)所示。由圖A7(a)可見,隨著數據缺失時段的長度由50 個時刻增到200個時刻,相序平均識別準確率從91%下降至63%。由圖A7(b)可見:當缺失時段長度在100個時刻以內時,本文算法的平均相序識別準確率都在90%以上;除了7 月的第1 周連續缺失200 個時刻的電流數據的情況,在其他的連續缺失50~200 個時刻的電流數據的情況下,本文算法的相序平均識別準確率都在90%左右。對3月某一周采集的電流數據的數據進行隨機時段缺失處理,并對比采用本文算法補全后、未缺失、缺失未補全3 種情況下的相序識別準確率,結果如附錄A 圖A8 所示。由圖可見,采用本文算法進行補全后,相序識別準確率比補全前最高提升了20%左右,且補全效果十分穩定。

4.2.3 通信延時影響分析

考慮到電表數據受到通信延時的影響,在原電表電流數據上疊加由量測時延造成的高斯誤差,并令電流數據的標準差為0.003[18]。通過仿真可知,當數據缺失率為5%~45%時,本文算法的平均相對誤差為3.21×10-4~1.20×10-3。在3 月某一周的電流數據中疊加高斯誤差,采用本文算法對疊加高斯誤差后的數據在不同的數據缺失率下進行補全,對比補全后、未缺失、缺失未補全3 種情況下的相序識別準確率,結果如附錄A 圖A9 所示。由圖可見,利用本文算法進行補全后,相序識別準確率比缺失未補全的相序識別準確率最高增長了12%左右。因此,在通信延時的影響下,本文算法仍能有效提升數據缺失情況下的相序識別準確率。

4.3 補充算例驗證

考慮到1 個臺區的算例分析結果具備偶然性,本文從廣州市另一臺區(臺區2)的歷史負荷數據中,選取了210個用戶在2020年5—8月的數據作為算例樣本數據集,以1 周為周期提取1 組數據,采樣間隔為15 min。臺區2 的示意圖如附錄A 圖A10 所示。采用本文算法對臺區2 的采樣數據在不同的數據缺失率下進行補全,并對比補全后、未缺失、缺失未補全3種情況下的相序識別準確率,結果如附錄A圖A11 所示。由圖可見,采用本文算法對臺區2 的采用數據進行補全后,相序識別率最高提升了15%左右,效果顯著。

5 結論

本文針對低壓臺區電表數據出現缺失引起的相序關系識別不準確問題,提出了一種基于二次矩陣補全的LVDN相序識別方法,主要結論如下:

1)基于臺區電流數據和時刻所形成的矩陣低秩性提出二次補全算法,與一次補全算法相比,其在數據隨機缺失的情況下具有更高的數據補全精度,在某時段數據全部缺失的情況下亦有良好的補全效果;

2)提出了基于二次補全的LVDN 相序識別算法,利用矩陣補全后的電流數據進行相序識別,識別準確率得到了明顯提高。

附錄見本刊網絡版(http://www.epae.cn)。

猜你喜歡
電表臺區時刻
配電臺區變-戶拓撲關系異常辨識方法
冬“傲”時刻
電表“對”與“錯”歸類巧掌握
捕獵時刻
“蹦叭”跳動電表數
降低臺區實時線損整治工作方法
10kV變壓器臺區設計安裝技術研究
停電那點事兒
基于用電信息采集系統的臺區線損管理研究
一天的時刻
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合