?

非侵入式負荷識別的電流序列可視化方法

2022-07-20 01:44崔昊楊吳軼凡江友華許永鵬
電力自動化設備 2022年7期
關鍵詞:電器準確率可視化

崔昊楊,吳軼凡,江友華,江 超,韓 韜,許永鵬

(1. 上海電力大學電子與信息工程學院,上海 200090;2. 國網電力科學研究院有限公司,江蘇南京 211106;3. 上海交通大學電子信息與電氣工程學院,上海 200240)

0 引言

居民智慧用電與高效用能是促進“3060”雙碳目標實現的重要舉措。以非侵入式負荷監測NILM(Non-Intrusive Load Monitoring)技術為核心的終端設備能源消耗監測手段,可為用戶及時、精準反饋各時段家用電器的運行狀態及能耗信息,使用戶了解自身行為習慣,合理規劃電器的使用策略。自20 世紀90年代美國George Hart 教授提出NILM 概念[1]以來,負荷特征如何選取一直是NILM 研究中的一項熱點問題[2]。早期研究人員通過手動選取特征的方式為負荷賦予標簽,但居民側用電負荷數量和類別的驟增導致該方式的效率愈發低下,且通常手動選取的單個特征攜帶的信息量不足,作為負荷標簽代表性不強,這導致對性質相似的負荷易產生誤判,造成負荷識別的準確度不高,難以滿足實際應用需求。因此,如何選取辨識度高的負荷特征并建立性能優異的分類模型是目前該領域亟需解決的問題[3]。

負荷識別包含特征提取和分類識別2 個環節。以機器學習算法為基礎的負荷識別方法,主要通過篩選、組合特征的方式提升負荷識別準確率,但其包含的信息量有限,大多僅能在統計學方面體現負荷特性。近年來,深度學習快速發展,有效解決了人工選取特征效率低的問題,它依靠獨特的網絡結構和訓練方法,能夠自動地從大規模樣本數據中尋找本質特征,網絡性能優異[4-5]。由于深度學習在圖像分類、目標檢測等領域的優異表現,研究人員根據時間序列二維可視化的思想[6-7],將序列識別問題轉換為適合用深度學習處理的圖像分類任務[8-10]。在NILM領域,V-I軌跡是最早將電信號轉換成可視化圖像的方法之一[11-12]。文獻[13-15]表明利用V-I 軌跡將負荷識別問題轉移至圖像分類領域是有效的,但由于圖像細粒度不足且未加入顏色信息,識別精度不夠理想。文獻[16-17]以改進的遞歸圖作為可視化途徑,得到了更好的分類效果,但其性能受限于遞歸圖相關超參數的選擇,較為繁瑣。盡管時間序列二維可視化的思想大幅改善了負荷識別效果,但單特征攜帶信息量不足且模型優化問題尚未完全得到改善,在識別準確度上依然有進步的空間。

考慮到NILM研究中采集的原始電壓、電流信號是與時間相關的非線性序列,本文提出一種基于時間序列二維可視化和遷移學習的非侵入式負荷分類識別方法。利用Fryze 功率理論將采集到的穩態電流信號分解為有功和非有功分量[18],擴大電流信號的差異程度。引入格拉姆角場GAF(Gramian Angular Field)將一維非有功電流序列轉換成二維矩陣并將其可視化為圖像,并加入顏色信息,在充分保留原始數據時間相關性的基礎上提升信息量?;谶w移學習的思想,利用預訓練模型Inception_v3提取并學習GAF 圖像特征,并且對負荷進行分類識別?;诠_數據集PLAID(Plug-Load Appliance Identification Dataset)和WHITED(Worldwide Household and Industry Transient Energy Dataset)對所提方法進行驗證,識別準確率分別達到98.88%和98.94%,所提方法為居民側電力能耗分析提供了基礎。

1 負荷標簽可視化方法

根據投切事件分離出單臺設備的電壓、電流,并基于電流信號標定負荷標簽。為進一步擴大電流信號間的差異程度,提取一個周期的穩態電流并利用Fryze 功率理論將其分解為有功和非有功分量。將電流的非有功分量序列進行標準化、極坐標編碼并代入GAF 矩陣,通過隱含電流大小信息的三角函數擴充數據量,以達到升維的目的。然后,賦予矩陣顏色信息使其可視化,提高負荷標簽的辨識度。

1.1 數據提取與預處理

居民側總線中的電壓、電流數據可通過智能電表等能源監控設備進行采集??偩€數據的波動往往表示有負荷進行了投切,假設同一時刻只有1 個負荷完成狀態切換才可將其進行分離。投切事件檢測和負荷分解已有大量成熟算法,本文不再贅述。

由于電力系統長期處于穩定運行狀態,各類家用電器的電壓信號總是近似于正弦波形,而電流信號則會由于負荷性質、投切事件等影響存在較大差異,因此許多負荷標簽都是基于電流信號進行標定的。將總線中投切事件前、后若干整周期的電壓和電流數據分別用von、voff和ion、ioff表示,則單臺設備的電壓和電流分別為v=(voff+von)/2、i=ioff-ion[19]。為了確保電流波形ioff和ion可以在時域中直接相減,應使它們的初始相角相同。為此,可以利用快速傅里葉變換等頻譜分析方法計算出基波電壓的相角,將相角為0°時的采樣點作為初始采樣點。

獲取電流數據后,對其進行差異化處理。根據Fryze 功率理論,負荷電流可分解為有功和非有功分量[18]:

式中:i(t)為t時刻負荷電流瞬時值;ia(t)為t時刻負荷電流有功分量,定義為原始電流在電源電壓方向上的投影,因此ia(t)與電壓成正比,能夠反映負荷的電阻信息,如式(2)所示;if(t)為t時刻負荷電流非有功分量,其與電源電壓正交,反映負荷的非電阻信息。

式中:Pa為有功功率;v(t)為t時刻負荷電壓瞬時值;vrms為電壓的有效值;Ts為一個基波周期總時刻數。

通過式(2)—(4)推導得到if(t)為:

圖1 展示了利用Fryze 功率理論分解電流的效果??紤]到功率因數,有功分量的占比通常更大。此外,由于有功分量與電源電壓成正比,其波形也接近正弦波,因此,將非有功分量可視化后作為負荷標簽比使用原始電流更具辨識度。

圖1 Fryze功率理論分解電流效果Fig.1 Effect of current decomposition by Fryze power theory

1.2 序列可視化流程

由于電流本質上可視作與時間相關的一維序列,根據時間序列二維可視化的思想,本文將GAF法[6]引入NILM 領域,為非有功分量構建可視化圖像。假設X={x1,x2,…,xn}為包含n個電流非有功分量采樣值的序列,將其轉換為GAF圖的步驟如下。

1)將X中元素標準化處理到[-1,1]區間,即:

2)對標準化處理后的序列進行極坐標編碼,即:

3)完成對標準化序列的極坐標變換后,本文采用GAF 將一維序列轉換成n階矩陣,將矩陣中元素的值映射到藍-紅顏色區間,使矩陣成為具有顏色和紋理分布的二維圖像。GAF有2種定義方式,分別為格拉姆和角場GASF(Gramian Angular Summation Field)和格拉姆差角場GADF(Gramian Angular Difference Field),對應的矩陣AGASF和AGADF分別為:

附錄A 圖A1 給出了二維可視化的流程。GAF是基于格拉姆矩陣演變而來的,采用極坐標系代替笛卡爾直角坐標系表示時間序列,通過三角函數細化序列中每2 個采樣點間隱含的電流差值信息來擴充數據量,從而提升序列的維度。與一維序列相比,二維圖像顯著提高了負荷標簽的辨識度。

對電流非有功分量進行極坐標編碼具有如下優勢:極坐標變換滿足雙射條件,每個采樣點在極坐標系中有且僅有唯一的映射結果,保證了編碼過程的唯一性;極坐標變換后,從矩陣元素左上角到右下角位置時間不斷增加;與直角坐標系相比,極坐標同時保留了采樣點間的電流大小關系和時間信息。

2 負荷識別模型

NILM 的實際應用場景沒有充足的計算資源和時間資源來從頭開始訓練用于負荷識別的復雜模型,即使建立一個龐大的數據庫來訓練分類模型的泛化能力,隨著家用電器數量和種類的增加,維護這樣的數據庫也將十分困難,而遷移學習可將現有成熟模型應用到新的場景,無需如同自定義網絡訓練大量參數,因此可大幅提升網絡的學習效率和性能。

成功應用遷移學習的前提是源域和目標域間存在相關性,可通過1個或多個中間域來連接2個不相關或弱相關的領域,稱為傳遞性遷移學習[20]。GAF作為一種可將序列可視化的途徑,有可能成為計算機視覺和NILM間的中間域。雖然還沒有專門為NILM建立的分類模型,但在圖像識別領域已有眾多性能優異的網絡架構,如AlexNet、GoogLeNet、VGGNet 系列、ResNet 系列、Inception 系列、DenseNet 系列等,這些模型是基于包含大量圖像的大型數據集ImageNet訓練得到的。綜合考慮準確率、占用內存、參數量、計算成本和功耗等因素,本文采用Inception-v3網絡。

根據傳遞性遷移學習原理,本文制定基于預訓練網絡的NILM 模型遷移方案:將預訓練網絡Inception-v3 的卷積基進行凍結,保證其不受分類器訓練的影響,然后改進分類器以匹配應用場景。當新的分類器訓練完成后再與卷積基進行級聯,從而應用到NILM 領域。該方案可以推廣到任意其他數據集,只需將負荷標簽進行可視化表示,且最后全連接層的輸出與負荷類別數量保持一致。Inception-v3模型采用隨機梯度下降法進行訓練,并設置了學習率自適應調整機制。若損失函數出現下降平臺期,則將學習率調整為原來的1/10以優化模型。在訓練過程中,為適應計算機顯存資源,將模型的初始學習率配置為5×10-4,每次訓練的樣本數設置為32,模型的訓練輪數設置為75。

3 實驗結果與分析

3.1 實驗條件

為驗證所提方法的有效性,本文在PLAID[21]和WHITED[22]公共數據集上進行實驗。由于PLAID 和WHITED 的采樣頻率分別達到30、44.1 kHz,相比低頻采樣有更豐富的原始數據,因此這2 個數據集被較多地用于評估負荷分類識別方法的有效性和實用性。PLAID包含美國匹茲堡市55個家庭11種電器的電流和電壓數據1074組。WHITED包含全球3個地區55種設備的電流和電壓數據1339組。2個數據集的區別在于PLAID 有較高的類內差異,而WHITED有較高的類間差異[19],因此,2 個數據集在統計規律上并非獨立同分布,可以驗證遷移學習模型的普適性。此外,采集前期負荷大多處于啟動的暫態過程,電流波形不穩定。為了減少不確定性,保證所選負荷標簽具有較強的代表性和較高的辨識度,實驗所用數據均為2 個數據集每條記錄中設備啟動幾秒后的穩態周期數據。

3.2 PLAID的實驗結果

根據第1 節的數據預處理和序列可視化流程,對PLAID中的電壓、電流進行處理,提取設備啟動幾秒后1 個穩態周期(500 個采樣點)的電流非有功分量序列構建GAF 圖。附錄A 圖A2 為PLAID 中11 種電器的GADF 圖(n=500)。由圖可知:11 種電器的GADF 圖存在顯著差異,可辨識性很強;盡管部分電器的GADF 圖整體視覺效果較相似,如洗衣機和電風扇、筆記本電腦和節能燈,但仍可通過局部細節辨別;矩陣AGADF的性質是主對角線上的元素均為0,且其他元素以主對角線為對稱軸呈反對稱,因此,映射到藍-紅顏色區間的GADF 圖對角線均為綠色,且主對角線兩側形狀對稱但顏色相反。

Inception-v3 模型在2 個數據集上的訓練過程如圖2 所示,最終PLAID 和WHITED 的驗證集識別準確率分別達到99.31%和98.74%,驗證了時間序列二維可視化方法可以有效提高負荷特征的辨識度。

圖2 預訓練模型在2個數據集上的訓練結果Fig.2 Training results of pretrained model on two datasets

圖3 是根據PLAID 的測試集實驗結果繪制的混淆矩陣示意圖。矩陣示意圖對角線上的值表示預測類別與真實類別相同,即識別正確的個數,非對角線上的值則表示識別錯誤的個數。

圖3 PLAID測試集實驗結果的混淆矩陣Fig.3 Confusion matrix of experimental results of PLAID’s test set

文獻[23]給出了用于評價NILM 模型分類性能的指標,其中正確率與召回率的調和平均值Fscore使用最廣泛,它是統計學中一種用來衡量二分類模型精確度的綜合性評價指標,定義如下:

式中:Rpre為正確率;Recall為召回率;TP為真陽性(即電器實際打開且識別正確);FP為假陽性(即電器實際關閉且識別錯誤);FN為假陰性(即電器實際打開且識別錯誤)。以冰箱為例,如圖3 混淆矩陣所示,TP=33,FP=5,FN=1,因此冰箱的正確率約為86.84%,召回率約為97.06%,Fscore≈91.67%。最終PLAID 在測試集上的整體識別準確率約為98.88%。

由圖3 可見,冰箱和空調的預測結果更容易與其他電器發生混淆,且由表1 所示PLAID 中11 種電器的Fscore可知,所有電器Fscore的均值Fmacro≈98.20,冰箱和空調的Fscore均低于Fmacro,其原因在于冰箱和空調有多種運行狀態,且不同狀態下負荷特征差別較大,易與其他電器混淆。例如,空調在制熱模式下可能與加熱型電器吹風機混淆。因此,需要研究多態模型來表示這類電器或采用其他方法對其進行區分,目前該問題尚未得到有效解決。

表1 PLAID中11種電器的FscoreTable 1 Fscore of 11 electrical appliances in PLAID

3.3 WHITED的實驗結果

WHITED 的模型參數設定及數據可視化過程類似于PLAID。由于部分電器樣本數過少,在驗證時幾乎不產生誤判,因此僅在模型訓練時對其進行保留,在結果展示中忽略這些電器。最終WHITED 在測試集上的整體識別準確率約為98.94%,混淆矩陣與Fscore值分別見附錄A 圖A3 和表A1。由結果可見,咖啡機、熨斗、燒水壺、烤箱、電燈泡、電烙鐵和熱水器之間更易產生誤判,這是由于這些電器都是典型的電阻型負荷,功能都屬于加熱范疇,因此這些電器間的預測結果易出現混淆。與PLAID 不同,WHITED 中空調和冰箱的分類準確率都很高,原因在于這2類電器的樣本數很少(均為10),在WHITED中僅涵蓋1種工作狀態。

同種類型不同品牌的家用電器因設備參數不同,GADF圖會存在差異,附錄A圖A4為WHITED中4 種不同品牌吹風機的GADF 圖。為了驗證所提方法能夠區分同種類型不同品牌的設備,選取WHITED中品牌數量最多的6 種電器,分別為充電器、風扇、吹風機、燒水壺、LED 燈和電燈泡,共有40 個品牌,實驗結果顯示僅發生1 例誤判,識別準確率達到99.74%,證明了所提方法具有區分同種類型不同品牌設備的能力。但巨大的類內差異也對負荷標簽的泛化性能提出了更高的要求,為此,重復使用基于PLAID 訓練的Inception-v3 模型對WHITED 中相同類別的11 種電器進行識別。實驗結果顯示分類準確率僅達到36.83%。因此,如何提升負荷標簽的泛化能力,從而實現跨數據集、跨區域的非侵入式負荷識別需要進一步研究。

3.4 分析與討論

在實驗中,每張GADF圖是基于1個電流周期得到的,不同周期數的GADF 圖如附錄A 圖A5 所示,由圖可見,2 個周期的GADF 圖僅是1 個周期GADF圖的復制,與1 個周期GADF 圖并無本質區別。當PLAID每條電流記錄所取的樣本數分別為1、2、5、10時,模型的驗證集準確率與最終在測試集上的準確率分別如圖4 和圖5 所示。由圖4 可見,樣本數越多,驗證集準確率曲線越平滑,模型的性能越好。由圖5 可見:測試集準確率隨樣本數的增加不斷提高,即使樣本數僅為1或2,也能達到相對理想的識別效果;當每條記錄的樣本數大于5 時,模型的識別準確率能維持在98%以上,此時識別準確率提升幅度較小,曲線逐漸趨于飽和。因此,所提方法能較好地適用于小樣本的場景。

圖4 不同樣本數對模型性能的影響Fig.4 Influence of different sample numbers on model performance

圖5 不同樣本數的準確率對比Fig.5 Comparison of accuracy among different sample numbers

表2 為本文方法以及與本文使用相似模型和相同數據集的其他文獻方法的對比結果。文獻[2]采用二值V-I 軌跡作為負荷特征,利用隨機森林(RF)算法對負荷進行分類;文獻[13]采用灰度V-I 軌跡作為負荷特征,并使用自定義的卷積神經網絡(CNN)進行負荷識別。這2種方法雖然將電壓、電流數據進行可視化,但圖像色調單一,未考慮顏色維度,且文獻[13]的網絡結構比較簡單,最終導致識別準確率不高。文獻[16-17]采用改進的遞歸圖作為可視化途徑,添加了顏色信息使得圖像在視覺上更具辨識度,因此分類準確率得到了提升,但其模型性能受限于遞歸圖相關超參數的選擇,較為繁瑣。與文獻[16-17]的方法相比,本文負荷標簽的構建過程簡單,摒棄特性相似的電壓數據,保留電流數據,同時根據Fryze功率理論分解出電流的非有功分量,擴大了負荷特征相互間的差異,通過序列可視化的方式進行升維,擴充了信息量,在采集場景復雜的高頻數據集PLAID、WHITED上獲得了更高的識別準確率。

表2 本文方法與現有方法的對比Table 2 Comparison between proposed method and current methods

4 結論

本文提出了一種基于時間序列二維可視化和遷移學習的非侵入式負荷分類識別方法。通過數據預處理和序列可視化等流程,選取二維圖像——GAF作為負荷標簽,不同的家用電器可以通過GAF 圖的紋理和顏色分布進行辨別。同時,GAF 圖作為中間域有效結合了計算機視覺與NILM 領域,將負荷識別問題轉換為適合用CNN 處理的圖像分類任務。在公共數據集上的實驗結果驗證了本文方法的準確性和有效性。但所提方法目前僅適用于高頻采樣數據,對采集裝置的硬件要求較高。負荷間的類內差異導致現有負荷標簽的泛化能力不足,跨數據集、跨區域的非侵入式負荷識別仍然難以取得理想效果。此外,為多狀態負荷設計具有代表性的多態模型依然較為困難。因此,如何在保證負荷識別準確率的同時降低應用成本,如何選取適合的負荷標簽以最小化同類負荷的差異并最大化不同類負荷的區別,將是未來非侵入式負荷識別研究的核心。

附錄見本刊網絡版(http://www.epae.cn)。

猜你喜歡
電器準確率可視化
基于CiteSpace的足三里穴研究可視化分析
家中電器要“煥”新 這波惠民操作別錯過
思維可視化
乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
2015—2017 年寧夏各天氣預報參考產品質量檢驗分析
頸椎病患者使用X線平片和CT影像診斷的臨床準確率比照觀察
基于CGAL和OpenGL的海底地形三維可視化
奧田電器
“融評”:黨媒評論的可視化創新
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合