?

基于卷積自編碼網絡的故障電弧多分類識別方法

2022-09-02 10:15李奎張丹王堯
關鍵詞:池化電弧編碼器

李奎,張丹,王堯

(1.河北工業大學 河北省電磁場與電器可靠性重點實驗室,天津 300130;2.河北工業大學 省部共建電工裝備可靠性與智能化國家重點實驗室,天津 300130)

0 引 言

電能在人們生產生活中應用廣泛,隨之而來的電氣火災事故也日益頻發。據統計,由于電氣原因引發的火災占火災總數的30%以上,其中故障電弧是引發電氣火災的重要原因[1-2]。串聯故障電弧電流一般低于線路正常工作電流,線路中安裝的斷路器或熔斷器等保護裝置通常無法消除此類故障。非線性負載電流與故障電弧電流在時頻域方面特征相似,導致故障電弧特征量選取困難[3]。因此,能否在非線性負載條件下準確檢測出串聯故障電弧,對于火災防治至關重要。

由于故障電弧電流與電弧發生的位置無關,國內外很多學者通過提取電弧電流時頻域特征并設置檢測閾值實現了故障電弧識別。E.Tisserand等[4]利用線電流的導數作為特征量進行故障電弧診斷;G.Artale等[5]對電弧故障電流進行線性調頻Z變換(chirp Z-transform,CZT),并利用變換后的低頻諧波識別電弧故障;K.Koziy等[6]利用小波變換的多分辨率分析特點,分析電弧電流突變特征,通過自適應調整閾值方式實現了故障電弧辨識;王堯等[7]計算電弧電流變化率與有效值的比值,選取6~12 kHz頻段的電流幅值作為時頻域特征量,并設置檢測閾值,所提方法簡單易行;孫鵬等[8]基于小波變換多分辨率的特點,提出了小波熵值為閾值依據的串聯型故障電弧檢測方法,在電弧穩定與不穩定燃燒狀態下有較高識別準確率;白輝等[9]提出了一種基于小波包變換與高階累積量相結合的故障電弧識別方法,能夠識別單一負載、組合負載以及支路電弧故障。閾值檢測方法算法簡便,易于硬件實現,但嚴重依賴于所設置的閾值大小,實際情況中非線性負載種類繁多,其工作特性存在較大差異,限制了閾值的泛化能力。

近年來,深度學習算法為故障電弧診斷提供了新思路,該方法無需人為設置閾值,通過訓練神經網絡模型自主形成故障電弧與正常工作的邊界區分條件。蘇晶晶等[10]應用經驗模態分解提取電弧電流多個特征量,并構建概率神經網絡模型進行故障電弧識別;J.E.Siegel等[11]應用傅里葉變換、梅爾頻率倒譜變換以及離散小波變換對數據進行預處理,結合深度神經網絡實現了故障電弧識別;楊凱等[12]應用分形維數對電流高頻信號的混沌特性進行定量衡量,并通過盒維數與關聯維數構造出故障電弧特征向量,最后采用支持向量機對其進行分類;WANG Yangkun等[13]基于時域和頻域分析方法,利用全連接神經網絡模型實現了故障電弧診斷。人工智能算法能在一定程度上解決閾值設置的問題,但現有方法常常需要人為提取電流數據特征作為網絡模型的輸入,增加了人為提取特征的工作量,此外,現有方法大多只進行故障電弧與正常工作的二分類研究,未進行負載類型識別。

本文結合卷積自動編碼器(convolutional autoencode,CAE)與Softmax多分類器,構建一種卷積自編碼網絡模型。該模型以原始電流數據作為網絡輸入,無需人為提取特征量,能夠同時檢測故障電弧并識別負載類型,既具有卷積自動編碼器的無監督特征學習功能,又具有Softmax多分類器的有監督多分類功能。

1 故障電弧實驗數據采集與特征分析

1.1 故障電弧實驗數據采集

根據GB/T 31143-2014《電弧故障保護電器的一般要求》搭建串聯故障電弧實驗平臺,如圖1所示。該實驗平臺包含點接觸、碳化電纜兩種電弧發生裝置,其中點接觸可以模擬接線端子松動、導體接觸不良導致的故障電??;碳化電纜可以模擬導線絕緣老化、絕緣擊穿引起的故障電弧。

圖1 故障電弧實驗平臺結構示意圖Fig.1 Structure diagram of arc fault test platform

試驗負載選取國家標準中規定的電阻、電容、啟動電機、真空吸塵器等8種負載,負載參數如表1所示。使用數字示波器采集負載發生故障電弧前后的電流信號,采樣頻率設置為40 k Hz。

表1 實驗負載參數設置Tab.1 Parameters setting of experimental loads

1.2 故障電弧電流時頻域特征分析

以線性負載電阻、非線性負載電子調光燈、真空吸塵器為例,分析故障電弧電流的特征。圖2為這3種負載正常工作與故障電弧狀態的電流波形圖。圖2(a)中的電阻屬于線性負載,正常工作狀態下電流波形為平滑的正弦波,發生故障電弧時在電流過零點附近會出現零休現象,產生高頻毛刺。圖2(b)中的電子調光燈通過改變可控硅的觸發角實現調光,正常工作時在電流過零點附近出現平肩部,容易與故障電弧的零休現象混淆。圖2(c)中的真空吸塵器為電機啟動類負載,通電后電動機高速旋轉,內部電刷換向時電流波形在過零點附近發生畸變,其特征與發生故障電弧時的電流特征類似。

圖2 典型負載正常工作與故障電弧狀態下電流波形圖Fig.2 Current waveform diagrams of typical loads under normal operations and arc fault states

電弧放電存在比較復雜的物理化學變化,不同負載下電弧電流差別較大,相同負載下電弧電流也不同。同時,某類負載正常工作時的電流波形可能與其他類負載發生故障電弧時的電流波形相似,導致故障電弧特征量選取困難,加劇了故障電弧的檢測難度。自動編碼器能夠通過無監督學習,不斷縮小重構數據誤差,從而獲取數據的深層特征[14],卷積神經網絡利用卷積操作提取數據隱含特征,因此,本文將自動編碼器與卷積神經網絡結合形成卷積自動編碼器,用于提取故障電弧電流數據特征。

2 卷積自編碼網絡的構成

2.1 卷積自動編碼器原理

自動編碼器利用自身高階特征進行自我編碼,能夠挖掘出輸入數據中隱含的特定結構[14]。卷積自動編碼器在自動編碼器基礎上加入了卷積和池化運算,用卷積層代替自動編碼器的全連接層。卷積神經網絡的權值共享和局部感知特點可加快網絡模型的計算速度,而自動編碼器的無監督學習特點可減小網絡發生過擬合的可能性。

卷積自動編碼器包括編碼器和解碼器,通過不斷縮小解碼輸出數據與原始輸入數據之間的差異,使解碼輸出數據盡可能復現原始輸入數據,其結構如圖3所示。

圖3 卷積自動編碼器示意圖Fig.3 Schematic diagram of convolutional autoencoder

設卷積自動編碼器中卷積層的輸出特征為hi,第i個特征向量的卷積運算權值為wi1,偏置為bi1,用輸入電弧數據xi訓練卷積層的神經元,得到輸出特征,f為激活函數。編碼器中卷積層運算方程為[15]

其中,*表示卷積運算,然后經過池化(下采樣)運算

式中:pool(.)為池化運算,選用最大值池化方式;yi為池化運算輸出結構;w2i為池化運算的權重為池化運算相應的偏置。輸入數據經過卷積和池化運算提取出特征yi。

解碼器是編碼器的逆運算,用于重構輸入數據,包括反池化與反卷積過程。其中,反池化進行上采樣計算,為池化運算的反過程,用于恢復數據規模。反池化計算方程為[15]

2.2 激活函數和優化算法的選擇

選用適合于深度網絡學習的Relu激活函數,其表達式如式(5)所示,導數如式(6)所示。

Relu函數的函數輸出值和導數輸出值在輸入數據小于0時恒為0;輸入數據大于等于0時,函數輸出值等于輸入值,導數輸出值恒為1,能有效避免梯度消失,有利于深度網絡快速收斂。

選用均方根誤差作為卷積自動編碼器的損失函數,損失函數值代表了卷積自動編碼器重構的電弧數據與輸入的電弧數據之間的差異,其表達式為[16]

損失函數一般具有非凸及非平滑性特性,不能用解析方式求解。采用優化算法近似求解,更新網絡參數,可不斷近似逼近最優解。由于隨機梯度優化方法樣本選取隨機,易發生震蕩,且學習率設置過大時會導致網絡不能收斂,學習率設置過小時又會導致收斂速度緩慢,因此,選擇自適應矩估計(adaptive momentum estimation,Adam)優化算法,能夠克服隨機梯度算法通過單一學習率更新權重的缺陷[17]。

Adam優化算法基于方差思想,在網絡反向傳播過程中,計算梯度的一階矩估計mt和二階矩估計vt,根據不同參數設置不同學習率。第t次迭代時的mt和vt表示為

式中:β1為mt的指數衰減速率,將其設置為0.9;β2為vt的指數衰減速率,將其設置為0.999。此時,mt和vt為有偏估計,將其轉換成無偏估計:

式中:βt1為β1在第t步計算的值;βt2為β2在第t步計算的值,取值為[0,1)。

3 故障電弧多分類識別方法

3.1 數據集制作

信號采集過程中不可避免會混入干擾信號,導致采集的電流數據出現異常點。為了確保同一類電流數據的一致性,需要對數據進行篩選,剔除不合理數據,主要包括實驗設備原因造成的數據空值、電弧熄滅導致電流為0的數據等。選擇一個工頻周期的電流數據為一個樣本,每個樣本包括800個數據點,8種負載中每種負載正常工作和發生故障電弧的電流數據各600組,共計9 600組數據,訓練集、驗證集、測試集按4∶1∶1進行劃分。為了避免不同負載電流值差異的影響,對電流數據歸一化處理,采用離差標準化將電流值限制在[0,1]內,表達式為

各負載標簽設置如表2所示。

表2 負載標簽設置Tab.2 Load label settings

3.2 用于故障電弧特征提取的卷積自動編碼器 設計

輸入無標簽的數據集,經過編碼器和解碼器運算過程,使卷積自動編碼器輸出數據盡可能還原輸入數據。卷積自動編碼器重構誤差反映了解碼輸出數據與原始輸入數據之間的差異,重構誤差越小,表示卷積自動編碼器的解碼輸出數據能更有效地還原輸入數據,可提取出輸入數據中的深層特征[16]?;赑ython中的Keras深度學習庫搭建網絡模型并進行實驗研究,實驗中網絡結構參數選取方法如下。

3.2.1 卷積核尺寸選擇

由于偶數卷積核尺寸在填充時難以保證輸入特征向量與輸出特征向量尺寸不變,卷積核尺寸通常設置為奇數[17]。卷積核尺寸為1時,相當于全連接網絡,無法體現卷積優異的特征提取能力;而卷積核尺寸過大時,會大大增加模型參數計算量。因此,在其他參數固定的情況下,分別選取卷積核尺寸為3,5,7,評估卷積自動編碼器重構數據的能力,實驗結果如圖4所示。

圖4 卷積核尺寸的選擇Fig.4 Convolution kernel size selections

卷積核尺寸為5時,損失函數值在訓練初期下降明顯,但在訓練中期出現轉折點,損失值下降緩慢;卷積核尺寸為3和7時,迭代20次左右即能達到相對較小的重構誤差,考慮到大卷積核會增加網絡模型參數,網絡訓練時間較長,因此,選取卷積核尺寸為3。

3.2.2 首層卷積核數量選擇

實際應用中為了充分發揮計算機性能,首層卷積核數量通常設置為8的倍數,后續層按照首層的2倍倍增設置[17]。分別設置首層卷積核數量為8,16,32,實驗結果如圖5所示。

圖5 首層卷積核數量的選擇Fig.5 Selections of the number of first layer convolution kernels

卷積核可看作多個特征提取濾波器,能夠從原始電弧電流數據中提取到有用特征,進行數據重構。數量較少時,卷積自動編碼器不能有效學習和重構輸入的電弧數據。首層卷積核數量為16和32時,訓練20次左右重構誤差能夠很大程度降低??紤]到卷積核數量過多時會增加網絡發生過擬合的可能性,選取首層卷積核數量為16。

3.2.3 池化比例選擇

構建卷積自動編碼器時,在卷積層后面設置池化層能夠減少網絡參數數量,加快計算速度,增強網絡魯棒性。池化層雖然能在一定程度上增強卷積自動編碼器的泛化性能,但池化比例過高會導致網絡丟失更多的特征信息,削弱網絡提取特征的能力,所以池化比例的選擇至關重要??紤]上述情況,本文設置池化比例分別為1,2,4,實驗結果如圖6所示。

圖6 池化比例的選擇Fig.6 Selections of pooling ratio

池化比例為4時,由于池化比例過高,網絡丟失了大量有用信息,導致提取到的電弧特征不具有代表性;池化比例為1時,即不進行池化運算,導致網絡模型參數較多,訓練時間較長。根據重構誤差的收斂性,池化比例為2時能夠加快網絡收斂,并且重構誤差較低。因此,選取池化比例為2。

3.2.4 卷積層數選擇

隨著卷積層數增多,得益于深度網絡優異的學習性能,網絡學習能力加強。但層數過多時容易出現過擬合現象,設置卷積層數分別為2,3,4,5,比較這4種卷積層數對卷積自動編碼器的損失函數值的影響,實驗結果如圖7所示。

圖7 卷積層數的選擇Fig.7 Selections of the number of convolutional layers

卷積層數為4時,重構誤差收斂較快,且最終收斂于一個較低值,卷積自動編碼器提取到的電弧特征具有很強的代表性。卷積層數為5時,迭代初期損失函數起伏波動,且層數增多時訓練時間大大增加。卷積層數為3時,迭代初期損失函數下降比較緩慢。卷積層數為2時,受限于網絡深度的影響,不能有效學習到更充分的特征。因此,設置卷積層數為4。

選擇4層卷積層構建卷積自動編碼器的編碼部分,每層卷積核尺寸為3,池化比例為2,首層卷積核數量為16,后續3層分別為32,64,128;解碼部分與編碼部分對稱,設置4層反卷積層,每層反卷積核尺寸為3,反池化比例為2,首層反卷積核數量為128,后續3層分別為64,32,16。

應用無標簽的電弧電流數據集對卷積自動編碼器進行無監督訓練,訓練完成后,輸入測試集樣本進行測試。圖8為真空吸塵器負載和電子式開關電源負載的編碼器原始輸入數據與解碼器重構輸出數據對比圖。電流重構數據在一定程度上能夠還原輸入數據,電弧電流的“零休”特征得以保留。卷積自動編碼器重構數據與輸入數據差異較小,僅開頭和末尾數據發生了微小波動,但負載正常狀態和故障電弧的邊界區分特征得以保留,重構數據的故障電弧波形不對稱特征較為明顯。因此,解碼器重構數據能夠有效還原原始輸入數據,說明卷積自動編碼的編碼器輸出數據能夠有效表征輸入數據的特征,利用卷積自動編碼器提取的特征進行故障電弧多分類識別具有一定的可行性。

圖8 原始數據與重構數據對比Fig.8 Comparison charts of raw data and reconstructed data

3.3 故障電弧多分類識別模型

基于卷積自編碼網絡的故障電弧多分類識別模型是將卷積自動編碼器的編碼器輸出連接至一個多分類器,使得該模型既具有卷積自動編碼器的深層特征提取功能,又具有多分類功能。選擇邏輯回歸模型中適用于多分類問題的Softmax多分類器。輸入電弧電流樣本{(x1,y1),(x2,y2),…,(xm,ym)},其中,xi為樣本數據,yi為樣本標簽,取值0~15,代表16種分類結果。對于給定的電弧測試樣本x,通過假設估計法計算出該樣本屬于16類中任意一類的概率p(y=j|x),假設函數將輸出16維數據,分別表示該電弧樣本屬于這16類的概率。其中,假設函數表達式為

式中,θ1,θ2,…,θ16模型參數。

Softmax多分類器應用激活函數將各個輸入向量映射到(0,1),所有輸出映射值之和等于1,輸入向量歸屬于輸出值中某一類的條件概率最大的作為分類器輸出結果。選擇適用于多分類問題的交叉熵損失函數

式中:dn,yn分別為第n個樣本的真值與模型預測值;N為樣本總數;K為類別總數。

卷積自動編碼器訓練完成后,去掉解碼器部分,將編碼器與Softmax多分類器相連。由于卷積自動編碼器最后一層含有128個卷積核,使得編碼器輸出特征維度較高,而Softmax多分類器輸出結果為16種類型,為了防止因為神經元個數急劇減少導致編碼器丟失有效的電弧數據特征,在編碼器最后一層池化操作后添加Flatten層,將其平鋪融合,再添加一層全連接層作為編碼器與多分類器之間的過渡層。

實驗選取合適的全連接層神經元個數,分別設置全連接層神經元個數為0(不加全連接層),50,100,150,200,測得故障電弧多分類識別準確率如圖9所示。隨著全連接層神經元個數增加,網絡的參數規模不斷增加,結合識別準確率,設置全連接層神經元個數為100,此時模型識別準確率較高,相比于150和200兩種情況下,節省了計算機內存,縮短了網絡參數計算時間。多分類器使用樣本標簽數據可進行有監督學習。

圖9 全連接層神經元個數選擇Fig.9 Selections of the number of neurons in the fully connected layer

故障電弧多分類識別模型如圖10所示。

圖10 故障電弧多分類識別模型Fig.10 Multi-class recognition model of arc fault

4 故障電弧多分類識別方法實現與 結果分析

4.1 故障電弧多分類識別過程

基于卷積自編碼網絡的故障電弧多分類識別流程圖如圖11所示。網絡模型訓練包括兩個階段:第一階段是無監督訓練卷積自動編碼器,輸入無標簽的一維原始電弧電流數據集,實驗選取合適的卷積核尺寸、首層卷積核數量、池化比例、卷積層數,并訓練卷積自動編碼器的參數,使其成為優異的特征提取器;第二階段將編碼器輸出層鋪平后連接一個全連接層,再連接至Softmax多分類器,輸入有標簽的一維原始電弧電流數據集,微調網絡參數,完成整個故障電弧多分類網絡的訓練,網絡訓練完成后,保存網絡模型參數,并輸入測試集數據對訓練完成的卷積自編碼網絡的故障電弧多分類性能進行實驗驗證。故障電弧多分類網絡模型參數設置如表3所示。

圖11 故障電弧多分類識別流程圖Fig.11 Flow chart of multi-class identification of arc fault

表3 故障電弧多分類識別模型參數設置Tab.3 Parameter settings of arc fault multi-class recognition model

4.2 故障電弧多分類識別結果分析

故障電弧多分類識別模型訓練集和驗證集的識別準確率如圖12所示。由圖12可以看出,在迭代過程中,訓練集和測試集的識別準確率逐漸上升,訓練過程中驗證集精度緊跟訓練集精度,網絡沒有發生過擬合。

圖12 識別準確率曲線Fig.12 Iterative accuracy curves

取8種負載正常工作與故障電弧狀態各100組測試集數據作為模型的輸入樣本,輸入至訓練好的故障電弧多分類識別網絡模型中,網絡輸出多分類混淆矩陣如圖13所示。其中縱軸label的標簽為輸入數據的真實標簽類別,橫軸predict的標簽為網絡的輸出類別標簽,對角線數值為分類正確的樣本個數,非對角線元素(a,b)為將a樣本錯判為b樣本的樣本個數。

由圖13可以分析出,故障電弧多分類識別(故障電弧及負載類型均正確識別)準確率為97.94%,負載種類識別正確的概率為98.31%,故障電弧檢測的準確率為99.31%,將正常組識別為故障組(誤判)的概率為0.062 5%,將故障組識別為正常組(拒判)的概率為0.625%。大多數分類錯誤樣本都是將電阻類電弧樣本與其他負載的電弧樣本混淆,尤其是與電容啟動電機、真空吸塵器負載電弧樣本混淆,這是因為電阻類電弧樣本的時頻域特征與一些非線性負載正常工作時相似,網絡模型多分類判據采用的是交叉熵損失函數,輸入數據歸屬于輸出值中某一類的條件概率最大的作為分類器輸出結果,當不同類樣本特征值相近時,條件概率最大的輸出值可能誤判為其他相似類別,導致分類錯誤。故障電弧多分類識別模型存在一定程度的誤判和拒判情況,但整體而言,在避免人為提取特征量的基礎上,故障電弧多分類識別模型能夠通過卷積自動編碼器學習到有效特征,多分類識別準確率較高。統計各負載的識別結果,如表4所示。

表4 各負載識別結果Tab.4 Recognition results of each load

圖13 多分類混淆矩陣Fig.13 Multi-class confusion matrix

5 結 論

(1)參照GB/T 31143-2014搭建故障電弧實驗平臺。采集了不同負載在正常工作與發生故障電弧時的電流數據,并建立了數據集。

(2)提出一種卷積自編碼網絡模型進行故障電弧多分類識別,該模型能從電弧電流數據中自主提取合適特征,無需人為提取特征量,能夠同時進行故障電弧檢測與負載類型辨識。

(3)實驗驗證故障電弧多分類識別的準確率,結果表明,所提網絡對不同負載的電弧識別準確率較高,均在96.5%以上,電弧多分類識別準確率均在93.5%以上,能夠滿足故障電弧識別的準確率要求。

猜你喜歡
池化電弧編碼器
基于航空交流故障電弧標準的電弧仿真研究
基于高斯函數的池化算法
融合CNN和Transformer編碼器的變聲語音鑒別與還原
哈焊院自主研發的激光-電弧復合焊技術在船舶領域取得新突破
卷積神經網絡中的自適應加權池化
設定多圈絕對值編碼器當前圈數的方法
電弧沉積TiSiN涂層的制備工藝研究
轉爐系統常用編碼器選型及調試
舞臺機械技術與設備系列談(二)
——編碼器
三絲焊接參數對電弧形態特征的影響
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合