?

基于ECAProNet 模型的小樣本變工況軸承故障診斷

2024-01-10 17:05吳東升王笑臣
沈陽理工大學學報 2024年1期
關鍵詞:原型特征提取故障診斷

王 勉,吳東升,王笑臣

(沈陽理工大學自動化與電氣工程學院,沈陽 110159)

滾動軸承是廣泛應用于各類機械設備中的重要基礎部件,在設備的穩定可靠運行中發揮重要作用。 滾動軸承在使用過程中易發生碎片剝落、磨損產生裂紋及凹坑,造成機械設備無法正常運行[1],甚至引起安全事故。 因此,對滾動軸承進行故障診斷具有重要的實際意義。

傳統機器學習故障診斷方法只適用于某一類機械,更換到另一類機械后不再有良好的診斷能力[2-3]。 近些年,深度學習算法被廣泛應用于軸承的故障診斷[4-6],其可通過深度神經網絡(deep nueral network,DNN)自動完成特征提取,但深度學習具有十分嚴重的數據依賴性,數據不足會導致訓練過程中發生過擬合現象,而實際生產中往往難以提供大量數據來滿足深度學習的要求。 由此,人們提出了小樣本分類方法。

Snell 等[7]于2017 年首次提出基于度量的原型網絡,并將其用于圖像的少樣本分類。 該網絡將帶標簽樣本與待識別樣本映射至同一空間,將同類樣本均值作為類原型,通過衡量待識別樣本與各類原型間的歐氏距離進行分類。 由于其泛化能力出色且易與其他模型相結合,諸多學者將其應用于少樣本軸承故障診斷中。 Chen 等[8]提出將軸承振動信號通過快速傅里葉變換(FFT)轉變為頻域信號,使用馬哈拉諾比斯距離代替歐氏距離,提高了診斷準確率。 喬春陽[9]提出基于金字塔分割注意力的半監督原型網絡,使用未標記樣本對初始原型進行調整,減少了構建網絡模型時對標記樣本的依賴。 華超等[10]提出基于密度加權的原型網絡,對每個樣本賦予不同的權值,對代表性大的樣本賦予更大權值,對代表性小的樣本賦予更小的權值,以此緩解樣本代表性不足的問題。 Wang 等[11]提出原型孿生網絡,在孿生網絡中增加了一個原型模塊,以學習每個類的高質量原型表示,在少樣本學習實驗中表現出較好的性能。

上述方法均在小樣本學習領域取得了較好的效果,但文獻[8]提出的網絡模型需要構建一個卷積神經網絡(CNN)作為特征提取網絡,再應用另一CNN 作為方差預測網絡,一定程度上增加了模型的復雜程度,加大了訓練的工作量。 文獻[9]提出的模型中每個類別需要3 ~10 個標記樣本,以滿足訓練階段的要求,無法應對特殊情況下僅有某類別且僅存在唯一樣本的變工況軸承故障診斷。 文獻[10]提出的改進原型網絡在進行50 次迭代后,準確率才有明顯提升,時間成本較高。 文獻[11]提出的網絡模型在1-shot 情況下的分類準確率過低,僅為48.7%。

針對上述問題,本文在原型網絡(ProNet)的基礎上,提出在預學習階段引入高效通道注意力機制(ECA)[12],對樣本的特征進行充分挖掘,增強對具有代表性特征的關注度,提高模型分類準確率,同時不增加模型的復雜程度。 本文提出的故障診斷方法簡稱為ECAProNet。

1 原型網絡

1.1 數據集的劃分

ProNet 采用元學習的訓練方法進行小樣本訓練,可通過極少數的樣本確定類原型,通過衡量待識別樣本與類原型間的歐氏距離,采用近鄰策略進行識別分類,其分類原理如圖1 所示。 ProNet算法采用基于episodes 的訓練策略,將數據集劃分為元訓練集Dtrain和元測試集Dtest,且訓練集與測試集樣本空間不相交,以使訓練過程中優化好的網絡模型能夠泛化到測試環境。

圖1 原型網絡分類原理圖Fig.1 Prototypical network classification schematic diagram

元訓練數據集Dtrain分為支持集S和查詢集Q,支持集表示為,查詢集表示為。 其中:xi和分別為支持集和查詢集樣本,xi∈RD,,D為樣本特征向量的維數;yi和分別表示xi和對應類別的標簽;ns為每類支持樣本數;nq為每類查詢樣本數。 若在支持集S中包含了N個類別且每個類別中包含了K個樣本,則將此類問題稱為N-wayK-shot 問題。

1.2 原型計算與分類

支持集經過特征提取網絡后,N個類別中每一個樣本從D維空間映射到M維空間(M為原型特征向量的維數),并得到特征向量,在M維空間中通過計算支持集樣本特征向量的平均值得到原型。 原型計算式為

式中:Lc表示第c類的原型,Lc∈RM;K為支持集中c類別中抽取的樣本數量;fφ(·)表示具有可學習參數φ的嵌入函數。

計算出查詢集中樣本與各類原型間的歐氏距離,利用softmax 分類器得到查詢集樣本屬于第c類別的概率Pφ,具體計算式為

式中d(·,·)為距離函數。

1.3 損失函數的計算

為使分類概率最大化,利用損失函數使網絡不斷迭代更新自身參數,取得最小損失,損失函數J計算式為

2 ECAProNet 算法

2.1 ECANet 算法

ECA 使用不降維的局部跨通道交互策略,解決了降維造成的通道注意力學習能力差的問題。該方法涉及參數少且效果顯著,一定程度上降低了模型的復雜程度。

ECA 網絡結構如圖2 所示。 圖中:χ為輸入特征;為帶有注意力的特征;W、H、C分別為卷積塊的寬度、高度及通道維數。 ECA 模型使用全局平均池化(GAP)不降維聚合卷積特征,確定卷積核大小q,進行一維卷積,通過Sigmoid 函數學習通道注意力,得到通道的權重,處理通道權重與輸入特征后即可得到帶注意力的特征。

圖2 ECA 網絡結構Fig.2 ECA network structure

ECA 通過大小為q(其大小決定局部跨通道交互的覆蓋范圍)的卷積核快速卷積,實現跨通道交互。q與通道維數C成正比,映射關系為

式中:|t|odd表示距離t最近的奇數;γ和b為自定義參數,本文分別設置為2 和1。

2.2 ECAProNet 算法

本文采用ResNet[13]作為特征提取網絡,將ECA 引入ResNet 網絡中。 通過特征提取網絡(ECA-ResNet)將樣本從D維空間映射至M維空間,依據式(1)計算出類原型,通過衡量查詢集樣本與類原型之間的歐氏距離,采用softmax 函數計算查詢集樣本屬于各類原型的概率,計算出查詢集樣本的負對數概率,得到損失函數,將損失函數反饋到特征提取網絡中,優化自身參數,達到網絡的迭代更新。 ECAProNet 算法框圖如圖3 所示。

圖3 ECAProNet 算法框圖Fig.3 ECAProNet algorithm block diagram

ResNet 引入殘差塊并采用跳躍連接將輸入數據直接傳遞到后續層,增強信息流動性,提高訓練精度。 基于殘差網絡的特性[13],在殘差塊中插入ECA 模塊,在不增加模型復雜度的前提下,能夠在少量數據中提取到更具代表性的特征;將帶有ECA 模塊的ResNet 作為原型網絡的特征提取網絡,在有限樣本數據中提取更有用的滾動軸承特征信息。

2.3 基于ECAProNet 的變工況診斷流程

本文提出的基于ECAProNet 的診斷流程如圖4 所示,具體步驟如下。

圖4 ECAProNet 故障診斷流程框圖Fig.4 Block diagram of ECAProNet fault diagnosis process

步驟1將采集到的一維振動信號轉變為灰度圖像,以便采集到更多有用信息。

步驟2在預訓練階段,于采樣頻率12 kHz下進行采樣,共分為4 種工況,每種工況包含5 個故障類型,在20 類故障類型中隨機選取N類樣本,并從N類樣本中隨機抽取K個樣本構成支持集S,再從每類樣本中隨機抽取樣本構成查詢集Q,作為特征提取網絡的輸入。

步驟3由ECA-ResNet 特征提取網絡將支持集S和查詢集Q中的樣本映射到統一特征度量空間,得到支持集S與查詢集Q中各樣本的特征向量。

步驟4由式(1)計算出支持集S中每類樣本的平均向量作為類原型,計算查詢集Q中各樣本的特征向量與類原型間的歐氏距離后輸入softmax 函數;由式(2)得到查詢集中樣本屬于每類原型的概率;通過式(3)計算得到損失函數并反饋到特征提取網絡,對其進行訓練,完成模型的迭代更新,優化自身參數。

步驟5在測試階段,經基于episodes 訓練策略優化好的特征提取網絡將Dtest中含有帶標簽信號的支持集和查詢集作為輸入,映射到度量空間,確定查詢集中無標簽樣本的調制樣式,確定軸承故障分類,得到變工況故障診斷結果。

3 實驗驗證

3.1 環境配置

本文實驗在Pytorch 框架下進行搭建,硬件設施為Intel Core i7-8700CPU、NVIDIA GTX1080ti顯卡的計算機。

3.2 數據集

本實驗采用的數據集為凱斯西儲大學(CRWU)的開放軸承數據庫[14],選用12 kHz 采樣頻率下的軸承振動信號作為訓練數據集,選用48 kHz 采樣頻率下的軸承振動信號作為測試數據集,驗證模型在不同工況下的故障診斷效果。 設置4 種工況(A、B、C、D)及5 種軸承故障類型,如表1 和表2 所示。

表1 CRWU 軸承的4 種工況Table 1 Four kinds of working conditions of CRWU bearings

表2 CRWU 的故障類型Table 2 Fault types of CRWU

3.3 模型對比實驗及結果分析

將ECAProNet 與其他四種小樣本診斷方法進行對比,分別為ProNet、與模型無關的元學習模型(MAML)[15]、基準模型(Baseline)、多任務學習模型(MTL)[16],對比實驗結果如表3 和表4 所示。 為得到較為穩定、客觀的診斷準確率,將5-way 5-shot 實驗與5-way 1-shot 實驗分別在訓練階段進行15 次迭代,在測試階段進行10 輪測試,取平均準確率作為實驗結果。 對比表3 和表4 可以看出,在5-way 5-shot 樣本抽取下的變工況軸承故障診斷準確率絕大多數高于5-way 1-shot。 原型網絡中支持集樣本數據的增加可為特征提取網絡提供更多的特征信息,提高診斷的準確率,5-way 1-shot 的實驗結果恰恰是樣本數據不足所造成的過擬合現象。

表3 5-way 5-shot 變工況軸承故障診斷結果Table 3 5-way 5-shot variable working conditions bearing fault diagnosis results

與ProNet 模型相比,加入注意力機制的ECAProNet 在診斷性能方面有著明顯提升;與其他三種模型相比,ECAProNet 的診斷性能亦表現較佳。 ECA 模塊的加入使改進后的特征提取網絡能夠關注到更多有用信息,在提升性能的同時并不增加模型的復雜程度,一定程度上保證了整體模型不會因為復雜度過高造成過擬合現象。

觀察5-way 1-shot 實驗結果可以發現,ProNet模型的診斷準確率低于其他四種模型,這是因為每類樣本數據只有1 組,導致度量空間中樣本特征向量的平均值即是抽樣樣本的特征向量,某工況下訓練好的故障分類模型無法準確對不同工況下測試樣本進行故障分類,在加入ECA 模塊后,診斷準確率則有明顯的提升。

4 結論

針對小樣本環境下的變工況軸承故障診斷,基于元學習和度量學習的思想提出了ECAProNet診斷算法。 通過加入ECA 模塊提升網絡模型的特征提取能力,得出更具代表性的類原型,提升診斷準確率。 在CWRU 軸承數據集上的實驗結果表明:在小樣本環境下,網絡模型存在過擬合問題;相較于原始的ProNet 算法,本文提出的ECAProNet 算法故障診斷準確率提升較為明顯,同時提高了模型在訓練時的泛化能力。

猜你喜歡
原型特征提取故障診斷
包裹的一切
基于Daubechies(dbN)的飛行器音頻特征提取
《哈姆雷特》的《圣經》敘事原型考證
Bagging RCSP腦電特征提取算法
論《西藏隱秘歲月》的原型復現
原型理論分析“門”
因果圖定性分析法及其在故障診斷中的應用
基于MED和循環域解調的多故障特征提取
基于LCD和排列熵的滾動軸承故障診斷
基于WPD-HHT的滾動軸承故障診斷
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合