?

基于預訓練GoogleNet模型和遷移學習的齒輪箱故障檢測方法*

2024-03-11 01:03楊魏華阮愛國黃國勇
機電工程 2024年2期
關鍵詞:齒輪箱分類工況

楊魏華,阮愛國,黃國勇

(1.昆明理工大學 民航與航空學院,云南 昆明 650500;2.文山苗族壯族自治州高級技工學校,云南 文山 663000;3.中國廣核新能源控股有限公司云南分公司,云南 昆明 650000)

0 引 言

在工業生產中,齒輪箱作為動力傳遞裝置,長期處在潤滑不良、載荷突變等惡劣工況下,致使齒輪工作表面容易發生磨損、裂紋、斷齒等故障,嚴重影響了動力傳遞系統的可靠性。齒輪箱出現故障也會造成巨大的損失。目前,齒輪箱的故障檢測方法主要有人工定期檢查、無損檢測、振動信號監測[1]等?;谡駝有盘柕臋z測方法在后期處理過程中具有技術上的優勢,因此逐漸成為旋轉件故障檢測的主流方式。

樊家偉等人[2]使用振動信號做快速傅里葉變換,然后將其用于長短期記憶網絡,對不同局部的齒輪箱進行了故障診斷;但該方法選用了部分頻段作為特征數據,易造成特征模糊等問題,無法對故障進行預判。包文杰等人[3]使用快速優化的短時傅里葉方法對行星齒輪進行了故障診斷,結果表明該方法得到的能量分布更為集中;但該方法未對信號進行去噪處理,在強噪音背景下具有一定的局限性。陳仁祥等人[4]針對工程數據難于滿足獨立同分布等問題,提出了一種深度置信網絡以用于齒輪箱故障診斷,并驗證了該方法的可行性;但該方法采用原始信號作為源域數據對模型進行訓練,訓練過程中存在人為調參量大的問題。SHAO Si-yu等人[5]提出了一種基于VGG-16模型與遷移學習的故障診斷方法,并將其用于齒輪箱故障診斷,結果表明該方法具有較高的識別率和更短的訓練時間;但該方法局限在于其使用的數據為原始數據,未進行必要的預處理。

院老虎等人[6]提出了一種AlexNet模型與遷移學習相結合的軸承故障分類方法,并證明了該方法在可用數據較少的情況下能達到較高的診斷精度;但該方法使用一維信號作為數據輸入,容易造成特征識別率低等問題。ZHANG Ma-Ping等人[7]提出了一種AlexNet模型與遷移學習相結合的方法,并在軸承故障診斷中進行了驗證。CAO Pei等人[8]提出了一種深度卷積網絡的遷移學習框架,此方法涵蓋了特征值的自動提取以及類別判斷的功能;但該方法使用原始信號作為輸入數據,在實際工作環境中,噪音含量較大,對特征提取影響較大。CHEN Ren-xiang等人[9]結合了卷積神經網絡(CNN)和離散小波變換,并將其用于齒輪箱故障診斷,結果表明該方法具有較高的精度;但該方法的主要局限在于需要大量數據對網絡進行訓練。王軍輝等人[10]針對遷移學習中源域和目標域分布差異問題,提出了動態域適應的軸承診斷方法,結果表明,該方法能有效提高跨域診斷精度;但該方法使用原始信號進行CWT變換,會造成小波尺度圖特征模糊。侯召國等人[11]提出了一種基于遷移學習與加權多通道融合的診斷方法,并在齒輪箱故障診斷中得以驗證;但該方法使用多通道融合數據預訓練網絡,對數據量的要求較高,實際工程中很難用于有效采集大量數據。劉飛等人[12]提出了遷移學習和深度殘差網絡的算法,將其用于滾動軸承,并取得了較高的精度;但該方法主要局限在于使用原始信號進行二維轉換,時頻圖含有干擾成分。

上述學者的研究表明,深度網絡用于故障診斷能夠較大程度提高診斷精度和診斷效率。

基于上述學者的研究成果以及研究中存在的問題,筆者提出對信號進行去噪處理,然后將其轉化為二維尺度圖用于網絡訓練,最后利用知識遷移的特點,把模型已經學到的知識用于新任務的處理。

1 信號預處理

若把齒輪箱看作一個系統,單位脈沖響應函數為k(t),則傳感器采集到的信號如下[13]:

(1)

式中:dj為齒輪故障沖擊強度系數;s(t)為齒輪箱實際沖擊信號;h(t)為其他分量信號;Tr為齒輪故障沖擊周期。

噪音摻雜于信號,易造成齒輪箱有用特征模糊等問題,導致神經網絡對故障特征識別率下降,為了突出故障的有用特征,增加網絡對故障特征的識別率,需要對信號進行去噪處理,去噪后故障特征更為突出,故筆者采用小波閾值去噪法對信號進行去噪處理。

信號去噪前后的二維尺度如圖1所示。

圖1 原信號與去噪信號尺度圖

由圖1(a)可知:原始信號中特征混雜,齒輪沖擊頻率沒有明顯的區分界限;通過圖1(b)可以發現,齒輪沖擊特征較為明顯,沒有多余的混雜成份。

1.1 小波閾值去噪

小波閾值去噪法是1992年JOHNSTONE和DON-OHO教授首次提出的[14-15]。

對于任意能量有限的信號,小波變換公式為:

(2)

式中:Wf(a,b)為小波系數;a為尺度因子,a≠0;b為平移因子,b∈R。

在信號空間L2(R)中,小波重構的逆變換公式如下[16]:

(3)

根據以上小波理論,選擇適合的小波基函數以及量化閾值,即可對信號進行分解與重構。筆者選用軟閾值進行量化處理,其表達式為:

(4)

為了說明該方法的可行性,筆者對原始信號及降噪信號在時域內進行了可視化處理,如圖2所示。

圖2 原始信號與去噪信號

由圖2(a)可以清楚發現:噪音摻雜于整個信號區間,難于區分有用信號成分;通過圖2(b)能清楚發現噪音部分已被過濾,只剩有用信號成分。

1.2 二維尺度圖獲取

一維信號轉變為二維圖片的方法較多,連續小波變換(CWT)因其能同時在時間域和頻率域刻畫原始信號被廣泛應用。

筆者選擇波形與齒輪箱沖擊特性較為接近的Morlet小波對信號進行二維尺度圖的轉化。

一維振動信號轉二維小波尺度圖流程如圖3所示。

圖3 振動信號轉小波尺度圖

由圖3可知:通過CWT能將一維信號轉變為二維小波尺度圖,且小波尺度圖能同時描述時間域和頻率域特征。

2 GoogleNet模型與遷移學習

2.1 遷移學習

遷移學習是指把先前已有的知識用于相近領域或任務的一種算法,是深度學習的一個子集。把學習知識的領域稱為源領域(source domain),待解決的領域稱為目標域(target domain),源域對應原任務,目標域對應目標任務。遷移學習中,只需要使用少量的標簽數據訓練微調后的網絡即可達到較好的分類效果,同時可以節省計算成本和訓練開銷。

遷移學習的定義為:

給定一個源域DS={xi,yi}(i=1,2……ns)和目標域DT={xj,yj}(j=1,2……NT),當遷移條件成立時,模型利用源域數據學得的知識去逼近一個目標域上的預測函數f(·),讓f(·)在目標域上達到最大的預測準確度。其表達式如下[17]:

(5)

式中:l(·,·)為預測誤差;f(·)為預測函數。

2.2 預訓練GoogleNet模型及微調

GoogleNet模型是基于大型圖像數據集ImageNet訓練的圖像分類網絡,其能夠對1 000個類別圖像進行分類。GoogleNet網絡模型包含了2個二維卷積層,9個inception模塊,2個最大池層和1個平均池化層。

模型具體結構參數(修改自文獻[18])如表1所示。

表1 GoogleNet網絡參數

GoogleNet模型中所有的激活函數均為ReLU函數,其表達式如下:

(6)

概率輸出函數為SoftMax函數,其表達式如式下:

(7)

式中:Pk為第k個類的概率值;j為類的總數。

平均池化、最大池化操作表達式如下[19]:

(8)

(9)

由表1可知:該模型第二個卷積層使用了更小的卷積核,同時使用了9個inception模塊和批量歸一化層(batch normalization, BN)以改善模型計算速度。但從零開始訓練模型對計算機算力以及數據量要求依然較高,訓練開銷依然較大,使用預訓練模型微調進行遷移學習可以很大程度改善上述問題。

筆者使用預訓練GoogleNet模型對其結構進行微調,然后將其用于齒輪箱故障分類任務,將GoogleNet模型的全連接層(Fc)、SoftMax層以及Output層輸出類別替換為和故障類別相對的節點數,模型剩余層參數保持不變。此時模型被分為保留層和更換層,在新模型訓練時,對保留層參數進行凍結,使用少量樣本訓練更換的新層即可。

圖4 基于GoogleNet的遷移學習診斷模型

由圖4可知:利用源域數據對模型進行預訓練,達到要求后保存模型參數,然后對預訓練模型進行微調,模型中保留層將被遷移至目標域,此時保留層參數保持不變,只需對更換層參數進行微調即可。

3 實驗驗證與分析

3.1 實驗數據說明

為驗證基于預訓練GoogleNet的遷移學習模型可行性,筆者使用平行齒輪箱數據和行星齒輪箱數據對其進行驗證。

其中,平行齒輪箱數據來自于昆明理工大學控制與優化重點實驗室。行星齒輪箱數據來自于東南大學齒輪箱公開數據。

平行齒輪箱數據采集于負載為0 N、2 N、4 N、6 N,四種不同工況下的斷齒(Miss)故障狀態和健康(Health)狀態數據,其中,采樣頻率為12 800 Hz,電機轉速為800 r/min。

行星齒輪箱數據采集于負載為0 V,采樣頻率為20 Hz,電機轉速為1 200 r/min,以及采樣頻率為30 Hz,電機轉速為1 800 r/min,負載為2 V的兩種工況數據。

其中包含的故障類型為5類,分別是齒缺損(Chipped)、斷齒(Miss)、齒根部磨損(Root)、齒面磨損(Surface)、正常(Health)[20-22]。

3.2 樣本集構建

為了保證有足夠的樣本用于模型的訓練,筆者采用滑窗切割信號進行樣本擴充。行星齒輪箱樣本按2 048個點分割,1 024個點為重疊度;平行齒輪箱樣本按1 926個點切割,963個點為重疊度。保證切割的每一個樣本覆蓋完整的齒輪運行周期。

由于教育教學督導和評價機制的主要目的是督促和引導教學良性發展,使教師的教學工作和學生的學習效果都有提升,所以,教育教學督導和評價機制的建立、發展和完善都與學校和學院的教學質量保障和建設息息相關。因此針對教師的教育教學督導和評價機制提出以下的改進辦法:

樣本擴充方法如圖5所示。

圖5 信號重疊采樣

由圖5可知:采用重疊采樣法能有效地擴充樣本數量,且50%重疊度能有效保證每個樣本覆蓋齒輪運行的完整周期,齒輪故障特征更為完整。

筆者按上述方法對不同工況下的信號進行CWT變換,行星齒輪箱0 V工況得到樣本5 000份,2 V工況得到樣本5 000份;平行齒輪箱6 N工況得到128份樣本。行星齒輪箱訓練集和測試集樣本按6 ∶4比例劃分,單工況獲得訓練樣本3 000份,測試樣本2 000份;平行齒輪箱按照5 ∶5比例劃分,單工況得到訓練樣本64份,測試樣本64份,如表2所示。

表2 樣本劃分

由表2可知:用于模型訓練的樣本數據較少,屬于典型的少樣本問題,該情況更能檢驗遷移學習模型在少樣本情況下的魯棒性。

3.3 實驗步驟與結果分析

筆者采用MATLAB深度網絡設計器搭建了模型,并完成了模型訓練,最后用測試集對模型進行了評估。具體的步驟如下:

1)加載預訓練GoogleNet模型;

2)對模型的低層實行凍結,對網絡高層進行微調,使神經元個數與故障類別對應;

3)將原具備1 000個分類的最后一個全連接和輸出層替換為新的5分類和2分類的全連接層和輸出層,并設置學習權重為10;

4)使用準備好的數據集對新層進行重新訓練,訓練過程中求解器選用Sgdm,初始學習率設置為10-3,批大小設置為100個,驗證頻率為10;

5)使用測試集對模型進行評估,繪制混淆矩陣。

3種工況的混淆矩陣如圖6所示。

圖6 3種工況混淆矩陣

根據處理得到的樣本數據,筆者共設置了3類不同工況,具體如下:

工況1。樣本數據來自電機轉速1 200 r/min,采樣頻率20 Hz,負載為0 V的工況,測試集分類結果如圖6(a)所示;

工況2。樣本數據來自電機轉速1 800 r/min,采樣頻率30 Hz,負載為2 V的工況,測試集分類結果如圖6(b)所示;

工況3。樣本數據來自電機轉速800 r/min,采樣頻率12.8 kHz,負載為6 N的工況,測試集分類結果如圖6(c)所示。

由圖6可知:模型在工況1和工況2中分類準確率未能達到100%,有少量樣本被錯誤分類;模型在工況3中的分類準確率達到了100%。

工況1、工況2中出現的誤分類問題,是相同超參設置情況下模型過度學習導致的。

3次分類準確率如表3所示。

表3 分類準確率

由表3可知:模型在3類工況下均取得較高的分類準確率,3次分類結果的均值高達97.40%,說明了TL對解決少樣本問題是有效的。

3.4 結果對比與分析

為了證明基于GoogleNet的遷移學習模型對于故障分類任務的優越性,筆者選用了部分診斷方法進行比較,其中包括1個含有2個二維卷積層的12層CNN模型,未經預訓練過的GoogleNet模型。

其比較結果如圖7所示。

圖7 分類精確度及訓練時間

由圖7(a)可知:基于預訓練GoogleNet的遷移學習模型在同類工況中的分類準確率高于其他兩類模型;從圖7(b)可知:基于預訓練GoogleNet的遷移學習模型在工況1和工況2中的訓練時間較少,具有較大優勢,僅為766 s和796 s;在工況3中,基于預訓練GoogleNet的遷移學習模型相比于未經預訓練的GoogleNet模型,訓練時間仍具有優勢,相比于12層CNN模型,訓練時間有所增加,這是12層CNN模型層數較少所導致的。

為了充分說明基于預訓練GoogleNet的遷移學習模型的優越性,筆者對圖7中3種CNN模型在3類不同工況下的準確率取均值,可視化數據分布結果如圖8所示。

圖8 3種CNN網絡分類結果

由圖8(a)分析可知:12層CNN模型對于不同故障類型的分類能力較差,圖中各種故障數據混雜,聚類度較低;由圖8(b)可知:大部分數據被網絡聚類分離,只有少部分數據混雜,證明該網絡具備較好的分類能力;由圖8(c)可知:多數數據被網絡聚類分離,只有少部分被錯分,而且被錯分的數量明顯少于圖8(b)中的數量,說明該網絡具備較好的分類能力。

通過上述分析可知:基于預訓練GoogleNet的遷移學習模型在齒輪箱故障分類問題中的精準度、訓練時間上,相比于其他方法更有優勢,而且能按照不同分類任務制定網絡輸出類別,在面對少量未知樣本的情況時,仍具有較高的分類精準率,這進一步說明了基于預訓練GoogleNet模型的遷移學習在故障診斷領域的可行性。

4 結束語

針對以往齒輪箱故障診斷中特征處理算法繁瑣的問題,筆者提出了一種基于預訓練GoogleNet模型和遷移學習的齒輪箱故障檢測方法,并利用東南大學齒輪箱數據集和昆明理工大學齒輪箱數據集對該方法進行了驗證。

研究結果表明:

1)相比于傳統的CNN網絡,基于預訓練GoogleNet的遷移學習方法在目標域樣本缺稀的情況下具有較高的故障分類能力,平均準確率高達97.40%;

2)相比于其他2種故障診斷方法,基于預訓練GoogleNet的遷移學習模型訓練時間較短(均值為766 s,遠低于12層CNN的1 296 s,以及未經預訓練GoogleNet模型的1 490 s),證明在節省訓練開銷和提高網絡精準度方面,微調預訓練模型實現遷移學習的方法是可行的;

3)在5分類問題中,模型準確率高達97.35%和97.40%,在2分類問題中,其分類準確率高達100%。這說明所提的微調模型高層的方法能根據目標任務分類情況個性化設置模型輸出,用于不同的分類任務;且微調模型后只用訓練模型更換層即可,能減少模型訓練開銷和超參試錯開銷,加快模型收斂,降低對計算機算力的要求。

筆者所提方法還存在一定的局限性,即當訓練樣本和測試樣本所在領域不同,且特征分布差異較大時,會導致故障識別率不穩定。因此,在后續的工作中,筆者將對上述存在的問題做進一步的研究。

猜你喜歡
齒輪箱分類工況
風電齒輪箱軸承用鋼100CrMnSi6-4的開發
熱網異常工況的辨識
分類算一算
不同工況下噴水推進泵內流性能研究
基于非負矩陣分解的高速列車走行部工況識別
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
提高齒輪箱式換檔機構可靠性的改進設計
杭州前進齒輪箱集團股份有限公司
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合