基于改進一維卷積神經網絡的滾動軸承故障診斷分析

2023-09-18 14:18董子健王樹民張金營陳建奇

機械設計與研究 2023年3期

程亮, 董子健, 王樹民, 張金營, 陳建奇

(1.邯鄲學院機電學院,河北邯鄲 056005,E-mail:chengliang6779@163.com; 2.華北電力大學控制與計算機工程學院,河北保定 071003; 3.國家能源投資集團有限責任公司,北京 100011)

滾動軸承作為智能設備、高端制造裝備、先進軌道交通、船舶裝備等領域的基礎和關鍵部件,其工作狀態直接影響到整個旋轉機械設備的工作狀態[1]。滾動軸承一旦發生故障,輕者造成整個機械設備停擺,重者造成重大經濟損失[2],因此對滾動軸承故障診斷方法研究十分必要。近年來,隨著機器學習理論不斷推進,智能故障診斷已成為滾動軸承故障診斷研究的重要環節。Chen等[3]從原始時域振動信號中提取4個頻域特征和12個時域特征輸入堆疊稀疏自動編碼器(SSAE)實現特征融合,用深度置信網絡(DBN) 實現軸承故障診斷;Liu等[4]使用長短期記憶神經網絡(LSTM)對原始時域振動信號進行特征提取,用于滾動軸承故障診斷;Chen等[5]將離散小波變換與卷積神經網絡用于行星齒輪箱故障診斷;金棋等[6]將多個堆棧降噪自編碼器提取齒輪箱振動故障特征來實現齒輪箱故障診斷;Xia等[7]將淺層學習機與深度神經網絡結合的方法構建滾動軸承故障智能診斷模型。張西寧等[8]提出了一種基于深度卷積自編碼網絡的滾動軸承故障診斷模型;Zhao 等[9]將度卷積神經網絡和同步壓縮變換相結合,可以有效地避免滾動軸承故障的漏診和誤診;卞景藝等[10]在一維深度卷積神經網絡基礎上構建多尺度一維深度卷積神經網絡進行滾動軸承故障診斷;仝鈺等[11]利用格拉姆角差域對采集到的滾動軸承振動信號進行編碼,然后進行滾動軸承故障特征的提取與分類。以上方法由于維度變換損失了部分時序信息沒有發揮卷積神經網絡強大的滾動軸承故障特征提取能力。

因此本文提出基于改進樽海鞘群算法優化CBAM-1DCNN結構參數的滾動軸承故障診斷模型。將一維卷積神經網絡與自注意力機制相結合,利用注意力機制合理分配通道,有效提取重要滾動軸承故障特征;在1DCNN中添加BN層,提高網絡學習速率和滾動軸承故障診斷效率。為避免人工選擇CBAM-1DCNN結構參數導致滾動軸承故障診斷模型識別準確率下降的問題,利用改進樽海鞘群算法對CBAM-1DCNN結構參數進行優化。

1 基本原理

1.1 一維卷積神經網絡

卷積神經網絡通常包括卷積層、池化層和全連接層,網絡結構如圖1所示。

▲圖1 卷積神經網絡結構圖

本文所采用的一維卷積神經網絡(1DCNN)在對一維時序序列采用一維卷積進行特征提取[12],一維卷積為:

(1)

最大池化為[13]:

(2)

1.2 批量歸一化層

為提高滾動軸承故障診斷模型訓練速度降低過擬合風險,在一維卷積神經網絡卷積層后添加批量歸一化層(BN)。批量歸一化步驟如下所示:

(1) 計算每個維度均值

(3)

式中:μβ為維度均值。

(2) 計算每個維度方差

(4)

(3) 對每一維數據進行歸一化

(5)

(4) 進行平移和放縮處理

在BN層中引入γ和β兩個學習參數

(6)

1.3 注意力機制模塊

一維卷積神經網絡在卷積池化過程中認為每個滾動軸承故障特征通道同等重要,但實際中每個滾動軸承故障特征所承載的信息重要性不同,簡單認為每個故障特征通道相同缺乏合理性。因此在BN層后加入注意力機制模塊(CBAM),將注意力放在重要區域而忽略不重要信息,以提高故障診斷準確率[14]。CBAM給每個滾動軸承故障特征信息分配不同權重,權重越小則故障特征信息重要性越低。CBAM包含兩個獨立子模塊:通道注意力模塊和空間注意力模塊,CBAM通道注意力模塊結構如圖2所示。

▲圖2 CBAM結構圖

通道注意力模塊將輸入的滾動軸承故障特征通過平均池化和最大池化得到相應的滾動軸承故障特征;相應的軸承故障特征通過多層感知層得到兩個滾動軸承故障特征向量;兩個滾動軸承故障特征向量元素逐個相加通過激活操作得到相應的滾動軸承故障通道注意力特征。通道注意力模塊工作原理如圖3所示。

▲圖3 通道注意力模塊

空間注意力模塊將上述的滾動軸承故障通道注意力特征進行平均池化和最大池化操作得到兩個滾動軸承故障特征;將上述兩個滾動軸承故障特征通道拼接后,經過卷積操作和激活操作與輸入的滾動軸承故障特征相乘,得到所需的特征?？臻g注意力模塊工作原理如圖4所示。

▲圖4 空間注意力模塊

1.4 基于CBAM-1DCNN的滾動軸承故障診斷模型

本文構建基于改進樽海鞘群算法優化CBAM-1DCNN結構參數的滾動軸承故障診斷模型,模型結構如圖5所示,模型主要由輸入層、卷積層、BN層、CBAM、池化層和全連接層構成。卷積層提取輸入層的不同滾動軸承故障特征后,通過修正線性單元增加網絡稀疏性避免出現過擬合現象;BN層可有效提高滾動軸承故障診斷模型訓練速度降低過擬合風險;CBAM合理分配通道,有效選擇提取重要滾動軸承故障特征;池化層優化工作量,降低滾動軸承故障診斷模型參數量;全連接層連接所有滾動軸承故障特征,將診斷結果送入分類器進行分類。

▲圖5 CBAM-1DCNN模型結構圖

2 基于ISSA優化CBAM-1DCNN結構參數設計

2.1 樽海鞘群算法

樽海鞘群算法 (SSA)根據海洋生物樽海鞘群的鏈式覓食行為提出的算法。相對其他群體智能算法,樽海鞘群算法具有設置參數少的優點[15]。

設定m維位置矩陣D,樽海鞘群個體分布在位置矩陣D中,表示如下:

(7)

則第一個樽海鞘個體位置更新為:

(8)

式中:ubj和ubj分別為j維搜索空間上限和下限;c2和c3為[0,1]之間隨機因子,其中c2決定第一個樽海鞘個體位置更新步長,c3決定第一個樽海鞘個體位置更新方向。

參數c1用來平衡算法局部搜索與全局開發能力,參數c1為:

(9)

追隨者位置更新由前一個樽海鞘位置和自身位置決定,更新后位置為:

(10)

2.2 改進的樽海鞘群算法

由公式(10)可知當追隨者位置更新完全取決于前一個樽海鞘位置,如果前一個樽海鞘陷入局部最優,就會導致整個樽海鞘群體陷入局部最優。因此,為提高樽海鞘群算法的泛化能力和適用性,本文從加入突變和加入信賴機制兩個方面進行優化,提出改進的樽海鞘群算法 (ISSA)[16]。

(1) 加入突變

為防止整個樽海鞘群體陷入局部最優,在每一次位置迭代過程中個體位置更新都可能發生突變,從突變發生概率和突變程度兩個層面進行描述。

① 位置突變概率符合卡方分布概率密度函數,表示為:

(11)

式中:L′為當前迭代次數;n為自由度。

② 位置突變程度取決于迭代次數和自身位置,表示為:

(12)

(2) 加入信賴機制

在個體位置更新前期,追隨者對前個體位置不夠信賴,自己也會去探索食物位置。因此在式(10)中加入能力限制算子ν和食物位置Fj,其權重會隨著迭代次數增加而減小,即樽海鞘群體隨著時間增加越來越信賴對方,這樣可以有效防止樽海鞘群算法陷入局部尋優,具體修改如下[17]:

(13)

式中:p和q為[0,1]之間隨機因子;ω為變化速度;ν為能力限制算子;Fj為食物位置。

引入(1-p)和(1-q)可以有效防止隨機因子過大或過小導致樽海鞘群算法偏離全局最優。

2.3 基于ISSA優化CBAM-1DCNN故障診斷模型

CBAM-1DCNN故障診斷模型結構復雜,僅依靠隨機設定CBAM-1DCNN網絡結構參數的方式極易陷入局部最優。因此采用基于改進樽海鞘群算法優化CBAM-1DCNN結構參數的滾動軸承故障診斷模型,即訓練批量大小Batch和學習率η∈[0,1),卷積層卷積核個數f1、f2和大小k1、k2。ISSA優化CBAM-1DCNN故障診斷流程如圖6所示。

▲圖6 ISSA優化CBAM-1DCNN故障診斷流程圖

3 實驗研究

3.1 實驗數據

本文選用美國凱斯西儲大學軸承數據開展研究,被診斷軸承有三種缺陷:滾動體故障、內圈故障和外圈故障。本文數據集共4 000個,1種正常數據和3種上述類型故障數據,標簽分別按照0～3順序命名,具體設置如表1所示。

表1 滾動軸承故障類型

由于滾動軸承振動信號存在噪聲、奇異樣本情況,且幅值不確定在[0,1]之間,因此對數據采用離差歸一化方法處理。

(14)

3.2 網絡結構及參數設置

本文構建的CBAM-1DCNN網絡結構如圖5所示,基于ISSA優化CBAM-1DCNN結構參數如表2所示。

表2 CBAM-1DCNN結構參數

3.3 實驗結果及分析

ISSA優化CBAM-1DCNN結構參數的滾動軸承故障診斷模型訓練過程中迭代次數為500,通過ISSA對CBAM-1DCNN結構參數尋優,圖7為診斷模型在訓練過程中準確率和損失值變化曲線。由圖7可以看出,在訓練次數達到300次左右,準確率達到99.12%、損失值降到0.08,利用ISSA優化CBAM-1DCNN滾動軸承故障診斷模型趨于穩定。

▲圖7 診斷模型準確率和損失值變化曲線

▲圖8 滾動軸承故障分類混淆矩陣

為進一步評估ISSA優化CBAM-1DCNN結構參數的滾動軸承故障診斷模型泛化能力,將測試樣本輸入到訓練好的CBAM-1DCNN滾動軸承故障診斷模型,并將結果以混淆矩陣表示?？v軸數據表示真實滾動軸承故障類型編號,橫軸數據表示診斷滾動軸承故障類型編號,如圖8所示。由圖8可知,軸承正常識別率達到100%,滾動體損傷識別率較高為99%。四種滾動軸承故障平均準確率為98%,說明ISSA優化CBAM-1DCNN結構參數的滾動軸承故障診斷模型具有良好的泛化能力。

為進一步驗證CBAM-1DCNN模型對于滾動軸承故障診斷的效果,本文將其與學者趙敬姣等提出的基于殘差連接的1DCNN(RC-1DCNN)滾動軸承故障診斷模型進行對比實驗研究[18]。2種模型訓練過程中的準確率和損失值對比曲線如圖9、圖10所示。由圖9、圖10可以看出CBAM-1DCNN模型比RC-1DCNN模型具有更高的準確率、更低的損失值。由于CBAM-1DCNN模型在BN層后加入CBAM模塊,診斷模型因此將注意力放在重要區域而忽略不重要信息,有效提高故障滾動軸承故障診斷準確率。而RC-1DCNN模型在提取更多滾動軸承故障特征同時也提取更多干擾,因此RC-1DCNN模型在整個訓練過程中準確率和損失函數存在較大的波動,而且龐大的計算量也增加了訓練次數。表3為2種故障診斷模型在訓練過程趨于穩定時,準確率最大值以及所需的訓練次數和損失值。

表3 2種故障診斷模型對比

▲圖9 訓練正確率變化對比曲線

▲圖10 訓練損失值變化對比曲線

由表3可知,CBAM-1DCNN模型在訓練過程中準確率和損失值均優于RC-1DCNN模型。

4 結論

(1) 針對滾動軸承故障診斷,本文提出基于注意力機制和一維卷積神經網絡的故障診斷模型。為加速網絡收斂在1DCNN網絡中添加BN層,提高網絡學習速率和滾動軸承故障診斷效率,有效避免出現過擬合現象的風險;1DCNN網絡與自注意力機制相結合,利用自注意力機制合理分配通道,有效選擇提取重要滾動軸承故障特征。

(2) 提出利用改進樽海鞘群算法優化CBAM-1DCNN結構參數的滾動軸承故障診斷模型,有效提高滾動軸承故障診斷準確率同時又減少診斷模型訓練次數。

(3) 通過系列實驗表明:CBAM-1DCNN網絡具有更高的準確率、更低的損失值和更穩定的訓練過程;經改進樽海鞘群算法優化的CBAM-1DCNN滾動軸承故障診斷模型,在較少的訓練次數下達到更高的準確率。

本文選用美國凱斯西儲大學軸承數據對滾動軸承故障診斷模型進行分析,論文下一步工作將利用自測數據開展工程實踐研究,提高本文所提出的基于ISSA優化CBAM-1DCNN滾動軸承故障診斷模型的實際工程應用價值。