?

基于多粗粒度與注意力網絡的軸承剩余壽命預測

2021-11-12 02:10莫仁鵬司小勝李天梅胡昌華
中國測試 2021年10期
關鍵詞:尺度注意力卷積

莫仁鵬,司小勝,李天梅,朱 旭,胡昌華

(火箭軍工程大學導彈工程學院,陜西 西安 710025)

0 引 言

在生產活動中,機械設備的安全可靠運行至關重要,對生產效益和生產安全有著重大影響。但由于內部損耗和外部環境的影響,機械設備在長期運行過程中不可避免地會發生性能退化現象,當退化到一定程度會徹底失效,進而影響生產活動的正常進行。而軸承作為機械設備的支撐部件,其退化現象尤為明顯,因此有必要對軸承進行剩余使用壽命(remaining useful life,RUL)預測,實時掌握其健康狀況,并進行適當的維修或替換,從而避免機械設備突然失效、對生產活動造成不必要的破壞。

目前流行的RUL預測方法主要包括統計數據驅動方法[1-3]和深度學習方法,但統計數據方法的預測效果受限于模型的選擇是否合適,而深度學習方法具有對大數據和非線性信息的強大處理能力,且不需要復雜的先驗知識,因此基于深度學習的RUL預測方法引起了廣大研究者的關注[4]。Ambadekar等[5]以顯微鏡觀察刀具的磨損情況并進行拍照,再將這些照片輸入到卷積神經網絡(convolutional neural network,CNN)中提取刀具的退化特征并進行RUL預測;Deutsch等[6]以深度置信網絡學習得到具有代表性的健康指標,再基于前饋神經網絡(feedforward neural network,FNN)預測 RUL,通過齒輪實例和軸承實例對所提方法進行了驗證;Hinchi等[7]首先利用CNN網絡提取局部特征,再引入長短期記憶網絡捕獲退化過程并預測軸承的RUL。

以上深度學習方法僅在單一尺度上學習機械信號的退化信息,沒有考慮到機械信號所蘊含的退化信息往往分布在多個時間尺度上[8]。鑒于此,本文提出一種可以自動提取多尺度退化特征的RUL預測方法,所提方法通過對軸承的原始振動信號進行多粗粒度操作獲得多尺度信號,再基于CNN網絡進行深層特征提取與融合,并引入注意力機制進行特征重標定,以強化對RUL預測任務貢獻度更大的特征,最后利用FNN網絡映射得到軸承的RUL預測值。

1 基于多粗粒度與注意力網絡的軸承RUL預測方法

本文所提方法的整體網絡結構如圖1所示,主要包括多尺度粗粒度層、多尺度特征融合層、注意力加權層以及RUL預測層。

圖1 本文方法的整體網絡結構

1.1 多尺度粗粒度層

對機械設備的振動信號進行多尺度粗粒度處理得到的多尺度特征,能更全面地表征機械設備的健康狀態[9-11]。因此首先采用多尺度粗粒度層處理軸承振動數據,具體過程如圖2所示。

圖2 多粗粒度處理

設傳感器對軸承監測得到的某樣本數據為x={x1,···,xi,···,xN},其中xi為第i個振動數值,N為樣本數據的長度。對振動信號進行多粗粒度處理,即分別以不同尺度的滑動窗在該振動信號上無重疊地移動,然后分別計算每個窗口內的均值作為新的信號數據,從而獲得蘊含更豐富退化信息的多尺度信號,公式如下:

其中 τ為滑動窗尺度即粗粒度,本文使用了1、2、4三個粗粒度,粗粒度1即為原始振動信號,粗粒度2處理過后的信號長度為原信號的一半,粗粒度4處理過后的信號長度為原信號的1/4。在網絡中,以多個尺寸的池化層來實現多尺度信號的自動提取。

1.2 多尺度特征融合層

CNN網絡主要包括卷積層和池化層,卷積層的卷積操作可以很好捕捉到軸承監測數據的非線性退化信息,卷積層的計算公式如下:

?——卷積運算;

W——卷積核權重;

b——偏置;

σ(·)——非線性激活函數,通常選擇為修正線

性單元(rectified linear unit,ReLU)。

本文采用大步幅的卷積層代替池化層進行特征壓縮,可以降低網絡的整體參數量,并提高預測模型的計算效率。不同粗粒度處理得到的多尺度信號長度不一致,因此在利用多個大步幅卷積層分別學習每個尺度信號的深層特征時,不同尺度對應的步幅組合亦有所不同,最終要確保三個尺度的深層特征在進行拼接時保持長度統一。此外,在本文中,將不同尺度的深層特征簡單拼接后得到合并特征,再將其輸入到一個公共的卷積層中進行融合,以學習不同尺度特征之間的潛在關系。

1.3 注意力加權層

本文在預測網絡中引入改進的卷積注意力模塊(convolutional block attention module,CBAM)[12]對深層特征進行特征重標定,CBAM包括通道注意力和空間注意力,分別在通道維度和空間維度上加強重要特征并抑制相對不重要的特征。傳統的CBAM先以通道注意力強化重要通道,之后再以空間注意力為補充,為不同的空間位置賦予最佳權重。但考慮到軸承原始振動信號為一維時序數據,因此本文先使用空間注意力進行權重分配,再以通道注意力作為補充,避免通道注意力加權之后破壞時序結構,影響空間注意力的效果。改進的CBAM模塊如圖3所示。

圖3 改進的CBAM模塊

設待標定的深層特征為F,計算其空間注意力權重Ms(F),將該權重與F相乘得到加權后的特征F1;再針對F1計算得到相應的通道注意力權重Mc(F1),并與F1相乘得到最終的加權特征F2,計算公式如下:

其中 ⊙表示逐元素相乘。

空間注意力Ms(F)與通道注意力Mc(F1)的計算公式如下:

式中:conv——單核卷積層;

MLP— —單共享參數的三層感知器,兩端的感知器神經元個數與通道數相等,中間層感知器神經元個數為:通道數/壓縮率,這種瓶頸結構能有效減少模塊參數量;

GAP和GMP— —單全局平均池化和全局最大池化,用來壓縮通道信息或空間信息為一個表示符,以表征對應通道或空間所包含的退化信息量;

δ(·)——sigmoid激活函數。

1.4 剩余壽命預測

最后,將經注意力重標定的特征輸入到FNN網絡中進行RUL預測。FNN網絡由多個全連接層組成,并且最后一個全連接層的神經元個數為1,如此便可映射得到一個單值數據,即為RUL預測值。全連接層的計算公式如下:

D——第l層的神經元總數;

Wi,j——兩個神經元之間{的連接權重。}

設某軸承振動信號為X=X1,···,Xj,···,XV,Xj為第j個樣本的數據,V為樣本總數。將每個樣本數據輸入到預測網絡中,經過多尺度粗粒度層、多尺度特征融合層、注意力加權層以及全連接層后,最終得到該樣本對應的RUL預測值。

在訓練網絡時,以預測值和真實值的均方誤差作為損失函數,并通過誤差反向傳播算法更新網絡參數,以逐漸最小化損失函數、減少預測誤差。經過多次訓練后,損失函數將降低到很小的程度,此時網絡能較好地捕捉到樣本數據到RUL真實值之間的映射關系。當輸入新的樣本數據到訓練好的網絡中,便可準確地預測出當前的RUL值。

2 實驗驗證

2.1 實驗數據

采用FEMTO-st研究所的PRONOSTIA軸承數據集[13]來驗證所提方法的有效性。該軸承數據集的振動信號通過在加速度傳感器上采樣獲得,采樣間隔為10 s,每個采樣點內有2560個數值。包含了3個工況下的17個軸承的全壽命振動信號,監測了每個軸承由正常狀態退化至失效的振動加速度值,在這個過程中,振動加速度值逐漸增大。

本文選用工況1的7個軸承進行實驗,每個軸承隨機選取70%的采樣點作為訓練集樣本,其余30%的采樣點作為測試集樣本。利用訓練集訓練好網絡模型后,將測試集數據輸入到網絡中得到RUL預測值,以測試集RUL預測值和對應RUL真實值之間的均方根誤差(RMSE)作為評價指標來評估所提方法的預測性能。

為了降低網絡訓練難度,對軸承每個采樣點的RUL值進行歸一化處理。例如軸承1-1一共包含2803個采樣點,其全壽命為 28030 s,則在第 2000 個采樣點對應的RUL為8030 s,對其進行歸一化得到:RUL2000=8 030/28 030≈0.286 5。

2.2 實驗設置

經過多次實驗,網絡超參數設置如表1時,所提方法會取得較好的預測效果。其余的實驗設置如下:優化器為Adam,學習率為0.001,共訓練30次。此外本文的實驗環境為:Tensorflow2.0,keras2.3.1,python3.6。

表1 網絡超參數

2.3 分析實驗

在CBAM模塊中,多層感知器的中間層壓縮率ratio的大小決定了該模塊的參數量,ratio越大則參數量越小,但過大的ratio可能會影響RUL的預測精度,為了在盡可能地減小模型參數規模的同時保證網絡的預測精度,對ratio的選擇進行了相關實驗。

分別觀察不同ratio情況下網絡對軸承1-1的預測效果,此外,去除CBAM模塊(MScale)、既無CBAM模塊又不采用多尺度粗粒度策略(SScale)亦作為對照組參與實驗,以驗證注意力機制和多尺度策略對RUL預測任務的有效性。實驗結果如表2所示。

表2 分析實驗

由表2可以發現,ratio=16時網絡的預測效果最好,且CBAM模塊的參數規模亦比較輕量,當ratio繼續增加時,模塊參數的減少量不大,且預測效果反而下降,因此最終選擇16作為CBAM模塊的壓縮率。此外,無論ratio取何值,含有CBAM模塊的網絡皆比MScale網絡的預測效果要好,這說明在預測網絡中引入了改進的CBAM模塊后,注意力機制能根據對RUL任務的貢獻度大小,自適應的為深層退化特征分配最佳權重,從而提高RUL預測精度;而MScale網絡的預測效果又要強于SScale網絡,驗證了多尺度粗粒度策略可以從軸承原始振動信號中提取更豐富的退化信息,有利于RUL預測任務的進行。

確定網絡超參數后,基于所提方法對軸承1-1、1-2的測試集進行RUL預測,結果如圖4所示。

圖4 所提方法對測試集的RUL預測結果

在軸承1-1和軸承1-2測試集上的RUL預測值與真實值較為接近,反映了訓練好的預測網絡能較好地捕捉到采樣點數據和對應RUL之間的關系,驗證了所提方法的有效性。

2.4 對比實驗

分別以深度神經網絡(DNN)[14]、卷積神經網絡(CNN)[15]以及無注意力機制的多尺度粗粒度方法(MScale)對工況1的7個軸承進行RUL預測,并與本文方法進行對比。對比方法的實驗條件與本文保持一致,同樣隨機劃分每個軸承的70%采樣點作為訓練集,其余采樣點作為測試集。實驗結果(RMSE)如表3所示。

表3 不同網絡在測試集上的RMSE

由于CNN網絡的特征提取能力要強于DNN網絡,因此CNN網絡的預測效果比DNN網絡更好;而MScale網絡的預測效果又優于CNN網絡,這體現了多尺度粗粒度操作獲得的多尺度特征,可以捕獲更多的軸承退化信息,從而提高網絡對軸承的RUL預測準確度;最后,本文方法在所有軸承上皆表現出了最佳的預測性能,驗證了本文方法在對軸承進行RUL預測時的優越性。

3 結束語

考慮到機械信號往往分布在多個時間尺度上,本文采用多粗粒度操作處理軸承的原始振動信號,以獲得的多尺度信號蘊含更豐富的退化信息。此外,由于網絡深層特征中的不同通道(不同空間)對RUL預測任務的貢獻度不一致,在預測網絡中引入改進的CBAM注意力模塊對深層特征進行特征重標定,以增強重要特征并抑制無效特征?;赑RONOSTIA軸承數據進行了分析實驗和對比實驗,實驗結果表明,所提方法能較好地捕捉到監測數據和RUL值之間的映射關系,且多尺度粗粒度策略和注意力機制可以有效提高軸承的RUL預測精度,與其他網絡的對比實驗表明,所提方法具有更佳的預測性能。

猜你喜歡
尺度注意力卷積
讓注意力“飛”回來
基于3D-Winograd的快速卷積算法設計及FPGA實現
財產的五大尺度和五重應對
從濾波器理解卷積
基于傅里葉域卷積表示的目標跟蹤算法
“揚眼”APP:讓注意力“變現”
A Beautiful Way Of Looking At Things
宇宙的尺度
9
一種基于卷積神經網絡的性別識別方法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合