?

基于EMD 和改進TCN 的滾動軸承剩余壽命預測方法

2024-01-03 12:04李孝忠
天津科技大學學報 2023年6期
關鍵詞:殘差分量卷積

胡 勇,李孝忠

(天津科技大學人工智能學院,天津 300457)

隨著工業技術的發展,現代機械設備正朝著大型化、綜合化、復雜化的方向發展[1]。滾動軸承作為旋轉機械中的重要零部件,廣泛應用于工業設備中。工業機械設備在長期運行的過程中可能受過載、沖擊等的影響,出現磨損、疲勞等一系列故障問題是不可避免的,更為嚴重的是這些故障會加速軸承的退化,對機械設備的安全可靠運行產生嚴重影響[2]。因此,如何有效地監測機器設備的運行狀況和健康狀態以及準確預測其重要零部件的剩余使用壽命(remaining useful life,RUL)是當前的研究熱點[3]。

Lei 等[3]將RUL 預測方法按照其基本技術和方法分為以下4 類,即基于物理模型驅動的方法、基于統計模型驅動的方法、基于深度學習的人工智能方法和混合方法。首先,基于物理模型驅動的方法比較依賴于專家知識,只有在充分了解故障機理后才能建立反映機械系統或零部件的退化行為的數學模型。其次,基于統計學模型驅動的方法一般需要較為理想的假設條件,且在非線性轉換到線性過程中存在信息丟失的風險[4]?;谏疃葘W習的人工智能方法具有很強的特征映射能力,能有效地克服上述問題[3]。Wang等[5]采用深度可分離卷積網絡(deep separable convolution network,DSCN)從軸承的原始振動信號中自動構造深度特征表示,用于軸承的RUL 預測。陳保家等[6]采用堆棧降噪自編碼對經過短時傅里葉變換(short-time Fourier transform,STFT)后原始特征集進行深度特征提取,然后將得到的深度特征輸入基于注意力機制的時間卷積網絡(temporal convolutional network,TCN)進行軸承的RUL 預測。由于上述方法只對單一尺度的特征進行提取,還缺乏對不同時間尺度的局部特征進行提取,所以無法避免某些重要的信息被忽略。莫仁鵬等[2]使用注意力模塊自適應地給原始多尺度特征集分配權重,然后通過卷積神經網絡(convolutional neural network,CNN)模塊進行深層特征提取與多尺度特征融合,最后通過前饋神經網絡(feedforward neural network,FNN)模塊映射得到RUL 預測,但該方法不利于非平穩和非線性信號數據的處理。周哲韜等[7]采用三角函數變換與累積變換對輸入特征進行修正,然后輸入Transformer 模型進行軸承的RUL 預測,但是其結構復雜,并且需要對原始數據進行位置編碼才能保持記憶能力,這就有可能對輸入特征造成破壞,甚至影響模型對退化敏感特征的提取。張繼冬等[8]將原始振動信號輸入全卷積網絡,得到原始的軸承壽命預測曲線,然后利用加權平均方法對預測結果進行降噪處理,得到最終的軸承RUL 預測結果,但其難以利用時序數據的內在信息,缺乏數據特征間的關聯性。

近年來,伴隨著廣大科研人員對長短期記憶網絡(long short term memory,LSTM)、TCN[9]和注意力機制[10]模型的不斷深入研究,驗證了它們在時間序列預測領域的強大功能。這也為軸承的RUL 預測提供了可靠的模型方法。LSTM 雖然具有較好的記憶能力,但是其參數量大且通常難以進行并行處理。傳統TCN 的靈感來源于LSTM 的記憶特點,具有像CNN的特征抽取能力,能很好地從多個維度提取原始信號的潛在特征。因此,本文提出一種基于經驗模態分解(empirical mode decomposition,EMD)分量統計特征和TCN 改進模型的滾動軸承RUL 預測方法。它不僅可以從原始信號中提取更多的可識別特征,而且能保證在不同時間尺度上的局部特征被高效利用。首先對軸承原始振動信號進行5 層EMD,得到5 個固有模態函數(intrinsic mode function,IMF)和1 個殘差分量;然后計算這6 個分量的時域統計特征、三角函數特征以及能量和香農熵作為輸入特征集;最后將這些特征作為TCN 模型的輸入進行壽命預測。在相同網絡層數和神經元的情況下,TCN 所需參數更少,模型收斂速度更快。

1 基本理論

1.1 經驗模態分解

經驗模態分解(EMD)是一種自適應數據處理方法[11]。它在處理非平穩和非線性數據方面具有明顯的優勢[12]。EMD 的基本思想主要在于能夠將復雜的原始信號分解為一組獨立的、近周期的固有模態函數(IMF)。其中,IMF 必須滿足以下條件:IMF 的零點和極值點的數目必須相等,或二者之差不超過1;分別由IMF 局部極大值和極小值構成的上下包絡線,二者在任意時刻的均值為0[13]。

對于給定的原始時間序列信號 x ( t ),其EMD 過程如下:

(1)找出 x ( t )局部極大值和極小值點,利用三次樣條插值法分別對極大值點和極小值點序列進行擬合,得到上包絡線和下包絡線。對上下包絡線取平均值,得到 m1(t ) 。

(2)計算原始時間序列數據 x ( t )與平均包絡線m1( t )之差 p1( t ),即

(3)若 p1( t )滿足IMF 分量的條件,則為第1 個IMF 分量;否則,將 p1( t )作為新的原始時間序列數據重復步驟(1)和步驟(2),直到滿足IMF 分量的條件為止。

(4)在得到第1 個IMF 分量 p1( t )后,將其從原始時間序列 x ( t )中分解出來,得到殘差分量 u1( t ),即

(5)將殘差分量 u1( t )作為新的數據輸入,重新執行步驟(1)—步驟(5),獲得新的殘差分量 u2( t )以及第2 個IMF 分量 p2( t )。以此類推,直到第k 個IMF分量 pk( t )的殘差分量 uk( t )為常數或者單調函數,不能再分解,整個EMD 過程完成。此時,原始時間序列 x ( t )可表示為

式中:uk( t )可看作是 x ( t )的趨勢或者均值;q1( t ),q2( t ),…,qk( t )為 x ( t )的IMF 分量,代表了原始時間序列數據的高頻分量到低頻分量。

1.2 時間卷積網絡

時間卷積網絡(TCN)是一種具有殘差結構、能夠處理時間序列的卷積神經網絡[9]。TCN 與卷積神經網絡(CNN)的主要區別在于擴展卷積與因果卷積。TCN 中的擴張卷積可以理解為,對于一維序列輸入, 假 設 卷 積 核 f={0 ,1,… , z - 1}→R,則時間序列元素s 的擴展卷積運算F 定義為

其中:d 為膨脹因子,k 為卷積核的大小,s - d ·i 表示過去的方向。

TCN 網絡由若干個殘差塊堆疊而成。TCN 基本結構如圖1 所示,其基本的殘差塊包含兩個相同的內部小單元和一個可選的殘差連接,其中每一個內部小單元從網絡底層到頂層依次為擴張因果卷積層、歸一化層、激活函數、Dropout 層。

圖1 TCN基本結構Fig.1 TCN basic structure

對于歸一化層默認選用批歸一化(batch normalization,BN)或者采用原始的權重歸一化(weights normalization,WN),但也可以采用層歸一化(layer normalization,LN)、組歸一化(group normalization,GN)等。激活函數一般默認采用非線性激活函數,如修正線性單元(ReLU)、指數線性單元(ELU)、帶泄露的修正線性單元(Leaky ReLU)等。本文對原本的TCN 殘差塊進行微小改進,歸一化層采用GN,激活函數采用ELU。

2 本文方法

2.1 分量統計特征提取

滾動軸承常用的狀態監測數據包含振動信號、溫度以及聲波信號,其中振動信號因包含了軸承大量有用的特征信息而被廣泛研究。本文也采用振動信號進行軸承的RUL 預測。首先,采用EMD 對原始振動信號進行5 層分解,得到5 個IMF 分量和1 個殘差分量;然后對這6 個時間序列的時域統計特征、三角函數特征以及能量和香農熵進行計算,得到66 維數據作為軸承RUL 預測的原始特征集。

2.2 滾動軸承RUL預測流程

基于EMD 和TCN 模型的滾動軸承RUL 流程如圖2 所示。

圖2 基于EMD和TCN模型的滾動軸承RUL流程Fig.2 RUL process of rolling bearing based on EMD and TCN model

滾動軸承RUL 預測流程的具體步驟為:

(1)EMD:首先采用EMD 對原始振動信號進行5 層分解,得到5 個IMF 分量和1 個殘差分量。

(2)特征提?。焊鶕盘柼幚碇谐R姷臒o量綱統計特征計算公式,計算6 個分量的11 個統計特征,得到66 維原始特征集。

(3)TCN 模型構建:將訓練集的特征進行最大和最小歸一化作為TCN 模型的輸入,將訓練集歸一化壽命值P(當前時間周期對應的真實剩余壽命值與全壽命周期對應的全壽命值之間的比值)作為訓練集標簽,以均方誤差(mean square error,MSE)作為模型的損失函數,用Adam 優化算法進行模型訓練,同時從訓練集樣本中隨機劃分15%數據作為驗證集,以增加TCN 模型的泛化能力。

(4)測試集驗證:將測試集的66 維特征輸入已經訓練好的TCN 模型中,預測測試集特征對應的歸一化壽命值P。

3 實 驗

3.1 數據集

為了驗證本文方法的有效性,采用PHM 2012 數據挑戰賽中提供的FEMTO-ST 滾動軸承全壽命數據集進行模型驗證。PHM 2012 數據集工況信息見表1。

表1 PHM 2012數據集工況信息Tab.1 Operating condition of PHM 2012 dataset

該數據集由PRONOSTIA 實驗平臺采集獲得(圖3),它通過加速度傳感器和力矩傳感器實現了3 種不同工況下的滾動軸承加速退化實驗[14]。利用加速度傳感器采集水平方向和垂直方向軸承全壽命周期的振動數據,每10 s 采集1 次,采樣時長0.1 s,采樣頻率為25.6 kHz,即水平方向和垂直方向每次采集的數據長度為2 560 個點。工況1 數據集屬于輕載,采集的軸承退化數據較好,被廣泛用于RUL 預測的實驗驗證。因此,本文采用工況1 數據作為本文的實驗數據集。

圖3 PRONOSTIA采集平臺Fig.3 PRONOSTIA platform

訓練集軸承振動數據EMD 如圖4 所示。本文采用工況1 數據集的水平振動信號作為EMD 的原始輸入數據,圖4(a)和圖4(b)分別為訓練集軸承Bearing1-1 和Bearing1-2 的第1 個時間點采集的數據(Signal)經過5 層EMD 后得到的5 個IMF 分量和1 個殘差分量(res.)。

圖4 訓練集軸承振動數據EMDFig.4 EMD of training set bearing vibration data

3.2 評價指標

為了對模型預測的RUL 結果進行評估,采用RUL 預測中常用的評價指標,分別是均方誤差(MSE,用符號EMS表示)和PHM 2012 評分函數[5-7,12]。MSE 是誤差指標越小越好,評分函數是效益型指標越大越好。

評分函數(Score,用符號S 表示)定義為

3.3 模型改進驗證

本文對傳統的TCN 模型進行了內部結構參數的探究,主要是對歸一化層的選用進行了研究對比。本文TCN 模型第1 層到最后一層TCN 殘差塊的卷積神經元的數目為依次為64、32、8、1;擴張率依次為1、2、4、8;卷積核大小均為3,并采用ELU 激活函數,批大小為32。由于TCN 模型屬于時間序列類型的模型,因此需要確定輸入數據的時間序列長度,即時間步長的確定。過短的時間步長會導致TCN 難以學到足夠的時間依賴信息,過長的時間步長則極大地增加計算量,降低運算效率。因此,本文時間步長設置為16,每一個時間步長輸入特征數據對應一個歸一化壽命值P 作為標簽數據。本文改進TCN 模型和傳統TCN 模型及其他歸一化形式的模型對比見表2,其中GN8、GN4、GN2 依次表示GN 分組參數為8、4、2。

表2 TCN模型不同歸一化層的對比Tab.2 Comparison of different normalization layers of TCN model

為了減小偶然誤差,上述模型分別運行3 次后取評價指標的均值,最終的評價指標對比見表3。

表3 測試集軸承RUL預測結果對比Tab.3 Comparison of test set bearing RUL prediction results

所有方案在Bearing1_3 和Bearing1_4 上的預測效果相當;方案5 和方案4 在Bearing1-7 上的預測效果最佳;而方案6 的TCN(GN2)模型在Bearing1-5,Bearing1-6 上的提升效果最為明顯,在衡量預測誤差的指標MSE 上,比方案1(常用模型)平均降低了70.03%;比方案2(原始模型)平均降低了78.54%;比方案3 平均降低了75.40%;比方案5 平均降低了75.37%;比方案4 平均降低了83.01%。

方案6 的TCN(GN2)模型的在測試集軸承RUL預測的整體評估效果上表現最佳。在MSE 指標上,方案6 比方案1(常用模型)降低36.67%,比方案2(原始模型)降低了 53.66% ,比方案 3 降低了53.66%,比方案5 降低了34.48%,比方案4 降低了53.66%,比這5 個方案平均降低了46.43%。在Score指標上,方案6 分別比方案1(常用模型)、方案2(原始模型)、方案3、方案5 和方案4 提升了2.78%、4.58%、4.23%、3.45%和5.26%,平均提升了4.06%。圖5 為本文4 種歸一化層和6 種方案在測試集Bearing1-3 到Bearing1-7 的RUL 預測可視化結果。

圖5 不同模型方案在測試集上的RUL預測可視化結果Fig.5 Visualization results of RUL predictions of different model schemes on the test set

3.4 與其他模型的對比

為了進一步驗證本文方法的有效性,本文與其他深度學習模型算法:CNN、LSTM 以及文獻[12]方法中的TCN 和EMD-TCN 進行了對比,結果見表4。

表4 本文改進TCN與其他模型方法的對比Tab.4 Comparison between improved TCN in this article and other model methods

從表4 中可以看出,本文的TCN(GN2)模型在Bearing1-3 到Bearing1-7 這5 個測試集軸承上的誤差指標MSE 和效益指標Score 上均為最佳,5 個測試集軸承RUL 預測的整體評估效果也是最佳。

在測試集整體的MSE 指標上,本文改進TCN模型比CNN 模型降低了87.33%,比LSTM 模型降低了90%,比文獻[12]的TCN 模型降低了82.73%,比文獻[12]的EMD-TCN 模型降低了78.89%,比這4種方法平均降低了84.74%。

在測試集整體的Score 指標上,本文改進TCN模型比CNN 模型的提升了182.35%,比LSTM 模型提升了 255.56% ,比文獻[12]的 TCN 模型提升118.18% ,比文獻[12]的 EMD-TCN 模型提升了95.92%,比這4 種方法平均提升了163%。

4 結 論

本文提出了一種改進的TCN 模型方法,并對TCN 殘差塊的內部結構進行了探究。經過實驗驗證,本文方法對經驗模態分解的每個IMF 分量和殘差分量都進行了特征提取,擴充了模型輸入的數據維度,使深度學習模型能夠更好地訓練學習特征信息。通過與CNN、LSTM 以及相關文獻方法進行對比分析,證明了本文提出的分組數為2 的組歸一化改進TCN模型在眾多模型中表現最佳。此外,本文模型具有輕量、易訓練以及參數量少等優勢,在PHM 2012 工況1 數據集上證明了TCN(GN2)的有效性和優越性。

本文提出的采用組歸一化改進的TCN 模型能夠很好地捕捉軸承的退化特征信息,有效預測軸承的RUL。在后續的研究中,可以將回歸擬合預測擴展到具有實際工程意義的截斷壽命預測。

猜你喜歡
殘差分量卷積
基于雙向GRU與殘差擬合的車輛跟馳建模
基于3D-Winograd的快速卷積算法設計及FPGA實現
帽子的分量
基于殘差學習的自適應無人機目標跟蹤算法
基于遞歸殘差網絡的圖像超分辨率重建
從濾波器理解卷積
論《哈姆雷特》中良心的分量
基于傅里葉域卷積表示的目標跟蹤算法
分量
平穩自相關過程的殘差累積和控制圖
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合