?

面向軸承早期故障檢測的多尺度殘差注意力深度領域適配模型

2020-10-18 12:57毛文濤劉亞敏田思雨
計算機應用 2020年10期
關鍵詞:殘差軸承注意力

毛文濤,楊 超,劉亞敏,田思雨

(1.河南師范大學計算機與信息工程學院,河南新鄉 453007;2.智慧商務與物聯網技術河南省工程實驗室(河南師范大學),河南新鄉 453007)

(*通信作者電子郵箱maowt@htu.edu.cn)

0 引言

隨著現代工業的迅速發展,各類機械設備的工作環境變得越來越復雜。軸承作為機械設備的關鍵支承部件,長期在大載荷、強沖擊等復雜工況下工作,且受沖擊能力較差,是機械設備中最易受損的零件之一,一旦軸承發生意外失效,將造成重大安全事故和人員財產損失。因此,對軸承早期故障及時進行有效的檢測極為重要,是故障預測與健康管理(Prognostic and Health Management,PHM)[1]的關鍵技術環節。近年來,隨著傳感技術的發展,基于數據驅動的早期故障檢測技術開始受到關注。從狀態監控數據中提取早期故障信息,提高異常檢測結果的準確性和實時性,具有明確的學術價值和應用需求。

由于振動信號可以直接反映出其工作狀態,現有的早期故障檢測方法較多采用振動信號進行研究。傳統的早期故障檢測方法通常包括兩個步驟:1)從時域、頻域、時頻域提取手工特征;2)建立機器學習檢測模型。對于傳統手工特征提取方法,Yan等[2]通過提取時域信號中的近似熵并將其作為中結構缺陷嚴重程度的指標,當近似熵值增加時表示機器的可靠性正在下降,從而實現對機器設備的健康狀態診斷;Qiu 等[3]通過使用最小化香農熵來優化Morlet 小波變換因子,并利用基于奇異值分解的周期檢測方法來選擇適合小波變換的尺度,最終實現對機械設備的故障檢測;對于建立機器學習檢測模型,Liu 等[4]針對故障振動信號的多分量特征和故障特征,建立沖擊時間頻率字典,然后使用短時信號來匹配字典,最后提取與原始信號最相關的原子分量作為支持向量機(Support Vector Machine,SVM)的輸入,從而構建故障檢測模型;楊洪柏等[5]使用輪廓圖對多維特征可視化后,去除聚類性弱、對故障區分無益的冗余特征維度,并采用反向傳播神經網絡算法進行故障診斷。但是,這類方法的不足在于提取特征時較依賴于對象的先驗知識,且模型多為淺層結構,判別能力存在一定的局限性;同時,此類方法默認訓練數據與目標數據屬于同一特征分布空間內,當目標數據處于異工況下時,其數據分布往往也不同,從而限制檢測模型的性能。

近年來,深度學習的迅速發展為早期故障檢測提供了新方法[6]。如Wen 等[7]提出了一種將軸承振動信號轉換為二維圖像的轉換方法,該方法可以提取轉換后的二維圖像的特征,并消除手工特征的影響,最終基于LeNet-5實現對軸承的故障檢測;Akcay等[8]提出了一種基于條件學習對抗網絡的故障檢測模型,該模型通過在生成器網絡中使用編碼器-解碼器-編碼器,使模型將輸入映射到較低維向量,然后將其用于重建生成的輸出向量,最終通過對比生成的數據與原始數據的差異性實現故障檢測。上述基于深度學習方法的故障檢測模型的優勢在于:利用多層神經網絡,深度學習可從原始數據中自適應性地提取特征,具有判別能力強和較少依賴先驗信息的優點[9],因此可用來提取表征能力良好的早期故障特征,并構建端到端的檢測模型。然而,此類方法的不足在于,深度網絡的訓練依賴于一定的數據量,但在實際應用中,受復雜工況所限,目標軸承的狀態監測數據通常難以大量采集,因此限制了深度學習的建模效果。而引入歷史積累的同型號軸承數據,由于工作環境和設備狀態的不同,數據分布可能存在一定的差異,所訓練的模型并不完全適用于目標軸承,導致檢測結果準確度下降。

由于深度學習理論模型通常要求訓練數據與測試數據屬于獨立同分布,即要求其處于同一特征分布空間,而在許多實際場景下,由于目標數據與訓練數據通常存在著一定的分布差異,從而限制了模型的性能?;诖?,國內外學者開始將注意力轉移至深度遷移學習方法,遷移學習的最大特點是能通過大量已有數據、提升在少量且數據分布不同的目標域數據上的建模效果。如借助最大均值差異(Maximum Mean Discrepancy,MMD)、聯合分布適配(Joint Distribution Adaptation,JDA)等遷移學習方法[10-11],在已有的大量訓練數據集上構建遷移故障檢測模型,提升在少量目標數據集上的檢測結果。例如,Lu 等[12]通過在多層自編碼器的訓練過程中添加MMD領域適配正則化約束,來提高不同工況下軸承數據的檢測精確度;雷亞國等[13]提出機械裝備故障的深度遷移診斷方法,將實驗室環境中積累的故障診斷知識遷移應用于工程實際裝備。Mao 等[14]對軸承信號進行三通道重構,并對預訓練好的VGG-16 模型進行微調適配,實現對目標軸承的早期故障檢測。上述方法的本質是將源域的故障機理信息遷移到目標領域,以此提升目標對象的診斷或檢測效果。但對于早期故障檢測,從強噪聲背景下的弱信號中提取特征難度較大,特征區分度不明顯。尤其需要注意的是,受環境、裝配條件等因素影響,正常狀態信號不可避免地出現不規則波動,上述模型容易將此類正常狀態樣本檢測為故障,從而導致較高的誤報警。綜合上述分析,提升早期故障檢測效果的關鍵在于:1)縮小因工況不同等因素產生的數據分布差異,使得不同工況數據訓練得到的檢測模型能夠有效應用于目標軸承數據;2)提高強噪聲背景下正常樣本與早期故障樣本的差異性,放大弱信號特征區分度,使得處于早期故障狀態的樣本與因不規則波動引起的偽故障樣本盡可能區分開,從而降低誤報警率。

由于檢測模型無法有效識別故障樣本與偽故障樣本,從而引起較高的誤報警率,為解決此問題,本文擬通過放大或縮小早期故障樣本與偽故障樣本的異常程度,使得檢測模型能夠更容易識別正常樣本與異常樣本,從而降低誤報警率。據文獻調研發現,注意力機制為上述問題提供了解決思路。注意力機制的本質是對數據進行加權學習,在深度學習模型中,通常使用sigmoid 函數對數據進行加權處理。不同的權重表示數據的不同的重要程度。該技術在圖像識別[15]、語音識別[16]等領域都已取得良好的效果。而在PHM 領域內,也有學者嘗試通過引入注意力機制解決相關問題。如孔子遷等[17]通過使用注意力結構對不同時間點的特征自適應地動態加權融合,最終通過分類器進行識別,實現行星齒輪箱的端對端故障診斷;吳靜然等[18]利用全卷積神經網絡提取深度特征,并采用注意力機制將特征進行融合,最后利用多分類函數實現旋轉機械故障診斷。上述方法的優勢都在于:注意力機制能夠通過自適應性學習對數據進行加權處理,放大數據的區分度,從而提升模型效果。

針對以上問題,本文提出一個多尺度注意力深度領域適配模型,將早期故障信息在不同工況數據之間的遷移,來提高檢測效果。該方法通過在殘差注意力網絡[15]中增加不同尺寸的濾波器,并使用卷積-反卷積來重構輸入信息,通過自適應性學習來放大或者縮小早期故障樣本和偽故障樣本的異常程度,從而獲取表征能力更強的多尺度注意力特征,使得早期故障樣本與偽故障樣本的區分度更高。同時,在注意力模型的損失函數中引入最大均值差異MMD正則化約束,在多尺度注意力特征基礎上尋找對早期故障更敏感的公共特征表示,使得模型能夠在從源域到目標域進行數據遷移的同時,有效區分正常狀態樣本與早期故障樣本,降低誤報警率。

本文的主要工作如下:

1)提出了一種基于殘差注意力網絡的多尺度注意力網絡框架。相比原始的殘差注意力網絡結構,本文通過在殘差注意力網絡中增加不同尺寸的濾波器,并使用卷積-反卷積來重構輸入信息并獲得數據的權重信息,即注意力信息,通過將注意力信息與多尺度深度特征融合,從而提取區分度更強的多尺度注意力特征,放大早期故障樣本與偽故障樣本的差異性,使得提取的注意力特征更有利于異工況下的數據遷移,因此更適用于早期故障檢測。

2)提出了一種新的基于深度領域適配的早期故障檢測模型。與現有遷移診斷方法不同,該方法將注意力機制與遷移學習機制結合,一方面引入注意力機制獲取區分度高的早期故障特征,然后構建基于交叉熵和最大均值差異正則化約束的損失函數,實現領域適配,從而提取對早期故障更為敏感的領域共享注意力特征,降低誤報警率。根據本文文獻調研,目前采用注意力遷移學習策略的早期故障檢測工作尚不多見。

1 相關工作

1.1 深度殘差網絡

在計算機視覺領域,對于傳統的深度神經網絡模型,國內外學者普遍認為網絡的層數越深,網絡的非線性表達能力就越強,同時也意味著該網絡所能學習到數據的潛在信息也就越多。如從經典的LetNet-5[19],一個5 層的神經網絡模型,到AlexNet[20](8 層)以至于GoogleNet[21](22 層)。神經網絡模型的層數對于模型的性能的確至關重要,但是當網絡層數增加至一定數量后,性能反而會下降。這是因為當網絡層數過深時,由于神經網絡模型的參數是通過鏈式求導的方式得到,所以會出現梯度消失或者梯度爆炸現象,導致在較深層時梯度很難優化,這使得網絡模型難以訓練,從而影響著網絡的性能。

為解決此問題,He 等[22]提出了深度殘差網絡(deep Residual Network,ResNet)模型。主要思想是:對于一個由幾層堆積而成的堆積層結構,當其輸入信息為x時將通過網絡學習到的特征記作H(x),網絡模型希望可以學習的目標是殘差F(x)=H(x) -x,這樣使得原始的學習特征其實是H(x)。當殘差為F(x)=0時,此時堆積層相當于是一個恒等映射,至少網絡性能不會下降。而實際上,學習目標F(x)僅僅會接近于0,并不會等于0,這就使得堆積層在輸入特征的基礎上仍然可以學習到新的特征,從而使得網絡模型擁有更好的性能。殘差網絡的單元結構如圖1所示。

圖1 殘差網絡結構Fig.1 Residual network structure

殘差單元可以表示為:

其中:h(xl)代表第l個殘差單元的輸入;F是殘差函數,代表學習到的殘差;xl+1=f(yl)表示恒等映射,f代表修正線性單元(Rectified Linear Unit,ReLU)激活函數?;谑剑?)~(2),可以求得從淺層l到深層L的深度特征:

對于梯度消失或者梯度爆炸現象,在ResNet 中,相較于直接堆疊網絡層數的網絡模型,因為捷徑連接的存在,梯度的計算方法由乘法變為了加法。損失函數用loss表示,則有:

1.2 殘差注意力網絡

注意力機制借鑒了人類視覺所特有的大腦信號處理機制,當人類快速掃描一幅圖像時,大腦的注意力總是會集中在人所想要重點關注的目標區域,進而獲取更多所需要關注的目標的細節信息,同時抑制其他無關信息。注意力機制的本質是對數據進行加權學習,在深度學習模型中,通常使用sigmoid 函數對數據進行加權處理,不同的權重表示數據的不同的重要程度。該技術在圖像識別、語音識別等領域都已取得良好的效果。

常見的注意力機制常應用于語音識別等領域,文獻[16]將注意力機制融入至深度殘差網絡結構中,構建一種殘差注意力網絡結構,達到了較好的圖像分類效果。殘差注意力網絡模塊的結構如圖2 所示,主要分為兩個分支:Trunk Branch和Soft Mask Branch。

圖2 殘差注意力網絡Fig.2 Residual attention network

其中:Trunk Branch 由兩個殘差單元組成,用于提取深度特征T(x);Soft Mask Branch 由兩個線性插值下采樣和兩個雙線性插值上采樣順序組成,用于重構原始輸入信息,并將重構后的輸出經過sigmoid 函數映射到0~1 范圍內,用以表征注意力信息。最終的輸出特征H(x)定義為:

其中:M(x)作為特征選擇器,用來增強特征表示能力,并抑制來自Soft Mask Branch 特征的噪聲。當M(x)趨于0時,T(x)的值接近T(x),這意味著當注意力信息為0時,由殘差注意力網絡模型提取的特征等價于由殘差網絡提取的特征。由于Soft Mask Branch 的存在,經過殘差注意力網絡模型提取的特征比由殘差網絡提取的特征更具備表征能力。

2 多尺度注意力深度領域適配模型

在實際場景中,從強噪聲背景下的弱信號中提取特征難度較大,特征區分度不明顯;同時,受環境、裝配條件等因素影響,待檢測的目標軸承數據與歷史積累的訓練數據存在分布差異,且正常狀態信號不可避免地出現不規則波動,導致檢測模型將此類正常狀態樣本檢測為故障,從而導致較高的誤報警。為解決此問題,本文提出了一種基于多尺度注意力機制的深度領域適配模型,包括三通道預處理、多尺度注意力網絡以及領域適配模塊。最終利用提取到的多尺度注意力早期故障公共特征,構建基于多尺度注意力深度領域適配的早期故障檢測模型,使得基于源域數據訓練的檢測模型能夠有效識別目標域數據的健康狀況,降低誤報警率。

2.1 數據預處理

由于本文所使用的注意力殘差網絡模型的原始輸入為三通道形式的圖像數據,因此,本文首先將軸承的一維振動信號變換為三通道形式,分別為原始振動信號通道、邊際譜通道以及頻譜通道。預處理流程如圖3所示。

圖3 數據預處理Fig.3 Data pre-processing

1)原始振動信號通道:由加速度傳感器采集到的振動信號。

2)邊際譜通道:對原始振動信號進行希爾伯特-黃變換(Hilbert-Huang Transform,HHT)[23]。使用經驗模態分解對原始振動信號分解如式(6)所示:

其中:x(t)表示原始信號;ci(t)表示第i個本征模態函數(Intrinsic Mode Function,IMF)分量;k表示IMF 分量總數;rk(t)表示原始信號剩下的余項。對每個IMF分量進行HHT:

其中τ是對t的取值。

且構建解析信號:

對希爾伯特譜積分得到最終邊際譜:

其中:w=,代表瞬時頻率。

3)頻譜通道:對原始振動信號x(t)進行快速傅里葉變換(Fast Fourier Transform,FFT)[24]。利用式(11)將x(t)變換為頻譜數據X(k)。

其中:t代表時間;N代表信號的長度。

將得到的原始振動信號、邊際譜數據以及頻譜數據合并為三通道數據,作為網絡模型的輸入。

2.2 多尺度注意力深度領域適配模型

本節在殘差注意力網絡的基礎上,引入多尺度的注意力機制,對模型結構和損失函數進一步改進,從而提取有效表示早期故障的多尺度注意力領域共享特征。具體而言,本文在圖2 中Soft Mask Branch 模塊引入卷積和反卷積,代替了殘差注意力網絡中Soft Mask Branch 的線性插值和雙線性插值,使得模型可以更好地還原輸入信息,從而有利于注意力信息的提??;同時,在Trunk Branch 中,由于數據尺寸大小的限制,本文只設置了一個殘差單元,且在殘差單元后添加了兩個不同尺寸的卷積核,然后再進行拼接,以提取更豐富的深度特征。最終,將注意力信息與深度特征融合,提取表征能力更強的多尺度注意力特征。多尺度注意力模塊如圖4所示。

圖4 多尺度注意力模塊Fig.4 Multi-scale attention module

如圖4 所示,本文對2.2 節的Soft Mask Branch 和Trunk Branch 進一步改進。其中Trunk Branch 使用一個ResNet 基礎網絡結構以及一個1×1 卷積和一個3×3 卷積,用于提取深度特征F(x);Soft Mask Branch 使用了兩個3×3 卷積和兩個反卷積來還原輸入信息,并通過Sigmoid函數將重構后的輸出T(x)映射到0~1,代表注意力信息。最終的注意力特征H(x)被定義為:

為了實現從源域到目標域的數據遷移,本文在提取的多尺度注意力特征的基礎上,構建基于交叉熵和MMD正則化約束的損失函數,以縮小源域和目標域的數據分布差異性。MMD 是用來度量在再生希爾伯特空間中兩個數據的分布距離。則源域與目標域數據的距離為:

其中:H 表示再生核希爾伯特空間;n表示樣本數量;分別表示源域樣本和目標域樣本。式(13)表示兩個域的樣本在非線性映射φ(·)上的均值差異。通過尋找一個φ(·)使得式(9)最小化,即可誘導得到兩個域之間的公共特征空間。

需要注意的是,式(13)是衡量兩個域之間的分布差異。而在早期故障檢測問題中,由于源域和目標域都存在正常和異常兩種狀態的樣本。若直接將全壽命階段數據進行領域最小化,則忽略了不同工況下數據之間的健康狀況。因此,此處分別計算源域正常樣本和目標域正常樣本、源域異常樣本和目標域異常樣本之間的MMD距離,以適配不同健康狀況下的數據分布,得到具有普適性的領域共享特征表示。具體表達如下:

同時,二分類的交叉熵損失函數如式(15)所示:

其中:Ms為訓練樣本數量;是訓練樣本的健康狀態標記;是訓練樣本的預測標記的概率分布。將這兩部分損失函數集成在一起,最終得到深度遷移早期故障檢測模型的目標函數:

其中:X=(T(x)+1)*F(x),代表源域數據和目標域數據的多尺度注意力特征。

本文所提出的多尺度注意力深度領域適配模型流程如圖5 所示,它是在殘差注意力網絡模型框架的基礎上進一步的改進,主要包括數據預處理模塊、多尺度殘差注意力模塊和領域適配模塊。數據預處理模塊是將原始數據分解為原始信號-邊際譜-頻譜三通道形式。多尺度殘差注意力模塊是通過不同尺寸大小的卷積來提取表征能力更強的多尺度深度特征,同時利用反卷積結構來提取數據中的注意力信息,然后通過將注意力信息與多尺度深度特征融合,從而獲得對早期故障更為敏感的多尺度注意力特征。將提取到的多尺度注意力特征通過領域適配模塊,構建基于交叉熵損失和最大均值差異正則化約束的損失函數,從而使得基于源域數據訓練的早期故障檢測模型能夠對異工況下目標數據進行有效的檢測。

圖5 多尺度注意力深度領域適配模型流程Fig.5 Flowchart of deep domain adaptation model with multi-scale attention

對于式(16)給出的目標函數,可采用小批量梯度下降法[25]反向逐層更新訓練參數,具體優化步驟如下:

2)前向傳播:①隨機選取批量訓練樣本執行式(12),獲取領域共享注意力特征。②根據式(13)計算源域數據與目標域數據之間的交叉熵損失值。③根據式(14)計算源域正常數據數據與目標域正常數據、源域異常數據與目標域異常數據之間MMD 值。④執行式(16)計算模型目標函數值,并進行迭代,如果迭代次數小于epoch 的值,則執行步驟3);否則就結束迭代,轉至步驟4)。

3)反向傳播:采用小批量梯度下降法,反向逐層更新訓練參數W0、b0的值;返回步驟2)。

4)目標域數據健康狀態識別:保存網絡參數W0、b0,將待檢測目標域數據輸入至檢測模型中,返回輸出層的檢測結果,即可預測目標域數據的健康狀態分布。

3 實驗與結果分析

3.1 數據集

為了驗證所提方法的有效性,本文所使用的實驗數據是IEEE PHM-2012 數據挑戰提供的軸承加速壽命實驗數據,實驗數據來自PRONOSTIA 實驗臺[26]。該數據集包含了從正常到故障的整個生命周期。

數據集由三個不同工況下的軸承的全壽命數據組成:工況1 下發動機的轉速為1 800 r/min,負載為4 000 N;工況2 下發動機轉速為1 650 r/min,負載為4 200 N;工況3 下發動機轉速為1 500 r/min,負載為5 000 N。每個工況下分別對7 個不同軸承進行數據采集實驗。本文使用工況1 下數據作為源域數據,工況2下軸承數據作為目標域數據進行實驗。

3.2 訓練數據狀態劃分

在本實驗中,訓練數據由源域數據和少量目標域輔助數據組成,包括工況1下的1~4號四個源域軸承數據和工況2下的1 號軸承輔助數據,測試數據由工況2 下2、4 號兩個軸承數據組成。這些軸承數據均包含了從正常到完全退化的全壽命周期信號。具體組成如表1所示。

表1 訓練、測試數據劃分表Tab.1 Training and testing data division table

為獲得有效的早期故障數據,本文首先采用一種常用的早期故障檢測方法——基于支持向量數據描述(Support Vector Data Description,SVDD)[27]的方法,對軸承運行狀態進行狀態劃分。具體做法是:選取樣本序列前500 個樣本的HHT邊際譜特征作為訓練集,構建SVDD 模型,設定當不再出現正常樣本的識別結果時,記為早期故障位置。其中SVDD正則化參數設為0.01,使用徑向基核函數(Radial Basis Function,RBF),核參數設為0.1。在源域數據和輔助數據上的狀態劃分結果如圖6 所示(為了合理展示檢測結果,在圖6和圖9 中,設置標簽“+1”表示正常狀態,“-1”表示異常狀態,由此對異常檢測結果進行標識)。為了有效對比,圖6 同時給出了相應軸承數據的均方根(Root Mean Square,RMS)值。SVDD 是目前常用的早期故障檢測方法,而RMS 作為衡量信號能量高低的指標,通常也能用于早期故障檢測。

圖6 源域數據和輔助數據的SVDD狀態劃分結果Fig.6 SVDD state division results of source domain data and auxiliary data

分析圖6 可知,所有子圖中的檢測結果在軸承的初始正常階段均出現較多的誤報警,這是由于在運行過程中受運行環境等因素的影響,采集到的振動信號出現不規則波動,即偽故障樣本,檢測模型若不具備一定的抗干擾能力,無法準確識別正常狀態樣本與偽故障樣本,從而出現了較多的誤報警。且從圖6可以看出,由SVDD檢測模型得到的狀態劃分結果與軸承振動信號的RMS 值大致相對應,當RMS 值明顯增高時,檢測結果顯示軸承處于異常狀態,即早期故障。然而RMS 值并不能作為衡量軸承運行健康狀態的唯一指標,只能作為參考依據,這是因為RMS 值只是一種統計量,具有一定的滯后性。

簡化起見,源域數據和輔助數據的狀態劃分結果如表2所示。

在本文中,Trunk Branch 中卷積核大小是3×3,stride 是1,使用ReLU 作為Trunk Branch 的激活函數;Soft Mask Branch 中卷積核大小是3×3,stride 是1,反卷積核大小是3×3,stride 是1,使用Sigmoid 激活函數將反卷積的結果歸一化至0~1,flatten 層節點數是128。小批量梯度下降法中,學習率是0.000 1,batch_size 大小是50,keep_prob 是0.7,epoch 是1 000。實驗所用電腦配置是Ubuntu 16.4,顯卡Tesla K40m,64 GB內存,本文所使用的算法環境是Python 3.6。

表2 狀態劃分結果Tab.2 State division results

3.3 實驗結果與分析

根據表2 給出的狀態劃分結果,使用源域數據和輔助數據作為訓練集,利用所提方法建立多尺度注意力深度領域適配早期故障檢測模型,最終對目標軸承數據進行分類。需要注意的是,目標軸承數據同樣需要采用3.1 節方法預處理為三通道數據形式。

本文以工況2 下2 號和4 號軸承為目標數據,分別采用HHT 邊際譜和本文方法所提的128 維特征,并使用t-分布式隨機鄰域嵌入(t-distributed Stochastic Neighbor Embedding,t-SNE)法[28]進行特征可視化,如圖7 所示??擅黠@看出,圖7(a)、(c)中正常樣本與異常樣本雖然有較明顯的區分度,但在圖7(a)的異常樣本內圈邊緣處混雜著不少正常樣本,圖7(c)中正常樣本外圈處同樣混雜著不少異常樣本,這也是導致檢測模型出現誤報警的原因。而在圖7(b)、(d)中,本文方法所提的特征可視化效果較好,正常樣本與異常樣本區分度明顯,且誤報警數量較少。

圖7 工況2下的2號和4號軸承特征分布Fig.7 Feature distribution diagrams of No.2 and No.4 bearings under operating condition 2

為驗證所提方法的可解釋性,本文設置一組基礎對照實驗,即通過在原始殘差注意力網絡添加MMD 正則化約束項。訓練過程loss值的下降過程如圖8所示。

圖8 loss下降過程Fig.8 loss decline process

分析圖8可知,圖8(a)中的對比方法在迭代至800輪左右時,loss值不再下降,模型達到收斂狀態;而圖8(b)中本文方法在迭代至400 輪左右時,loss已經基本上趨于平穩,即模型達到收斂狀態。究其原因,本文方法的反卷積結構能夠獲取更豐富的注意力信息,且利用不同尺度大小的卷積提取深度特征表征能力更強,融合后的注意力特征對早期故障更敏感,因此模型會更快地達到收斂狀態。

對于早期故障檢測問題,由于其本質是流數據的異常檢測,需要從貫序到達的監控數據中檢測出異常狀態,現有研究[29]多采用檢測位置和誤報警數來評價模型的可靠性。為了對檢測模型的可靠性和準確性進行評價,本文采用退化過程的RMS 曲線進行驗證。由于RMS 曲線是退化過程的一種廣泛采用的特征表示,因此具有較好的參考價值。

以工況2 下2 號和4 號軸承為目標軸承,檢測結果如圖9所示。本文設定當正常樣本消失、連續出現異常樣本時,記為報警時間點。為對比起見,圖9 中同樣提供了目標軸承的RMS曲線和基于SVDD的檢測結果。

由圖9 和表2 可知,SVDD 的檢測結果在軸承正常運行階段出現了較多的誤報警,同時,當RMS 值出現較為明顯的波動時,誤報警數也隨之變多。這是因為檢測模型不具備一定的抗干擾能力,無法識別偽故障樣本,導致檢測結果不夠魯棒。而本文所提方法的檢測結果在正常樣本與異常樣本之間區分更為明顯,能夠在不延遲報警時間點的情況下,有效地降低誤報警數。究其原因,注意力模塊通過自適應性學習來放大或者縮小早期故障樣本和偽故障樣本的異常程度,使得早期故障樣本與偽故障樣本的區分度更高;同時通過引入MMD領域適配約束項,縮小源域樣本與目標域樣本的分布差異,使得模型能夠在從源域到目標域進行數據遷移的同時,有效區分正常狀態樣本與早期故障樣本,降低誤報警率。

為進一步驗證本文方法的有效性,表3 給出了本文方法與8 種代表性的早期故障檢測方法的實驗結果。這8 種方法中,LOF(Local Outlier Factor)[30]和iForest[31]是兩種典型的異常檢測算法,其中LOF閾值為8,iForest樹的數目為100。SRD(Sparse Residual Distance)[32]是一種代表性的基于統計指標分析的故障檢測方法。BEMD-AMMA(Bandwidth EMD with Adaptive Multiscale Morphology Analysis)[33]被認為是最新的一種基于信號分析的早期故障檢測方法。DAFD(Domain Adaptation for Fault Diagnosis)[12]是一種代表性的基于自編碼器實現深度領域適配的遷移診斷方法,其中自編碼器的網絡結構設為[500,100,50],即提取的深度特征維度為50。SDFM(Self-adaptive Deep Feature Matching)[6]是一種基于深度學習的異常序列匹配的早期故障在線檢測方法,所采用的自動編碼器結構是[800,512,50],即提取的深度特征維度為50,滑動窗口大小為100。遷移成分分析(Transfer Component Analysis,TCA)[34]和測地線流式核(Geodesic Flow Kernel,GFK)方法[35]是兩種典型的遷移學習算法,這兩種算法的輸入為HHT 邊際譜,檢測模型為SVDD。本文認為這八種方法可涵蓋不同角度的對比。

由圖9(b)中的RMS 曲線可知,4 號軸承的早期故障階段持續時間極短,因此表3中對軸承4五種對比方法與本文方法的報警時間點均沒有太大差異。定義誤報警率計算公式為:誤報警率=誤報警數/總樣本數。通過對軸承2 的檢測結果計算可知,以上八種對比方法的平均誤報警率為2.01%,本文方法誤報警率為0.75%,誤報警率相對降低了62.7%。軸承4對比方法的平均誤報警率為1.73%,本文方法的誤報警率為0.67%,誤報警率相對降低了61.3%。

表3 PHM數據集工況二對比檢測結果Tab.3 Comparative test results under operating condition 2 of PHM dataset

分析表3 的實驗結果可知,與其他方法相比,本文方法能夠在更少誤報警的情況下,更早判斷出軸承的異常狀態。因此,本文方法可以被認為對早期故障更為敏感,以及有著更好的魯棒性,更適用于早期故障檢測。

圖9 目標軸承數據的檢測結果Fig.9 Detection results of target bearing data

4 結語

本文針對早期故障檢測的需求特點,提出了一種基于多尺度注意力機制的深度領域適配模型。該模型將多尺度注意力機制和遷移學習結合,既能提取對早期故障更為敏感的注意力特征,同時也可有效利用不同工況監測數據蘊含的故障機理信息。從實驗結果來看,本文所提取的多尺度注意力特征,對早期故障與偽故障樣本的區分度更明顯,更具備表示性,有效增強了檢測模型的魯棒性,并顯著降低誤報警率。本文所使用的注意力機制是從計算機視覺領域移植而來的,盡管其在PHM 領域內雖然能夠有效應用,但可解釋較差。接下來將進一步探索適合一維信號使用的注意力機制,使其能夠更有效地應用于早期故障檢測。

猜你喜歡
殘差軸承注意力
異步立式感應電機軸承系統設計
基于殘差-注意力和LSTM的心律失常心拍分類方法研究
基于雙向GRU與殘差擬合的車輛跟馳建模
讓注意力“飛”回來
無軸承電機的結構設計
泵用電機水潤滑軸承選擇與應用
基于殘差學習的自適應無人機目標跟蹤算法
如何培養一年級學生的注意力
基于深度卷積的殘差三生網絡研究與應用
A Beautiful Way Of Looking At Things
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合