?

基于自監督學習的動力設備異常檢測方法

2023-12-30 14:26喬怡群劉克新郭云翔
空間控制技術與應用 2023年6期
關鍵詞:動力設備掩碼卷積

喬怡群, 王 田,2,3*, 劉克新,3, 王 麗, 呂 坤, 郭云翔

1. 北京航空航天大學 自動化科學與電氣工程學院,北京 100191 2. 復雜關鍵軟件環境國家重點實驗室,北京 100191 3. 中關村實驗室,北京 100191 4. 武漢高德紅外股份有限公司,武漢 430205

0 引 言

空間技術是指利用各種科學技術手段開展空間活動的技術,是提高國家綜合實力和國際地位的重要標志.動力設備是航空航天技術的核心部件,它的性能和可靠性直接影響著飛行器的安全和效率[1].空間技術的發展離不開動力設備的支撐.動力設備技術性能、可靠性、安全性、經濟性等方面的提升,都將為空間技術的進步帶來巨大的推動力.

在實際情況中,動力設備數據是由多傳感器進行采集的,這些采集到的數據反映了系統的不同狀態.基于這些采集到的傳感器數據,能夠有效提取表征信息就顯得尤為重要[2].

異常檢測其定義而言是從正常數據中挖掘不正常情況的技術.動力設備中存在的故障或異常往往會影響其性能,甚至造成極為嚴重的事故.通過傳感器數據,應該及時準確地捕獲到系統中出現的異常,這對于保障動力設備的可靠性與安全性具有重要意義.

簡單來說,異常檢測的方法可以分為傳統的機器學習方法和基于深度學習的方法.傳統的異常檢測方法包括時間序列模型,如自回歸移動平均模型[3]、馬爾科夫模型[4]、卡爾曼濾波[5]等.這些方法在檢測精度上一般不夠高,同時對于高維的長時間序列數據特征的提取不夠好.隨著深度學習的發展,神經網絡被應用于異常檢測,并表現出優于傳統方法的檢測性能.

基于深度學習的異常檢測方法可以簡單的分為有監督學習和無監督學習.在監督學習的訓練網絡階段,必須對訓練數據進行標記.工業數據的標簽樣本需要由經驗豐富的工程師手工標記,成本高、耗時長.如果在整個訓練過程中標記的異常樣本數量不足,則不平衡的訓練結果將導致學習的不充分.無監督學習是指在未標記的數據集上解決模式識別問題.在異常檢測中,基于預測或基于重建的方法是最常用的.在訓練集大小方面,無監督學習可以遠遠超過監督學習.在訓練過程中使用正常數據集通常很重要,而異常數據在訓練樣本中的不同比例可能會導致不同的檢測準確率.因此在現實場景中需要仔細篩選和選擇數據集.具體方法而言,MALHOTRA[6]等引入了一種基于LSTM的編碼器-解碼器模型,該模型學習表示正常時間序列行為的特征向量,用于傳感器異常檢測問題,然后應用重建誤差檢測異常.LIN[7]等提出了將VAE和LSTM相結合的異常檢測模型.該模型利用了VAE模塊在短窗口形成穩健的局部特征,同時又使用LSTM在VAE推斷的特征上估計長期相關性.LI[8]等提出了基于LSTM-RNN的GAN模型,利用GAN網絡的判別器和生成器重建數據和實際樣本之間的殘差,來檢測網絡物理系統中的異常.這些無監督方法依賴于從輸出或預測任務中重建輸入.然而,預測或重建方法可能不是表征學習所必需的.

當訓練集有異常數據時,訓練模型是一項困難的工作.YANN認為,自我監督是未來人工智能研究的一個重要點[9].他認為,在人工智能系統中,自我監督學習是最有希望建立背景知識和近似常識形式的方法之一.

自監督學習在近幾年得到了迅速的發展,并已經應用于圖像處理[10]、視頻處理[11]和自然語言處理[12]等領域,并取得了較好的效果.目前多數的自監督學習方法研究集中在視覺處理和自然語言處理領域中.在計算機視覺中,自監督表示學習的方法逐漸受到研究者的關注.CARL[13]等使用拼圖來構建輔助任務,通過分割圖像并預測這些部分的相對位置來訓練圖像網絡.CHEN等在文章[14]中強調了各種數據增強方法的重要性,并在數據表示和對比度損失之間引入非線性轉換,提高了學習到的表征質量.基于生成的自監督表示學習方法也越來越受到關注.HE[15]等提出了一種基于掩碼的自編碼器,通過非對稱編碼器結構對骨干網絡進行預訓練;文獻[16]在此基礎上進行了改進,通過預測被遮擋區域的特征,而不是重建原始圖像實現網絡的預測.在自然語言處理中,BERT模型采用自監督學習進行預訓練,包括對詞向量的預測等,并在此基礎上,又進一步發展了其他的預處理方法,例如:句子順序預測、預測中心詞匯等,這些方法取得了較好的效果.自監督學習在時間序列異常檢測領域的研究很少.在文獻[17]中,DELDARI等首先提出了對比學習方法用于時間序列變點檢測,時序卷積網絡[18]被用于提取序列特征.

自監督方法可以認為是一種特殊的無監督方法.自監督方法與有監督學習相比,訓練樣本不需要標注,可以使用更大規模的訓練數據集.與無監督學習方法相比,可以在訓練過程中學習到更加通用的表征信息.因此,本文在基于自監督表征學習方法的異常檢測領域做一些初步的工作.

本文主要的貢獻如下:1)首先是引入了自監督學習的策略實現動力設備數據的異常檢測.該網絡通過特定的任務在模型預訓練階段提取序列數據的一般性表征;2)提出了一種用于傳感器數據的特征提取網絡,該網絡可以從時間序列數據中提取有效的、通用的特征,并針對不同的特征通道賦予不同權重;3)針對序列數據的增強,提出了兩種不同的增強策略,包括加入噪聲與隨機遮掩方法.異常樣本可以看作是數據增強的方式,在現實場景中異常樣本數量有限,因此在訓練階段不需要剔除異常數據.

1 方法概述

基于自監督學習的異常檢測方法可以分為數據預處理、模型預訓練以及下游任務訓練3個不同的階段,其總體流程圖如圖1所示.首先是數據預處理,針對采集到的動力設備傳感器數據,通過歸一化的手段將采集到的不同范圍的數據轉化為相同的尺度.模型的預訓練將采用對比學習的方式,通過數據增強和無標簽的學習,讓模型學習到更加一般性的表征.下游任務訓練則針對動力設備的數據進行異常檢測任務的訓練,并在測試集上計算模型評價指標,驗證算法的有效性.

圖1 異常檢測總體流程圖Fig.1 Overall process of anomaly detection

2 異常檢測算法設計

針對動力設備的異常檢測問題,下面分別介紹數據預處理、數據表征學習、數據增強方法以及整體的網絡結構.表1定義后文中用到的符號并說明其含義.

表1 符號與含義Tab.1 Symbol and meaning

2.1 數據預處理

動力設備采集到的不同的傳感器數據具有不同的范圍和量綱,導致訓練的過程中不容易穩定.本文采用常見的最小-最大歸一化方法將數據縮小到指定的范圍之間,計算公式如下:

(1)

式中,x代表了原始的輸入數據,xmin代表了原始輸入數據的最小值,xmax代表了原始輸入數據中的最大值.通過式(1),可以完成數據的歸一化預處理.預處理前后的數據如圖2所示.可以看到,處理前數據的范圍在641.1~644.7之前,處理后的數據在0到1之間分布.

圖2 數據預處理前與預處理后Fig.2 Before and after data preprocessing

2.2 數據表征學習

通過自監督學習的方式,在預訓練階段通過無標簽的數據,完成特征提取器的表征學習.特征提取器將時間序列特征映射成緊湊的嵌入表示,是自監督學習的基礎,其結構將在后文中進行描述.自監督學習的總體結構如圖3所示.

圖3 自監督學習的結構Fig.3 Structure of self-supervised learning

向量序列(xi,…,xseq)從序列(x1,…,xn)中采樣得到,通過不同的數據增強的方法得到vt(x)以及v′=t′(x).隨后通過特征提取網絡fθ和fδ分別得到數據的表征y和y′.特征提取網絡得到的表征y經過投影頭和預測頭得到向量qθ,表征y′經過投影頭得到向量zδ.最后可以計算向量之間的損失函數,損失函數計算方法如下:

lθ,δ

(2)

δ←τδ+(1-τ)θ

(3)

其中,τ是人為選定的超參數,范圍在[0,1]之間.在預訓練完成后,即可以獲得特征提取器fθ用于下游任務的訓練.訓練的流程圖如表2所示.

表2 模型訓練階段流程圖Tab.2 Flow chart during model training

2.3 數據增強方法

下面將對兩種不同的數據增強方法進行介紹.

2.3.1 加入高斯白噪聲

通過采集到的多傳感器的數據,針對不同的傳感器數據分別計算數據的均值和方差,并根據下面的公式將高斯白噪聲加入到數據中.

x′=x+γ·noise(0,std)

(4)

其中,x代表了原始的數據,x′是增強后的數據,γ∈[0,1]代表噪聲率,noise(0,std)代表了生成一個均值為0,方差為std的高斯白噪聲.在對比學習時加入高斯噪聲,可以提高模型學習的魯棒性和泛化能力.通過向輸入數據添加噪聲,模型被迫學習對輸入中的微小變化具有魯棒性的特征.高斯噪聲的選擇方法主要是根據噪聲的標準差來調節.但過大的標準差也可能使模型更難以從數據中學習有用的特征.

2.3.2 數據掩碼

通過掩碼的方式將數據中的一部分遮掩掉.具體的操作方式如下:首先利用伯努利分布確定需要在原始數據中掩碼的位置,隨后將確定的位置采用mask的方式替換原始數據,數據掩碼的方式如圖4所示.

圖4 數據掩碼方式Fig.4 Data masking mode

在對比學習中,通過使用數據掩碼,模型被迫學習對輸入中的缺失或不完整的信息具有魯棒性的特征,這可以幫助它在處理不同類型或質量的數據時表現更好.

2.4 網絡結構

下面將對網絡的每部分模塊以及整體的網絡結構進行介紹.

2.4.1 空洞因果卷積

傳感器數據是時間序列數據,異常的確定通常需要從異常之前的一段時間進行分析.神經網絡需要更大的感受野來建立更長時間的聯系.使用CNN會導致層和模型參數的激增,而遞歸神經網絡(RNN)或LSTM按順序輸入,并且存在梯度爆炸或緩慢的訓練問題.

本文使用空洞因果卷積代替一般卷積,模型中使用更少的網絡層數和模型參數獲得更大的感知場.因果卷積允許網絡在時刻t的輸出只與時刻t之前的輸入相關聯,如圖5所示.這個操作是通過零填充實現的.這樣可以避免未來信息對當前時刻網絡輸出的影響.因果卷積的每一層的輸出由前一層對應的位置輸入及其前一位置的輸入得到.擴展卷積跳過部分輸入,濾波器可以應用于比濾波器本身長度更大的區域,從而可以獲得更大的感受野.

圖5 普通卷積、因果卷積與空洞卷積Fig.5 Normal convolution, causal convolution, dilated convolution

2.4.2 多頭注意力機制

注意機制的過程可以描述為通過查詢Q和鍵值K計算分數,然后將分數與值V相乘得到輸出.其中,Q,K以及V都是向量.

對于空洞因果卷積提取到的特征,輸入到多頭注意力機制中.輸入分別經過Wq、Wk和Wv的全連層得到Q,K以及V的值.V的維度是dv,Q和K的維度是dk.在計算Q和K的點積后,通過softmax得到各個值的權重,具體的計算方法如下:

(5)

softmax()函數的計算公式為

(6)

其中exp()代表了指數函數.

多頭注意力機制是注意力機制的完善,在不同的空間建立不同的投影信息.將輸入矩陣進行不同的投影,在得到許多輸出矩陣后,將其拼接在一起.

MultiHead(Q,K,V)=ZWO
Z=Concat(head1,…,headh)

(7)

2.4.3 通道注意力機制

在本文中,采用通道注意力機制,通過學習不同的權重來平衡不同通道的貢獻.具體的計算方法如下:

Ga=softmax(WU·ReLU(WP·T))

(8)

其中,ReLU(x)=max(0,x),T為輸入的特征向量,特征維度是m,WP和WU均為全連接線性層,WP將特征維度變為了m/2維,WU將特征維度再映射為m維.最后通過softmax函數將得到的權重歸一化,softmax函數的計算方法參見式(6).通過這種方式,將學習到的權重和原通道相乘,從而賦予原通道不同的權重,并采用殘差連接的方式和網絡中的其他模塊銜接起來.

2.4.4 殘差網絡

殘差網絡是一種卷積神經網絡,其內部使用了跳躍連接,由大量的殘差塊組成.殘差塊的特點是將輸入直接傳遞到輸出,并與經過卷積、激活函數等操作后的輸出相加.這種結構可以緩解深度神經網絡中增加深度帶來的梯度消失和梯度爆炸問題,其優點是:可以訓練更深的網絡,從而提高準確率;易于優化,即使網絡很深也很容易收斂;可以應用于各種任務,包括圖像分類、物體檢測、自然語言處理等.計算公式如下:

xl+1=xl+F(xl,Wl)

(9)

其中,xl+1代表的是殘差模塊的輸出,xl代表的是殘差模塊的輸入,F代表的是殘差模塊中的函數.

2.4.5 整體網絡結構

網絡的整體結果如圖6所示.整體上包含了空洞因果卷積,通道注意力機制,注意力機制、歸一化模塊.對于動力設備上采集到的數據,首先采用歸一化等手段將數據做歸一化處理,并將數據切片;隨后利用空洞因果卷積對數據的特征進行提取,空洞因果卷積可以擁有更大的感受野;隨后利用通道注意力機制進一步對提取的表征進行處理并將表征輸入到多頭注意機制中.多頭注意模型有助于從多維數據中提取特征,并可以并行處理序列數據.歸一化模塊和殘差模塊有助于提高模型自監督表征學習過程中的訓練穩定性.

圖6 網絡結構圖Fig.6 The network structure

3 實驗分析

在本章節中,將通過實驗去驗證所提方法的有效性.

3.1 數據描述

本實驗采用的美國國家航空航天局(national aeronautics and space administration,NASA)提供的發動機模擬數據集合.該數據集記錄了多個傳感器通道數據來描述動力設備的故障演化,從開始的正常狀態到最終的故障停止運轉.數據集由多維度的時間序列組成,包含了26列,分別為編號、時間周期、操作設置與傳感器測量值.針對采集到的所有數據,將對各個通道的數據做特征分析,分別計算均值和方差,對于方差過小的通道進行剔除,從而保證模型的學習效果.

3.2 參數設置

在實驗中,采用了Pytorch框架和Nvidia 2080Ti顯卡為模型的訓練進行加速.在模型訓練中,采用了SGD優化器.在實驗中時,學習率給定的是0.000 5.

針對特征提取器,空洞因果卷積的輸出維度是64.多頭注意力機制的模型的維度與卷積層輸出維度相同,都是64維度的,多頭的數目為4.后續的線性層將維度輸出為32維度.在采用自監督學習進行與訓練時候,τ給定的數值為0.999.

3.3 評價指標

綜合運用準確率(Accuray)、精準率(Precision)、召回率(Recall)和F1(F1-score)[19, 20]分數來確定模型的性能.指標的詳細公式如下:

(10)

(11)

(12)

(13)

其中,TP代表的是真正例,FP代表的是假正例,TN代表真反例,FN代表假反例.精準率代表了在所有預測為正的例子中,實際上真的為正的比例.召回率代表了是所有實際為正的例子中,預測對了的比例.F1代表了精準率和召回率的調和平均.F1指標越高,代表了模型的性能越好.

3.4 實驗結果與分析

在本小節中,將從實驗結果對比、消融實驗以及數據增強參數對實驗結果的影響3個方面闡述方法的有效性.

(1)實驗結果對比與分析

在數據集上對本文的算法進行了驗證,實驗結果如表3所示.實驗結果表明,在噪聲率給定0.05,掩碼范圍0.15時,所提的方法在F1-score上可以取得0.851的成績,精度(ACC)可以達到0.954,精準度可達到0.833,召回率可以達到0.87.相比較于經典的邏輯回歸方法,在F1-score、ACC等指標上均有部分的提升.其中,邏輯回歸模型的公式為:

表3 結果對比1Tab.3 Comparison of results 1

(14)

σ()代表了sigmoid函數.假設邏輯回歸模型訓練好了參數,只需要將預測的x帶入上面的方程,輸出的y則為對應的概率.

實驗結果表明,在動力設備數據集上,本文所提的方法是有效的.

在動力設備中,軸承部件是易損部件,它的異常會導致設備故障,其平穩運行對于動力設備的穩定具有重要意義.因此,軸承部件的異常檢測是動力設備異常檢測的重要組成部分.針對動力設備中的軸承部件,進行算法驗證.使用了軸承故障數據集,進行了異常檢測的仿真驗證分析,實驗結果如表4所示.實驗結果表明:在軸承數據集上,本文所提的方法在精度以及F1-sore指標上,均優于LSTM網絡.對于軸承的異??梢赃M行較為準確的檢測.

表4 結果對比2Tab.4 Results of ablation experiments 2

(2)消融實驗

下面通過消融實驗驗證各個模塊的作用和性能.實驗結果如表5所示.消融實驗的結果表明,在去掉空洞因果卷積或者注意力機制后,模型在精度、F1-score等指標上性能都有所下降.實驗結果同時表明,模型中加入的BN層有助于模型在預訓練階段表征的學習,從而提升模型的性能.消融實驗的結果表明了網絡中各個模塊的有效性.

表5 消融實驗結果Tab.5 Results of ablation experiments

(3)數據增強參數與實驗結果的影響

本文通過自監督學習解決異常檢測問題.異常檢測的目的是區分正常和異常樣本特征之間的差異.一般情況下,存在樣本的不平衡,異常事件的數量較小.對比學習可以在較少的負樣本情況下得到較好的特征提取.數據增強是對比學習中的一種重要方法.在訓練階段,對比學習減少相似樣本之間的距離的同時,增加負樣本之間的距離,實現正常樣本和異常樣本的表征學習.采用該模型提取傳感器數據的特征.通過數據增強和對比學習的方法,在預訓練階段提取出更好的特征.

表6給定不同的噪聲水平或者是對數據進行不同的mask的比例下,不同的參數對仿真結果的影響.實驗結果可以看出,在噪聲率或者掩碼的范圍較大時:噪聲率給定0.9(對應表5中第一行),或者掩碼的區域占比范圍達到90%(對應表中第二行),此時網絡在預訓練階段特征的學習能力會降低,在下游任務做動力設備的異常檢測任務時,相應的指標均有一定程度的下降.因此,在實驗中選擇合適的噪聲率和掩碼范圍有助于模型對于數據特征的學習.

表6 不同參數對結果影響Tab.6 The influence of different parameters

4 結 論

本文主要針對動力設備的故障進行異常檢測.本文的主要工作包括,首先提出了一種訓練特征提取器的自監督學習策略,該策略可以用于在預訓練階段利用無標簽數據進行一般性表征的學習.隨后針對自監督學習方法,提出了兩種數據增強手段,包括加入噪聲和隨機掩碼從而增強預訓練階段對于特征的提取能力.最后,提出了一種端到端的深度學習模型用于提取動力設備數據中的時空特征.在數據集上的實驗表明,本文所提的方法在F1-score上可以取得0.851的成績,精度(ACC)可以達到0.954,可以取得較好的效果,證明了算法的有效性.

猜你喜歡
動力設備掩碼卷積
基于3D-Winograd的快速卷積算法設計及FPGA實現
煙草動力設備中的自動化控制問題及對策思考
從濾波器理解卷積
低面積復雜度AES低熵掩碼方案的研究
基于傅里葉域卷積表示的目標跟蹤算法
基于布爾異或掩碼轉算術加法掩碼的安全設計*
大型水輪發電機電氣試驗研究及相關規程討論的認識
基于掩碼的區域增長相位解纏方法
基于掩碼的AES算法抗二階DPA攻擊方法研究
關于半導體廠部分動力設備節能措施的分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合