?

基于深度卷積網絡的多傳感器信號故障診斷方法研究

2018-02-05 01:44,,,,2
計算機測量與控制 2018年1期
關鍵詞:分類器故障診斷卷積

,, ,,2

(1.北京航天測控技術有限公司,北京 100041; 2.北京市高速交通工具智能診斷與健康管理重點實驗室,北京 100041)

0 引言

航空、航天、航海和高鐵等領域復雜的系統組成和精密的設備部件,以及各種復雜的運行環境和工況,使得系統的可靠運行和維修保障面臨很大的挑戰[1-2]。故障診斷技術就是通過傳感器采集反映設備或部件相關信息的數據,進行分析后判斷和預測設備及其內部組件的故障情況,從而決定其能否正常運行或需要進行維修和防護[3]。

采用多個傳感器對復雜設備進行監測,能夠擴展獲取信息的物理屬性、空間范圍或時間范圍,從而更全面的反映設備的狀態。例如,對電機的監測可采用電流、電壓、溫度以及不同安裝位置的振動傳感器。與單傳感器數據相比,多傳感器數據增加了信息的多樣性和完整性,理論上利用多傳感器數據進行故障診斷可獲得更高的準確度,但同時也需要更復雜的診斷模型。

近年來,利用多傳感器數據進行故障診斷方面取得了大量的研究成果[4],根據數據融合層級的不同,這些方法可分為以下三種類型:(1)原始數據融合:對各路傳感器采集的信號直接進行融合,一般用于同種物理量不同傳感器信號之間的融合,使其從多維信號降為單信號再進行故障判別;(2)信號特征融合:對各傳感器采集的信號進行時域或頻域分析,提取特征量后再進行融合,從而在降低特征空間的維度;(3)診斷結果融合:對每路傳感器信號進行單獨的故障診斷,再對診斷結果采用某種策略進行融合,例如三取二判決等。

以上三種方法均存在一定的局限性:原始數據融合和信號特征量融合只能用于相同性質物理量的融合,無法處理不同性質物理量的測量信號,而且降維操作不可避免將造成信息損失;診斷結果融合方法將每路傳感器信號單獨處理,沒有利用各路傳感器之間的關聯信息,實際上無論采用哪種策略進行判決都很難適應復雜多變的工況。從原理上說,只有完整利用各傳感器采集的原始數據,才能夠最大程度地挖掘數據的蘊含的故障特征,為故障診斷提供更全面的信息基礎。

深度學習(Deep Learning)是機器學習領域的一種新興方法,具備強大的自動特征提取能力,已經在圖像、語音識別等領域已經取得了輝煌的成果[5]。深度置信網絡(DBNs ,Deep Belief Networks)是深度學習的經典模型之一,已經成功應用于旋轉機械的故障診斷中[6]。但DBNs因其原理所限僅適合于單傳感器信號的故障診斷。雖然有研究將多傳感器信號拼接或融合為單路信號用DBNs進行處理,但因未利用多傳感器信號間的關聯信息而非最佳方案。深度卷積網絡(CNNs ,Convolutional Neural Networks)作為深度學習(Deep Learning)的另一種經典模型,同樣具備強大原始數據特征提取能力,成功應用于多個應用領域,如人臉識別、圖像導航、醫學圖像處理等[6]。CNNs還因其輸入數據為點陣和卷積運算的特點更加適用于多傳感器數據的分析處理。

本文研究了基于CNNs模型對多傳感器數據開展故障診斷的一般過程,通過截取相同時段的多傳感器采集數據形成測量數據幀,利用多個卷積層的若干卷積核在測量數據幀內部及相鄰時域幀之間進行卷積運算,實現自動提取特征。該方法對原始數據直接處理,并通過卷積運算充分利用多路數據之間的關聯信息,避免了以往數據降維操作帶來的信息損失。采用本方法分別對機器人故障數據集REF和軸流風機數據集BI02進行了處理分析,結果表明該方法對大規模數據集和小規模數據集均能取得理想效果。

1 CNNs概述

CNNs模型的發現是受到了動物視覺系統結構原理的啟發[7],通過十余年的發展已成為圖像處理領域最重要的模型之一。

CNNs一般由卷積層、池化層、全連接層和分類器組成,如圖1所示。其中卷積層和池化層組合在一起在前段使用,而全連接層和分類器組合在后端使用。卷積層、池化層、全連接層的自由組合連接,賦予CNNs極大的靈活性和適應性,在實際應用中可建立層數較多的深度網絡以提取更高層次的特征信息。

圖1 CNNs組成結構

1.1 卷積層

卷積層包含一定數量的濾波器,在設置權重和偏置矩陣后對輸入數據進行卷積計算,抽取特征形成特征面(feature map)。每個濾波器中的神經元通過一組權值被連接到原始數據或上一層特征面的局部區域,即卷積層中的神經元與其輸入層中的特征面進行局部連接。同一個濾波器中的所有神經元共享一組權重,從而大幅度減少計算量。

設卷積層的輸入為矩陣X,M和N列是輸入數據行數和列數,則卷積層的輸出如式(1):

Ccn=f(X*Wcn+bcn)

(1)

其中:*為卷積操作符,Ccn是該卷積層第cn個特征面,cn是濾波器數量;Wcn是第cn個濾波器的權重矩陣,bcn是該濾波器的偏置量;f是激活函數。

在一般人工神經網絡應用中一般使用飽和非線性函數如sigmoid函數,tanh函數等。但相比較于飽和非線性函數,不飽和非線性函數能夠解決梯度爆炸、梯度消失等問題,同時其也能夠加快收斂速度,因此成為深度網絡的首選。

本文選用的激活函數為ReLU函數,其計算公式為:

fcov(x)=max(0,x)

(2)

CNNs的卷積層通過卷積操作提取輸入的不同特征,第一層卷積層提取低級特征如邊緣、線條、角落,更高層的卷積層提取更高級的特征,這也是深度卷積網絡的意義所在。

1.2 池化層

池化層(pooling layer,也稱為取樣層)緊跟在卷積層之后,以卷積層輸出的特征面作為輸入,旨在通過降低特征面的分辨率來獲得具有空間不變性的特征。卷積層的一個特征面與池化層中的相應特征面一一對應,起到二次提取特征的作用。

常用的池化函數有最大池化、均值池化和隨機池化。文獻[8]通過分析得出:最大池化特別適用于分離非常稀疏的特征,能夠獲得一個更好的分類性能。

本文采用如下所示的最大池化函數,其中S是池化塊區域。

(3)

所有池化塊的輸出Pcn將組合在一起形成池化層的輸出,經過池化操作以后數據的行列尺寸將減少MS和NS倍,其中MS和NS為池化塊S的行列尺寸。

1.3 全連接層和分類器

在經過若干卷積層和池化層組合后,數據將進入全連接層和分類器進行最后的處理。CNNs中的全連接層和分類器與傳統人工神經網絡中的沒有區別。本文采用全連接層加上softmax分類器作為CNNs的最后輸出部分,假設任務為K類分類問題,按下式計算輸出:

其中:Wj和bj為權重和偏置量,O為CNNs最終分類結果。

CNNs可選用其它分類算法,但因為訓練算法也多采用BP算法,所以選取的分類器必須支持BP算法。同時,為了避免訓練過擬合,常在全連接層中常采用dropout這種正則化方法,在訓練過程中隨機選取某些隱層節點失效,這些節點不參加某次前向和后向傳播,從而使得CNNs的神經元學習過程更具更魯棒性。

2 故障診斷應用流程

采用CNNs模型進行故障診斷分為兩個階段:模型訓練和診斷應用,如圖2所示。其中模型訓練階段利用樣本數據對網絡模型進行監督訓練,診斷應用階段即利用訓練好的模型對采集數據進行分類。

圖2 CNNs故障診斷步驟

2.1 模型訓練

在模型訓練階段包括以下步驟:

1)測量數據幀設計。

CNNs模型的輸入為二維矩陣,根據這一特點定義測量數據幀如圖3所示。

圖3 測量數據幀

其中:M是傳感器/數據通道數量,N為截取采樣點的數量。N的選取比較關鍵,如N取值過小不能包含緩變信號全周期,將無法全面反映信號內容;如N取值過大,會減少訓練樣本數量。因此,應綜合樣本信號的周期特性、采樣數據總量來權衡決定N的取值。

2)樣本歸一化。

測量數據幀中各通道測量數據有不同的量綱及量程,為避免具有不同物理意義和量綱的輸入變量不平等使用,防止凈輸入絕對值過大引起的神經元輸出飽和現象,保證輸出數據中數值小的不被吞食,必須將量綱的數值經過變換化為無量綱的純量,即進行歸一化處理。

3)網絡參數設置與訓練。

CNNs網絡參數設置項包括:卷積層和池化層數量、卷積核維度和數量、全連接層數量、分類器類型、優化算法等。CNNs網絡訓練中主要采用BP算法,其實質是梯度下降算法。在實際應用中針對學習速率的設置產生了很多優化算法。選擇合適的優化算法讓網絡用最快的訓練次數達到理想的精度。常用算法包括SGD、Adam、Adagrad等,實際應用中可根據測量幀大小、樣本的數量以及計算資源選擇合適的優化算法。

在訓練深度神經網絡的時候經常會出現欠擬合和過擬合這兩個問題,將導致訓練精度過低或測試精度與訓練精度差別過大,從而造成模型不可用。解決方法包括重新清洗數據、增大數據的訓練量、采用正則化方法、采用dropout方法等,可在訓練過程中根據模型收斂情況選用。

2.2 故障診斷

在模型訓練完成之后可用于對采集數據的故障診斷分類,其步驟包括:按照格式要求截取采集的數據組成測量數據幀;將測量數據幀歸一化計算;將歸一化后的數據幀作為CNNs輸入進行前向傳播計算;根據分類結果后查找相應標簽得到故障類型。

3 實驗及分析

本文選用兩個數據集:Robot Execution Failure(REF)數據集[9]和某型軸流風機故障數據集(BI02),分別作為典型的小樣本數據和大樣本數據案例進行試驗。

3.1 機器人故障數據集

機器人故障數據集(REF,robot execution failure)是葡萄牙新里斯本大學公布的機器人故障監測數據,分別對某型號機器人不同部位安裝力和力矩測量傳感器采集共6路數據。REF共5 個子數據集,本文選取第一個子數據集LP-1 作為實驗數據集,共88個樣本,每個樣本包含15條測量數據,每個樣本均分別標記為normal、collision、fr_collision或obstruction這四個類型中的一種。

因LP-1提供的數據在采集時已經按照15×6維度進行分組,因此測量數據幀維度選定為M=15,N=6,其測量數據幀波形圖如圖4所示。

圖4 LP-1樣本測量數據幀

在數據集里隨機選取80%作為訓練樣本,剩余20%作為測試樣本。

CNNs網絡采用兩個卷積層(卷積核尺寸為5、個數分別為16和32)、兩個池化層(尺寸為2的max-pooling)、兩個全連接層和Softmax分類器,采用SGD優化算法。

因訓練樣本個數只有70個,在實驗初期出現較嚴重的過擬合現象,所以采用隨機加噪聲數據對樣本進行擴展,噪聲類型為隨機高斯白噪聲,擴展后樣本數量為560個。測試樣本數量不變。

采用擴展后樣本對網絡進行預訓練,其準確度曲線如圖5。

圖5 LP-1數據集訓練準確度曲線

訓練次數10 000次后準確度達到0.94,輸入測試樣本得到的測試準確度為0.91,高于文獻[10]中列出的幾種方法,取得較好的效果。

3.2 某型軸流風機故障數據集

此數據集為某型軸流風機(BI02)進行故障試驗時采集的數據,工作狀態分別為正常(N)、轉子不平衡(F1)和軸承裂縫(F2),測量參數為電流、轉速、振動頻率、輸入功率、空氣流量、空氣壓力數據,采樣頻率為12 kHz,測量時間持續1 000 S,每種工作狀態采集1 200萬條數據記錄,屬于較大規模數據集。

此數據集中截取每200個采樣點為一個測量數據幀,即測量數據幀維度M=200,N=5,其測量數據幀波形圖如圖6。

圖6 BI02樣本測量數據幀

在數據集里隨機選取80%作為訓練樣本,剩余20%作為測試樣本。

CNNs網絡采用兩個卷積層(卷積核尺寸為5、個數分別為32和64)、兩個池化層(尺寸為2的 max-pooling)、兩個全連接層和Softmax分類器。

此次訓練樣本個數較大,受實驗計算機內存限制,每批次訓練1 000個樣本,采用Adam優化算法,其準確度曲線如圖7。

圖7 BI02數據集訓練準確度曲線

經過1輪共126批次訓練準確度達到0.99,測試準確度達到0.99,取得較好的分類效果。

4 結論

本文提出了一種基于CNNs網絡用于故障診斷的方法,可直接和完整地利用多傳感器采集的原始數據進行故障分類診斷,明確了模型訓練和應用的流程步驟。通過對小規模故障數據集REF和大規模故障數據集BI02進行故障分類診斷試驗,取得較好效果,驗證了CNNs模型對不同規模數據集的適應性。

該方法在工程應用中還具有以下優勢:(1)直接利用原始數據,故障特征由CNNs網絡自動提取而無需人工設計算法處理,技術門檻大幅度降低;(2)同步處理多路傳感器信號,具備效率優勢;(3)模型具備普適性,可廣泛應用到各種信號的故障檢測當中,可建立領域通用的面向故障檢測的CNNs模型訓練和應用平臺。

以CNNs為代表的深度學習方法可從各類型試驗數據中挖掘高層次特征信息,后續將利用深度學習方法針對大型復雜系統在線故障實時診斷和預警進行應用研究,推廣其在工程中的實際應用。

[1] 傅建中. 智能制造裝備的發展現狀與趨勢[J].機電工程, 2014 , 31 ( 8) :959-962.

[2] 李 睿,郭迎清,吳文斐. 航空發動機傳感器故障診斷設計與驗證綜合仿真平臺[J]. 計算機測量與控制,2010, 18(3).

[3] 吳明強,史 慧,朱曉華,等. 故障診斷專家系統研究的現狀與展望. 計算機測量與控制,2005,(13)12.

[4] 王國彪,何正嘉, 陳雪峰,等. 機械故障診斷基礎研究何去何從 [J] . 機械工程學報, 2013, 49 ( 1): 63-72.

[5] Bengio, Yoshua, Hinton G E. Deep learning [J]. Nature, 2015,521(14539): 436-444.

[6] 葛強強. 基于深度置信網絡的數據驅動故障診斷方法研究[D]. 哈爾濱工業大學, 2016.

[7] Hyeon-Joong Yoo. Deep convolution neural networks in computer vision: a review [C]. IEIE Transactions on Smart Processing and Computing,2015, 4(1):35-43.

[8] Y-Lan Boureau, Jean Ponce, Yann LeCun. A theoretical analysis of feature pooling in visual recognition [C]. International Conference on Machine Learning, 2010, 32(4):111-118.

[9] Robot Execution Failures (REF)[Z/OL]. https://archive.ics.uci.edu/ml/machine-learning-databases/robotfailure-mld/.

[10] 李正欣, 郭建勝等. 多元時間序列相似性度量方法[J]. 控制與決策,2017, 32 (2):368-372.

猜你喜歡
分類器故障診斷卷積
比亞迪秦EV充電系統故障診斷與排除
學貫中西(6):闡述ML分類器的工作流程
基于包絡解調原理的低轉速滾動軸承故障診斷
基于3D-Winograd的快速卷積算法設計及FPGA實現
基于樸素Bayes組合的簡易集成分類器①
卷積神經網絡的分析與設計
從濾波器理解卷積
一種自適應子融合集成多分類器方法
數控機床電氣系統的故障診斷與維修
基于傅里葉域卷積表示的目標跟蹤算法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合