?

基于機器學習算法的壽命預測與故障診斷技術的發展綜述

2019-03-19 01:20,
計算機測量與控制 2019年3期
關鍵詞:壽命故障診斷向量

,

(西南交通大學 數學學院統計系,成都 611756)

0 引言

壽命預測與故障診斷是可靠性分析中的兩大基本問題。壽命預測,也被稱為剩余服役壽命預測或剩余使用壽命預測,指在規定的運行工況下,能夠保證機器安全、經濟運行的剩余時間,而在可靠性工程中的壽命預測是進行預測與健康管理的關鍵技術,是減少生產損失的方法,可以節省維護成本。故障診斷則是指故障檢測和故障隔離這兩個過程,其中利用各種檢查和測試方法,發現系統和設備是否存在故障的過程是故障檢測;故障隔離則是要求把故障定位到實施修理時可更換的產品層次(可更換單位),因此故障診斷可以判定出設備故障類型與故障部位,從而對設備進行維修,減少由于設備停運時間過長而造成的損失。

針對不同的時期,壽命預測分為早期預測和中晚期預測[1]。在可靠性工程領域中,早期壽命預測能確定設備的設計(計算)壽命,中期預測則是通過實況監測還處于設計壽命中的設備從而實現對剩余壽命的預測,從而到達避免設備在使用期間出現意外情況的目的;采用晚期預測是因為設計壽命往往都會比較保守,設備還沒有得到充分利用就會被認為已經到達使用壽命,這樣一來就會造成很大的經濟浪費,因此需要利用晚期預測對累計使用時間已經超過設計壽命的設備進行剩余壽命預測。目前壽命預測的方法大體可以劃分為三類:基于力學的壽命預測方法、基于概率統計的壽命預測方法、基于信息新技術的壽命預測方法[2]。從本質上來看,基于力學的壽命預測方法是從動力學特性(失效和破壞機制)上來進行壽命預測,可是當多失效模式發生耦合情況的時候,該方法運用起來就得稍顯吃力;根據積累的數據(試驗數據與現場數據)來建立統計模型,通過確定壽命分布的特征值以及失效概率,在指定可靠度下預測壽命是基于概率統計的壽命預測方法,但此方法的前提是大量的試驗和數據的積累。而如今的數據都來源于試驗技術:真實的現場試驗以及在實驗室進行模擬或加速試驗,這兩種獲取數據的方法都是使用產品原型進行試驗,普通類型的機械產品適合這兩種常規方法,而對于小批量生產的重大機械裝備,其造價昂貴,供貨時間也長,因而常規的大樣本試驗方法是非常不合適的,這個時候就需要采用基于信息新技術的壽命預測方法,做到同時兼顧大/小樣本數據達到壽命預測的目的。

在可靠性工程中進行故障診斷的步驟:首先判定設備有無故障,接著分析原因,確定故障類型,最后劃分故障類別,診斷出設備具體的故障部位以及故障原因,為恢復故障設備做準備。目前,故障診斷的方法也大致分成三類:基于解析模型的故障診斷方法、基于信號處理的故障診斷方法以及基于人工智能的故障診斷方法[3]。發展最早、研究最系統的故障診斷方法是基于解析模型的故障診斷方法,它能夠深入系統本質的動態性質和實時診斷,但是很難獲得一個系統模型,同時由于建模中有誤差、擾動和噪聲,使得魯棒性問題漸漸凸顯;基于信號處理的方法盡管易于實現、實時性也比較好,但在對潛在的故障進行診斷的時候就會凸顯其不足之處,因此往往將其用于故障檢測。而基于人工智能的故障診斷方法能夠克服對于模型的過分依賴性,也能對潛在的故障進行診斷,從而提高故障診斷的精度。

當前處于大數據時代,基于信息新技術的壽命預測方法與基于人工智能的故障診斷方法幾乎都是利用機器學習算法來進行,但隨著技術的不斷進步,機器學習算法的種類也在不斷增加,因此本文總結了目前在壽命預測與故障診斷中最常用的幾種機器學習算法,分析了現有研究的不足,展望未來的研究重點和發展趨勢。

1 機器學習算法簡介

機器學習,即是通過自主學習大量數據中存在的規律,獲得新經驗和知識從而提高計算機智能,使得計算機擁有類似人類的決策能力。

基于學習形式的不同通??蓪C器學習算法分為監督學習(Supervised Learning)、無監督學習(Unsupervised Learning)以及強化學習(Reinforcement Learning)三類:

(1)監督學習(Supervised Learning):給學習算法提供標記的數據和所需的輸出,對于每一個輸入,學習者都被提供了一個回應的目標。監督學習主要被應用于快速高效地教熟AI(Artificial Intelligence)現有的知識,被用于解決分類和回歸的問題。常見的算法有:決策樹、Adaboost算法、人工神經網絡算法(Artificial Neural Networks, ANN)、支持向量機(Support Vector Machine, SVM)、樸素貝葉斯、K近鄰、邏輯回歸、隨機森林。

(2)無監督學習(Unsupervised Learning):給學習算法提供的數據是未標記的,并且要求算法識別輸入數據中的模式,主要是建立一個模型,用其試著對輸入的數據進行解釋,并用于下次輸入?,F實情況下往往很多數據集都有大量的未標記樣本,有標記的樣本反而比較少。如果直接棄用,很大程度上會導致模型精度低。這種情況解決的思路往往是結合有標記的樣本,通過估計的方法把未標記樣本變為偽的有標記樣本,所以無監督學習比監督學習更難掌握。主要用于解決聚類和降維問題,常見的算法有:聚類算法(K均值、Expectation Maximization算法、Affinity Propagation聚類、層次聚類)、降維算法(主成分分析、局部線性嵌入降維算法)。

(3)強化學習(Reinforcement Learning)該算法與動態環境相互作用,把環境的反饋作為輸入,通過學習選擇能達到其目標的最優動作。強化學習這一方法背后的數學原理與監督/非監督學習略有差異。監督/非監督學習更多地應用了統計學,而強化學習更多地結合了離散數學、隨機過程這些數學方法。常見的算法有:TD(λ)算法、Q_learning算法。

監督學習、無監督學習、強化學習三類方法的主要區別點見表1。

表1 三類機器學習算法的比較

2 機器學習算法在壽命預測中的應用與發展

目前,機器學習算法在壽命預測中應用最多是基于人工神經網絡與支持向量機,并在這些算法的基礎上靈活運用其他算法或模型進行優化改進,從而提高壽命預測的精度。

自20世紀80年代以來,人工神經網絡(又被稱為神經網絡或類神經網絡)逐漸成為了人工智能領域興起的研究熱點,是從信息處理的角度出發,對人腦的神經元網絡進行抽象,從而建立起某種簡單的模型,根據不同的連接方式組成不同的網絡。人工神經網絡屬于一類運算模型,是由大量的節點(神經元)相互聯接構成的,這里每一個節點都代表一種特定的輸出函數,稱其為激勵函數;而每兩個節點間的連接被稱為權重,即對通過該連接信號的加權值。網絡的輸出則隨著網絡的連接方式、權重值以及激勵函數而改變。而網絡自身往往是對自然界的某種算法、函數的逼近,或者是對一種邏輯策略的表達。由于現在已知的人工神經網絡種類較多,因此目前在壽命預測中通常使用BP(Back Propagation)神經網絡以及結合灰色模型與人工神經網絡模型的灰色神經網絡,也有少量采用其他人工神經網絡如極限學習機(Extreme Learning Machine,ELM)、遞歸神經網絡(Recurrent Neural Network, RNN)等。在工程中的應用與研究,僅采用BP神經網絡有:文獻[4-7]通過BP神經網絡分別建立起了繼電器剩余壽命的關系模型、油浸式變壓器固體絕緣老化模型,機械密封壽命預測模型、AISI1045鋼材疲勞壽命預測模型,都得到了較好的壽命預測結果;Elforjani Mohamed[8]等則通對比實驗發現BP神經網絡預測聲射技術機器的慢速軸承的剩余壽命的結果優于支持向量機與高斯回歸過程。

但由于BP神經網絡的初始權值和閾值是隨機獲取的,容易導致訓練陷入局部最優以及延長收斂時間,因此往往需要用其他算法對BP神經網絡進行優化改進。在應用與研究中常常與BP神經網絡結合的算法有遺傳算法、粒子群算法(Particle Swarm Optimization, PSO),文獻[9-12]都是用遺傳算法去優化BP神經網絡分別預測了LED、刀具、除濕機、液壓支架的壽命,發現其預測誤差小,普適度高;文獻[13-15]則是用粒子群算法優化網絡權值及閾值,分別對刀具壽命、電動機絕緣剩余壽命、電鍍金剛石套鉆使用壽命進行預測,并證明了PSO-BP模型的預測精度較BP神經網絡模型有一定的提高。也有采用其他算法進行改進的,文獻[16-18]都運用了L-M(Levenberg-Marquardt)算法去訓練BP神經網絡,但很少有關注到對算法本身進行改進之后再去訓練神經網絡,而文獻[19]則首先對L-M算法進行改進,提出了一種采用了動態動量和阻尼L-M算法的混合優化算法,再結合BP神經網絡對軸承的剩余壽命進行了預測。當然,除了BP神經網絡以外,工程中還存在其他種類的神經網絡的應用與研究,如Zhang[20]等發現在預測刀具剩余壽命預測中,模糊神經網絡(Neuro-Fuzzy Network, NFN)的預測效果優于BP神經網絡和徑向基函數網絡(Radial Basis Function Network, RBFN);杜占龍[21]等則針對多分類極限學習機缺乏概率輸出能力的問題,提出一種基于由Platt[22]提出的sigmoig后驗概率映射和Lagrange成對耦合法的多分類ELM(Multi-class Probabilistic ELM, MPELM),并將其用于剩余壽命預測,實驗結果表明,相比于多分類概率支持向量機(Multi-class Probabilistic Support Vector Machine, MPSVM),MPELM耗時高于MPSVM,但MPELM所需優化參數少,預測精度高于MPSVM;與基于Hastie[23]成對耦合法的MPELM相比,兩者預測精度相近;Guo[24]等提出了一種基于遞歸神經網絡的健康指標用于軸承的剩余壽命預測,并從實驗和工業領域收集的兩個軸承數據集進行驗證,其結果表明,改進后的模型具有較高的單調性和相關性,提高了剩余壽命的預測精度。表2則詳細梳理了以上文獻中對于神經網絡算法改進的具體創新點。

在工程中常用的機器學習算法除了人工神經網絡之外,還有支持向量機。支持向量機是1995年由Vapnik依據統計學習理論提出的一種基于結構風險最小化的二分類器。這里的結構風險最小化是指在保證經驗風險(即自檢正確率)的基礎上,優化分類函數的置信范圍(即分類函數的可推廣性),取得實際風險的最小。二分類器(Binary Classifier):采用兩類樣本XA、XB訓練得到二分類器SVMA-B,給定測試樣本XT,SVMA-B能夠判定XT更可能屬于類別A或是類別B。介于只使用支持向量機所建壽命預測模型精度較低,一般在工程運用中會將支持向量機與其他壽命預測模型或算法相結合,從而提高預測精度:Chen[25]等提出了基于相似理論與SVM的航空發動機的剩余壽命預測模型,并用數據驗證了該模型的有效性;Gao和Huang[26]提出了一種基于多項式核和徑向基核函數的新型多核SVM,并運用粒子群優化算法搜索模型的核參數,懲罰因子和權重系數,運用該模型去預測鋰電池的剩余使用壽命,并通過驗證得到改進后的算法不僅具有更好的預測精度和更強的泛化能力,而且還減少了訓練時間和計算復雜度;于震梁[27]等針對現有機械零件剩余壽命預測模型在建模過程中無法同時采用已有數據庫數據及被預測產品實時退化數據,提出了一種基于SVM和非線性卡爾曼濾波相結合的機械零件剩余壽命預測模型,并以某型號滾動軸承為例,驗證了所提出剩余壽命預測模型的精度、穩定性及工程應用價值;王莉[28]等則提出了一種新的電池壽命預測模型,即基于最小二乘SVM的電池壽命預測,并利用此預測模型對實驗數據進行了比較驗證,驗證結果表明,該模型在閥控式鉛酸蓄電池壽命預測中具有很好的實用性,預測值與實測值能夠保持很好的一致性,因此,基于最小二乘SVM的閥控式鉛酸蓄電池壽命預測方法是切實可行的。表3詳細梳理了以上應用與研究對SVM算法進行改進的具體創新點。

除了采用人工神經網絡與支持向量機這兩種機器學習算法,也有采用樸素貝葉斯與隨機森林去進行壽命預測,如Wu[29]等采用了基于隨機森林的工具磨損壽命預測的方法,并與前饋反向神經網絡、支持向量回歸作比較,隨機森林壽命預測模型更準確;Ng Selina[30]考慮在恒定工作條件下在不同環境溫度和放電電流值下的鋰離子電池剩余壽命預測,提出了一種樸素貝葉斯(Native Bayes, NB)模型,用于在不同操作條件下對電池進行剩余壽命預測。在該分析中顯示,在恒定放電環境下,可以使用NB方法預測,且不用管操作條件的確切值。并且通過實例表明,NB比SVM產生穩定且有競爭力的預測性能。

從上述應用與研究可以看出,機器學習算法在壽命預測中的發展是由單一算法(BP神經網絡、SVM)的應用作為起點,為了提高預測精度以及改進算法在不同零件、設備壽命預測中的不足之處,從而將其他種類算法與之結合。而隨著人工智能領域的不斷發展,又引入了其他種類的機器學習算法,如隨機森林、樸素貝葉斯等。

3 機器學習算法在故障診斷中的應用與發展

在數學問題中,故障診斷屬于分類問題,故而可以選用機器學習算法中的分類算法進行故障診斷。一般情況下,智能故障診斷系統主要包含以下幾個功能模塊:數據庫模塊、知識獲取機構、診斷推理模塊、學習機構、解釋機構以及人機接口。不同的系統與診斷方法會建立的不同功能的故障診斷系統,但前提是必須保證設計的診斷系統符合需求,如可靠性、實用性、可維護性等等;并且要達到指定的診斷準確率和診斷速度。故障信息的不間斷更新會影響診斷性能,得到更多的故障知識,實時更新故障內容,并將故障知識用恰當的診斷系統表達出來,這樣能使得故障診斷系統的性能更好。在故障診斷中使用機器學習算法的整體框架見下圖,在實際情況下,會根據不同的診斷對象對應建立不同的故障診斷模型,并在診斷中不斷地對模型進行修改、更新、完善。一般用于故障診斷的機器學習算法是SVM、灰色神經網絡、Elman神經網絡。

圖1 機器學習算法的兩種應用

運用SVM時,往往跟其用于壽命預測中一樣,會用其他算法去進行優化改進。SVM算法在工程中的應用與研究常常出現在滾動軸承的故障診斷,如Li[31]等提出一種基于分層符號動態熵(Hierarchical Symbol Dynamic Entropy, HSDE)和二叉樹支持向量機(Binary Tree Support Vector Machine, BT-SVM)的滾動軸承故障診斷方法;Zhou[32]等提出了在少量訓練樣本可用時保持較高的故障識別準確率的新方法,即基于集合經驗模態分解(Ensemble Empirical Mode Decomposition, EEMD)、加權置換熵(Weighted Permutation Entropy, WPE)和改進支持向量機集成分類器相結合的故障診斷方法,結果表明,該方法能夠有效地檢測軸承故障;阮婉瑩[33]等則是針對滾動軸承故障振動信號的非平穩性和低信噪比的特點,提出基于變分模態分解(Varianational Mode Decomposition, VMD)排列熵和粒子群優化支持向量機(Particle Swarm Optimization-Support Vector Machine, PSO-SVM)的故障診斷方法,在滾動軸承故障診斷實例中,通過與VMD結合SVM和集成經驗模態分解結合PSO-SVM進行對比。結果表明,新提出的方法故障診斷的準確率更高。當然,SVM算法的應用不僅僅局限在滾動軸承的故障診斷,例如在感應電動機的故障診斷中,Gangsar和Tiwar[34]用小波包變換與SVM相結合的故障診斷方法,并且考慮了不同小波的影響,其結果表明即使在某些電機工作條件下數據或信息有限,所提出的故障診斷方法也可用于成功檢測和隔離各種故障;Liu和Zio[35]針對數據來源不同提出了基于KNN的模糊SVM方法,文中分別用反向KNN檢測異常值以及KNN識別邊界點用于定義支持向量機中的分類超平面,最后對高速列車的制動系統中進行故障診斷,驗證了新方法的可行性;何慶飛[36]等針對單方法所建液壓泵壽命預測模型精度較低的缺陷,提出基于灰色理論和支持向量機的組合預測模型的液壓泵壽命預測方法,采用該模型對液壓泵進行壽命預測,并與灰色模型、單一支持向量機模型進行預測性能對比。結果表明,灰色支持向量機預測性能最優。在表4中,對SVM算法在故障診斷中的應用與研究的創新點進行了梳理。

表4 SVM算法在故障診斷中的改進

在實際中,僅采用SVM算法進行故障診斷解決問題具有一定局限性的,故而會采用其他機器學習算法,如人工神經網絡。與SVM算法類似,為了提高預測準確率,會將其他算法與人工神經網絡算法相結合,灰色神經網絡就是由灰色模型與人工神經網絡結合而成的。在故障診斷中,會因為對某些設備的故障信息掌握得不夠全面而使得設備故障具有一定程度的灰色性,因此可以采用灰色系統理論來對應解決這類故障診斷問題?;疑碚摰囊粋€重要分支是灰色關聯度分析,它的作用是確定系統的邊界、判別主次要因子、模式識別、灰關聯聚類分析等。李婧與王娜[37]將BP神經網絡與灰色關聯度分析結合,對典型灰色系統變頻調速系統進行故障診斷,并通過實例證明該灰色神經網絡容易實現,診斷準確率也有所提高;程加堂[38]等針對油中溶解多種氣體含量會影響變壓器故障類型,為了提高故障診斷的精度,利用灰色神經網絡建立了變壓器的故障診斷模型,擬合輸入、輸出之間復雜的非線性函數關系,并證明了該方法的可行性;Elman神經網絡是由J.L.Elman在1990年針對語音處理問題而提出的,它屬于一種典型的局部回歸網絡,可以被看作是具有局部記憶單元和局部反饋連接的遞歸神經網絡。通過對已有應用與研究的整理,發現Elmn網絡多用于滾動軸承的故障診斷,比如Fu[39]等為實現隨機噪聲下滾動軸承的精確故障診斷,提出了一種基于集合經驗模態分解(Ensemble Empirical Mode Decomposition, EEMD)和優化Elman-AdaBoost的故障診斷方法;楊紅葉與高偉軍[40]針對提取滾動軸承故障特征向量信號和識別故障類型的問題,為了提高故障診斷的精度,提出了一種新方法:結合小波包分析和BP算法權值修正的Elman神經網絡。表5則詳細梳理了以上應用與研究對神經網絡算法進行改進的具體創新點。

表5 神經網絡算法在故障診斷中的改進

在故障診斷中還存在其他機器學習算法。比如溫江濤和周熙楠[41]針對在旋轉機械的智能故障診斷中,復雜網絡結構的非監督學習方法調節參數多,訓練時間長,而結構簡單的網絡診斷準確率不夠理想這些問題,采用模糊信息?;拖∈枳跃幋a器搭建并行結構的學習網絡,并行結構的稀疏自編碼器同時對?;笾匦聵嫵傻亩鄠€有效參量信息自適應的進行特征提取,隨后使用隨機森林方法對提取的特征進行融合分類,實驗結果表明該方法可以有效實現高精度故障診斷,且與常用的串行多網絡處理結構相比,降低了網絡參數調節的復雜度和多層網絡的前后影響,并且提高了診斷精度,減少了訓練時間;Liu[42]等提出了基于固有時間尺度分解和多級Adaboost相關向量機的故障診斷方法對柴油機故障診斷;Yao[43]等提出了一種利用局部特征尺度分解多尺度置換熵和ELM-AdaBoost算法進行軸承故障診斷的新方法,并用結果表明該方法可以有效地準確診斷鐵路軸箱軸承故障。

4 發展趨勢

從上述應用與研究中可以發現,機器學習算法在壽命預測與故障診斷中還需要解決的問題主要有以下3個:

第一,機器學習算法的運用現狀還僅僅局限于材料試件與局部構件,距離實現重大裝備整體的壽命預測與故障診斷還有較大的差距,這未來機器學習算法需要突破的一個重大難點;

第二,目前還只是運用了極少數的機器學習算法,其中應用與研究最為廣泛的是人工神經網絡與支持向量機,還有大量機器學習算法有待發掘;

第三,已經應用的算法更適用于擁有大樣本試驗數據的設備,而實際中獲得的小樣本試驗數據的情況居多,因此如何利用機器學習算法對小樣本數據的設備進行壽命預測與故障診斷也是需要攻堅的一個難點。

以上難點都需要對其他種類的機器學習算法進行深入學習與研究,才可能最大化地挖掘機器學習算法在壽命預測與故障診斷中的作用。

5 結束語

人工智能下的機器學習算法為可靠性分析中的壽命估計與故障診斷提供了一種高效手段,并且已逐漸運用于工程領域中。本文梳理了機器學習算法的具體應用與研究現狀,從現有數據來源來看,都是通過試驗技術得到,而試驗技術的方法都是采用產品原型試驗進行確定,適用于普通機械產品,而對于小批量生產的機械重大裝備,由于價格昂貴,供貨時間長,采用常規的大樣本試驗方法是非常不適宜的,甚至是不可能的,因此需要機器學習算法對小樣本數據進行壽命預測與故障診斷;從研究對象來看,當前絕大多數運用機器學習算法進行壽命預測的研究還是停留在各種材料試件或者機械裝備的各種零部件,距離實現機械重大裝備整體壽命預測還需要不斷深入研究;從對機器學習算法的運用來看,盡管現如今存在眾多機器學習算法,但目前運用最為廣泛的是人工神經網絡與支持向量機,距離實現機器學習算法的全面應用還需要不斷深入發展。

猜你喜歡
壽命故障診斷向量
比亞迪秦EV充電系統故障診斷與排除
向量的分解
基于包絡解調原理的低轉速滾動軸承故障診斷
人類壽命極限應在120~150歲之間
聚焦“向量與三角”創新題
倉鼠的壽命知多少
馬烈光養生之悟 自靜其心延壽命
數控機床電氣系統的故障診斷與維修
人類正常壽命為175歲
向量垂直在解析幾何中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合