?

基于數據驅動的渦輪發動機剩余壽命預測

2021-07-14 02:04柳長源何先平于會越
電機與控制學報 2021年7期
關鍵詞:梯度壽命發動機

柳長源, 何先平, 于會越

(哈爾濱理工大學 測控技術與通信工程學院,哈爾濱 150080)

0 引 言

渦輪發動機的工作狀態直接影響飛機的性能,而飛機由于其起飛后長時間滯空等客觀原因,其發生故障后不管是對人身安全方面的危害,還是經濟方面的損失,都是無法估量的。為了保障渦輪發動機的運行的可靠性,并降低飛機的維修成本,美國等航空發達國家早在1977年就將故障預測和健康管理應用于發動機的維修[1]。ISO13881-1定義故障預測為:對設備失效或出現風險的時間點進行估計。而設備的剩余壽命(remaining useful life RUL)[2]指的是設備從初始狀態到設備完全失效這一階段的時間。預先精準的剩余壽命預測能夠使航空公司提前做出明智的維護決策,避免永久性損壞,顯著的降低了運營和維護成本。

渦輪發動機剩余壽命預測主要有2個方向,1)基于物理模型:在發動機失效原理基礎上建立模型后對剩余壽命進行預測操作;2)基于數據驅動,通過采集或者仿真發動機失效過程中的數據,利用算法、機器學習等結合失效閾值進行剩余壽命預測,如基于滑動窗口的算法[3]、基于隱馬爾科夫的算法(HMM)[4]、基于K-Means的算法[5]、基于支持向量機的算法(SVM)[6]、基于卷積神經網絡(CNN)和長短期記憶網絡(LSTM)的算法等[7-8];基于物理模型建立壽命預測模型的泛化性較差,所以本文采用第二種方式進行壽命預測。

基于支持向量回歸的算法不能良好利用性能參數對應的提取時間來預測剩余壽命,而且SVR模型的參數較多,在實際應用的在參數設置方面會耗費大量的資源,并且預測效果和算法的效率一般?;谏窠浘W絡的算法受其搜索算法的控制,求解空間函數時若搜索步長過小容易陷入局部最優,存在局部極小、收斂速度慢的問題。隨著機器學習技術的成熟,集成學習也有了很大的發展。這種通過某些規則將多個機器學習的成果有效的整合在一起的方法也可以應用在發動機壽命預測上。通過使用單邊梯度采樣和互斥特征綁定對梯度提升迭代決策樹(gradient boosting decision tree, GBDT)進行改進,該算法提高了樹算法中的殘差的近似值,選擇擬合損失函數的負梯度的方法來進行壽命預測,在保證預測性能指標的同時大大降低了模型的運行時間,提高了模型的預測效率。

1 梯度提升樹模型原理

GBDT模型是利用加法模型和前向分布算法實現學習優化過程的一種集成模型。GBDT預測流程如圖1所示。

圖1 GBDT預測流程Fig.1 GBDT forecasting process

該模型基分類器為分類與回歸樹(classification and regression tree,CART),集成方為梯度下降(gradient boosting)[9]。GBDT在進行子樹構建時將會產生相應的殘差,將其數據傳輸給下一個子樹,并且按照子樹逐層構建的順序來進行預測,最終將預測結果相加。

1.1 GBDT概述

GBDT模型在訓練過程中不斷調整殘差,最終通過相加來實現數據的回歸。訓練數據集表示為

T={(x1,y1),(x2,y2),…,(xN,yN)},xi∈χ?Rn。

(1)

式中:x為輸入空間;yi∈Y?Rn,y為輸出空間。損失函數為L(y,f(x)),輸出為F(x)。損失函數訓練數據集模型可以表示為決策樹的加法模型:

(2)

式中:T(x;θm)為決策樹;θm為決策樹參數;M為樹的個數。

模型訓練總輪數為M輪,每輪都會有一個弱分類器T(x;θm)產生。弱分類器的損失函數為

(3)

GBDT的每一次迭代都要輸入上一次迭代產生的殘差,擬合誤差會隨著迭代次數的增加逐步減小。因此,通過不斷的迭代,最終得到一個弱學習器T(x;θm),使樣本的損失盡可能變小。

1.2 GBDT的負梯度擬合

Freidman通過采用損失函數的負梯度的方式來模擬最速下降法,從而得到擬合本輪損失的近似值[10],這種方法解決了損失函數擬合方法的問題,最后通過擬合得到一個CART回歸樹[11]。第M輪的第i個樣本的損失函數的負梯度表示為

(4)

利用(xi,rmi)(i=1,2,…,m)估計回歸樹葉節點區域。將第m顆樹的輸入空間χi分為j個無交集部分Rm1,Rm2,…,RmJ,每個部分的輸出為常量cmj,c為上一輪迭代后決策樹的輸出值,有

(5)

(6)

(7)

采用線性搜索來估計葉節點區域的值,使損失函數達到極小化,則樹由初始狀態(6)更新為式(7)。

最終得到回歸樹為

(8)

1.3 改進的梯度提升樹

GBDT具有效率高、精度高等優點,但由于GBDT在處理數據是需要掃描數據集的所有特征,在處理高維度、數據量大的數據集時非常耗時[12]。

本文使用基于梯度的單邊采樣和互斥特征捆綁這兩種算法對GBDT進行改進,改進的GBDT算法能夠很好的平衡運行效率和數據量。這種改進大幅度提高了計算速度、降低了內存消耗,也更適應于大數據的回歸。

1.3.1 單邊梯度采樣

單邊梯度采樣主要是通過減少樣本數據,在保證較大梯度樣本數據不變的同時,隨機采樣部分的小梯度樣本,不僅極大地提升了計算速度,也有效地保證了計算精度。

較大梯度的數據能夠為計算信息增益的提供較大的幫助,當某個樣本點的梯度已經減小到足夠小時,此時該樣本的訓練誤差已經達到要求,即該樣本已經被充分訓練。因此,使用常量乘法器放大未充分訓練。

為了保證數據的總體分布,首先針將數據的絕對值進行依次減少的順式排序,然后選取前a個樣本作為較大梯度的數據子集A,并對其余樣本進行隨機采樣,在剩下的較小梯度數據中選取b個樣本實例作為數據集B[13]。最后,通過計算所選取的a+b個樣本數據,獲得信息增益,其計算方式為

(9)

1.3.2 互斥特征綁定

互斥特征綁定的定義是為提升計算效率,而將不完全互斥的特征進行融合捆綁來降低特征數量。為減少計算量,將特征按照非零值進行排序,非零值越多,越容易發生互斥,并將不完全發生互斥的2個特征進行捆綁,并使用特征合并法來降低算法復雜度。通過互斥綁定后的復雜度為O(數據×綁定后特征數目),此時使用的綁定后特征數目已經大幅度降低,使得模型在保證精度的情況下減少訓練時間。改進的GBDT算法存儲的不是連續的特征值而是離散的直方柱。通過向指定的直方柱添加偏移量解決原始特征值可識別問題。設定特征數組總共包含2個特征C,D。若C∈[0,8],D∈[0,16],向特征向量D添加8個單位的偏移量,則綁定后的范圍為[8,24]。

2 基于梯度提升樹的壽命預測

2.1 實驗數據介紹

本實驗采用的是大型渦輪風扇發動機GE90的仿真數據。該數據集共有4個子集,各個子集的操作模態和故障數目各不相同,每個子集都由200個及以上完整的運行單元組成。每個完整的運行單元由26維特征數據構成。每一維數據都可以描述給定時間點上引擎狀態或受到其他列傳感器影響的數據。該矩陣第一列表示發動機ID,第二列表示發動機運行次數,接下來的三列為運行環境設置,余下的21列則對應傳感器數據。4個仿真數據子集的詳細設置如表1所示。

表1 C-MAPSS數據集

為了衡量算法效果,本文使用兩種評價指標來進行衡量。懲罰函數(Score)的大小衡量了壽命預測的合理性,有

(10)

而均方根誤差(RMSE)反映了預測壽命與實際壽命的擬合程度,表示為

(11)

其中Ei為真實壽命與預測壽命之差,當Ei越小,即Score與RMSE越小,預測壽命越準確,預測效果越好。

2.2 剩余壽命估計目標函數

早期的余壽預測領域所使用的目標函數大多數為一次遞減函數,這種函數只能表示設備損耗與設備性能之間的線性下降的關系,無法顯示設備的損耗與時間的關系。機械設備工作初期設備磨損較小,機械設備在一段時間內工作在穩定狀態。而機械設備在經過長時間的磨損之后,設備性能逐漸降低,當磨損達到一個臨界值,設備的使用壽命逐漸下降[14]。因此,使用分段目標函數能夠更加準確的表示剩余壽命的發展趨勢,如圖2所示。

圖2 剩余壽命估計目標函數Fig.2 Remaining useful life of objective function

本文采用的分段函數是通過實驗確定,對于GE90的仿真數據集,其最長使用壽命為130能夠得到最優的預測性能。對于一個完整運行壽命周期為200的實驗,設其最初運行時為最大使用壽命130,運行一段時間后到達第70個檢測采樣周期,此后電機壽命開始逐漸下降,呈線性衰減,直到實驗結束時剩余使用壽命衰減為0。

2.3 數據歸一化

數據處理根據數據自身具有的特性,避免特征絕對值上小數據被大數據平均掉,幫助模型更好的適應數據。

崇明島內河水位主要是由沿江水閘控制的。在枯水期(1月、2月、11月、12月),島上的水閘一般采取西水東調、南引北排的方式進行調水工作;在平常的3月、4月、5月、10月,則根據長江內的水質情況,采取選擇性的引排方式,即選擇符合引水標準的南沿水閘進行引水、北沿水閘適當排水。而在主汛期主要是以南引北排的方式進行,以控制內河水位。

歸一化方程式為

(12)

式中:μi表示平均值;σi表示標準偏差。對發動機的21維傳感器參數進行歸一化處理后如圖3所示。

圖3 歸一化處理Fig.3 Normalization

3 實驗結果分析

本實驗的實驗環境如表2所示。

表2 實驗環境

3.1 工況一性能分析

圖4為改進的GBDT模型在FD001數據集和FD003數據集中的Score變化情況,這兩種數據集均工作在模態1下。實驗結果表明,改進的GBDT算法在FD001數據集和FD003數據集的Score指標上表現極其優越。FD003數據集在Score指標表現上較FD001數據集表現稍差,這是由于FD003數據集是在高壓壓氣機和風扇均故障下收集得到的。

圖4 FD001和FD003的Score對比Fig.4 Comparison of Score between FD001 and FD003

圖5為不同算法在FD001數據集和FD003數據集下的評價指標直方圖。由圖可以看出,改進后的GBDT算法在2種數據集中的RMSE值偏高,但由于RMSE值與Score值的相關性,綜合總體情況,改進后的GBDT算法更加適用于提前發出壽命預警,而對于飛機發動機而言,更早的發現發動機設備的受損情況能夠更早的進行設備維護工作,因此較早提出壽命預警是合理的。

圖5 FD001和FD003的RMSE對比Fig.5 Comparison of RMSE between FD001 and FD003

3.2 工況二性能分析

FD002數據集和FD004數據集在模態6下工作。通過對比實驗可知,改進GBDT模型的Score指標較剩余壽命預測領域經典算法提升幅度小,各個算法的Score指標對比如圖6所示。

圖6 FD002和FD004的Score指標對比Fig.6 Comparison of Score between FD002 and FD004

復雜工況下改進的GBDT的RMSE表現較差,FD002數據集較FD004數據集稍好一些。RMSE直觀對比如圖7所示。更復雜的情況導致擬合較為困難,2個數據集下改進GBDT的RMSE指標都是僅僅比SVR表現略好。將兩種指標進行總體分析,改進的GBDT模型在復雜工況下,Score值較其他算法略有提升,RMSE較經典算法略有提高,能夠在發電機剩余壽命結束前發出預警。

圖7 FD002和FD004的RMSE對比Fig.7 Comparison of RMSE between FD002 and FD004

通過分析改進的GBDT與其他算法在不同工況下的性能,可以得出改進的GBDT算法在Score指標上有較為明顯的提升,能夠較好的預測發動機的剩余壽命情況,尤其是在故障較少的FD001和FD002數據集下表現較為優異,算法預測更為準確,而在復雜工況的下提升幅度較小。改進的GBDT算法在RMSE指標上也是在簡單工況的表現更好。因此,改進的GBDT算法能夠提早完成預測,適用于發動機剩余壽命預測。

從C-MAPSS中的FD001、FD002、FD003、FD004中分別隨機選擇一個時間周期,在保證其測試結果完整的情況下進行結果可視化,真實剩余壽命與預測剩余壽命的對比圖如圖8所示。其中折線為根據分段函數設定的發動機真實壽命,另一條為改進的GBDT預測壽命。

圖8 剩余使用壽命預測Fig.8 Prediction of remaining useful life

3.3 運行速度與評價指標分析

CMAPSS數據集的維數為26維,對一段完整的生命周期進行一次剩余壽命預測需要將近兩百個循環,大量的數據在一定程度上保證了預測效果但也使得運行效率并不理想。通過將互斥程度較小的特征進行捆綁,減少特征維度,達到計算效率的提升。表3為改進后的GBDT模型與其他算法在不同工況下的剩余壽命預測時間。

表3 不同模型運行時間

為了進一步驗證模型的性能,做了多種不同的算法性能對比,Score指標結果對比如表4,RMSE指標結果如表5。

表4 Score指標結果

表5 RMSE指標結果

通過以上指標對比分析,改進的GBDT模型在不同數據集上的運行時間有較大幅度的提升,Score指標較幾種現有算法均有明顯提升,RMSE指標在FD002和FD004數據集上略有提升,在FD001和FD003數據集上略有下降,RMSE指標除SVR較差外,其他幾種方法與改進的GBDT算法大體相仿。

4 結 論

本文通過比較改進的GBDT模型與現有的SVR、CNN、LSTM、CNN-LSTM算法在不同工況下的性能指標,得到改進的GBDT模型在Score指標上有大幅度提升,RMSE指標相仿。結合實際情況可以得出改進的GBDT算法傾向于更早提出壽命預警,更適用于飛機發動機剩余壽命預測領域。同時,在保證預測性能指標的情況下,改進的GBDT模型在4個子數據集下的運行時間較經典算法都下降60%以上,表明本文所提出的算法具有較高的實用價值。

猜你喜歡
梯度壽命發動機
一個改進的WYL型三項共軛梯度法
人類壽命極限應在120~150歲之間
一種自適應Dai-Liao共軛梯度法
倉鼠的壽命知多少
發動機空中起動包線擴展試飛組織與實施
一類扭積形式的梯度近Ricci孤立子
馬烈光養生之悟 自靜其心延壽命
人類正常壽命為175歲
新一代MTU2000發動機系列
地溫梯度判定地熱異常的探討
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合