?

基于進化蒙特卡洛方法的特征選擇在機械故障診斷中的應用

2011-09-17 09:08劉曉平鄭海起祝天宇
振動與沖擊 2011年10期
關鍵詞:二值蒙特卡洛特征選擇

劉曉平, 鄭海起, 祝天宇

(1.軍械工程學院,石家莊 050003;2.武漢軍械士官學校,武漢 430075)

機械故障診斷是一個典型的模式分類問題。首先,通過安裝在機械設備上的各類傳感器提取該設備的運行信息。然后,利用各種信號處理方法進行分析處理,形成原始特征集。最后,將特征集作為分類器的輸入,達到故障分類的目的。然而,在實際的故障診斷中,原始特征集中常常包含冗余特征,導致計算量的加大以及分類精度的降低。因此,研究如何尋找最優的特征子集,提高診斷精度是一個有重要意義的課題[1,2]。

在實際應用中,尋找最優的特征子集通常是很難的,高維數據情況下特征選擇問題通常是 NP難問題。因此只能通過非窮盡搜索算法在運算效率和特征子集質量間折中考慮。遺傳算法、模擬退火等非窮盡式隨機搜索算法在特征選擇中已有了較多的研究[3,4]。然而傳統的遺傳算法易于過早收斂和陷入局部極小。在模擬退火中,任何比對數下降快的降溫方式都不能保證算法收斂到全局最優點,而足夠慢的降溫過程又導致了極低的搜索效率。

進化蒙特卡洛(EMC)[5,6]是一種基于總體的蒙特卡洛方法,它聯合了遺傳算法與模擬回火各自的優點。運用遺傳算法中變異和交叉的思想指導馬爾可夫蒙特卡洛移動,是一種具有“學習”能力的蒙特卡洛方法。研究表明,進化蒙特卡洛對于高維分布采樣模擬和優化問題是非常有效的[7-9]。

將進化蒙特卡洛方法引入機械故障診斷的特征選擇,采用支持向量機(SVM)作為分類決策器,Wrapper式特征子集評價標準,利用進化蒙特卡洛算法搜索最優特征子集。以滾動軸承振動信號特征選擇為例,驗證了方法的有效性。

1 進化蒙特卡洛算法

進化蒙特卡洛(EMC)是一種基于總體的蒙特卡洛方法,它將遺傳算法中的變異和交叉運算引入到模擬回火的框架,運用變異和交叉的思想指導馬爾可夫蒙特卡洛移動。它同時運行多條馬爾可夫鏈,每一條鏈均與固定的溫度相聯系。這些鏈通過變異、交叉和交換操作來更新[5,6]。假設目標分布為:

在EMC中,為了從上述目標分布中模擬抽樣,首先建立N個Boltzmann分布:

其中Zi(ti)是該分布的歸一化常數。

T=(t1,t2,t3,…,tN)是 N 個給定的不同溫度值,并且t1>t2>t3>…>tN=τ,這樣(·)就是采樣的目標分布。用xi表示從(xi)中的一個采樣,x1,x2,…,xN組成一個總體X,其中N表示總體的容量,X={x1,是一個d維的向量,稱為個體或染色體。在EMC中,應用的是增廣狀態空間X上的馬爾可夫抽樣。目標分布為總體的Boltzmann分布:

1.1 變異

在變異操作中,從當前總體X中隨機選取一個染色體xk,在xk的二值序列的一個隨機位置上隨機改變其值,將xk變異為 yk。新的建議總體為 Y={x1,…,yk,…xN}。根據 Metropolis準則,以概率 min(1,rm)接受建議總體。在變異操作中,總體中的每個染色體都獨立進行變異:

1.2 交叉

在交叉操作中,根據某種選擇方式(例如隨機選擇或輪盤賭),從當前總體X中選取一個染色體對xi和xj,新的后代yi和yj通過一次交叉運算獲得。一個新的建議總體為 Y={x1,…,yi,…,yj,…xN},根據 Metropolis準則,以概率min(1,rc)接受建議總體。

建議轉移函數為:

父輩染色體的選擇方法如下:首先按照輪盤賭的方式以Boltzmann權重選出第一個染色體xi,即以概率選出xi。第二個染色體xj從剩余的總體中隨機的選取。選中(xi,xj)的概率為:

交叉運算可以選擇在遺傳算法中常用的1點交叉、2點交叉和均勻交叉。這些交叉都是對稱的,即:

還有一種新的交叉運算:自適應交叉。在自適應交叉運算中,兩個后代的產生方法如下。若xi和xj在它們的二值序列的第k個位子上的值相等,則后代yi和yj復制該值,并且獨立地以概率p0改變該值;若xi和xj在它們的二值序列的第k個位子上的值不相等,則yi復制xi的值并以概率p2改變它,yj復制xj的值并以概率p1改變它。通常有0<p0≤p1≤p2<1,這種自適應交叉可以將一個總體好的基因型保存下來,同時算法的學習能力也加強了。在交叉操作中,通過迭代的方式約40%的染色體被選中進行交叉。

1.3 交 換

交換操作和并行回火[10]是一樣的,給定當前總體X 和溫度階梯 T,(X,T)=(x1,t1,…,xN,tN),在 xi和 xj之間進行一個交換操作但不改變溫度階梯,即初始狀態為:

交換之后的狀態為:

根據Metropolis準則,以概率min(1,re)接受建議總體。

2 基于二值編碼EMC的特征選擇方法

特征選擇的目的是從原始特征集中選擇一個特征子集。這個子集對于一個評價函數來說是最優的。因此,特征選擇是個最優化過程。特征選擇需要解決兩個問題:①特征子集的評價準則;②采用何種尋優策略來找到滿足條件的最優子集。本文采用Wrapper模型,以學習算法的性能作為特征選擇的評估標準。利用二值編碼的進化蒙特卡洛作為搜索策略尋優特征子集。

2.1 解的表示方法

假設通過特征提取共得到了d個故障特征,那么特征集的維數為d。在特征選擇問題中,一個特征要么在解中要么不在解中,因此,對解采用0和1的二進制編碼。在二值編碼的EMC中,每個染色體xi可用一個長度為d的0、-1二值序列表示,0表示對應的特征沒被選中,1表示對應的特征被選中。

2.2 適應度函數的設計

以特征子集學習訓練得到的分類錯誤率作為適應度函數,為了盡可能減小輸入數據維數,采用如下適應度函數:

A(xi)為特征子集的分類錯誤率估計值;m為選中的變量數;d為原始特征數;p為調整參數,平衡最小錯分率與選中特征個數。

采用交叉驗證法(Cross-validation)來估計分類器的錯誤率。用支持向量機作為學習分類器對特征樣本進行訓練并估計特征集的分類錯誤率。支持向量機是Vapnik等人[11]根據統計學習理論提出的一種機器學習方法。統計學習理論是目前針對小樣本統計估計和預測學習的最佳理論。支持向量機具有較強的泛化能力,能夠收斂到全局最優,有效地克服了“維數災難”,現已在機械故障診斷中得到廣泛的應用[1,12]。

2.3 二值編碼的EMC特征選擇步驟

特征選擇是一個優化問題,我們可以通過在特征子空間上的形式分布中抽樣:

從而將優化問題轉化為模擬問題。H(xi)是xi的適應度。二值編碼的EMC可以用來從上述模型中進行抽樣:

① 選擇一個容量為N的總體X和溫度階梯T,隨機初始化X;

② 計算每個染色體的適應度;

③ 以概率qm對總體進行變異,或以概率1-qm對總體進行自適應交叉;

④ 進行交換操作。在總體中隨機的選取xi,以概率選取

⑤ 若算法終止準則滿足,則停止。否則,返回步驟②。

3 實驗結果分析

實驗中采用減速機輸入端6206軸承,在不影響軸承正常使用性能的情況下,分別在滾動軸承外圈和內圈加工寬為0.5 mm,深為1.5 mm的小槽來模擬軸承的局部裂紋故障。實驗時測試系統為LMS多分析儀,振動傳感器為B&K4508,采用兩路傳感器采集信號,測點1位于軸承座,測點2位于齒輪箱體上。采樣頻率為8 192 Hz。分別在輸入軸轉速為600 r/min和1 200 r/min兩種工況下進行采樣,每種工況重復采樣40次,實驗中軸承共有3種工作狀態:① 正常;② 外圈故障;③ 內圈故障。選擇一半數據進行訓練,其余數據用于測試。在訓練階段采用5折交叉驗證。

對每一組軸承原始振動信號數據分別從時域統計、EMD分解提取特征。選取無量綱參數峰值因子、斜度因子、波形因子、脈沖因子、裕度因子及峭度因子等6個時域統計量為特征參數。使用EMD方法對原振動信號進行分解[12],選擇包含有用信息的前8個本征模式分量進行研究。分別計算各本征模式分量的能量,得到8個能量值,對本征模式分量矩陣進行奇異值分解,得到8個奇異值。

將上述提取的特征進行歸一化處理。用x={β1,β2,…,βi,…,βd}表示原始特征集,每個測點信號依次提取上述時域特征、能量值、奇異值等22個特征,這樣兩路傳感器共提取44個故障特征,x的維數就為44。圖1~圖4分別為其中一組外圈、內圈故障時的振動信號及EMD分解。

EMC的初始設置為:初始種群數N=20,溫度在10和0.5 之間等間隔分布,變異率 qm=0.15,p0=0.02,p1=0.06,p2=0.1,最大迭代次數為 1 000。

圖4 滾動軸承內圈故障時的振動信號EMD分解Fig.4 EMD results of the vibration signal of the rolling bearing with inner raceway fault

圖5 為外圈故障時各個特征被選擇的概率。最后找到6個特征,尋優特征子集的維數為6,它們被選擇的概率均大于0.8,分別是測點1的斜度因子、峭度因子、前兩個IMF能量值及奇異值。圖6為內圈故障時各個特征被選擇的概率。最后找到7個特征,尋優特征子集的維數為7,它們被選擇的概率均大于0.7,分別是測點1的斜度因子、峭度因子、第2、3個IMF能量值及前三個奇異值。

表1 不同特征子集SVM分類結果Tab.1 Classification results of SVM with different feature subset

為檢驗該方法的有效性,使用SVM分類器對原始特征集和優化子集的分類性能進行比較,結果如表1所示。由表1可知,經EMC算法搜索到的優化特征子集提高了SVM的分類精度。同時,經過特征選擇后,大大降低了SVM輸入向量的維數及其復雜度,提高了SVM的訓練效率。

4 結論

針對在機械故障診斷中,由于原始特征集中冗余特征的存在,影響了診斷性能和效率,將進化蒙特卡洛方法引入機械故障診斷的特征選擇,采用二值編碼的EMC作為搜索策略從模型中進行抽樣,利用特征子集對SVM分類性能的影響作為特征集的評價標準。實驗表明,該方法能夠從原始特征集中找到優化特征子集,提高故障診斷精度和效率。

[1] 王新峰,邱 靜,劉冠軍.基于靈敏度分析的支持矢量機特征選擇[J] .機械工程學報,2006,42(4):122-126.

[2] 潘宏俠,黃晉英,毛鴻偉,等.基于粒子群優化的故障特征提取技術研究[J] .振動與沖擊,2008,27(10):144-147.

[3] Wang X F,Qiu J,Liu G J.New feature selection method in machine fault diagnosis[J] .Chinese Journal of Mechanical Engineering,2005,18(2):251-254.

[4] Lin SW,Lee Z J,Chen SC,et al.Parameter determination of support vector machine and feature selection using simulated annealing approach [J] .Applied Soft Computing,2008,8:1505-1512.

[5] Liang F,Wong W H.Evolutionary monte carlo:applications to cpmodel sampling and change point problem[J] .Statistica Sinica,2000,10(2):317-342.

[6] Liang F,Wong W H.Real-parameter evolutionary monte carlo with applications to bayesian mixture models[J] .Journal of the American Statistical Association,2001,96(454):653-666.

[7] Liang F,Wong W H.Evolutionary monte carlo for protein folding simulations[J] .Journal of Chemical Physics,2001,115(7):3374-3380.

[8] Goswami G,Liu J S,Wong W H.Evolutionary monte carlo methods for clustering[J] .Journal of Computational and Graphical Statistics,2007,16(4):1 -22.

[9] Goswami G,Liu J S.On learning strategies for evolutionary monte carlo[J] .Stat Comput,2007,17:23 -38.

[10] Wang C M,Hyman J D.Allon percus,russel caflisch.parallel tempering for the traveling salesman problem[J] .International Journal of Modern Physics C,2009,20(4):539-556.

[11] Vapnik V.Statistical learning theory[M] .New York:Wiley,1998.

[12] 程軍圣,于德介,楊 宇.基于內稟模態分解奇異值分解和支持向量機的故障診斷方法[J] .自動化學報,2006,32(3):476-480.

猜你喜歡
二值蒙特卡洛特征選擇
征服蒙特卡洛賽道
基于蒙特卡洛法的車用蓄電池20h率實際容量測量不確定度評定
面向網絡邊緣應用的新一代神經網絡
基于二值圖像數字水印算法研究
基于稀疏表示的二值圖像超分辨率重建算法
基于最大信息系數和近似馬爾科夫毯的特征選擇方法
基于曲率局部二值模式的深度圖像手勢特征提取
Kmeans 應用與特征選擇
蒙特卡洛模擬法計算電動汽車充電負荷
基于特征選擇聚類方法的稀疏TSK模糊系統
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合