?

基于設備運行數據的風機故障診斷方法

2021-11-08 03:20鄧媛媛劉國奇
關鍵詞:決策表約簡故障診斷

鄧媛媛,劉國奇,蔡 磊

(沈陽建筑大學理學院,遼寧 沈陽 110168)

隨著可再生能源行業的發展,風能作為一種環保、可再生、無污染、可循環利用的新型能源,其發展受到世界各國風能行業的重視。根據統計,在2019年全球風電第一大市場,中國風電裝機容量在全球遙遙領先,其發展態勢迅猛。風力發電機(簡稱風機)作為將風能轉化為電能的設備,長期處在極端溫度、風沙等惡劣環境下,并承受了巨大的機械應力,極易發生各類機械、電器故障[1]。因此,風機故障診斷的研究變得越來越迫切。隨著計算機的普及,通過在風機的關鍵部件上安裝傳感器,這些部件在運行時的狀態會實時采集到計算機上,這些參數以秒為間隔進行采集,因此能夠較確切地反映出部件的實時變化[2]。隨著科學技術的發展,工業數據庫中積累了大量歷史數據,這其中包含海量關于風機故障時各采集點的測量參數,如何對這些數據記錄分析、尋找規律,并用于風機故障診斷的研究有著重要的意義。

國內外許多學者已經提出了多種風機故障診斷方法,如E.Wolfgang[3]采用專家系統對汽車進行故障診斷;A.Widodo[4]提出了基于部件分析和支持向量機的發動機故障診斷方法。這些方法各有特點,雖然在實際中得到了一定的應用,但是對于處理不斷產生的海量數據,以及不確定故障信息的容錯性,仍然不太理想。針對以上問題,近些年產生了更多有效的方法,如針對數據挖掘技術的基于時間序列數據挖掘[5]、粗糙集理論算法[6]、貝葉斯網絡算法[7]、決策樹技術[8]等紛紛被引入到故障診斷中。而在探索過程中,關聯規則挖掘作為一種重要的方法應用于數據挖掘技術中,這種方法不但能夠發現隱藏在海量數據中有關聯性且有價值的數據,也對決策樹生成具有重要的使用價值,因此多被用在商業智能解決方案體系中,但在風機故障診斷研究中不常見。文獻[9]提供了關聯規則挖掘在商業智能中的重要應用。而文獻[10]中雖然將關聯規則挖掘應用到了變壓器故障診斷中,但風力發電機與之有許多不同之處。

基于上述分析,筆者采用關聯規則經典算法,將基于粗糙集理論的關聯規則挖掘算法應用到風機故障診斷中,將風機各個監測點的參數作為條件屬性,風機故障數據類型作為決策屬性。首先利用粗糙集理論對條件屬性進行約簡,提取最佳屬性進行約簡組合處理,然后利用上面結果形成的約簡決策表和關聯規則挖掘診斷進行推理,最終得到診斷決策表。研究表明,診斷決策表有效地反映了條件屬性和決策屬性之間的關聯關系,表明筆者提出的方法對風機故障診斷具有有效性,可為風機設備故障診斷和故障預測提供幫助。

1 數據來源

筆者使用的數據來自于內蒙古察右后旗紅牧風電場,位于內蒙古中部陰山北麓,烏蘭察布市后山地區,共安裝24臺單機容量為2 000 kW的風力發電機組,總裝機容量為4.8萬kW。筆者從紅牧風場工業數據庫采集樣本數據,該數據庫中存放了大量的風機狀態信息,數據庫中每一行數據記錄為風機在一個特定時間點的狀態,風機的狀態是各部分傳感器搜集到的參數決定的。數據集中原始數據包含139個參數,而這些數據參數采樣的時間間隔平均為2s,這些數據包括平均有功功率、溫度、壓力、平均無功功率等106個定量化指標參數;對于以上定量化數據,筆者將其分為兩種類型,一種是不斷波動的參數取值,它們是不斷變化的,比如電壓、電流等;另外一種是在正常狀態下恒定的參數取值,屬于定性指標,例如液壓制動壓力、故障及狀態報警等,這些數值是不能用來進行計算分析的。還有一些指標在行業內被叫做定性指標,這些定性指標使用報警碼或故障碼來代替特定的報警或者是故障,也被稱為報警碼或故障碼,這些指標也不會在預測中被使用。風機參數分類的相關信息如表1所示。

表1 風機參數分類Table 1 Classification of wind turbine parameters

定性化的報警碼或故障碼在預測中也具有非常重要的作用,在收到任何一個報警碼或者故障碼后,都代表風機設備發生了故障。在實際的數據中,不同故障發生的頻率差別很大,有一些故障一年發生很多次,而有一些故障多年也不發生一次;另外,故障也被劃分為不同級別,級別越高則故障越嚴重。筆者選取發生次數多且報警級別高(4級)的故障的歷史記錄來進行研究。

在觀察中發現,故障發生的次數和故障條目多少沒有必然聯系,因為有的故障發生一次可能持續一個小時甚至更長時間,而有的故障發生一次可能持續幾秒鐘。表2列舉了21種常見的風機故障代碼。

表2 風機故障實例及說明Table 2 Example and illustration of wind turbine faults

2 基于粗糙集理論和關聯規則的風機故障診斷模型

2.1 基于Apriori算法的關聯規則挖掘

故障診斷實際上是一種比較分類,在進行故障定位時,是將故障規則庫與待診斷的故障參數值進行比較,把一個實時采集的故障信號歸入到故障規則庫中[11-13]。

圖1為風機故障診斷模型圖。該模型首先獲取風機狀態歷史數據,使用粗糙集理論對風機的特征屬性進行約簡,得到最佳的風機狀態屬性子集,然后使用關聯規則Apriori挖掘出數據中潛在的規則,專家對這些規則進行評估,將有意義的規則存入到數據庫中,形成故障規則庫。當需要對風機進行故障診斷時,只需將風機的實時參數與規則庫中的規則進行匹配即可確定故障類型。

圖1 風機故障診斷模型Fig.1 The model of fault diagnosis in wind turbine

定義1條件屬性

A=(a1,a2,…,ak,…,ai)為條件屬性集,其中ai為條件屬性,即風機狀態的表征參數或者風機狀態屬性。

定義偏移向量為風機故障條目參數取值形成的向量與正常條目參數取值的向量的差值。那么偏移向量分量為0,表示該分量對應的參數取值正常。

定義2決策屬性

D={d1,d2,…,di}為決策屬性集,di為決策屬性,即風機故障類型。

定義3風機狀態歷史數據集

設U={u1,u2,…,ui,…,un}為風機狀態歷史數據集,其中ui為風機狀態歷史數據集,其中第i個樣本,每個樣本包含m個條件屬性和1個決策樹形,記作{A,D}。

定義4關聯規則

形如r:X?Y的蘊含式,其中X?A,即條件屬性的子集,Y∈D,即一種故障類型,R={r1,r2,…,ri,…,rk}為規則集。

算法基本思想:風機狀態歷史數據集U={u1,u2,…,ui,…,un},其中ui為第i個樣本,每個樣本包含m個條件屬性和1個決策樹形,記作{A,D}。首先對U進行二值化處理,所有數據都只有0和1兩種取值,得到處理后的數據集S={s1,s2,…,si},然后利用粗糙集理論的基于區分矩陣和邏輯運算的條件屬性約簡算法對數據集S中的條件屬性集合A={a1,a2,…,am}進行約簡,得到條件屬性集合A的子集AR={ak1,ak2,…,akp}(p?m),然后將數據集S中屬性{AR,D}對應的列出去,得到新的數據集SN=(sn1,sn2,…,sni,…,snn),其中sni的屬性為{AR,D}。接著使用關聯規則挖掘出決策表中滿足最小置信度和最小支持度的規則集R={r1,r2,…,rn}。

2.2 相關定義

給出定義相關的概念如下:

定義5首先給定一組故障參數信息R={r1,r2,…,rn}為條件屬性,故障類型D={d1,d2,…,dn}為決策屬性,決策表S={U,C∪D},U={u1,u2,…,ui,…,un}為風機狀態歷史數據集,其中ui為第i個樣本。

筆者采用的數據集中,監測點的個數為106,即條件屬性個數為106,所以R={r1,r2,…,rn},并且只分析一種故障,即決策屬性的個數為1,所以D=d1。

定義6信息系統S={U,R,V,f},其中U代表實驗數據記錄集,R=C={c1,c2,…,c106},V=D,f:U×R→V為一信息函數,表示對每一個a∈R,x∈U,f(x,a)∈Va。

定義7若P∈R,P≠φ,則P中所有等價關系的交集稱為不可分辨關系或者是不可區分關系,記為IND(P);IND(P)={(x,y)∈U×U,r∈P,f(x,r)=f(y,r)}。

定義8S={U,C∪D}為一個決策表,其中C為條件屬性集,D為決策屬性集,C∩D=φ,決策表S的區分矩陣被定義為Cij,其中元素Cij={a∈C|a(xi)≠a(xj),且xi,xj滿足陳述W(xi,xj)},W(xi,xj)表示((xi∈Posc(D)∧xj?PosC(D))∨(xi?PosC(D)∧xj∈Posc(D))∨(xi,xj∈PosC(D)∧(xi,xj)?IND(D))

2.3 算法步驟

首先利用粗糙集的基于可辨識矩陣和邏輯運算的條件屬性進行約簡處理,得到的是最小約簡集,再約簡掉不必要屬性,就能夠獲得最小的決策表(見Step1~Step6)。然后使用關聯規則經典算法——Apriori算法進行關聯規則挖掘(見Step7,Step8),生成最小決策表上大于支持度閾值的頻繁項集,并在頻繁項集的基礎之上生成決策表上不小于置信度閾值的強關聯規則。

Step1 對數據進行預處理,得到布爾型決策表S;

Step2 將決策表的可辨識矩陣CD進行計算;

Step6 將約簡結果輸出,得到新的決策表。

Step7 掃描新的決策表,得到頻繁1-項集,然后通過頻繁1-項集得到頻繁2-項集,如此進行下去,頻繁k-項集通過連接得到頻繁k+1-項集,然后通過將不滿足支持度閾值的項刪去,完成剪枝;

Step8 通過掃描頻繁項集,將滿足置信度閾值的規則輸出,得到強關聯規則。

3 實驗分析

3.1 實驗過程

風力發電機設備本身結構復雜,通常一臺風力發電機的傳感器就多達200個,所以其故障種類較多,表2中給出了21種典型的故障代碼和故障名稱,筆者選取故障碼為T_158的故障為研究對象。對于其余故障的分析同158號故障分析的方法相同。

3.1.1 數據選擇和屬性編號

選取3 089條風機狀態歷史數據,即U={u1,u2,…,u3 089}進行分析,數據選擇包括屬性選擇和抽樣選擇。對于數據選擇,首先刪除一些測量結果明顯有誤的數據,隨機對數據進行抽樣;然后對各個屬性進行編號,A={a1,a2,…,ak,…,a139},其中ai表示第i個屬性。對于屬性選擇,在原始數據中,有139個屬性,將一些明顯與風機狀態沒有關系的參數刪去,例如故障警報、線圈匝數、版本號等等,剩余106個參數。經過初步的處理后,得到的風機狀態歷史數據記錄為1 206條,即U={u1,u2,…,u1 206},106個屬性,即A={a1,a2,…,a106}。

3.1.2 數據預處理

為了方便使用差別矩陣對決策表進行約簡以及關聯規則挖掘,需要將風機的參數轉換為參數的取值只有0或1的布爾類型數。風機工作時,有些參數的取值在一定范圍內波動,但有些參數的取值保持不變。因此,筆者對數據分類如下處理。

(1)波動型參數

對于該種特定的參數,專家根據經驗設定針對該參數的閾值limit,假設A1在t1時候的取值為preValue,A1經過處理后取值為value1,則

(1)

其中,筆者取preValue的絕對值|preValue|,該參數在風機狀態歷史數據庫中該參數的最大值為max,該參數在歷史數據中的最小值為min。但取值為1表示該參數當前值超出了該參數的正常取值范圍;0的value表示該參數當前值為正常。

(2)恒定型參數

對于一些取值恒定的參數,該參數的取值稍微偏離恒定值時并不是異常,只是該種參數允許波動的范圍要小于波動型參數,筆者設定該種參數的允許波動值limit,設定恒定型參數的穩定值point,當前狀態參數的取值為preValue,經處理后參數的取值為value2,則

(2)

(3)屬性約簡

使用粗糙集理論對條件屬性集A進行約簡,約簡后得到AR為條件屬性集合A的子集。筆者使用基于差別矩陣的屬性約簡算法,將算法實現過程分為三個步驟:首先得到區分矩陣,然后是求和操作,即將區分矩陣中的單一屬性元素合并起來,最后約簡得到最終結果。

3.1.3 關聯規則挖掘

將粗糙集理論篩選出來的屬性對應的數據取出,然后使用關聯規則挖掘這些數據中的知識。根據相關專家根據經驗以及最終與風機故障相關參數的個數確定關聯規則的置信度和支持度,其中支持度為0.85,置信度為0.7,得到最終的關聯規則R。

3.2 實驗結果

使用一個傳統的模型與筆者所建立的模型進行比較。所謂的傳統模型就是使用相關性分析和關聯規則的模型,該模型首先通過相關性分析將與決策屬性,通過計算風機參數和故障類型之間的相關系數,將相關性小的參數刪去,從而完成屬性約簡,形成新的決策表,然后使用關聯規則對新的決策表進行挖掘[14-15]。

利用筆者所建立模型得到的規則進行故障診斷,如果規則成立,說明風機發生的是158號故障,即變頻器加熱器過載,并與傳統模型進行比較,比較結果如表3所示。其中,0表示沒有故障,1表示有故障。在準確度上,傳統模型的準確度為54.56%,筆者所提出模型的準確率為65.78%。

表3 測試結果(部分)Table 3 The test result(part)

圖2描述了筆者提出的模型的準確度,實心圓表示選用模型得到的結果與實際結果一致,空心圓代表選用模型結果與實際結果不一致。由此可見,圖2中實心圓的密度反映了模型的準確度,密度越大,準確度越高;相反,空心圓的密度越高,準確度卻越低。

圖2 改進模型預測準確點與誤判點Fig.2 Accuracy points and error points of improved model

改進模型與傳統模型相比在準確度上有較大的提升,但還需要和實際值進行比較,其比較結果如圖3所示。

圖3 實驗結果比較Fig.3 Comparison of experimental results

圖3中,實線表示實際值,實線為0表示實際沒有發生故障;實線為1表示發生了故障。虛線表示改進模型取值。實驗結果表明在發生故障后(實線為1的部分),誤判率比較高;在沒有故障發生的時候(實線為0的部分),誤判率較低。這表明本文提出的模型,沒有故障發生時誤判率比較低,但是真正發生故障后,誤判率比較高。

4 結 論

(1)筆者提出了一種基于粗糙集屬性約簡和關聯規則算法的風機故障診斷模型,該模型的特點是在挖掘關聯關系的時候先進行了基于粗糙集的參數約簡;與基于關聯規則的方法相比較,雖然參數減少了,但是準確度提高了;解決了傳統的僅基于關聯規則的風機故障診斷模型的算法效率低,準確度不高等問題。

(2)筆者所提出的模型的優勢在于實現使用了粗糙集理論中的屬性約簡算法,找到了特征屬性子集,該集合能夠完全表征原來屬性的空間,即該屬性子集能夠完全替代原來的屬性集合,然后使用關聯規則算法,由于屬性的數量與未處理之前大大減少,因此大大縮短了關聯規則挖掘的時間。

(3)該模型明顯優于傳統的風機故障診斷模型,尤其是對大型風機狀態歷史數據的處理效果會非常顯著;對于系統比較復雜,參數比較多的設備進行故障診斷的時候,并不是參數選取越多,其準確度就越高。

猜你喜歡
決策表約簡故障診斷
基于決策表相容度和屬性重要度的連續屬性離散化算法*
基于二進制鏈表的粗糙集屬性約簡
實值多變量維數約簡:綜述
基于模糊貼近度的屬性約簡
因果圖定性分析法及其在故障診斷中的應用
正反轉電機缺相保護功能的實現及決策表分析測試
基于LCD和排列熵的滾動軸承故障診斷
基于WPD-HHT的滾動軸承故障診斷
一種改進的分布約簡與最大分布約簡求法
高速泵的故障診斷
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合