?

基于SCADA數據的風機故障診斷算法預測研究

2021-01-13 02:22
中國新技術新產品 2020年22期
關鍵詞:特征參數數據挖掘風機

張 月 竇 瑞

(成都理工大學,四川 成都 610059)

0 引言

隨著化石燃料對生態環境的破壞程度日益增加,可再生能源的利用被重視起來。相關調研數據顯示,雖然我國風能資源巨大,但是其廣泛分布在高寒地區和沿海地區[1]。由于這些地區存在海拔較高、空氣濕度較高以及環境溫度較低的情況,所以這些因素嚴重制約了風機的發電性能,并且給風機的安全運行造成較大威脅。尤其是當葉片附著較大質量的冰層時,會在很大程度上改變風機葉片的共振頻率,同時也會改變動態的響應行為,造成葉片斷裂的事故。該文充分地結合了SCADA 系統的運新數據,首先對海量數據進行數據預處理,其次對數據進行探索性分析,最后建立數學模型?;赑ython(計算機程序設計語言)平臺的TensorFlow(符號數學系統)環境下搭建數據分析平臺,依據數據結果探索出各個算法之間的優劣性。根據相關系數水平以及均方根差(RMSE)值選出最優的算法。將高緯量的輸入向量作為特征值進行取值,使其更加符合挖掘所需的目標。該過程充分地考慮了機組和部件之間的相關性以及耦合性,有效針對實際監測中的運行功率和理論功率之間的偏差關系建立風電機組的運行狀態。同時,不同算法之間的結冰過程預測準確度也直接決定了除冰系統的效率、風機的效率損失和風機運行的風險。因此橫向對比不同算法間的預測結果精度具有較高的應用價值[2]。

1 相關理論

近年來,深度學習技術越來越成熟。一些較為熟悉的算法模型逐漸擴展到工程應用的各個領域。數據挖掘技術能夠有效地將循環神經網絡的時序概念引入網絡的結構設計中。從而在數據分析和表現中展現出更加強烈的適應性。

1.1 多層感知器(MLP)

多層感知器(Multilayer Perceptron,縮寫“MLP”)是能夠通過前向結構的人工神經網絡形式。其輸入的映射范圍主要為一組輸入向量到一組輸出向量。通過算法對權重進行優化,減少在訓練過程中的偏差數據。計算神經元輸出值a 的公式,如公式(1)所示。

式中:aj代表隱藏層神經元的輸出值; g(hj)代表激活函數;hj為變量數; wijxij分別代表w 層的第i 節點權重以及j 節點的權重系數。輸入“,”表示偏移節點,如公式(2)所示。

式中:y 代表輸出層的結果,等效賦予給ak;M 代表迭代計算總次數; wjk代表w 層輸出第j 層第k 個節點的權重系數;xjk代表x 層輸出第j 層第k 個節點的權重系數;M 代表變量總數。

1.2 卷積神經網絡(CNN)

卷積神經網絡(Convolutional Neural Network, 簡稱“CNN”)是一種能夠根據已有數據進行前饋神經網絡設計的數據挖掘的途徑。在神經網絡的計算過程中,首先由輸入層開始按照正向傳播順序進行傳播,然后依次參照卷積層的順序開始計算,最后計算至輸出層就完成計算并輸出結果。其計算原理如公式(3)所示。

式中:Mj代表上一層次輸出的特征集幾何以及原始圖像;代表集合中表達的特征結果;代表集合中表達的特征圖;代表輸入中第i 個特征圖到輸出的第j 個特征圖之間計算所用的卷積核;代表第j 個特征圖的偏置;f 代表激活函數。

1.3 長短期記憶網絡(LSTM)

LSTM 是一種新的循環神經網絡(Recurrent Neural Network,簡稱“RNN”)模型變體,區別于傳統的神經網絡, LSTM 網絡在其內部構建了一個“處理器”。能夠及時有效地對輸入數據進行計算,并且依據數據結果決定信息的去留情況。

根據平均絕對誤差( Mean Absolute Error,簡稱“MAE”)和均方根誤差( Root Mean Squared Error,簡稱“RMSE”) 2個指標將不同算法的建模結果進行對比,結果表明MAE 和RMSE 是評估機器學習模型和深度學習模型常用的2 個指標,它們的計算公式如公式(4)、公式(5)所示。

式中:N表示樣本數量;yt表示第t個樣本的真實值;表示表示第t個樣本的預測值。

2 特征參量數據挖掘

2.1 數據預處理

該文采用的數據為某風場2015 年11 月4 日~2016 年1 月1 日的實時運行數據。首先針對數據中的風機運行機理進行數據過濾。根據實際測量的環境參數對風機的狀態參數以及環境參數進行定義[3]。SCADA 風機數據主要參數描述見表1。

表1 SCADA 風機數據主要參數描述

其次依據SCADA 系統中機組啟停故障信息,依據四分位法的形式將運行過程中由于系統組件所帶來的自身問題進行數據剔除。設定系統的運行切入風速為3 m/s,額定風速為12 m/s,切出風速為25 m/s。擇選取的風速范圍為[3,25]。

2.2 模型建立

根據以上數據結果,將393 887 組機組樣本數據作為3 種模型的訓練集,剩余的165 組為測試集,以功率輸出的形式作為預測指標進行分析。根據不同算法的計算過程,進而得到機組的運行性能參數,預測的誤差結果見表2。

表2 預測誤差結果

由此可以看出,機組的實際運行性能可以在各個特征參數的回歸中具有很好的一致性。在機組的實際運行過程中,功率的相對誤差為2.51%,葉輪轉速的誤差為3.22 %,機組槳距角的樣本誤差為2.11 %。根據上述結果可知,經過LSTM 算法尋優的模型,其預測精度高,穩定性較好。

3 數據結果

以閾值判別風機運行狀態的結果為基礎,首先對原始振動信號進行經驗模態分解( Empirical Mode Decomposition,簡稱“EMD”),得到本征模態分量;其次,利用有效的分量去除原始信號的中的混合噪聲。該文采用單調性和相關性評價指標從重構信號的時域特征以及頻域特征對特征參數進行選擇。通過故障信號可以針對濾波進行有效降噪[4]。進而得到6 種IMF 的分量值,其數據結果見表3。

表3 互相關系數和峭度值

從表3 中可以得出結論:雖然IMF1 ~IMF4 在故障的沖擊中具有相似的成分,但是從數據結果的表現形式上來看,IMF1 的噪聲表現比較大;并且IMF5 和IMF6的丟失信息較多。該文按照互相關系數準則和峭度準則的原則充分對IMF 分量進行篩選。此時對應的數據值與原始信號的相關性比較大。最終把IMF2、IMF3 和IMF4選為重構信號分量。實際功率的時間序列預測值如圖1所示。

圖1 實際功率預測值

在進行壽命預測前要根據實際的運行參數總結出分機葉片信號的退化趨勢。特征參數過多會導致計算量的增加,而特征參數過少又不能完整地表達出風機葉片的退化趨勢,會導致結果與實際的測量結果之間存在較大誤差。因此,該研究通過單調性以及相關性的準則,根據降噪后的風機數據進行探究,選取了5 種特征參數構成相關系數矩陣。相關系數能夠有效地反映出風機葉片的相關性水平,具體數據如圖2 所示。

圖2 分類混淆線性相關性矩陣

經過數據訓練后的模型最終合并成1 個合并效果較好的多分類模型。使用混淆性矩陣對模型的分類效果進行基本的評價?;煜仃囀窃u價模型的分類和相關效果最常用的方法之一[5],同時也是科學評價數據集分類精度的1 種重要方法。模型分類后得到測試集的分類混淆線性相關性矩陣如圖2 所示。

圖中,橫縱座標分別代表樣本的預測名稱,網格數據代表相關性系數水平;其中正值代表正相關,負值代表負相關。正相關系數水平中,風速與發電風機電功率間的線性系數水平最高。依據風機葉片退化時刻參數建立風機葉片特征參數集標簽。把退化起始點之前數據集設置為0。把退化起始點開始數據至完全退化狀態的數據標簽設置為1。該文的參數設置中,根據3 組葉片全壽命周期的實測數據作為樣本數據。同時采用MLP 網絡和CNN 網絡作為基本的對照實驗組。具體的網絡設置參數見表4。

表4 3 種方法網絡參數

時域統計分析是時域分析中最常見的手段之一。時域統計的特征參數主要有均值、方根值、各類斜度值和方差等。該文主要是通過時域分析來判斷各個幅域的參數。其基本方法是通過描述設備的總體狀態來對設備故障進行監測。把時域和頻域作為共同表征值來進行特征值的選取,對有效實現RUL 具有重要意義。根據數據挖掘結果,得到的各個算法之間的RMSE 值見表5。

表5 預測誤差

通過LSTM 網絡訓練的壽命預測數據與真實實測數據的一致性結果最好。根據時間序列的結果,在出現結冰后的一段時間內,預測數據結果的波動性較大,這主要是因為葉片在出現結冰故障發生后還需要恢復時間。其恢復的內容是,由于自身重量發生變化,導致振幅波動在運行的過程中變化較大。尤其是在恢復階段后期,其預測精度比較平穩。表5 中給出了3 種預測方法的均方根誤差值,其中LSTM 的RMSE 最小,這進一步證明了LSTM 方法預測性能優于其他2 種方法。通過該次數據挖掘與統計信息可以證明,LSTM 算法可以準確預測風機葉片剩余使用壽命,為發電風機的有效運行提供保障。

4 結論

該文通過監測正常工作的風電機組,用SCADA 系統監測的數據進行數據挖掘和分析。建立風機機組運行狀態特征參數,進而建立數據挖掘預測模型。對發電風機運行參數數據進行時域、頻域和時頻域的故障特征提取,將提取出來的特征參數值作為預測模型的輸入參數,同時把一部分樣本數據作為各個輸入數據的基礎數據進行訓練,并根據訓練結果調整網絡參數。通過RMSE 預測度確定算法優度,相對于CNN 和MLP,基于LSTM 網絡的壽命預測模型可以充分利用全生命周期時序數據的前后關聯信息,對風機故障診斷和預測有更高的準確率。

猜你喜歡
特征參數數據挖掘風機
故障診斷中信號特征參數擇取方法
基于特征參數化的木工CAD/CAM系統
基于PSO-VMD的齒輪特征參數提取方法研究
基于并行計算的大數據挖掘在電網中的應用
節能技術EPU在AV71風機上的應用
一種基于Hadoop的大數據挖掘云服務及應用
TS3000系統防喘振控制在 AV80-14風機中的應用
統計特征參數及多分類SVM的局部放電類型識別
基于GPGPU的離散數據挖掘研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合