?

基于多目標異權重回歸的冷水機組故障診斷顯式模型

2024-02-05 01:24吳孔瑞楊鈺婷陸海龍凌敏彬
制冷學報 2024年1期
關鍵詞:冷凝器制冷劑類別

吳孔瑞 韓 華 楊鈺婷 陸海龍,2 凌敏彬

(1 上海理工大學能源與動力工程學院 上海 200093;2 重慶美的通用制冷設備有限公司 重慶 401336)

制冷系統發生故障會對其安全性及經濟性造成影響。建筑中空調和供暖系統的能耗約占總建筑能耗的50%[1]。冷水機組是建筑空調的核心部件,結構復雜并且長時間運行導致其故障發生的概率也隨之增大[2]。冷水機組發生故障不僅會造成能源浪費,降低室內環境舒適度[3],嚴重時還會危及樓宇安全。傳統的故障檢測方法費時費力,因此采用人工智能技術使之能夠及時精準地發現冷水機組的故障,再由專業人員進行維修,對節約能源及提升用戶舒適度均具有重要意義。

相比于1987年J. S. Haber等[4]初次將故障診斷技術應用于制冷系統,近些年來,數據的豐富、算力的提升促進了人工智能在故障診斷領域的應用。張立國等[5]結合模糊熵與GG聚類算法用于滾動軸承故障診斷;焦衛東等[6]改進支持向量機算法用于齒輪箱故障診斷;王群飛等[7]基于隨機森林算法對V2G充電樁故障診斷研究。在冷水機組的故障診斷領域,梁晴晴等[8]基于BP神經網絡,采用貝葉斯歸一化將整體的診斷正確率提升了30%以上;王占偉等[9]將距離拒絕機制融入貝葉斯網絡中,構建冷水機組故障診斷模型;董英杰等[10]采用混合神經網絡模型保留數據之間的長期依賴關系特征構建了模型,并基于Spring Boot開源框架建立了冷水機組設備健康管理系統;張展等[11]集成多種基礎分類器,采用投票法確定最終的診斷結果,集成模型的性能較基礎分類器均有顯著提升。

但無論是傳統的機器學習,還是深度學習,都面臨著訓練完成的模型難以可視化的問題。顯式模型可以觀察到模型的內部結構,容易得到模型內部各特征參數對各故障類別的權重,便于更好地理解故障,且無需迭代,對計算性能要求低,易于部署到制冷設備中。本文基于交叉熵損失函數和隨機梯度下降算法,建立離心式冷水機組的故障診斷顯式模型,可視化各故障的參數權重,得到各故障診斷的重要參數。

1 基本原理

1.1 多目標異權重回歸的故障診斷模型

傳統的線性回歸模型,將故障類別以一個回歸目標中的不同大小來編碼,導致模型中的單個特征對所有故障的權重(W)相同,但實際上,每個特征對每個故障的影響程度不同,因此該模型存在一定的局限性。本文提出多目標異權重回歸(圖1),對故障類別進行獨熱編碼,使回歸目標與涉及的故障類別一一對應,確保每個特征對不同的故障均有單獨的權重(W1、W2、W3…Wn),便于觀察不同故障與特征參數之間差異化的關聯特性,進而分析故障及故障診斷原理。模型最終輸出目標值最大的類別,作為故障診斷結果。

圖1 兩種方案的原理對比

模型流程如圖2所示,數據處理部分將訓練數據與測試數據進行歸一化,消除參數量綱對模型中參數權重的影響。在模型訓練部分,首先初始化權重得到初始的顯式模型,歸一化之后的訓練數據進入顯式模型,計算得到各目標類別的預測值,輸出預測值最大類別作為診斷結果。采用交叉熵(cross entropy, CE)損失函數計算診斷類別與真實類別之間的差異,在模型沒有達到設定迭代次數之前,采用隨機梯度下降算法(stochastic gradient descent, SGD)沿著損失函數的負梯度方向優化顯式模型中各目標類別的權重,使模型的診斷結果盡可能的擬合訓練數據的真實類別。訓練完成可得到每個特征對各故障類別最佳權重的顯式模型,在模型驗證部分通過測試數據對模型的性能進行評估分析。

圖2 模型流程圖

1.2 交叉熵與隨機梯度下降算法

交叉熵由S. Kullback等[12]于1951年首次提出,用來度量兩個概率分布之間的差異性。對二分類問題,模型最后的輸出只有兩種情況,故此時的交叉熵損失函數為:

(1-yi)log(1-pi)]

(1)

式中:L為損失值;N為樣本總數;yi為第i個樣本的標簽,正類為1,負類為0;pi為第i個樣本診斷為正類的概率。

多分類問題是對二分類問題的擴展,計算式為:

(2)

式中:M為類別總數;yic為第i個樣本是否為類別c,若是,則為1,否則為0;pic為第i個樣本診斷為類別c的概率。

模型中的權重直接影響損失值的大小,若需獲得損失函數的最小值,則需要沿著梯度的反方向進行權重的更新。對于優化問題minL(w),梯度下降算法的迭代公式為:

(3)

隨機梯度下降算法(SGD)借鑒粒子群的隨機游動思想,在算法陷入局部最優值時,給予算法一個適度的干擾,希望可以跳出當前的局部最優解以尋找一個更好的極值點。將高斯噪聲作為該擾動[13]添加至迭代公式中,得到新的迭代公式:

(4)

式中:β為添加的擾動的強度;N(0,σ2)表示服從0,σ2的高斯分布的隨機數,其它參數同式(3)。

2 研究對象

2.1 實驗數據

本實驗數據來自ASHRAE 1043-RP[14]項目,該項目以一臺制冷量約為317 kW的離心式冷水機組作為研究對象,充注制冷劑為R134a。該項目主要對制冷系統中常見的3種系統性故障(制冷劑泄漏/充注量不足、制冷劑過充和潤滑油過量)和4種局部故障(蒸發器側水流量不足、冷凝器結垢、冷凝器側水流量不足和制冷劑含不凝性氣體)及正常運行情況進行模擬,獲得實驗數據。其中正常和每種故障均在27種不同的工況下模擬運行,工況的詳細信息如表1所示。

表1 27個工況參數設置

本文從經過穩態篩選[15]的數據中隨機選擇了12 000條數據,隨機選取8 000條作為訓練數據,用于模型訓練,另外4 000條作為測試數據,用于訓練完成后對故障診斷模型性能進行評估,保證模型具有一定的泛化能力。表2為正常狀態與7種典型故障的英文縮寫。

表2 制冷系統正常運行及7類典型故障

2.2 模型評價指標

為評價所構建的機器學習中分類模型的效果,常有準確率(Accuracy)、精確率(Precision)、召回率(Recall)以及F1-Score等評價指標來衡量分類模型的好壞。

1)準確率(Accuracy,A):表示所有診斷樣本中被診斷正確的樣本所占比例。計算式為:

(5)

式中:TP為樣本真實為正類且被診斷為正類;FP為樣本真實為負卻被診斷為正類;FN為樣本真實為正類卻被診斷為負類;TN為樣本真實為負類且被診斷為負類。

2)精確率(Precision,P):表示所有被診斷為正類樣本中實際為正類的樣本的比例,(1-精確率)為虛警率。計算式為:

(6)

3)召回率(Recall,R):表示被正確判定的正類樣本數占總的正類樣本數的比例,(1-召回率)為漏報率。計算式為:

(7)

4)F1-Score:為精確率和召回率的調和平均,更接近于精確率與召回率中較小值,能夠有效平衡精確率和召回率的影響,可以較為全面地評價分類模型的性能。計算式為:

(8)

(9)

3 實驗分析

3.1 性能對比分析

ASHRAE的數據中由傳感器直接測得的有48個參數,在實際使用中,安裝如此多的傳感器是不現實的。因此許多文獻均針對ASHRAE RP-1043項目冷水機組7種典型故障,提出了相應的診斷用特征集,如Gao Y. 等[16]采用基于隨機森林的全局敏感性分析,并結合相關性分析進行特征清洗與增補得到9個特征,記為Gao_9;Han H. 等[17]基于互信息、遺傳算法與支持向量機(SVM)結合得到8個特征,記為Han_8;Zhao Yang等[18]從獨立性、冗余性和特征數量三方面綜合考慮得到16個特征,記為Zhao_16;Zhou Qiang等[19]根據故障與正常運行性能差異建立的定性規則表進行篩選,得到8個特征,記為Zhou_8;范雨強等[20]從現場傳感器出發,適當增補得到10個特征,記為Fan_10,各特征集中至少有兩個特征集合的共有特征列于表3中,“√”號表示該特征集合具有該特征參數;每個特征集合的特征參數列于表4中。

表3 各特征集合中的共有特征參數

表4 各特征集合的特有參數

本文提出的模型是在線性模型基礎上的改進,因此選擇了與原始的線性回歸模型進行對比分析。圖3所示為幾組特征集合在本文提出的模型上的性能表現。對比同一特征集合在兩種模型下的性能,可知本文提出的權重回歸模型比線性模型的性能大幅提升,各特征集合分別提高了64.10%、61.55%、40.5%、59.48%和44.58%。對比各特征集合在權重回歸模型下的性能,特征集合Gao_9可以達到88.65%的準確率,比性能最差的特征集合Fan_10的準確率高28.82%。

圖3 不同特征集下權重回歸模型與線性模型性能對比

表5為特征集合Gao_9在權重回歸模型的方法下的各性能指標。冷凝器結垢、冷凝器水流量不足、制冷劑含不凝性氣體和蒸發器水流量不足4種局部故障的各評價指標均可以到達95%以上。制冷劑泄漏、制冷劑過充及潤滑油過量屬于系統性故障,較難檢測,故診斷性能不佳。對正常狀態識別的召回率不足50%,說明大量正常的樣本被誤報為故障,導致正常狀態識別的F1值較低。

表5 Gao_9特征集下模型的性能

為進一步分析該模型對樣本的誤報類別,表6為Gao_9特征集訓練得到模型的混淆矩陣。正常狀態虛警為制冷劑泄漏故障(RefLeak)的樣本量有150個,潤滑油過量故障(ExcsOil)被誤報為制冷劑泄漏故障的樣本量有84個。此外3種系統性故障與正常狀態之間的識別均存在混淆,以正常與制冷劑泄漏故障之間最為突出,因為在制冷劑輕度泄漏時,由于冷水機組的自我調節能力,使各參數值與正常狀態時相差較小,難以分辨。

表6 Gao_9特征集下的混淆矩陣

3.2 新特征集的選取及性能分析

在關于制冷劑充注量的故障中,I. N. Grace等[21]指出,冷凝器下游液體管路制冷劑過冷度(TRC_sub)是很好的表征參數。且考慮到Gao_9特征集合中的特征TWI(自來水供水溫度)屬于模擬故障實驗時存在,但在實際制冷系統中并不存在的參數,因此將Gao_9特征集中的參數TWI替換為TRC_sub,得到新的特征集,記作Selected_9。

表7為特征集合Selected_9在權重回歸模型的方法下的各性能指標,新的特征集在故障診斷中可獲得89.83%的準確率,對比表5與表7,特征替換之后,模型的準確率提升了1.18%,表明采用TRC_sub較TWI性能更佳。通過采用故障新特征集,模型對制冷劑泄漏故障的診斷性能略有下降,但對制冷劑過充與潤滑油過量故障的診斷性能均有提高,特別是制冷劑過充故障,F1-Score提升了4.31%。

表7 Selected_9特征集下模型的性能

表8為特征集合Selected_9在權重回歸模型下的混淆矩陣。該混淆矩陣與表6(Gao_9特征集下的混淆矩陣)相比,雖然制冷劑泄漏故障被漏報的樣本量有所增加,但其它各類故障之間被混淆診斷的樣本量有所減少,總體看來,模型的性能有所提升。由表8可知,被診斷混淆的樣本主要集中在表格的左上角,即正常狀態與3種系統性故障識別的相互混淆依然是限制模型性能的主要影響因素。

表8 Selected_9特征集下的混淆矩陣

3.3 顯式模型

選擇出最好的特征集之后,將在Selected_9特征集合下訓練的顯式模型展示。表9為模型得到的權重矩陣(W)及偏置矩陣(B)。其中權重矩陣的維度為8×9,表示8個類別與9個參數對應的權重;偏置矩陣的維度為8×1,與每個類別對應。表10所示為隨機選取的10條樣本及其真實對應的類別標簽,表11所示為9個特征參數的范圍值,用來計算實際數據歸一化之后的值。

表9 權重矩陣及偏置矩陣

表10 10條測試數據(x)及真實類別

表11 各特征值的范圍

表12所示為上述的權重矩陣與測試數據計算后得到的結果。例如,第一行第一個數據2.40表示序號為1的測試數據判定為正常的計算值,計算方法為:表10中序號為1的數據中每個參數(x)先根據表11中的參數值范圍計算得到歸一化之后的值,乘以表9中正常(Normal)的各參數權重(W),然后再加上正常(Normal)的偏置值(B),如式(10)所示。每一條數據均需計算判定為各狀態的計算值,最后各狀態的計算值中的最大值(采用紅色加粗標注)所對應的列為診斷的類別;最后一列表示該條樣本的真實類別;第1條樣本(添加灰色背景)診斷結果與真實類別不一致,實際為正常的一條樣本虛警為制冷劑泄漏故障。

(10)

表12 計算診斷結果與真實類別的對比

3.4 故障權重分析

圖4所示為制冷劑泄漏、制冷劑過充和潤滑油過量3種系統性故障下,各參數的權重分布(圖4(a))及權重絕對值占比(圖4(b),圖中未標出占比小于3%的數值)。某故障下,參數權重的絕對值越大,說明該參數對該故障的判定越重要:若權重為正,則該參數值越大,判定為該故障的概率越大(正相關);若權重為負,則該參數值越小,判定為該故障的概率越大(負相關)。例如,制冷劑泄漏故障與制冷劑過充故障中,權重占比最大的參數均為過冷度(TRC_sub),符合參考文獻[21]中指出的過冷度是制冷劑充注量的很好表征參數的結論。對比制冷劑泄漏故障下各參數的權重分布(圖4(a)中紅色線),過冷度的負權重最大,說明系統的過冷度值越小,判定為制冷劑泄漏故障的可能性越大;相反,對制冷劑過充故障(綠色線),該參數具有較大正權重,說明系統過冷度值越大,判定為制冷劑過充故障的可能性越大。對潤滑油過量故障,TO_feed(供油溫度)具有最大的正權重,而PO_feed(供油壓力)具有較大的負權重,二者權重占比高達66%,表明潤滑油參數與潤滑油過量故障緊密相關。

圖4 3種系統性故障的各特征的權重分布及權重絕對值的占比

圖5所示為冷凝器結垢、蒸發器水流量不足、冷凝器水流量不足以及制冷劑含不凝性氣體4種局部故障下,各參數的權重分布(圖5(a))及權重的絕對值占比(圖5(b),圖中未標出占比小于3%的數值)。由圖5可知,每個系統性故障都對應有一個參數的權重明顯大于其它故障的權重,說明局部故障的診斷不易混淆,進而確保局部故障的診斷性能好。冷凝器趨近溫度(TCA)對制冷劑含不凝性氣體故障的判定最為敏感,制冷劑中的不凝性氣體主要存在于冷凝器中,導致冷凝器的傳熱效率低,故冷凝器溫度與冷凝器趨近溫度(TCA)會增大;供油壓力(PO_feed)對冷凝器結垢故障的判定具有最大的正權重,可能與冷凝器結垢故障實驗前進行了一次油壓調整(提升)[14]有關,導致供油壓力對冷凝器結垢故障的判定敏感;冷凝器水流量(FWC)對冷凝器水流量不足故障的權重絕對值占比最大,且權重值為負,說明冷凝器的水流量值越小,則越可能是冷凝器水流量不足故障;蒸發器水流量參數(FWE)對蒸發器水流量不足故障的影響類似。

4 結論

本文結合交叉熵損失函數與隨機梯度下降算法,對離心式冷水機組建立了顯式的故障診斷模型,對正常運行及7種典型故障進行識別診斷。對比了多目標異權重回歸模型與傳統線性回歸模型的性能差異,分析了不同特征子集上的診斷性能,并對模型中得到的各參數權重進行了可視化分析。得到結論如下:

1)多目標異權重回歸模型較傳統線性回歸模型略顯復雜,但故障診斷性能明顯優于后者:在多個公開文獻所提特征集合中,性能提升達40.50%~ 64.10%;在本文所提包含9個參數的Selected_9特征集合中,總體診斷準確率最高,可達89.83%,性能提升65.11%。局部故障診斷準確率超過98%;制冷劑泄漏、制冷劑過充及潤滑油過量屬于系統性故障,影響范圍大,較難檢測與診斷,因此性能不及局部故障。該模型對正常狀態檢測精確率為72.75%,召回率64.42%。

2)通過展示Selected_9特征集合下,冷水機組故障診斷的多目標異權重顯式模型,并可視化模型中的參數權重,發現:過冷度和供油溫度參數,對診斷制冷劑泄漏、制冷劑過充和潤滑油過量3種系統性故障最為重要;供油壓力、冷凝器趨近溫度、蒸發器與冷凝器的水流量參數,對診斷冷凝器結垢、制冷劑含不凝性氣體、蒸發器水流量不足、冷凝器水流量不足4種局部故障最為重要。

顯式模型避免了反復的在線優化計算,通過簡單的線性運算得到模型結果,在實際應用中,對設備計算性能要求低,可以更好地嵌入現有的制冷設備中,而且通過對模型中各特征參數的權重分析,有助于更好地理解故障及故障診斷原理。

猜你喜歡
冷凝器制冷劑類別
揚州市出臺“制冷劑六條”提升制冷劑安全管理水平
數據機房集中式與平面型冷凝器熱環境對比研究
冷凝器換熱管開裂原因分析
近共沸制冷劑R134a/R1234yf的PVTx性質的實驗研究
蒸發冷卻冷凝器在通信機房空調節能改造中的應用
服務類別
論類別股東會
中醫類別全科醫師培養模式的探討
外繞微通道冷凝器空氣源熱泵熱水器仿真與優化
霍尼韋爾新型制冷劑獲歐盟科研機構認可
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合