?

一種用于工業過程監測的魯棒遷移字典學習算法

2021-03-17 02:54陽春華梁慧平黃科科李勇剛桂衛華
工程 2021年9期
關鍵詞:源域正則字典

陽春華, 梁慧平, 黃科科*, 李勇剛, 桂衛華

S chool of Automation, Central S outh University, Changsha 410083, China

1.引言

過程監測對工業系統來說是必要的和有意義的,并吸引了工業界和學術界相當多的關注[1-4]。一般來說,過程監測方法分為三類:基于模型的方法、基于知識的方法和數據驅動的方法[5-8]?;谀P偷姆椒ㄊ褂孟到y的數學表示,將對系統的物理理解納入監測方案?;谥R的方法使用圖形模型,如Petri 網、多信號流圖和貝葉斯網絡(BN),用于系統監測和故障排除。這種方法特別適合于耦合系統的預測[9]。數據驅動的監測方法不需要反應機理或過程的機理知識。近年來,通過利用智能傳感器、數據分析和深度學習技術的快速進步,數據驅動方法已經被開發出來,以提高診斷的有效性和性能[10]。該領域的進展包括玻爾茲曼機、支持向量機(SVM)、卷積神經網絡(CNN)等[11-13]。近年來,數據驅動的方法已經成為復雜工業過程監測的主流。

然而,目前大多數數據驅動的方法均假定歷史訓練數據和在線監測數據遵循相同的分布[14-16]。事實上,從實際工業過程中收集的數據總是受到許多因素的影響,如多變的操作環境、原材料的變化和生產指標的修改[17]。當基于訓練數據學習的模型被應用于實際在線監測時,這些因素常常導致模型失配等問題。這樣的問題使其難以實現精確的過程監測。為了解決歷史訓練數據和在線測試數據遵循不同分布的問題,研究者已經做了很多的工作。Hou等[18]提出了一個用于時變過程監測的增量主成分分析(PCA)在線模型。在這個模型中,當獲得一個新的樣本時,PCA 模型利用原來的PCA 模型和新的樣本進行更新,預測誤差平方(SPE)和T2的控制限也被更新。Jiang等[19]提出了一種基于當前數據和歷史數據的多模型判別部分最小二乘法(DPLS)來診斷數據。Zhang等[20]建立了一個深度信念網絡(DBN),該網絡具有很強的泛化能力,可以在線監測焊接狀態。為了適應新數據樣本的增加,Zeng 等[21]提出了增量局部保存投影(LPP)算法,該算法通過使用拉普拉斯矩陣和原始樣本的投影值來更新。然而,這些算法不能應對兩個域之間的巨大差異,例如,被監測的工業過程處于一個完全不同的操作環境。Ge和Song[22]提出了在線批處理獨立成分分析-主成分分析(ICA-PCA)方法,在該方法中,使用從模型庫中選擇合適的ICA-PCA 模型來監測新數據。然而,這種方法需要構建多個模型,而且數據的不平衡性會降低監測性能。

字典學習通常學習一個過完備的字典,然后,原始數據可以通過字典和稀疏矩陣進行重構。真實的原始數據通常具有結構冗余的特點。通過字典學習,原始數據被映射到一個較低的維度空間,從而消除了原始數據的結構冗余,同時保留了最簡潔的信息。Peng等[23]提出了一種通過LPP計算出一個映射字典的方法,以保留原始數據的幾何結構。Chen等[24]提出了一種利用字典正則化從少量目標域數據中學習字典的方法,同時保障這個字典與從源域數據中學習的字典相似。Zhang 等[25]提出了一種方法,在該方法中,為了實現跨域分類,學習了一個公共字典、一個源域字典和一個目標域字典。在Jie等[26]提出的方法中,學習了源域字典和目標域字典之間的若干個子空間字典。Long 等[27]提出了遷移稀疏代碼(TSC),該方法引入了圖的正則化并減少了分布距離,以實現知識遷移。這些字典學習方法在信號重建、信號降噪、圖像識別、圖像校正等方面取得了很大的成就,引起了學術界和工業界的高度重視。此外,最近的研究表明,字典學習在過程監測中具有非凡的優勢。Huang 等[28]提出了一種核字典學習方法用于實現非線性過程監測,以及一種分布式字典學習方法用于實現高維過程監測。

盡管上述方法在工業系統中表現出卓越的過程監測性能,但它們沒有考慮歷史數據和在線監測數據的分布差異。遷移學習是不同域間知識遷移的一般框架,近年來得到了廣泛的研究,特別是在人工智能、圖像識別和計算機視覺界。受字典學習強大的表示能力和遷移學習的跨域知識遷移能力的啟發,本文提出了一種魯棒遷移字典學習(RTDL)方法,用于處理現實工業過程監測的數據分布畸變問題。本方法是聯合表示學習和域自適應性遷移學習的一種協同方法。簡而言之,歷史訓練數據和在線測試數據被分別作為遷移學習問題的源域和目標域。對于一個工業系統來說,雖然系統總是在不同的運行環境中運行,會不可避免地導致不同的數據分布,但其內部的基本信息,如機理,往往是相同或相似的。換句話說,工業系統的高維觀測數據往往在不同域間有不變的子空間。因此,將源域和目標域映射到一個公共的子空間是可行的,在該子空間中源域和目標域之間的分布差異被消除。之后,在該子空間中進行過程監測。在實際應用中,提出了一種判別性的字典學習方法,從多模態工業數據中提取特征。接下來,提出了最大平均差異(MMD)正則化[29]作為非參數距離度量來表達分布距離,減少了源域數據和目標域數據之間的分布畸變。此外,為了減少模內數據的距離,引入了線性判別分析(LDA)正則化。因此,即使源域和目標域受到不同操作環境的嚴重影響,本方法也能學習到一個魯棒的公共字典。因此,該方法能有效地提高過程監測和模態識別的性能。

本文的主要貢獻如下。第一,提出了一種RTDL 方法,以減少工業系統多變的運行環境所帶來的負面影響。通過減少域間差異,本方法可減少由多變的運行環境引起的過程監測和模態識別的性能下降。第二,給出了關于帶約束不可微分字典學習問題的詳細優化步驟,可以有效實現RTDL 的求解。第三,通過大量的實驗驗證了本方法,包括數值仿真實驗和實際工業實驗。實驗結果表明,該方法在精度上優于一些先進的方法。因此,該方法適用于工業系統的過程監測任務。

本文的其余部分組織如下。第2節簡要介紹了域自適應遷移學習、字典學習和本文的動機。第3 節提出了RT‐DL 模型并給出了其有效的優化步驟。第4 節進行了廣泛的實驗,包括數值仿真、連續攪拌釜加熱器(CSTH)基準和風機系統實驗,以驗證RTDL方法的有效性。第5節為結論和總結意見。

2.相關知識

2.1.域自適應遷移

假設有一個擁有大量數據的源域(Xs=[xs1,xs2,...,xns],其中ns是源域數據Xs的數量)和一個擁有少量數據的目標域(Xt=[xt1,xt2,...,xnt],其中nt是目標域數據Xt的數量)。這里,源域和目標域是相關的,但不相同。以風機系統為例,將風機系統在冬季的過程數據設為源域,在夏季的過程數據設為目標域。這兩個域是相關的,因為每個域的數據均是在相同的機理下從同一個風機系統中采集的。然而,由于外部運行環境的不同,兩個季節的觀測數據往往具有不同的分布。在數學上,各域的輸入特征空間是相同的,但各域的邊緣分布和條件分布是不同的,即Xs?χ、Xt?χ、Ps(x)≠Pt(x)、Ps(y|x)≠Pt(y|x)。其中Ps和Pt分別代表源域和目標域的概率分布;χ代表數據空間;x代表數據樣本;y代表數據x的標簽。

為了實現目標域的過程監測,需要消除源域和目標域之間的分布差異,即條件分布差異和邊緣分布差異。當源域和目標域的分布畸變消除后,源域數據可以表現出與目標域數據相同的過程信息,因此該方法可以利用豐富的源域數據輔助訓練模型,從而達到積極的知識遷移效果。

2.2.字典學習

字典學習的思想是通過學習由一系列原子組成的字典和一個稀疏矩陣來最小化數據重構誤差。假設XN=[x1,x2,...,xN]?Rm×N是一組原始樣本,其中xN表示維數為m的第N個樣本,R是向量空間,N表示數據量。DK=[d1,d2,...,dK]?Rm×K是由K個原子組成的字典,其中dK是第K個原子,K是原子數。SN?RK×N代表稀疏矩陣。字典學習的問題可以表示如下:

式中,α(α>0)是控制SN稀疏性的參數;‖ ‖?F表示矩陣XN的F范數;‖ ‖?0表示矩陣SN的L0范數。

2.3.本文動機

如前所述,盡管一個工業系統在不同的運行環境下(如不同的地點、時間、天氣和人工操作等外部干擾)運行時,會不可避免地導致數據分布的畸變,但基本的內部機理往往是相同或相似的。也就是說,不同域下的工業系統的高維觀測數據往往具有不變的子空間。因此,有必要提取不變的知識或子空間,以消除外在干擾,從而進一步提高工業過程監測的性能。為了生動地展示源域數據和目標域數據之間可遷移特征的效果,圖1顯示了僅受不同環境因素影響而導致不同分布的數據散點圖。源域和目標域的邊緣分布和條件分布明顯不同。傳統的數據驅動方法有兩種常見的策略。如圖1(a)所示,第一種策略是忽略源域數據,只用目標域數據作為輸入數據,這樣可以滿足訓練數據的分布與測試數據的分布相同的假設。然而,由于目標域的訓練數據非常少,最終的模型很容易出現過擬合。如圖1(b)所示,第二種策略是忽略源域和目標域的不同特征。這種策略直接使用大量的歷史數據和少量的新數據來進行模型訓練任務,因此,最終的模型會混淆域間差異信息和異常信息。此外,該模型很容易被擁有大量樣本的源域所支配。相比之下,圖1(c)是本文提出的RTDL模型。該方法試圖找到一個映射關系函數Φ(·)。通過這個映射關系,原始數據被映射到一個子空間。在這個子空間中,源域的邊緣分布和條件分布與目標域的分布相同;也就是說Ps(Φ(x))=Pt(Φ(x)),Ps(y|Φ(x))=Pt(y|Φ(x)),其中Φ(x)是關于x的映射。我們認為如果Φ(·)能克服外在環境的干擾,只保留最簡明的內部機理信息,就能將知識從源域遷移到目標域。也就是說,通過在字典學習目標函數中加入MMD 和LDA-like 的正則化,RTDL 方法可以利用豐富的源域數據來輔助訓練模型,達到遷移的效果,以提高工業過程監測的效果。

3.方法

在詳細討論該方法之前,這里先引入一個假設。這個假設是合理的,且通常情況下工業系統滿足這個假設。

假設:一個復雜的工業過程常常以不同的模態運行,以滿足不同的現實需求。在不同的模態下,觀察到的變量的特征是不同的。為了清楚地描述不同的觀察結果,歷史訓練數據和在線測試數據分別被看作是源域和目標域。

一般來說,進行多模態數據過程監測有兩種方式。第一種方式是單獨處理多模態數據,然后單獨完成過程監測任務。第二種方式是全局處理多模態數據,然后使用單一模型完成過程監測任務。當在每個單獨模態下收集的數據足夠時,第一種方式是更好的選擇。然而,對于實際的工業過程監測任務來說,目標域的數據總是嚴重不足,單獨的方法容易造成過擬合,因此,最好是全局處理多模態數據。此外,觀察到的變量不僅由工業過程的內部機理決定,還受到外在環境(如人工操作、不確定性、參數測量的不連續性、噪聲等)的影響。在線測試數據的外在環境與歷史訓練數據的外在環境不同,所以會出現域畸變。為了獲得準確的過程監測結果,一個明智的選擇是通過使用域自適應遷移學習的方法來消除無關的外在干擾。

圖1.源域數據量大而目標域數據量小的情況。(a)傳統策略1:忽略源域,僅利用目標域數據進行模型訓練。(b)傳統策略2:忽略源域和目標域的特征差異,直接利用所有數據進行模型訓練。(c)RTDL模型將源域和目標域的數據進行正則化約束,消除域間差異。該模型是三種模型中最合理的。PC1和PC2表示數據的兩個主要成分。

3.1.判別性字典

傳統的字典學習已經被廣泛地引入過程監測。此外,最近的研究表明,學習判別性字典可以使字典具備模態識別能力[30-33]。因此,對于過程監測任務來說,迫切需要一種判別性的字典學習方法。這里,判別式字典被表示為D=[D1,D2,...,DC]?Rm×Ck,其中C代表模態的數量;k代表每個模態的原子數量;DC是一個由k個原子組成的子字典,用來代表第C個模態的特征。原始樣本矩陣(X)關于字典D的稀疏矩陣為S=[S1,S2,...,SC]?RCk×(ns+nt),其中SC=[SsC,StC];SsC代表第C個模態源域數據的稀疏編碼;StC代表第C個模態目標域數據的稀疏編碼。為了簡單起見,我們將Xi關于字典D的稀疏編碼記為Si=是Xi關于子字典DC的編碼系數;Xi是由第i個模態樣本組成的矩陣(i?{1,2,...,C}),是X的子矩陣。

為了提高多模態數據的表示能力,應該在字典學習中加入先驗約束。第一,數據應該被字典和相應的稀疏矩陣很好地重構,即X≈DS。第二,數據應該被它自己的子字典和子稀疏矩陣很好地表示出來; 即Xi≈第三,由于數據可以由它自己的子字典和子稀疏矩陣很好地表示,因此項應該盡可能地接近于零,公式(1)可以轉化為以下形式[31]。

式中,db代表字典D中的第b個原子;Sin和Sout是關于S的表達式,如下所示。

式中,xa是X的第a個樣本。

3.2.正則化

由于工業系統的源域和目標域受到不同環境因素的影響,所以數據分布是不同的。為了確保學習到的字典能夠捕捉到源域和目標域中潛在的公共機理信息,而不是無關的外在干擾,一個直接的方法是通過最小化一些預定義的度量來減少分布差異。MMD正則化被認為是一種表達域間分布差異的非參數指標[27],它可以使稀疏矩陣Ssi和Sti的中心接近。在數學上,MMD正則化表示如下。

式中,c1代表源域和目標域之間的MMD正則化;nsi和nti分別代表源域和目標域中第i個模態的樣本數;sj是稀疏矩陣S中的一個稀疏代碼;Mi代表MMD矩陣M的第i個模態部分,可以計算如下。

眾所周知,同一模態下的觀測數據的分布應該是相同的。然而,由于工作環境的不確定性,同一模態下的數據也表現出一定的差異。為了消除不確定環境的干擾,無論數據來自哪個域,最好使同模態數據的稀疏碼彼此更加接近。也就是說,Si=[Ssi,Sti]?i?{1,2,...,C}的每一個列向量均應該相互接近。因此,的值應該盡可能小,其中是Si的中心。因此,應該引入以下約束條件。

式中,c2是所有模態的模內距離;I是單位矩陣。LDAlike矩陣H可以通過以下方式得到。

式中,1ni是一個長度為ni及所有元素均等于1的向量;ni是第i個模態在源域和目標域的總數據數。公式(7)的正則化形式上與LDA 正則化相似[34],所以它被稱為LDAlike正則化。

總之,MMD和LDA-like正則化可以被認為是一種漸進的關系。MMD正則化使每個模態的源域中心接近每個模態的目標域中心。作為補充,LDA-like正則化使同一模態的數據相互靠近,以減少模態內的距離?;谶@兩種正則化的協同作用,我們將公式(2)、(3)和(7)連接起來,形成了本文中所提出的方法,該方法的目標函數可以表示如下。

式中,β1和β2(β1,β2>0)分別是MMD 正則化和LDAlike正則化的超參數,這些超參數可以平衡重建誤差和正則化約束之間的權重。由于本方法減少了源域和目標域之間的分布畸變,因此可以達到消除外在環境干擾的效果。

3.3.優化

上述目標函數的優化變量是D和S。由于優化問題不是兩個變量的聯合凸問題,而是分別凸于D(保持S固定的情況下)和凸于S(保持D固定的情況下),因此引入迭代優化方法來計算D和S的最優值[35]。

3.3.1.更新D

當通過固定S更新字典D時,目標函數可以簡化為如下形式:

構建了一個新的數據矩陣Xnew=[X,X,O]和一個新的稀疏矩陣Snew=[S,Sin,Sout],其中O是與矩陣X維度相同的零矩陣,目標函數[公式(10)]變為如下形式:

該目標函數可以通過使用拉格朗日對偶法[35]來有效解決。首先,考慮拉格朗日函數:

式中,L是拉格朗日函數;是引入的非負參數。

通過最小化拉格朗日函數[公式(12)]得到拉格朗日對偶問題,如下所示。

式中,B是拉格朗日對偶公式;Λ是由組成的對角矩陣,拉格朗日對偶問題[公式(13)]可以用牛頓法或共軛梯度法來優化。在最大化B(λ→)后,我們得到最優字典D如下。

3.3.2.更新S

矩陣S將被逐列進行更新。當更新其中一列sj時,目標函數可以表示如下。

式中,Q、P和hj是目標函數簡化過程中的中間變量。Q=(β1Mjj'+β2(I-H)jj')sj'。Q是一個對角線矩陣,元素1只存在于sj所屬模態的相應的k個位置上;xj是X中的第j個樣本;是sj中的第p個元素。我們通過特征符號搜索算法[27,35]來優化公式(15)。定義g(sj)如下:

式中,g(sj)是公式(15)的可微分部分。為了實現公式(15)中的特征符號搜索算法,引入以下定理。

定理1:定義一個關于x的連續函數為F(x)=G(x)+的最優必要條件為

式中,G(x)是關于向量x的連續可微函數[35-36];xp是向量x的第p個元素;?pG(x)是G(x)關于xp的偏導。

證明:我們通過反證法來提供一個簡短的證明。假設最優解x中有一個元素xp不符合上述最優必要條件。首先,對于|xp|≠0,?pG(x)+λsign(xp)≠0,則很明顯可知?pF(x)=?pG(x)+λsign(xp)≠0。因此,我們可以找到另一個值x*p來代替xp,使F(x*)值更小。這與x為最優解的假設是矛盾的。其次,對于|xp|=0,?pG(x)>λ,由于G(x)是一個連續可微的函數,我們可以找到一個x*p<0來代替xp, 并 且 滿 足G(x*)-G(x)<λx*p。 因 此F(x*)=G(x*)+這也是與假設相矛盾的。對于|xp|=0,?pG(x)<-λ,可以用同樣的方法來證明該假設不成立。綜上所述,命題得證。

根據定理1,公式(15)中的必要條件可以描述如下。

當第一個條件被違反時,因為其符號是已知的,公式(15)中的目標函數是可微的,它成為一個無約束的優化問題(QP)。當第二個條件被違反時,假設?(p)g(sj)>α,由于?(p)f(sj)一定大于零,為了最小化f(sj)的值,必須減少。由于從零開始,對其進行的任何無限小的調整均會使其符號為負,因此,我們直接讓為?1。那么,f(sj)關于同樣是可微的,問題可以簡單解決。如果?(p)g(sj)<-α,可以用同樣的方法更新。

據此,稀疏矩陣優化算法的完整過程被總結為算法1。

3.4.在線過程監測

在獲得通用字典D后,利用該字典可以進行過程監測和模態識別任務。

3.4.1.過程監測

字典D和正交匹配追求(OMP)算法[37]被用來計算訓練集中目標域數據的稀疏表示,訓練集中目標域數據的重構殘差(RES)可以根據公式(19)得到。

式中,‖ ‖?2代表向量的L2范數;r是樣本x的重建誤差。

接下來,用核密度估計法(KDE)[38]計算目標域數據的殘差分布區間,以檢測新的測試數據是否正常。當新的測試數據x來自目標域時,使用同樣的OMP 算法得到稀疏代碼s;然后使用公式(19)可以得到測試數據的RES。當RES 屬于上述分布區間時,它是正常數據,否則,就是故障數據。

3.4.2.模態識別

測試數據被檢測為正常數據后,進行模態識別,通過公式(20)來識別數據x。

式中,si是s的子稀疏表示。

綜上所述,RTDL的完整流程總結于算法2。

4.驗證實驗

在本節中,我們在數值仿真、CSTH基準和風機系統上進行了廣泛的實驗,以證明RTDL方法的有效性和優越性。為了性能的可視化和參數的敏感性分析,在數值仿真中分別引入MMD正則化和LDA-like正則化,以便能夠直觀地觀察樣本的分布。對于CSTH基準和風機系統,將提出的方法與一些最先進的方法進行了性能比較。

4.1.性能可視化和參數敏感性分析

4.1.1.數據集

本小節在數值仿真上進行了實驗,以驗證本文動機并直觀地評價性能。數值仿真的數據生成模型如下。

表1 關于仿真數據的細節描述

?

對于訓練數據,我們在源域的每個模態收集了100條正常數據,在目標域的每個模態收集了10 條正常數據。對于測試數據,我們在每個模態收集50 條正常數據,在目標域收集300條異常數據。

4.1.2.性能可視化實驗

如前文所述,MMD正則化和LDA-like正則化可以從不同角度消除分布畸變。為了驗證兩者均有消除分布畸變的能力,我們分別引入其中一個,設置另一個正則化參數為零,直觀地觀察樣本的分布。訓練數據被利用來學習一個公共的字典。然后通過公共字典和OMP 算法得到源域數據、目標域數據和異常數據的稀疏代碼。我們通過PCA將稀疏代碼可視化。圖2顯示了可視化的情況。

圖2(a)顯示了原始數據的分布。由于環境干擾,域間數據出現了分布畸變,且異常的信息是不明顯的。圖2(b)、(c)顯示,在單獨使用其中一個正則化后,分布畸變被部分消除,異常信息通過字典學習后開始顯示出來。圖2(d)顯示,源數據和目標數據完全混合,通過使用兩種正則化的方法,異常信息很容易被識別。據此,實驗結果驗證了本文的動機(第2.3節)。

Algorithm 2.RTDL.Input:Source domain data matrix Xs=[xs1,xs2,...,xns],target domain data matrix Xt=[xt1,xt2,...,xnt],parameters α,β1,and β2 Begin RTDL algorithm Step 1.Initialization Structure data matrix X=[Xs1,Xt1,...,Xsc,Xtc,...,XsC,XtC],MMD matrix M by Eq.(4)and LDA-like matrix H by Eq.(8).D and S are initialized as random values,where Xsc and Xtcrepresent the data sets of Cth mode of the source domain and target domain,respectively Step 2.Off-line training Obtain D and S iteratively To fix S,update D using Eq.(14)To fix D,update S using Algorithm 1 Step 3.Online testing(i)Process monitoring Get the RES limit by D and the OMP and KDE algorithms Conduct process monitoring by comparing the RES statistic and RES limit(ii)Mode classification After the testing data is detected as normal data,conduct mode classification using Eq.(20)End RTDL algorithm

4.1.3.參數敏感性分析實驗

參數α是字典學習中一個重要的調整參數,它控制著S的稀疏程度。一般來說,α可以通過觀察S的稀疏程度來選擇,S的稀疏程度表示矩陣中非零元素所占的比例。如圖3所示,當稀疏率(SPR)為20%~50%時,可以得到滿意的過程監測結果;據此,對SPR 的參數敏感性分析驗證了所提方法的魯棒性。

接下來,對修改后的β1和β2參數的過程監測性能進行分析。令β1從101變化到105,而β2從10 變化到70。錯誤報警率(FAR)和故障檢測率(FDR)被認為是過程監測的兩個評價指標。結果顯示在圖4 和圖5 中??梢钥闯?,當β1和β2改變時,FAR總是低于3%,FDR總是大于80%。盡管β1和β2的變化范圍很大,但過程監測的這種性能仍是滿意的。當β1和β2的值過小時,學習的字典可以很好地重建訓練數據。然而,訓練數據中不相關的環境干擾也會被字典學習。當β1和β2的值過大時,目標函數只是減少域之間的分布差異,學習到的字典不能很好地重建過程數據,而且潛在的語義信息,如數據中的機理信息將被丟失。這兩種情況均會降低字典捕捉過程數據中常見的潛在信息的能力,導致過程監測的性能不佳。為了給這些超參數選擇一個合適的值,可以選擇網格搜索這樣的優化方法。

4.2.性能比較實驗

4.2.1.數據集

由于RTDL在數值仿真中的性能是比較滿意的,我們現在考慮其在現實工業場景中的性能。本實驗準備了兩個數據集。

(1)CSTH。CSTH 過程是一個非線性的真實平臺,已被廣泛用作評估不同過程監測方法的基準[39]。CSTH的原理如圖6 所示。在CSTH 過程中,有兩個物理平衡:質量平衡和熱平衡。冷水和熱水同時流入水槽進行攪拌,同時被蒸汽加熱[40]。假設這個過程有兩種模態,其中模態狀態由液面設置、溫度設置和熱水閥位置設置決定。詳細情況見表2。為了模擬環境干擾,我們在所有觀測變量中加入一個指數分布變量,以形成源域,在所有觀測變量中加入一個F分布變量,以形成目標域。在觀察到的流量變量上施加一個加性故障,以產生異常數據。我們在源域的每個模態收集了100個數據,在目標域的每個模態收集了30 個正常數據,以形成訓練數據。測試數據包括每個模態的50個數據和目標域的200個異常數據。

表2 CSTH的傳感器電流信號設置參數

圖2.樣本分布散點圖。(a)原始數據;(b)通過帶LDA-like正則化的字典學習得到的稀疏表示;(c)通過帶MMD正則化的字典學習得到的稀疏表示;(d)通過同時帶LDA-like正則化和MMD正則化的字典學習得到的稀疏表示。

圖3.參數α對指標FAR和SPR的靈敏度分析。FAR:錯誤報警率。

圖4.參數β1和β2對指標FAR的靈敏度分析。

圖5.參數β1和β2對指標FDR的靈敏度分析。

(2)風機系統。風機系統的數據來自于北京的一家風力發電公司。從2011年1月1日至2011年11月11日,8臺風機每分鐘采樣一次,表3所示的15維數據被用于過程監測和模態識別。每臺風機的數據中存在著不同的流形結構,可以認為是風機系統的運行模態。夏季的溫度和風力與冬季不同,導致風力發電機組的工作溫度和工作功率不同,從而導致數據分布畸變。風力渦輪機系統在不同季節會受到不同的環境干擾。我們假設冬季為源域,而夏季為目標域。詳細說明見表4。訓練數據由源域中每種模態的350 個正常數據和目標域中每種模態的50 個正常數據組成。每個模態的50個正常數據和目標域的300個異常數據構成測試數據。由于風機系統數據的尺寸差異很大,所有的數據在實驗前均進行了標準化處理。

表3 風機系統實驗中使用的特征

表4 關于風機系統數據的詳細描述

圖6.CSTH原理圖。TC:溫度控制器;FC:流量控制器;LC:液位控制器;TT:溫度傳感器;FT:流量傳感器;LT:液位傳感器;sp:設定值。摘自參考文獻[40],經Elsevier許可,?2008。

4.2.2.過程檢測的比較實驗

為了定量評估RTDL方法,我們使用了另外兩種新穎的字典學習方法和一種自適應監測方法進行比較實驗。此外,第2.3 節中提到的兩種數據處理策略也被用于對比。比較方法包括:label consistent K-singular value decompo‐sition(LC-KSVD)(S+T)、LC-KSVD(T)、Fisher dis‐crimination dictionary learning (FDDL)(S+T)、FDDL(T)、moving window PCA(MWPCA)和RTDL。LC-KS‐VD[41]、FDDL[31]和MWPCA[42]方法是用于過程監測的三種先進的方法。LC-KSVD 和FDDL 同時具有模態識別的能力,而MWPCA是另一種用于過程監測的自適應方法。這里,LC-KSVD(S+T)和FDDL(S+T)分別指LC-KSVD 方法和FDDL 方法,其直接使用所有源域訓練數據和目標域訓練數據作為輸入數據,不考慮域之間的不同特征。LC-KSVD(T)和FDDL(T)分別指LC-KSVD方法和FDDL方法,其只使用目標域訓練數據作為輸入數據。MWPCA方法直接使用所有源域訓練數據和目標域訓練數據作為輸入數據,不考慮域之間的不同特征。RTDL將源域的訓練數據和目標域的訓練數據有區別地作為輸入數據。為了公平,字典的大小和其他參數被設定為相同。為了比較各模型的性能,我們參考了兩個指標:FAR 和FDR。

結果顯示在圖7和圖8中。如圖所示,在這兩個實際數據集中,本方法在準確性方面均優于對比方法。有一些有趣的結果值得注意,在CSTH中,LC-KSVD(S+T)的FDR接近于LC-KSVD(T)的FDR,但是LC-KSVD(S+T)的FAR明顯大于LC-KSVD(T)的FAR。這一結果與我們的觀察相吻合,即如果忽略了域的分布畸變,模型可能更容易將域間差異信息與異常信息混淆,導致過程監測結果更差。

4.2.3.模態識別比較實驗

本方法可以處理多模態數據,當檢測到數據為正常數據時,可以進行模態識別。因此,在本節中,通過與對比方法的比較來評估模態識別的有效性。對比方法的參數設置與過程檢測比較實驗一樣。值得注意的是,MWPCA方法不能完成模態識別任務,所以該方法不用于本實驗。為了比較模型的性能,我們參考了兩個指標:模態1準確率和模態2準確率。結果顯示在表5中??梢钥闯?,本方法在模態識別中的表現優于對比方法的表現,這進一步驗證了本方法的有效性。

表5 模態識別結果

圖7.本方法與對比方法在CSTH 上的監測結果。(a)LC-KSVD(S+T)的統計量DRE;(b)LC-KSVD(T)的統計量DRE;(c)FDDL(S+T)的統計量DRE;(d)FDDL(T)的統計量DRE;(e)MWPCA的統計量T2;(f)RTDL的統計量DRE。DRE:字典重構誤差。

圖8.本方法與對比方法在風機系統上的監測結果。(a)LC-KSVD(S+T)的統計量DRE;(b)LC-KSVD(T)的統計量DRE;(c)FDDL(S+T)的統計量DRE;(d)FDDL(T)的統計量DRE;(e)MWPCA的統計量T2;(f)RTDL的統計量DRE。

5.結論

由于工業過程經常受到多變的操作環境的影響,在線監測數據和歷史訓練數據并不總是遵循相同的分布。因此,基于歷史訓練數據的過程監測模型不能準確地執行監測在線流數據的任務。為此本文提出了一種RTDL 方法。該方法是一個表示學習和域自適應遷移學習的協同框架。也就是說,首先使用字典學習方法,將原始數據投射到一個子空間,學習一個公共的字典來表示源域數據和目標域數據。在減少子空間中的域間分布距離和模內距離后,消除了環境干擾引起的分布畸變,從而提高了字典表示內部語義信息的能力,如機理信息。通過大量的實驗,包括數值仿真、CSTH基準和真實的風機系統,證明了所提方法在域遷移問題上的優越性。因此,可以得出結論,本方法可以將知識從單一源域遷移到單一目標域。由于工業過程通常會遇到多種操作環境,未來的工作將集中在實現從多個源域到多個目標域的知識遷移。

致謝

本研究由國家自然科學基金(61988101)和國家重點研發計劃(2018YFB1701100)項目資助。

Compliance with ethics guidelines

Chunhua Yang, Huiping Liang, Keke Huang, Yong‐gang Li,and Weihua Gui declare that they have no conflict of interest or financial conflicts to disclose.

猜你喜歡
源域正則字典
J-正則模與J-正則環
π-正則半群的全π-正則子半群格
基于參數字典的多源域自適應學習算法
字典的由來
剩余有限Minimax可解群的4階正則自同構
類似于VNL環的環
大頭熊的字典
正版字典
可遷移測度準則下的協變量偏移修正多源集成方法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合