?

基于生成對抗網絡的滾動軸承不平衡數據集故障診斷新方法

2022-10-11 08:13郭俊鋒王淼生續德鋒
計算機集成制造系統 2022年9期
關鍵詞:集上準確率故障診斷

郭俊鋒,王淼生,孫 磊,續德鋒

(蘭州理工大學 機電工程學院,甘肅 蘭州 730050)

0 引言

在現代工業中,機械設備正朝著高精度、高效率、自動化、復雜化的方向發展,故障甚至事故更加頻繁發生[1],這對機械設備的可靠性和安全性提出了更高的要求。滾動軸承是旋轉機械的重要支撐部件,其健康狀況會影響整個設備的工作性能,一旦發生故障,輕則降低生產效率,耽誤生產進度;重則造成影響惡劣的生產事故。因此,及時對滾動軸承進行狀態監測以及可靠的故障診斷具有重要意義。

機器學習,尤其是深度學習[2]已經被廣泛地用于旋轉機械的軸承狀態監測和故障診斷。與依賴于人工提取特征的傳統方法相比,深度學習模型具有強大的深層次特征提取的能力[3-5],已經在機器狀態監測故障診斷的最新應用中取得了巨大成功。沈濤等[6]提出一種卷積長短時記憶網絡(Convolutional Neural Networks—Long Short Term Memory, CNN-LSTM)批標準化診斷模型,實驗表明該方法優于傳統的深度學習診斷模型。

對于深度學習模型,訓練數據是影響其性能的重要因素。為了獲得準確的故障診斷,需要大量的平衡數據對深度診斷模型進行訓練。在實際情況下,機械設備在大多數時間里在正常的工作條件下運行,可以很容易地收集到足夠多的機械設備在正常狀況下工作的數據。然而,機械設備很少在故障狀況下運行,故很難收集到足夠多的故障樣本[7]。因此,很難得到大量且平衡的數據訓練深度學習模型,這極大地限制了深度學習模型實現準確故障診斷的能力。

為了解決不平衡數據集的故障診斷問題,現有方法主要分為算法優化和數據合成。算法優化的目的在于優化模型結構和損失函數,使分類器盡可能地關注少數類別。ZHANG等[8]提出一種基于原型學習網絡的滾動軸承診斷的深度對抗半監督方法。JIA等[9]提出深度歸一化卷積神經網絡來改善訓練過程,加權SoftMax損失有助于解決分類不平衡的問題。WU等[10]開發了一個加權的長循環卷積LSTM模型,并利用欠采樣策略和加權的代價敏感損失函數來解決不平衡數據集故障診斷的問題。但是,基于算法優化的方法主要針對數據集各類別樣本數量比例固定的情況,不能很好地解決數據集各類別樣本數量比例變化的問題。而機械設備在運行過程中,數據集的不平衡率會發生變化[11]。因此,合成少數類別以平衡數據集是提高分類器性能的最優方案。

當使用設備運行中產生的數據解決數據集不平衡的故障分類問題時,生成對抗網絡(Generative Adversarial Net, GAN)為生成少數類別樣本提供了一個選擇[12]。GAN最初被用作生成圖像的框架,已被證明在圖像生成方面具有強大的能力。但是,由于GAN訓練不穩定,使用GAN生成的數據質量非常差。因此,已經有很多關于提高GAN性能的研究。ZHENG等[13]提出一種有監督的條件生成對抗網絡(Conditional Generative Adversarial Network, CGAN)模型用于生成大量的故障數據,并用生成的數據代替真實的故障數據,構成一個新的數據集來訓練分類器。WGAN(Wasserstein GAN)[14]試圖形成一個新的損失函數,以獲得更好的穩定性和圖像生成效果,但同時也給判別器網絡帶來了新的限制,這一限制使得網絡存在訓練困難的問題。李亞鑫[15]針對工業環境無故障樣本的問題,結合有限長單位脈沖響應帶通濾波器和深度卷積生成對抗網絡,僅采用行星齒輪箱結構參數和健康的行星齒輪箱振動信號,搭建了行星齒輪箱關鍵零部件故障檢測框架。ZHANG等[16]提出一種使用條件生成對抗網絡解決數據集不平衡的問題,采用多個生成模塊來進行少數類的數據擴充。SHAO等[7]開發了一個基于輔助分類器的GAN框架,從機械振動信號中學習并生成逼真的一維原始數據。但上述模型依舊存在著各自的問題,并未解決生成對抗模型梯度消失、模式崩潰、訓練過程不穩定以及生成樣本質量較差和沒有指向性等問題。同時,GAN作為圖像生成框架,只有將其用于生成圖像樣本,才能更好地發揮它在樣本生成方面的優勢。

本文利用小波分析(Wavelet Transform, WT)[17]將一維原始振動信號轉換為二維時頻圖,并將其作為條件梯度懲罰生成對抗網絡(Conditional Wasserstein GAN—Gradient Penalty, CWGAN-GP)模型的輸入。通過將小波時頻分析與CWGAN-GP相結合,充分利用了原始信號的時頻域信息,同時將時頻圖作為生成目標也能更好地發揮CWGAN-GP圖像生成的優勢。此外,該方法也解決了原始GAN訓練過程不穩定、梯度消失、生成樣本質量差和訓練一次只能生成一類樣本的問題。實驗結果表明,提出的方法能夠生成高質量的樣本,具有很好的魯棒性,且在數據集不平衡的情況下也具有不錯的診斷性能。

1 小波變換與GAN

1.1 小波變換

小波變換被稱為信號分析顯微鏡,它可以大規模地全局顯示低頻信息,而在小范圍內可以局部顯示高頻特性。雖然可以采用WV(Wigner-Vile)分布、短時傅里葉變換和小波變換等多種方法將原始信號轉換為時頻圖像,但其中的一些方法存在一定的局限性。短時傅里葉變換的窗口大小是固定的。WV分布會受到交叉項的干擾[18]。在時域中,一般的小波變換可以表示為:

(1)

式中:x(t)為給定的時間序列,φ為母小波,φ*為φ的復共軛,a為可以控制小波展開的比例,b為標識其位置的平移因子。

本文采用小波變換,從一維原始信號中提取時頻圖像特征,使其作為生成對抗網絡的輸入。除此之外,Morlet是應用最廣泛的小波基,并且非常適合于旋轉機械的故障特征提取,因此選擇Morlet作為小波變換的小波基。

1.2 CGAN

生成對抗網絡是一種無監督的深度學習模型框架,最初由GOODFELLOW等[12]提出,框架中通常包括生成器和判別器兩部分。該模型具有很強的學習數據表示的能力,其訓練過程是一個零和博弈過程。簡單的噪聲分布,如高斯分布或均勻分布作為生成器的輸入,生成器G將其映射到與輸入的真實樣本相同的數據空間,通過訓練,盡可能生成與真實樣本相似的樣本。同時,判別器D被用來判別生成的樣本和真實的樣本,并訓練判別器不被生成的樣本所欺騙。當訓練過程達到納什均衡時,生成樣本的分布將與真實樣本的分布一樣接近,GAN的目標函數如式(2)所示:

Ex~Pg[log(1-D(x)]。

(2)

式中:Pr是真實數據的分布,Pg是由兩個隱式x=G(z)和z~p(z)定義的生成數據的分布,其中z是從簡單的噪聲分布中采樣得到的。D的目標是最大化識別出輸入樣本來自真實樣本的概率,G的目標是使生成樣本的分布無限接近真實樣本的分布。

在生成器和判別器中加入指導樣本生成的輔助信息y就得到了GAN的變體CGAN,輔助信息y可以是類別標簽,也可以是任何其他類型的信息。輔助信息的加入能夠提高生成樣本的質量[19]。CGAN的訓練過程與GAN相同,目標函數如式(3)所示:

Ex~Pg[log(1-D(x|y))]。

(3)

式中Pr和Pg的意義與在GAN中的相同。

在式(2)和式(3)中,兩項均值之和即為JS(Jensen-Shannon)散度。在每一次訓練過程中通過最大化JS散度使判別器達到最優,然后固定判別器,最小化JS散度使生成器生成的數據盡可能真實。經過大量訓練以后,使得判別器無法判別樣本是真實樣本還是生成樣本。但是,實際訓練過程是很不穩定的,很容易出現梯度消失、模式崩潰等問題,導致生成樣本單一甚至訓練無法繼續,這是由于JS散度是離散的,即使兩個分布不重疊或者當重疊部分可以忽略不計時,JS散度都恒為常數。

1.3 WGAN-GP

為解決JS散度不連續導致梯度消失的問題,提出了WGAN。WGAN使用EM(earth-mover)距離,也被稱為Wasserstein-1距離作為衡量真實樣本分布和生成樣本分布之間距離的度量,且Wasserstein距離是連續的,這使得WGAN的訓練過程更加穩定。WGAN的目標函數如式(4)所示:

Ex~Pg[D(x)]。

(4)

然而,在式(4)中,Δ表示1-Lipschitz函數集。因此,要實現WGAN,判別器D應該屬于1-Lipschitz函數。這一限制可以通過乘以比例因子放寬,通過將判別器中每一層的權重裁剪到[-c,c]就可以使式(4)中判別器屬于K-Lipschitz函數,也會使WGAN的訓練過程更穩定。但是在某些情況下,WGAN會出現訓練過程不收斂,生成樣本質量差的問題。而這些問題的發生就是因為為了放寬Lipschitz約束而使用了權重裁剪。權重裁剪導致WGAN無法學習復雜樣本的分布。除此之外,權重裁剪也將各層的權重限制在一個很小的范圍內,而這很容易導致梯度消失。

為了解決上述問題,提出了WGAN-GP(WGAN with gradient penalty),該方法進一步改進了WGAN的損失函數,它用梯度懲罰滿足Lipschitz條件。WGAN-GP的目標函數如式(5)所示:

(5)

(6)

在實際應用中,WGAN-GP具有更快的收斂速度以及更穩定的訓練過程,并且可以在幾乎不調整默認參數的情況下,獲得高質量的生成樣本。

1.4 CWGAN-GP

受到GAN的變體CGAN的啟發,同時為了解決GAN在訓練過程中梯度消失、訓練過程不穩定以及生成樣本單一以及WGAN-GP一次只能生成一類樣本的問題,提出了CWGAN-GP。同時在WGAN-GP的生成器和判別器中加入條件輔助信息y,在這里y可以是任何類型的輔助信息,CWGAN-GP的目標函數如下:

(7)

判別器和生成器的目標函數最小化后,

(8)

(9)

在實際應用中,CWGAN-GP具有收斂速度快、生成樣本質量高且一次訓練就可以生成多類樣本的數據生成能力,同時也不存在GAN和WGAN在訓練過程中梯度消失,訓練過程不穩定的問題,而且幾乎不需要修改默認超參數就可以生成高質量的樣本數據,解決了GAN訓練困難的問題。

2 基于CWGAN-GP的軸承故障診斷方法

2.1 診斷方法與步驟

本文的目的是利用CWGAN-GP模型生成高質量的樣本對軸承不平衡數據集進行擴充與平衡,然后將其用于軸承故障診斷。在實際應用中,不平衡數據集會嚴重制約故障診斷模型的性能,而基于CWGAN-GP模型生成的高質量樣本能夠豐富原始數據集,為模型訓練提供更多有價值的信息,從而有助于實現準確的故障診斷。診斷過程如下:首先,利用小波變換對原始振動信號進行時頻分析,將原始一維振動信號通過提取特征轉換為二維時頻圖樣本;其次,利用提出的CWGAN-GP模型進行樣本生成,用于平衡數據集;最后,使用平衡后的數據集進行故障診斷。診斷方法如圖1所示。故障診斷流程圖如圖2所示,具體步驟如下:

步驟1從試驗臺收集軸承原始振動信號進行信號預處理,并使用小波變換將其轉換為時頻圖像。

步驟2將轉換后的時頻圖像按一定比例分為訓練集和測試集。

步驟3利用訓練集中的樣本訓練生成對抗網絡模型,對生成的樣本進行相似度驗證,從而生成更多的訓練樣本。

步驟4用生成的樣本和原始訓練集中的樣本組成新的訓練集用于訓練故障診斷模型。

步驟5利用測試集測試訓練好的故障診斷模型。

步驟6輸出故障診斷結果。

2.2 基于CWGAN-GP的樣本生成

本文采用CWGAN-GP模型用于樣本生成,具體是將一維時域信號經過小波變換后得到的時頻圖輸入CWGAN-GP模型。其中生成器采用反卷積結構,判別器采用卷積結構。如圖3所示,生成器中有5個反卷積層。一個服從高斯分布的100維噪聲隨機變量被映射和整形為許多卷積表示的特征圖,最后這些特征圖被轉換為64×64×3大小的圖像。另外,判別器中有4個卷積層,輸入為64×64×3的圖像,隨后被映射和整形為許多卷積表示的特征圖。最后,一個全連接層作為輸出層。在生成器中,前4層卷積核的大小為5×5,最后一層為3×3。在判別器中,卷積核的大小均為3×3。

3 實驗與結果分析

3.1 數據集描述

實驗數據來源于凱斯西儲大學(CRWU)軸承數據中心的開放數據集,該數據集在故障診斷領域得到了廣泛的應用。利用電火花對軸承內圈、外圈和滾珠進行損傷,損傷直徑分別為0.007英寸、0.014英寸、0.021英寸和0.028英寸。然后在0 hp~3 hp的不同載荷下采集各種振動信號。該數據集包含正常狀況、內圈故障、外圈故障和滾珠故障4種工作狀況。數據集的振動信號是由加速度計從軸承實驗臺收集的,實驗臺示意圖如圖4所示。在本實驗中,選擇實驗臺驅動端的深溝球軸承作為研究對象,采樣頻率為12 kHz。

3.2 實驗數據預處理

在本實驗中,以工作負載分別在0 hp和1 hp且故障直徑在0.007、0.014、0.021英寸的故障軸承為研究對象。為了驗證本文所提出的方法對不同類型的故障能夠實現很好的診斷效果,采用表1數據集作為實驗數據。在能夠區分不同類型故障的基礎上,為了進一步驗證本文方法對同一類型不同故障程度的識別效果,又采用了表2數據集,其中既包括不同故障類型又包括同一類型不同故障程度的數據。本文研究遵循循序漸進的過程。實驗軸承在每種不同的故障狀況下有120 000個數據點,以600個數據點為一段,為了獲得更多的樣本,相鄰的段之間有300個點重復。經過小波時頻分析,在每種工作條件下,可以得到400張時頻圖像。然后隨機的選擇200張用于訓練GAN和分類器,剩下的200張用于測試和評價模型。詳細信息如表1和表2所示。

表1 四類數據集信息(0 hp)

表2 十類數據集信息(1 hp)

續表2

3.3 生成樣本相似性的可視化評價

圖5給出了在4類數據集下真實樣本的時頻圖和利用CWGAN-GP模型生成的時頻圖樣本。很明顯,在圖5中,生成樣本與真實樣本非常相似。雖然在一些地方有很小的差別,但是可以發現生成樣本中的特征與真實樣本的特征基本具有相同的分布。除此之外,這些細微的差別也可以說明生成對抗網絡學習到了真實數據的分布,生成的樣本是從真實分布中采樣得到的,而不是對原始樣本的簡單復制,由此可以增強故障診斷模型的魯棒性,提高分類模型的泛化能力。

本文采用t-分布隨機領域嵌入(t-distributed Stochastic Neighbor Embedding, t-SNE)[20]驗證生成數據與真實數據的相似性。t-SNE是一種用于降維和數據可視化的算法,該方法通常被用作驗證數據相似性,它通過仿射變換將數據點映射到概率分布上。在映射的過程中,高維空間的點需與低維空間中的點一一對應,但低維空間的點存在一個隨機的過程,因此在本文中會導致真實數據的位置不相同。

在本文t-SNE的實驗結果中,只要各類別生成樣本和真實樣本可以聚合為一類以及各故障類別樣本有清晰的邊界,就可以說明本文所提方法的有效性,樣本的位置并不影響實驗結果。實驗中所有對照實驗使用的真實樣本均為同一批。圖6和圖7展示了真實樣本和生成樣本在4類和10類數據集上的t-SNE圖,為了驗證兩類樣本的相似性,隨機地從各類真實樣本和生成的樣本中分別選擇50個樣本。圖6和圖7分別展示了GAN、CGAN、WGAN、WGAN-GP、CWGAN-GP五種生成模型在4類和10類滾動軸承數據集上生成樣本和真實樣本的分布。結果表明,隨著模型的改進,生成樣本和真實樣本的分布越來越趨于一致。同時,通過將兩個分布之間的衡量標準由JS散度替換為EM距離也進一步使生成樣本和真實樣本的分布更加相似。在4類數據集的t-SNE圖中可以發現,雖然前3種生成模型生成的樣本能夠與真實樣本聚合為一類,并且4類故障之間有清晰的邊界,但是這3類模型生成的樣本沒有分布在真實樣本之間,而是自成一類分布在真實樣本周圍,說明這3種模型生成的樣本與真實樣本的相似性不足。雖然最后兩種模型生成的樣本和真實樣本非常相似,但是可以發現本文中提出的模型生成的樣本與真實樣本有更好的相似性,其分布更接近真實樣本的分布。

同時,在10類數據集的t-SNE圖中可以發現,前3種模型生成的樣本與不同類的真實樣本和生成樣本混疊在一起,沒有清晰的分類邊界。最后兩種模型生成的樣本與真實樣本之間雖然存在分類邊界,但是第4種模型的少數類別之間依舊存在著樣本混疊,而CWGAN-GP模型生成的每一類樣本基本與其他類別樣本沒有混淆。通過分析,本文提出的模型與第4種模型相比,由于加入了故障類別輔助信息,生成的樣本與真實樣本更相似。這說明條件信息對樣本生成具有積極的指導作用。

為了說明本文使用的生成模型生成的樣本數據對故障分類有積極的影響,將從10類數據集中隨機選擇50個真實樣本得到的數據集和將使用該數據集訓練不同的生成網絡模型后生成的各類樣本全部添加到該數據集中的得到的數據集分別進行t-SNE可視化展示,數據分布結果如圖8所示。從圖中可以發現未添加生成樣本的10類故障的數據的分布之間沒有明顯的邊界,存在混疊現象。而添加了全部生成樣本的10類故障數據之間存在明顯的邊界,由此可以說明,生成樣本與真實樣本有著很強的相似性,同時,生成的樣本對故障分類有著非常積極的作用。除此之外,與圖7e對比也可以發現,添加的生成樣本越多,各故障類別之間的邊界越明顯。這說明樣本數量影響類別邊界,從而影響故障分類的準確率。

3.4 基于統計指標的樣本相似性評價

為了從統計的角度評估真實樣本和生成樣本的相似性,本文引入歐幾里得距離和余弦相似性兩個指標,這兩個指標展示了生成模型樣本生成的平均性能。

歐幾里得距離,也稱歐氏距離,它衡量的是空間中各點的絕對距離,跟各個點所在的位置坐標直接相關。它主要被用于評價在歐幾里得空間中兩個向量在位置上的差異性,其值越小,表明相似度越大。兩個空間向量的歐幾里得距離計算公式如下:

(10)

余弦相似性,也稱余弦距離,是用向量空間中兩個向量的余弦值作為衡量兩個個體差異大小的指標。相比歐幾里得距離,余弦距離更加關注兩個向量在方向上的差異,其值越小,表明兩個個體越相似。兩個向量的余弦距離計算公式如下:

(11)

圖9展示了4類和10類數據集上所有類別統計指標的箱線圖。箱線圖的中位數表示了樣本數據的平均水平,箱線圖的高度表示數據的波動程度,箱線圖上方和下方的線表示指標的最大值和最小值。從圖中可以發現,在4類數據集上GAN、CGAN以及WGAN生成的樣本與真實樣本之間的距離較大,樣本相似性不足,且各類別生成樣本的質量差異較大。而WGAN-GP雖然從圖中表明其與CWGAN-GP模型的平均性能基本一致,但是兩類指標箱線圖的高度高于CWGAN-GP模型,這說明WGAN-GP模型生成的各類樣本質量差異較大。在10類數據集上,GAN生成的樣本相似性不足,且生成樣本的質量波動較大。CGAN和WGAN模型生成樣本的質量以及各類別樣本質量差異較大。WGAN-GP和CWGAN-GP模型生成樣本的質量以及各類別樣本質量的差異性遠遠優于其他3種生成模型,且CWGAN-GP生成的樣本質量明顯優于WGAN-GP。綜上所述,CWGAN-GP模型有更好的魯棒性與多類別數據生成能力,其性能優于其他模型。

3.5 在不平衡數據集上的故障診斷實驗

在實際的場景下,本文收集到的軸承各類故障數據是極不平衡的,即軸承處在正常狀態的樣本遠遠多于處在故障狀態下的樣本。這種情況下,傳統的各種故障診斷方法的性能將會被限制。為了進一步驗證本文所使用的生成對抗模型在數據增強方面的有效性,本文將4類和10類原始數據集中的各類別故障樣本的數量縮減到原始規模的10%,得到不平衡數據集Origin,并使用各生成模型生成的數據平衡該數據集,基于上述兩個數據集,使用其分別訓練支持向量機(Support Vector Machine, SVM)、隨機森林(Random Forest, RF)、多層感知器(Multilayer Perceptron, MLP)、卷積神經網絡(Convolutional Neural Networks, CNN)、一維卷積神經網絡(One Dimensional Convolutional Neural Network, CNN-1D),并使用測試數據測試兩個數據集在5種分類器下的準確率,測試結果如圖10所示。

由圖10可知,無論使用何種樣本生成模型擴充數據集,在4類和10類數據集上的故障分類準確率都明顯地提高了。尤其是明顯地提高了10類數據集上的故障分類準確率,這說明本文使用的數據擴充方法非常有效。數據擴充后,使用CNN和CNN-1D在4類數據集上進行故障分類,準確率達到了98%以上,在10類數據集上的準確率也達到了97%以上。其中,基于SVM和MLP的分類模型最為明顯。此外,基于CWGAN-GP的樣本擴充方法在所有的故障分類器上都具有最高的分類準確率。這說明基于CWGAN-GP的生成模型生成的樣本能夠用于替代真實樣本平衡數據集。同時可以發現,基于CNN的分類方法在平衡后的數據集上都獲得了最高的分類準確性,這也說明將一維數據轉變為二維數據進行樣本生成是非常合適的。

總之,基于CWGAN-GP的數據擴充方法為數據集不平衡的軸承故障診斷提供了一種非常有效的方法,并且它在分類模型上有著較高的故障分類準確率和較好的魯棒性。

為了進一步驗證本文所提方法的有效性,在10類數據集的訓練集上設定了正常樣本與故障樣本的多種不平衡率,然后基于上述5種分類模型在測試集上進行了測試,結果如表3所示。

表3 不平衡率差異下10類數據集上的故障分類準確率

由表3可知,即使正常樣本和故障樣本的不平衡率達到100∶1,在利用本文所提方法生成的樣本平衡數據集之后,軸承故障分類的準確率在兩種卷積神經網絡的方法下也保持在很小的范圍內變化。這進一步說明生成對抗網絡已經學習到了真實樣本的分布,利用本文所使用的方法是解決不平衡數據集故障診斷問題的有效方法。此外可以發現,通過將訓練集樣本的數量擴大,無論哪種分類器,故障分類準確率都有所提高,尤其是基于SVM的方法最為明顯。這說明樣本數量也是制約分類器準確率的一個重要因素??傊?,生成的樣本已經可以與真實樣本相媲美。

最后,由于本文使用的數據集是由圖片樣本組成的,并且CNN在各種數據集平衡模型上都得到了非常高的準確率,而且CNN在圖像特征提取方面有很大的優勢,為了評估模型在各個故障類別上的表現,本文選用CNN作為故障分類器,使用圖8b所使用的數據集,訓練100個Epoch之后繪制出了在10類數據集上的混淆矩陣,如圖11所示,Ball1故障中很小的一部分被錯誤地分類到了Ball3故障,Ball2故障的很小一部分也被錯誤地分類到了Ball3故障,Ball3故障的很小一部分被錯誤分類到了Ball2故障,而且在圖中可以發現所有故障類型的診斷結果均在99%以上,這說明本文所使用的數據擴充方法能夠很好地生成各種類型的故障樣本,對于解決不平衡數據集的故障診斷,本文提出的故障診斷方法是比較理想的選擇。

3.6 故障診斷的及時性

為了進一步說明本文所提出的滾動軸承不平衡數據集故障診斷方法的及時性,分別統計了生成樣本耗時、在圖8b所使用的數據集下不同故障診斷模型的訓練耗時以及每個樣本的故障診斷耗時。實驗電腦系統為Windows10;CPU為Intel Corei7-9700F,3.00 GHz;RAM為16 GB;顯卡為GTX1660。編程軟件為Python 3.6版本,深度學習框架為Keras。4類和10類數據集上的故障診斷耗時如表4和表5所示。

表4 4類數據集上不同診斷方法的耗時 s

表5 10類數據集上不同診斷方法的耗時 s

由表4和表5可以發現,所有方法中主要耗時為生成樣本耗時,由于5種方法都采用了相同的樣本生成方法,具有相同的生成樣本耗時;在診斷模型訓練耗時方面,本文所提方法CWGAN-GP+CNN耗時最長,這是由于為提高分類準確率采用了深層學習機制,模型參數多,導致訓練時間長,在一些對訓練時間要求較高的場合可以提前進行離線訓練;從故障診斷耗時來看,本文方法耗時最長,但是也僅僅在微秒級,在實際應用中影響很小。結合診斷精度和診斷模型的魯棒性來看,本文方法在耗時影響不大的情況下可以取得很好的故障診斷效果。

4 結束語

本文提出一種新的基于CWGAN-GP的不平衡數據集故障診斷方法。通過將一維原始振動信號換為時頻圖像,充分地利用了信號在時頻域的信息。并且該方法結合了CGAN模型利用條件信息將無監督學習轉變為監督學習生成多類別數據以及WGAN-GP模型在樣本生成過程中避免模式崩潰、梯度消失、收斂慢和訓練過程不穩定的優點。利用生成的高質量樣本進行數據集擴充與平衡,能夠解決分類模型在訓練過程中因數據集不平衡導致的故障分類準確率低的問題。在CRWU數據集上的實驗結果表明:

(1)本文所使用的方法能夠在幾乎不調節超參數的情況下生成質量更高的樣本,并且有助于提高故障診斷的準確率。利用小波變換得到的時頻圖作為CWGAN-GP模型的輸入能夠取得不錯的效果。

(2)t-SNE可視化方法以及分類模型的結果表明,數據量的大小會影響分類模型的準確率,數據量越大,分類模型越能夠取得不錯的分類結果。同時,在生成模型中添加類別輔助信息有助于提高生成樣本的質量。

(3)10類數據集上的混淆矩陣表明,本文所使用的方法生成的樣本用以平衡數據集可以在各故障類型的診斷中取得非常不錯的效果,從而表明該方法具有較好的魯棒性。

雖然本文所提方法在數據集不平衡的滾動軸承故障診斷問題上取得了不錯的效果,但是由于本文所提出的樣本生成方法在模型訓練時耗時長,故難以實現對新的故障的快速診斷,在未來還需進一步研究如何縮短模型的訓練時間,綜合利用新的信息實現準確故障診斷的方法。

猜你喜歡
集上準確率故障診斷
比亞迪秦EV充電系統故障診斷與排除
基于神經網絡的船舶電力系統故障診斷方法
邁騰B81.8T起動機無法啟動故障診斷分析
關于短文本匹配的泛化性和遷移性的研究分析
乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
多層螺旋CT技術診斷急性闌尾炎的效果及準確率分析
不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
頸椎病患者使用X線平片和CT影像診斷的臨床準確率比照觀察
師如明燈,清涼溫潤
幾道導數題引發的解題思考
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合