?

基于過程數據分析的彩色濾光片產線故障機臺定位

2020-06-13 09:33劉仁俊孫兆輝明新國
計算機集成制造系統 2020年5期
關鍵詞:濾光片機臺警報

劉仁俊,孫兆輝,張 莉,程 光,明新國+

(1.上海交通大學 機械與動力工程學院,上海 200240;2.上海儀電顯示材料有限公司,上海 201108)

1 問題的提出

生產線故障定位技術是生產故障修復的基礎,是保證生產系統高效、穩定運行的前提[1-2]。在當今彩色濾光片定制化、小批量、多產品、高規格的新常態化生產模式下[3],面對繁雜的生產工序、生產排程以及大量檢測設備產生的海量數據,傳統的質量分析技術在故障定位的效率和精度提升上已面臨瓶頸[4]。

如圖1所示,彩色濾光片由玻璃基板、黑色矩陣、彩色光阻層、透明導電膜和間隔柱組成[3],復雜的產品結構導致制造工藝也比較復雜,包括拆包(unpack)、黑色矩陣(black matrix)、彩色光阻層(color resist red, green, blue)、透明導電膜(Indium Tin Oxide, ITO)、間隔柱(photo spacer)、包裝(pack)6個工藝,每個工藝的制造流程高度自動化,排除了人的影響,使產品的質量缺陷和工藝間具有強相關關系。

彩色濾光片的質量缺陷可以通過宏觀肉眼觀察和微觀機器圖像識別來檢測,但作為其根本原因的特性缺陷則需要追溯生產的機臺。傳統彩色濾光片質量追溯流程如圖2所示,通常采用基于人工經驗的方法查詢對應生產機臺的加工記錄和警報信息,對比加工工序是否存在時間異常。

傳統質量追溯流程存在幾個主要的問題瓶頸:

(1)分析困難 全自動化生產導致的數據爆炸,復雜工藝及流程帶來的樣本維度不一,以及外部干擾導致的數據噪聲大、異常警報多等問題,給人工分析帶來了巨大困難。

(2)判斷主觀,存在矛盾 在復雜的實際業務情景下,技術人員經驗的差異性和部門間信息的不對稱性,導致了不同的故障分析標準和流程。

(3)時間滯后 由于無法實時檢測機臺的運行狀態,判斷故障積累水平,傳統的質量追溯流程要在出現濾光片缺陷時才發起,拉長了平均故障修復周期,增加了生產線不穩定運行的風險。

針對傳統流程已有的瓶頸,在缺陷樣本的評價分類上,莊進發[5]采用拒絕式轉導推理多類支持向量域數據描述(Rejected Transductive Inference Multi-class Support Vector Data Description, RTIM-SVDD)方法,通過應用M+1個超球體處理M分類問題,并使用轉導推理原則評判模糊樣本點歸屬,相對于距離式M-SVDD(Multi-class SVDD),該方法的性能有所提升。在建模分析方面,吳娟[6]建立了神經網絡故障觀測器模型,基于多源特征信息輸出端與傳感器故障參數的映射,通過實時趨勢描述基元比對專家故障知識庫進行故障定位;郭金玉等[7]通過局部離群因子K近鄰算法(Local Outlier Factor-K-Nearest Neighbor, LOF-KNN)建立模型,對檢測出的故障計算基于K近鄰法(K-Nearest Neighbor,KNN)的變量貢獻,對貢獻矩陣進行量化得出故障定位圖;涂光輝[8]針對樣本分布不均衡的過程數據上存在的模型失配問題,采用新的引力質心模型,在宏平均誤差和微平均誤差兩個指標上超越了基于質心的網絡故障分類器。在信息融合綜合判斷方面,作為一種不確定性推理方法,D-S(Dempster-Shafer)證據理論[9]比傳統概率理論能更好地把握問題的模糊性和不確定性,而且提供了一個非常有用的綜合工時,可以將多種證據來源融合為一個綜合結論;Yager[10]和孫全等[11]針對D-S證據理論合成高度矛盾的證據時會產生不合理結果的缺陷,提出了改進方法;陳非[12]通過定義基于過程信息融合的信息來刻畫過程狀態變化,從而判斷故障位置和故障烈度。

目前,已有的故障定位研究主要基于傳感器數據,對與缺陷同樣強相關的加工參數和機臺警報信息利用得較少;同時對多個過程數據源做出的獨立判斷,缺乏有效的信息融合手段來定位綜合故障。因此,本文提出新的彩色濾光片生產線故障機臺定位模型,該模型基于缺陷類型和面積權重評分確定多缺陷共存時的濾光片主缺陷標簽,通過Xgboost[13]集成方法訓練加工過程數據與缺陷的關聯模型,以信息熵增益確定各個過程數據源的貢獻度;基于K-means[14]聚類機臺警報劃分每個故障問題子集,以警報來源反推機臺故障概率,進而以D-S證據理論融合兩者判斷,確定綜合問題機臺概率。該模型解決了數據量大、維度高情況下分析困難的問題,并基于多源數據的融合判斷方法使判斷更加客觀而全面,而且通過自動化的分析改善了傳統方法的時間滯后性。實際案例應用表明,該模型能夠幫助專業技術人員更好更快速地定位問題機臺,加速故障分析流程。

2 基于過程數據分析的故障定位模型

圖3所示為基于過程數據的故障定位模型,整個流程的輸入為彩色濾光片缺陷檢測數據,模型針對成品的單片彩色濾光片常包含多個不同類型不同大小缺陷的情況,基于缺陷類型和面積的權重進行缺陷類型評價分類,以確定玻璃片的主要缺陷類型作為訓練標簽。然后,通過統計過程控制(Statistical Process Control, SPC)系統查詢該玻璃片加工時所在的產線,進一步查詢產線上的機臺獲得加工過程數據和機臺警報信息。加工過程數據通過數據降維和Xgboost方法訓練出過程數據與玻璃片缺陷的關聯決策樹模型,以信息熵增益得到特征貢獻度評價并反推得出機臺可能有問題的概率。機臺警報通過警報代碼和警報產生時間兩個維度進行聚類,對每一個類團確定主要警報并反推出機臺可能有問題的概率。最后,通過分別產生的兩條問題機臺概率證據,以D-S證據理論進行信息融合產生綜合的問題機臺概率結論。

整個故障機臺定位流程分為缺陷類型評價分類、過程數據建模分析、機臺警報聚類分析、信息融合4部分分別討論。

3 基于過程數據分析的故障定位流程

3.1 缺陷類型評價分類

彩色濾光片由大量像素點構成,在生產過程中容易產生像素壞點,這些壞點都會成為成品的質量缺陷,目前生產企業主要通過彩膜自動光學檢測(Automated Optical Inspection, AOI)技術結合分區檢測技術[15],針對不同的工藝和矩陣圖形分區比較,根據各分區基本灰階設定閾值來自動化檢測彩色濾光片缺陷,其檢出的缺陷類型包括反射黑(RB)、反射白(RW)、透射黑(TB)、透射白(TW),缺陷大小包括小(S)、中(M)、大(L)、超大(OL)。

單片彩色濾光片在生產加工過程中往往會產生多處不同類型不同面積的缺陷,很難對濾光片定義唯一的缺陷標簽,因此提出基于缺陷類型和面積權重評分的主類型評價分類方法。在實際生產中,鑒于中等及以下缺陷占比高(80%以上)但對質量影響不大,定義S和M大小的缺陷為1分和2分;對于L和OL大小的缺陷,一旦出現就很有可能導致激光修補或者返工,其影響程度明顯高出一個數量級,因此分別記為10分和20分。

表1所示為某片濾光片上所包含的所有缺陷。一般可以得出RB缺陷影響最大、TB次之、TW可以忽略,因此RB是該濾光片主要缺陷的結論。同理根據本文缺陷評價分類方法,4種缺陷RB,RW,TB,TW對應的評分為25,0,4,10,濾光片應標記為最高分的RB,與經驗判斷相同。算法流程如下:

算法1缺陷類型評價分類。

輸入:彩色濾光片樣本X,樣本個數n,樣本缺陷數nk。

輸出:分類后的彩色濾光片樣本。

1:function缺陷類型評價分類(X)

2: [S,M,L,OL].weight=[1,2,10,20]

3: for i=1→n & j=1→nkdo

4:if Xij.label=[OK,RB,RW,TB,TW,Other] & Xij.size=[S,M,L,OL] then

5:label.score←label.score+size.wight

6: endif

7: Xij.label←max(label.score)

8: Endfor

9: return X

10:end function

表1 單片彩色濾光片缺陷舉例

3.2 過程數據建模分析

彩色濾光片生產制造涉及多條生產線和數量眾多的機臺,產生的大量信息可以作為過程數據的屬性(如表2),包括預先設定的加工工藝參數(如RGB層涂層厚度、洗凈機清洗液流速、曝光機曝光強度等設定)、機臺各工序的實際加工時間(如實際涂布、清洗、顯影時間),以及機臺傳感器感知的環境信息(溫度、濕度、壓力、振動等)。在現實情況中,大部分機械結構故障如電機運作不良、機械手運動不到位,機械破損如液體泄漏導致的余量不足、氣密性被破壞導致的污染物流入等,會與過程數據相關聯并最終導致濾光片產生缺陷。通過建立彩色濾光片過程數據與缺陷關聯模型,可以從缺陷的產生反推對應的過程數據屬性,從而為確立具體機臺問題提供重要數據支撐,因此提出基于Xgboost與信息熵增益的缺陷根因特征評價方法,其主要流程如下:

表2 過程數據包含的信息

(1)數據預處理

過程數據的屬性總量非常大,而且屬性里存在缺失數據或者恒定值的情況,因此必須進行數據預處理。假設有n片彩色濾光片,一片彩色濾光片加工時流經所有機臺的工藝參數、加工時間等過程數據特征有m維,則經過數據采集并聚合可得樣本矩陣X∈n×m,其行向量Xi∈m表示第i片彩色濾光片樣本,列向量fj∈n表示第j項過程數據特征。使用Z標準化[16]對所有屬性的數據進行標準化,對彩色濾光片的標簽OK,RB,RW,TB,TW,Other分別編碼為0,1,2,3,4,5。

(2)數據篩選與特征降維

過程數據部分屬性存在耦合、變化趨勢高度一致、數據冗余的情況,為了后續高效訓練,必須對數據進行降維。本文分別采用正則化自表示[17](Regularized Self-Representation, RSR)和拉普拉斯評分[18](Laplacian Score, LS)的特征選擇方法,相比于皮爾森相關系數、L2正則化等其他特征選擇方法,這兩種方法在算法復雜度上有一定優勢,適用于數據維度高、樣本量大的工業場合。

RSR方法的目的是要找到最能代表其他特征的特征,從而將特征選擇問題轉為以下最小化問題:

(1)

式中:X為彩色濾光片樣本矩陣,W為自表示權值矩陣,故有‖X-XW‖2,1越小W越準確;λ為正則化常數;‖W‖2,1為對W的正則化項,用于增強W對異常樣本的魯棒性以及防止W成為單位矩陣。最終計算出第j項特征的自表示評分為

vj=‖Wj‖2。

(2)

顯然對于數值恒定和數值缺失的特征,其代表其他特征的能力很弱,反映到自表示權值矩陣W,即對應行向量的平方和很小,自表示評分很低。因此通過自表示特征選擇可以有效去除冗余的特征,實現數據降維。

LS方法的目的是找出最能反映樣本局部結構的特征,以增強樣本區分性并提高后續模型的準確率。LS方法首先構造了基于樣本K個鄰居的鄰近圖G,圖中一個節點表示一個彩色濾光片樣本,如果兩個節點互為k個最鄰近節點之一,則在兩個節點之間建立一條邊,于是將特征選擇問題轉化為以下目標函數:

(3)

式中:Lr為第r項特征的拉普拉斯評分;fri為第i個彩色濾光片的第r項特征,i∈{1,…,m};

(4)

Sij是對第i個和第j個節點相似性的估計;Var(fr)為第r項特征的方差。顯然,對于區分性良好的特征,任意有邊相連的兩個節點,其該特征的差值的平方(fri-frj)2較小,而且相似性估計Sij趨近于1,任意不相連的兩個節點因為Sij=0不統計,所以綜合而言拉普拉斯評分較小。通過拉普拉斯評分可以有效篩選出區分性能好的特征。

(3)Xgboost模型訓練

可以用于建立彩色濾光片過程數據與缺陷關聯模型的方法有許多,如邏輯回歸、KNN、支持向量機(Support Vector Machine,SVM)、卷積神經網絡(Convolutional Neural Networks,CNN)等,本文選用Xgboost方法的原因是其具有解釋性強、準確性較高、抗過擬合和訓練速度快、可分布式計算適應工業大數據場景的特點。Xgboost是通過梯度提升樹的方法建立一系列決策樹來擬合彩色濾光片過程數據與缺陷的關聯性。

針對彩色濾光片的多分類問題,使用二叉平衡樹作為Boosting方法的基學習器,以指數損失函數計算多分類錯誤率來確定誤差,利用GridSearchCV依次確定樹的最大深度、最小葉子值、后剪枝參數、列采樣率、樣本采樣率、正則化系數等。多次試驗取最佳參數,對所有彩色濾光片樣本進行訓練得到過程數據與缺陷關聯模型。

(4)特征貢獻度評價

在Xgboost訓練出的梯度提升樹模型中,每一個節點通常將該節點樣本子集的分類準確率提升最大的特征作為節點分裂判斷條件。分裂后的兩個樣本子集分類準確率比分裂前更高,樣本組成更單一,不純度更小。采用基尼系數[19]作為決策樹的不純度計算標準:

(5)

(6)

Importance(A)=Gini(D,A)-Gini(D)。

(7)

式中:D為一棵決策樹中某一個枝干對應的彩色濾光片樣本子集;N為D中缺陷類型的個數;pn為第n個缺陷類型占整個樣本子集的比例;D1和D2為D通過某個特征A的值a進行分割得到的兩個樣本子集。一個特征的重要度通過統計模型決策樹中該特征作為判斷條件的次數得到。

顯然,一個特征的重要度越高,即在越多決策樹中作為判斷條件出現,其對不純度的提升越大,其與缺陷的關聯性越強。因此,重要度反映了該特征與彩色濾光片缺陷的關聯關系,即重要度越大,與缺陷的關聯程度越高,特征對應的機臺越可能有問題。

(5)反推問題機臺概率

因為彩色濾光片樣本的每一個特征都來自其加工流程上對應的某一個機臺,所以可以將某機臺對應的多個特征的重要度累加起來作為該機臺的重要性,即問題機臺概率,其大小反映了加工機臺與彩色濾光片缺陷之間潛在的因果關系。

算法流程如下:

算法2過程數據建模分析。

輸入:彩色濾光片樣本X,樣本特征F,樣本特征數t,機臺M。

輸出:問題機臺概率。

1:function過程數據建模分析(X)

2: for X.label=[OK,RB,RW,TB,TW,Other] do

3: X.label←[0,1,2,3,4,5]

標簽編碼

4:end for

5:F.RSRScore=RSR(X,nambda,iteration,epsion)

6:F.LSScore=LS(X,neighborNumber,tVariance)

7: for i=1→t do

特征篩選

8: if Fi.RSRScoreLSThresholdthen

9: X.filter(Fi)

10: end if

11: end for

12: train,val←split(X, testSize, RandomState)

Xgboost訓練

13: params←[gbtree, multi:softmax, gamma, seed]

14: model←xgb.train(train, params, numRounds)

15:preds←model.predict(val)

16:F.importance←model.booster().getFscore()

17:for i=1→t & j=1→m do

18:if Fi.machine=Mjthen

19:MPj←MPj+Fi.importance

20:end if

21:end for

22:return MP

23:end function

3.3 機臺警報聚類分析

機臺警報信息是能高度反映機臺故障的另一個重要數據源。通過機臺嵌入式系統和SPC系統檢測和分析,可以輸出機臺警報信息,包括設備代號、警報級別、警報代碼、警報內容、受影響彩色濾光片列表、發生時間等。

在實際生產中有成百上千種警報類型,每種類型的數量從幾個到幾千個不等,導致人工故障定位非常困難。在此情況下提出的基于K-means聚類的警報信息分析方法基于兩個假設,一是警報類型代碼相近則故障表現相似,二是警報發生時間相近則警報根因相同,使用警報類型代碼和發生時間兩個維度進行k均值聚類來確定反映同一個機臺問題的子類團,找出子類團中的主要警報并反推為其對應的機臺,以子類團警報數量的對數為權重綜合各子類團求得問題機臺概率。具體流程如下:

(1)數據預處理將以年月日時分秒記錄的發生時間轉化為秒,將警報類型代碼轉化為可運算的數字,例如將16進制的警報類型代碼轉化為10進制。

(2)警報聚類首先采用Calinski-Harabasz準則[14]確定最佳類團數量,并判斷聚類的有效性。以下函數取最大值時的類團數量即為最佳類團數量:

(8)

式中:B和W分別為類間方差矩陣和類內方差矩陣;N為所有機臺警報的個數;C為類團的個數。矩陣B的跡

(9)

式中:ni為第i個類團中警報的個數;mi和m分別為子類團和整個警報樣本的中心點。矩陣W的跡

(10)

式中ci為第i個子類團中的不相交子集。

找出最佳類團數量后,通過K-means方法進行聚類得到各個警報子類團,將警報級別為低和高的警報分別記為1分和2分,然后加和計算第i個警報子類團第j個機臺的分數Sij,以此得到第i個子類團中的問題機臺概率:

(11)

MPi=(MPi1,…,MPiM)。

(12)

為了關注影響程度大、影響時間集中的機臺問題,對子類團取其數量的對數作為權重求出整個機臺警報對應的問題機臺概率

(13)

算法流程如下:

算法3機臺警報聚類分析。

輸入:機臺警報樣本A,警報個數n,機臺M,機臺個數m。

輸出:問題機臺概率。

1:function機臺警報聚類分析(A)

2: A.alarmCode←hexToInt(A.alarmCode)

3:A.alarmTime←timeToSecond(A.alarmTime)

4:A←Standized(A)

預處理

6:CHi←KmeansClustering(A)

7:end for

8: K←argmax(CH)

最佳類團數量

9:for i=1→K & j=1→m do

10: M[j].score←M[j].score+A.levelScore

11:Ci.MP←M.score/sum(M.score)

12: end for

13:Pi←log(ni)

子類團權重

15:return MP

16:end function

17:

18:functionKmeansClustering(A,k)

19:est←Kmeans(k,‘k-means++’)

20: A.clusterLabel←est.fitPredict(A)

類標簽

21: C,Ci←est.clusterCenters

全部及子類團中心

22:ni←est.clusterCount

子類團警報數

23:for i=1→k do

24:traceB←traceB+ni*‖Ci-C‖2

25:end for

26:for i=1→k & x∈Cido

27:traceW←‖x-Ci‖2

28:end for

29: CH=traceB/traceW

30:returnA.clusterLabel, CH

31:end function

3.4 信息融合

通過過程數據建模分析和機臺警報聚類分析,得到某些機臺可能存在問題的兩條證據,需要通過信息融合方法綜合兩條證據判斷后,在矛盾的地方進行取舍,得到機臺存在問題的概率。因此提出基于D-S證據理論的過程數據與機臺警報判斷融合方法。

對于以上兩條概率證據,辨識框架θ={machinej},j={1,…,M}是參與彩色濾光片生產制造過程的所有M個機臺的集合。作為D-S證據的基本概念,基本概率分配(Basic Probability Assignment, BPA)函數定義為

(14)

即辨識框架外的問題概率為0,以及框架內所有機臺存在問題的概率之和為1?;诖?,兩條證據的融合規則可以定義為

(15)

式中:

(16)

為規范化系數;A為θ中任一機臺machinej,B和C為θ任一子集。另外,為了應對實際情況中可能出現的高度矛盾的情況,例如對于某一機臺j,過程數據分析出的概率為0,機臺警報分析出的概率為1,則融合概率為0,而一般人工經驗判斷會認為取均值0.5,將融合規則定義為

m1(A)⊕m2(A)=R×p(A)+(1-R)×q(A)。

(17)

式中:

(18)

(19)

規范化系數R反映了證據之間矛盾的大小,當R→1即矛盾輕微時,融合結果接近經典D-S證據理論;當R→0即矛盾嚴重時,融合結果接近平均值。通過使用上述規則融合兩條證據,得到所懷疑機臺存在問題的綜合概率用于故障機臺定位。算法流程如下:

算法4信息融合。

輸入:證據樣本E,機臺M,機臺個數m。

輸出:綜合問題機臺概率。

1:function信息融合(E)

2: recognitionFrame←[Mi],i=1→m

識別框架

3: for i=1→m do

4:R←R+E[1,i]*E[2,i]

規范化系數

5:end for

6:p,q.MP←zeros((1,m))

7:for i=1→m do

8: pi←pi+E[1,i]*E[2,i]/R

9: qi←qi+(E[1,i]+E[2,i])/2

10:MPi←R*pi+(1-R)*qi

11:end for

12: Uncertainty=1-sum(MP)

不確定性

13:return MP,uncertainty

14:end function

4 應用案例驗證

Y公司是一家顯示材料制造公司,生產包括多種玻璃基板厚度、不同尺寸范圍的近60種彩色濾光片產品,每月生產數萬片彩色濾光片成品。然而,機臺故障導致的彩色濾光片污染、破片事件時有發生,能否快速定位問題機臺并解決機臺故障、減少進一步產生缺陷產品,對制造生產活動有巨大的影響。該公司采用的傳統質量分析流程在進一步提升質量上存在瓶頸,因此在藍色光阻層產線上嘗試使用本文提出的基于過程數據分析的故障模型。

4.1 過程數據獲取

應用模型的藍色光阻層BL1產線的工藝流程如圖4所示,工藝產線包括紫外照射機、洗凈機、熱盤脫水機、光阻涂布機、預烘烤機、曝光機、顯影機、光學檢查機、巨觀檢查機、烘烤機共10個機臺。試驗樣本選取該產線一個月內加工的30 895片彩色濾光片,采集每片彩色濾光片的工藝參數、加工時間、環境信息、缺陷判斷等信息,以及10個機臺在同一時間段內產生的34 295個機臺警報信息。

4.2 實驗設計與結果

4.2.1 缺陷類型評價分類實驗

對于每一片彩色濾光片,查詢光學檢查機檢測出的RB,RW,TB,TW 4類缺陷信息,每一類缺陷采用S,M,O,OL分別計1,2,10,20分的規則進行計分,取分值最大的作為該彩色濾光片的缺陷評價結果。處理后的玻璃片標簽如圖5所示。

4.2.2 過程數據建模分析實驗

經過數據預處理后,每一行數據對應一片彩色濾光片,包含215個特征,特征值經過Z標準化后處理為0-1自然分布。

通過RSR算法計算出的自表示特征矩陣值為對稱矩陣,如圖6所示,圖中:橫縱坐標為215個特征;坐標(i,j)的值表示引入正則化后第i項特征表示第j項特征的能力,值越大說明表示能力越強,兩者相關性越大;對角線(i,i)的值表示第i項特征自表示的能力,對角線上的淺色特征對部分其他特征也有較強的表示能力,即與區域內其他特征存在互相耦合的關系,可進行特征聚合以進一步降維。因此第i行的值表示第i項特征表示所有215個特征的能力,該行的二范數表示第i項特征的綜合表示能力,其中冗余特征的綜合表示能力接近0。為過濾值顯著為0的特征,并保留合適的特征數量,取RSR閾值為10-3。最終每個特征的RSR重要程度如圖7所示,篩選后的特征數量為189個。接著通過LS算法計算LS重要度(如圖8),根據LS算法的值越小越好的特性,取LS篩選閾值為0.1,篩選后的特征數為149個。

完成特征降維后使用Xgboost訓練過程數據與濾光片缺陷的關聯模型。設定學習目標為multi:softmax,標簽類別數為6,以gpu_exact作為樹方法,mlogloss作為評價函數。通過GridSearchCV依次確定學習速率為0.1,樹最大深度為3,葉子最小權重為5,γ為0.1,reg_alpha和reg_lambda正則化系數均為3。如圖9所示,通過多次實驗,確定采用RSR和LS特征選擇后的數據集訓練出的模型,在準確率提升0.07%的基礎上使訓練時間減少了28.9%,有效地提高了模型的訓練速度。

關聯模型由一系列梯度提升決策樹組成,訓練后的決策樹如圖10所示。對于每一個測試樣本,從每一棵決策樹的根節點開始,根據根節點判斷條件選擇走向左子節點還是右子節點,直到走到葉子節點,每一棵決策樹獲得的葉子節點值之和即為預測的類別,從而實現了基于彩色濾光片過程數據的缺陷預測。統計每個特征在一系列決策樹中作為判斷條件的出現次數,得到每個特征對彩色濾光片缺陷的貢獻度,如圖11所示??梢奻4特征的貢獻度最高,f51次之,然后是f21,f22,f18。對產線上每一個機臺所屬特征的貢獻度求和并歸一化處理后,得到各個機臺的可疑概率,如表3所示。由表3可見,曝光機(EXP)是最有可能存在問題的機臺,其概率為58%,其和洗凈機(CLN)、光學檢查機(AOI)、烘烤機(OVN)一起占90%以上,意味著如果濾光片突然出現大量缺陷,則極有可能是這4個機臺存在一個或多個問題。

表3 過程數據的可疑機臺概率

序號機臺重要度序號機臺重要度1EXP0.587 5106COA0.025 7442CLN0.178 3007DHC0.015 8133DEV0.015 8138DUV0.012 3554AOI0.084 3569PHC0.001 0225OVN0.078 39010SMA0.000 698

4.2.3 機臺警報聚類分析實驗

在現實生產中,某些機臺故障常會導致一段時間內大量出現某類濾光片缺陷,同時產生多個類型相近的警報。例如由于機臺冷卻水泄露導致的彩色濾光片大面積圓形水漬污染,會在一段時間內使濾光片大量檢測出RB類型缺陷,同時故障機臺會經常發出與冷卻相關的冷卻水流量異常100023A0、系統工作溫度異常100023B5等警報。因此基于警報類型代碼近似及發生時間相近的警報代表同一個機臺故障的兩個假設,使用警報類型代碼和發生時間兩個維度進行k均值聚類以確定反映同一個機臺問題的子類團。

首先通過數據預處理對時間字段和警報類型進行轉化。例如,原時間“03-11月-17 02.53.10.000000上午”轉化為“564893590” s。原警報類型代碼是8位的16進制數,因為代碼編寫需要保留余量,目前只使用了第1位和后4位數,而且有意義的警報類型代碼相對稀疏,所以需要省略未使用的部分類型代碼,使警報類型間隔不會過大,以保證聚類的有效性;同時,因為16進制不方便計算歐式幾何距離,所以轉化為十進制,最終轉化規則為A000BCDE→3·A·163+B·163+C·162+D·16+E,例如“100012DA”轉化為“21210”。經過0-1標準化后,使用CH(Calinski-Harabasz)準則確定合適的類團數量。如圖12所示,一開始CH評分的增長主要得益于類間方差的增加,但隨著類團數的增加,類團數的影響增大并導致CH評減少。CH評分在類團數量為10左右時取得最大值,此時是聚類效果與聚類數的良好折中,因此類團數為10是該機臺警報樣本集的最優類團數。使用K-means聚類,得到每個警報對應的警報類團標簽,如圖13所示。每個類團對應一個問題子集,類團內各個警報的數量反映了其在該問題子集中的重要性,間接反映了警報來源機臺存在問題的概率。取警報級別“L”為1,“H”為2,在每一個警報類團中對10個機臺(AOI,CLN,COA,DEV,DHC,DUV,EXP,OVN,PHC,SMA)分別計分。對于每一個警報類團,以評分除以總分得到每一個警報類的機臺概率,因為更希望關注持續時間長、跨越多個類團的問題,所以以警報類團的警報數量的自然對數作為類團權重,從而削減短時間隨機波動問題造成的干擾。最終得到的機臺警報生成概率如表4所示。

表4 機臺警報的可疑機臺概率

序號機臺重要度序號機臺重要度1AOI0.330 8576DEV0.037 6472COA0.317 6377OVN0.009 1893DUV0.171 3318PHC0.008 3024EXP0.079 3139CLN0.005 4085DHC0.037 64710SMA0.002 667

4.2.4 信息融合實驗

將BL1產線上的10個機臺作為D-S信息理論的識別框架,即有

θ={AOI,CLN,COA,DEV,DHC,DUV,EXP,OVN,PHC,SMA}。

根據過程數據和機臺警報得到的可疑機臺概率,使用改進的D-S證據理論進行信息融合,中和證據中矛盾的部分,得出疑似問題機臺的綜合概率,如表5和圖14所示??梢钥闯?,過程數據分析出的結果認為問題主要集中在EXP和CLN,機臺警報分析出的結果認為問題主要集中在AOI和COA,通過信息融合給出一個綜合判斷意見,確定了EXP,AOI,COA的排查順序,并給出了8%的不確定性以供參考。同時,信息融合可以方便地引入其他模型,得到更多懷疑機臺存在故障的證據進行綜合判斷,具有強大的擴展能力。結合實際應用情況,還可以對各個證據引入不同的權重,例如過程數據的證據實際使用效果好,經常命中問題機臺,可以相應地增加其權重,使得綜合判斷更加準確可靠。

表5 疑似問題機臺的綜合概率

4.3 結果分析

由實驗結果可知,本文提出的基于過程數據分析的彩色濾光片生產線故障機臺定位方法,能夠對數萬片濾光片、數百個特征的樣本進行分析,得出疑似問題機臺的綜合概率,其基于數據的流程標準統一,符合技術人員由經驗規律推導出的結果。整個流程可以通過系統自動完成,將傳統人工查找的幾十分鐘到幾小時的搜索時間縮短到10 min以內,從而大大提高故障機臺定位的效率,縮短產線非計劃停機時間,增加企業利潤。

5 結束語

本文分析了傳統故障定位方法在工藝復雜的彩色濾光片產線上遇到的瓶頸,提出基于過程數據分析的彩色濾光片生產線故障定位模型,基于缺陷類型和面積權重評分確定多缺陷共存時的濾光片主缺陷標簽,并通過Xgboost集成方法訓練加工過程數據與缺陷的關聯模型,以信息熵增益確定各個過程數據源貢獻度;基于K-means聚類機臺警報劃分每個故障問題子集,以警報來源反推機臺故障概率,進而以D-S證據理論融合兩者判斷,確定綜合問題機臺概率。

本文提出的針對多種過程數據源得出故障定位判斷并進行信息融合的故障定位模型,改進了傳統模型在分析能力、判斷標準及定位速度上的缺陷或不足,提升了故障定位的有效性與時效性,特別是在制造業從自動化、信息化向數字化、網絡化轉型的新時代,面對未來智能制造產生的海量數據,人工判斷故障已不現實,而本文基于數據進行故障定位將成為未來智能運維中的一環,具有巨大的應用前景。同時由于生產線上加工參數和機臺警報的通用性與普遍性,本文模型可以推廣到其他復雜電子產品的生產線,具有廣泛的實際應用價值。

猜你喜歡
濾光片機臺警報
基于北斗三號的人防警報控制系統及應用
假期終結者
某光電觀測儀圖像非預期切換原因及解決措施
優化PROTOS70梗中含絲量技術性研究
是誰的責任?
拉響夏日警報定格無痕跡美肌
可調諧濾光片的透射譜研究
一種橡膠硫化機機臺的夾柱結構
基于ASCOM標準的CCD自動觀測系統*
基于Rugate理論的負濾光片設計研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合