?

基于自組織映射-反向傳播網絡的PCB樣板投料預測

2020-09-02 01:36鄭彬彬呂盛坪李燈輝冼榮亨
計算機應用與軟件 2020年8期
關鍵詞:投料樣板均值

鄭彬彬 呂盛坪 李燈輝 冼榮亨

(華南農業大學南方農業機械與裝備關鍵技術教育部重點實驗室 廣東 廣州 510642)

0 引 言

印制電路板(Printed circuit board,PCB)是電子元器件的支柱,常被稱為“電子產品之母”。隨著計算機、通信、消費電子、5G、汽車電子、人工智能等行業的快速發展及其產品的迭代更新,具有不同設計特點和制造要求的多樣個性化PCB訂單(企業常稱之為樣板)快速增加,針對樣板的生產模式也從傳統的大規模批量生產轉化為面向客戶的小批量生產,相應的生產管控面臨一系列新的挑戰,生產前更準確預測每個訂單的投料是關鍵問題之一。

目前,大部分PCB樣板生產基本上依靠人工經驗估算投料面積并轉換計算相應生產面板(Panel)數。但人工投料常導致車間超投和補投均較高且波動較大。超投剩余個性化PCB樣板只能置于庫存或直接銷毀。通過補投可以減少樣板剩余,但會增加生產成本和造成交貨拖期,影響企業信譽。生產前更合理地確定各訂單投料面積和投入Panel數,可以降低物料、生產、庫存和銷毀等綜合成本,減少投料人力投入[1-2]。同時,減少冗余生產可以降低因生產和銷毀帶來的化學藥品和重金屬污染。

數據驅動的智能制造框架[3-4]、范式[5-6]、分析方法和體系[7]等被大量研究。相應成果已廣泛應用于支持產品設計、生產制造、銷售、服務和回收等產品全生命周期不同階段[8-9]。同時,數據挖掘為把握產品質量規律和改進質量提供了更精益智能化手段,相應研究主要集中在質量描述、預測、分類和參數優化四個方面[10]。具體到PCB質量規律挖掘主要集中在PCB貼裝相關工藝,所采用理論方法主要集中在支持向量機(Support vector machine,SVM)[11]、人工神經網絡(Artificial neural networks,ANN)[12-13]、ANN與遺傳算法結合[14-15]、模糊ANN[16]、自組織映射[17-18]等。所涉及業務對象及其任務主要集中在PCB貼裝相關工藝的質量描述、預測和參數優化。但是上述研究較少涉及PCB生產質量特別是樣板質量規律挖掘研究。

結合企業需求,呂盛坪等[1]利用多元線性回歸、卡方自動交互檢測器、SVM和ANN構建了報廢率預測模型。隨后,提出了考慮單屬性變結構人工神經網絡(multiple structural change ANN,MSC-ANN)預測模型[2]。但是訂單結構及其報廢率影響因素可能存在較大差異,綜合考慮樣板不同屬性對訂單進行分組,繼而優選各分組訂單質量影響關鍵因素,在此分組構建相應預測模型將有利于進一步提高預測模型的精準度。本文提出先基于SOM對樣本進行聚類分組;繼而采用特征選擇機制,優選各分組數據報廢率關鍵影響屬性;在每個分組的基礎上構建BPN報廢率預測模型;綜合PCB生產特點,將其轉換為對應預測投入生產面板數;最后以生產車間樣板訓練上述模型并以不同評價指標驗證所提出模型的可行性和優越性。

1 屬性與樣本

綜合企業資源管理數據庫中屬性,利用繼承、派生、轉換等方式,共梳理影響樣板報廢率和統計分析屬性56個,具體如表1所示[2]。編號1-35是可能影響每個樣板報廢率的屬性;36-56是統計變量,其中生產拼板數、要求生產數量、向上圓整Panel數、成品單元面積、要求生產面積等變量(編號分別為36、38、39、46和47),不僅可以作為統計參數,還可以作為預測模型建立的候選屬性。

表1 PCB樣板屬性

在此基礎上,從企業資源管理數據庫中抽取一個廠2013年10月至2016年10月期間累計的共計30 117條有效數據,進一步采用多變量箱線圖[2]篩除異常數據,最后得到29 157條樣板數據作為本研究模型構建和測試分析樣本。

2 SOM-BPN預測模型

PCB樣板結構和報廢率影響關鍵屬性存在一定差異,將所有樣本集中于單一模型之中易降低模型預測精度,增大預測偏差,降低泛化能力。

本文先基于SOM對樣板進行聚類分組,進一步優選各類樣板報廢關鍵影響屬性并構建基于BP網絡的預測模型。SOM網絡能將任意維的輸入在輸出層映射成一維或二維圖形,并保持其拓撲結構不變。網絡通過對輸入數據的反復學習可以使權重向量空間與輸入數據的概率分布趨于一致,使得輸入屬性相近的數據可以聚合在一起。SOM-BPN模型框架如圖1所示。

圖1 SOM-BPN預測模型框架

具體步驟如下:

(1) 數據準備和預處理:基于表1給定屬性及其抽取的歷史數據,對各變量數據開展0-1歸一化處理,以降低不同屬性取值范圍差異影響。

(2) 聚類屬性選擇:結合車間專家經驗選取聚類輸出屬性,具體包括層數、工序數、內層最小線寬/間距、外層最小線寬/間距、要求生產數量、向上圓整Panel數、要求生產面積、是否有鉛噴錫/無鉛噴錫/OSP/圖鍍銅鎳金/鍍金手指/電鍍硬金/軟金鎳鈀金/沉金沉銀沉錫。其中層數、工序數代表了樣板整體特征;內外層最小線寬/間距是孔線加工代表性特征;要求生產數量、向上圓整Panel數、要求生產面積代表訂單規模。

(3) 基于SOM的樣本聚類分組:SOM是一種只有輸入層-競爭層的神經網絡。在此使用的SOM輸入層為上述17個屬性;競爭層在此設置為由2×3神經元組成的二維平面離散網絡,并且與輸入層之間全連接。競爭層為2×3的二維平面將聚類數控制在2~4個之間,以便降低車間訓練、測試和后續維護模型數量并保持較好的預測精準度。

(4) 聚類樣本關鍵影響屬性優選:模型構建輸入屬性過多將增加數據準備、預處理、模型構建、預測分析的復雜度和時間,且更容易導致模型過擬合、降低模型泛化能力。本文采用線性相關性、最大信息系數、遞歸特征消除、線性回歸、Lasso回歸、Ridge回歸和隨機森林回歸等[19-20],計算各屬性對報廢率影響得分,優選平均得分大于一定閾值(比如0.15)的屬性為預測模型輸入。

(5) BPN預測模型構建:基于聚類樣本及其優選屬性,設置訓練樣本和測試樣本,以相應訓練樣本開展模型訓練。BPN網絡模型設置如下。

輸入和輸出:輸入為歸一化后各分組優選屬性數據;輸出為歸一化處理后各樣本預測報廢率。

隱藏層設置:單一隱藏層,相應節點數采用較為常見的(輸入節點數+輸出節點數)/2計算??梢钥闯銎潆[層節點數取決于各分組所選屬性,較大的隱藏節點數一般能提高模型的非線性適應能力和預測精準度,在此將各分組BPN隱層節點統一設置為15(各分組所選屬性最多的一組為28個)。

激活函數:研究表明,BP神經網絡在其隱藏層采用Sigmoid函數即f(x)=1/(1+e-x),輸出層采用線性函數f(x)=x,只要隱含層中有足夠的神經元,就幾乎可以以任意精度擬合任何函數[21]。

學習率:0.05。

終止條件:最大迭代次數大于25 000。

SOM通過(歐氏)距離判斷樣本之間的相似性。學習過程中,輸入樣本找到與之距離最短的競爭層單元(獲勝神經元),并對其更新。同時,將鄰近區域的權值更新。具體聚類流程如下:

(1) 網絡初始化:用0~1之間隨機數初始化輸入層與競爭層之間權值矩陣wij(i=1,2,…,17,j=1,2,…,6,表示競爭層第i個神經元與輸入層第j個神經元之間的連接權重)。設定初始鄰域Nc(0)=2,學習速率η(0)=1/3e2,最大迭代次數T=500,當前迭代次數t=1。

(4) 權值、鄰域和學習率更新:以j*為中心確定t時刻的權值調整域。

(5) 基于樣本的學習:隨機抽取新樣本,返回步驟2,完成步驟2-步驟4,直至全部樣本完成上述迭代。

(6) 終止條件判斷:若t

3 結果分析

SOM-BPN模型采用Python 3.6開發實現?;赟OM聚類后的29 157條樣本被劃分為3組,分別以C1、C2和C3標識,各聚類分組中樣本規模分別為12 992、6 674和9 491。因各分組內向上圓整Panel數、要求生產數量和外層最小線寬取值差異較大,繪制樣本在上述三維空間的分布如圖2所示。圖3給出了不同聚類分組輸入屬性均值。

圖2 聚類結果分布

(a) 非二分類型屬性均值對比

(b) 二分類型屬性均值對比圖3 各聚類分組中相應屬性均值比較

三組樣本的訂單規模(要求生產數量、向上圓整Panel數和要求生產面積)均值差異較大,是區分和識別每個分組內樣本差異的主要屬性,與工廠實踐一致,車間也是將訂單規模視為重要變量。C2中外層最小值線寬/間距均低于C1和C3中樣本相應值,但層數均值更高,說明層數越高相應線路越密,這與實際一致。

基于聚類分組樣本,以表2給出的41個屬性為輸入,以報廢率為預測目標,基于前述特征選擇機制計算各屬性對報廢率影響得分,計算出各分組樣本和所有樣本各屬性重要性得分均值,如圖4所示,其中對應編號同表2給定編號??梢钥闯?,不同樣本組關鍵影響屬性存在較大差異,原因之一是模型可能存在多個復雜分布[2]。

表2 不同樣本分組優選屬性

續表2

(a) C1組樣本屬性重要性得分均值

(b) C2組樣本屬性重要性得分均值

(c) C3組樣本屬性重要性得分均值

(d) 全體樣本屬性重要性得分均值圖4 樣本屬性重要性得分均值

在此優選其重要性得分均值大于0.15的屬性作為各BP網絡預測模型的輸入,各分組樣本相應預測模型所優選屬性在表2中以“▲”標識??梢钥闯?,C1、C2、C3組和全體樣本選擇屬性數分別為28、26、22和16。不同聚類組所選屬性存在一定的差異,但層數、羅杰斯材料、工序數、華為驗收標準、樹脂塞孔、阻焊塞孔、背鉆、圖鍍銅鎳金、軟金鎳鈀金、成品單元面積、要求生產數量/面積、向上圓整Panel數、歷史良率等對各分組報廢率均具有關鍵影響。

隨機選擇每組中70%樣本用以訓練相應BPN網絡,剩余30%樣本作為測試樣本。其中C1、C2、C3以及全體數據中相應訓練樣本規模分別為9 094、4 672、6 644和20 410,測試樣本規模分別為3 898、2 002、2 847和8 747?;趦炦x屬性分組訓練報廢率預測模型,并將其轉換為預測投入Panel數。圖5、圖6分別為針對測試樣本人工投人Panel數(車間實際投料方式)和基于SOM-BP預測投入Panel數與至少投入Panel數的偏差對比和回歸圖??梢钥闯?,人工投料存在明顯超投,基于SOM-BP預測機制能進一步降低車間因超投Panel導致的余數入庫,從而降低車間因冗余帶來的物料、生產、庫存等浪費。

(a) 人工投入Panel數與至少投入Panel數偏差

(b) SOM-BP預測投入Panel數與至少投入Panel數偏差圖5 測試樣本Panel數偏差

(a) 人工投入Panel數與至少投入Panel數擬合 (b) SOM-BP預測投入Panel數與至少投入Panel數擬合圖6 測試樣本Panel數回歸結果

進一步以預測投入Panel數與至少投入Panel數的均方誤差(MSE)、絕對平均誤差(MAE)和平均絕對百分比誤差(MAPE)為評價指標判斷相應預測效果,指標定義參考文獻[2]。同時,在此以全部訓練樣板為輸入,以表2中“全體”列中所優選屬性為輸入構建單一BPN預測模型。同時與基于單一參數(要求生產數量)劃分樣本后分組構建BP預測模型的MSC-ANN[2]進行對比,對比結果如表3所示??梢钥闯鯯OM-BPN能明顯降低MSE、MAE和MAPE的誤差。其原因可能是基于分類劃分和分組屬性優選,盡可能地降低了同組內樣本分布差異,從而提高模型預測精準度。

表3 不同預測模型MSE、MAE、MAPE對比

SOM-BPN與MSC-ANN對比結果顯示SOM-BPN所得MSE和MAPE指標優于MSC-ANN,其中MAE稍高于MSC-ANN所得對應值。但是MSC-ANN將樣本劃分為6組,分別構建了6個預測模型,在前期模型訓練構建、后續實施維護等方面均需要投入更多的人力物力,而SOM-BPN只需要分組構建三個預測模型,所以基于SOM-BPN的模型在優化人力投入上具有明顯優勢。

結合車間具體需求,最終考核指標一般為余數入庫率和補投率,基于文獻[2]中式(4)-式(11)轉換計算余數入庫率(Surpr_Pd)和補投率(Supfr Pd),不同算法對比結果如表4所示。與投料相比,SOM-BPN預測模型可同時降低余數入庫率和補投率;其中前者從27.44%下降到10.13%,后者從17.91%下降到9.37%。另外,未經聚類的單一BP預測模型余數入庫率和加投率明顯高于SOM-BPN模型。同時,SOM-BPN優于MSC-ANN所得結果,進一步證明本文模型在減少模型數量的同時可進一步優化車間投料,降低余數入庫和補投帶來的損失。

表4 不同預測模型余數入庫率和補投率的對比

4 結 語

本文結合SOM和BPN建立了基于SOM-BPN的PCB投料分組預測模型。SOM-BPN較手工投料、單一BP預測模型能獲取更低的MSE、MAE、MAPE以及與預測余數入庫率(Surpr_Pd)和補投率(Supfr_Pd);與MSC-ANN比較,SOM-BP能獲得更低的MSE、Surpr_Pd和Supfr_Pd,且MSC-ANN需要訓練、構建和維護6個預測模型,而SOM-BP只需維護3個。單一BPN預測模型將Surpr_Pd和Supfr_Pd從27.95%和17.91%分別降低至16.53%和12.89%;MSC-ANN將其降低至11.96%和11.91%;而SOM-BPN分別將其降低至10.13%和9.37%。這表明SOM-BPN可進一步降低因超/補投帶來的損失。綜合樣本不同分布特點的分組、優選的關鍵屬性、基于優選屬性的分組預測模型構建及其轉換可為其他PCB樣板廠投料優化提供參考。

直接基于多樣樣板和影響質量全因素自動分組劃分樣本,提取組內共享特征并訓練相應預測模型,實施應用時能自動優選各樣板最合適預測模型仍有待進一步深入研究。

猜你喜歡
投料樣板均值
農科城如何為鄉村提供“振興樣板”
自動化分裝投料系統設計與實現
噸包拆袋投料站的創新設計與應用
浮法玻璃生產線斜毯式投料機在線檢修實踐
打造辣椒種植“樣板田”
均值—方差分析及CAPM模型的運用
均值—方差分析及CAPM模型的運用
打贏脫貧攻堅戰的“人大樣板”
淺談均值不等式的應用
均值不等式的小應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合