?

基于XGBoost的鋁合金LIBS光譜分類識別方法

2021-02-03 08:03李晨陽陳雄飛王亞文田中朝王世功趙珍陽劉鵬宇
光譜學與光譜分析 2021年2期
關鍵詞:譜線鋁合金光譜

李晨陽,陳雄飛,張 勇,王亞文,田中朝,王世功,趙珍陽,劉 英,劉鵬宇*

1.有研科技集團有限公司國家有色金屬及電子材料分析測試中心,北京 100088 2.國合通用測試評價認證股份公司,北京 101400 3.北京有色金屬研究總院,北京 100088 4.山東東儀光電儀器有限公司,山東 煙臺 264670

引 言

隨著我國工業的發展,鋁合金材料因其優異的性能而被廣泛應用于各個領域,但大量的鋁合金廢料的分類回收成了工業難題。當前多采用密度分離技術來對鋁合金進行分離,但該技術有著很多缺陷,且鋁合金之間的物理性能差異較小,其他傳統分離技術如磁、渦流、顏色感應等分離效果不好,耗能嚴重[1],因此需要新的識別方法來對進行鋁合金分類回收。

激光誘導擊穿光譜(laser induced breakdown spectroscopy,LIBS)是近年來快速發展的一門嶄新的分析技術,因其能夠快速、全元素分析、實時、原位、遠距離檢測等優點而受到廣泛關注[2]。該技術利用高功率脈沖激光輻射聚焦在樣品表面上,立即蒸發出少量樣品,引發樣品元素的雪崩電離,產生擊穿效應。樣品中各特征元素所產生的原子線和離子線,是進行定性鑒定的基礎。將LIBS技術應用于合金金屬廢料回收,可以快速地對合金廢料按不同成分進行識別和分類。

LIBS技術在未經任何樣品預處理的情況下原位使用時,靈敏度、重現性和準確性無法保證;但在進行快速分類及對未知對象的成分與參考標準進行比較等方面,靈敏度和準確性問題則起著較小的作用。由于LIBS的快速性和魯棒性,已有報道在LIBS定性識別和定量分析中使用偏最小二乘判別分析法(PLS-DA)、主成分分析法(PCA)、人工神經網絡(ANN)、支持向量機(SVM)、隨機森林算法(RF)等[3-4]。金屬合金類樣品因其所含雜質元素種類多、含量低等特點,成為LIBS進行識別研究的難點?,F有金屬合金類樣品識別分析多集中在鋼鐵樣品的分類研究。Prasanthi Inakollu[5]等通過ANN來預測鋁合金的元素濃度,預測效果優于傳統方法。Liang[6]等將LIBS同SVM相結合,實現了不同牌號鋼材的快速識別,通過改進SVM模型算法,滿足多分類目的的同時,避免了冗余信息對識別的干擾,提高了識別正確率。Xu[7]等通過蒙特卡洛有放回的重采樣技術,最大限度的提取有效信息來進行變量選擇,提升了SVM對鋼鐵樣品的分類效率,獲得了更好的穩定性和普遍性。Campanella[8]等將LIBS同“模糊化”的ANN相結合,在模擬工業環境的條件下實現對鋁合金的有效分類。

基于樹的XGBoost算法是一類有監督的機器學習算法,具有正則化、并行處理運算、內置交叉驗證和高度的算法靈活性等優勢[9],其模型結構簡單、運算量較小,且準確率較高,成為近年來機器學習挑戰中極受歡迎的算法。此外,XGBoost算法克服了ANN算法復雜的、難以解讀的黑箱問題,能夠對算法提供詳細解釋;同時較SVM等算法,具有更高的準確率[10]。對于光譜分析,XGBoost算法能夠直接提取譜線特征信息進行預測,對LIBS識別材料提供很大的幫助。

1 XGBoost算法原理

XGBoost是一種迭代型樹類算法,將多個弱分類器一起組合成一個強的分類器,是梯度提升決策樹(GBDT)的一種實現[11]。XGBoost是一種強大的順序集成技術,具有并行學習的模塊結構來實現快速計算,其通過正則化來防止過度擬合,可以生成處理加權數據的加權分位數草圖[12]。具體算法步驟如下:

目標函數

在XGBoost中,每棵樹需逐個加入,以期效果能夠得到提升。

如果葉子的節點太多,模型的過擬合風險就會增大。所以在目標函數中加入懲罰項Ω(ft)來限制葉子節點個數。

式中,γ為懲罰力度;T為葉子的個數;ω為葉子節點的權重。

完整的目標函數即為

得到

求出目標函數最優解

上式可作為樹的子葉分數,樹的結構隨著分數的增加而優異。且一旦分裂后的結果小于給定參數的最大所得值,算法將停止增長子葉深度[13]。

2 實驗部分

2.1 儀器及參數

采用自主設計搭建的LIBS系統,采用調Q開關Nd∶YAG脈沖激光器(Quantel Brilliant B,波長1 064 nm,脈沖寬度8 ns,最大重復頻率10 Hz)。位移平臺設計為手動調節的“弓”字型運動方式,以避免激光脈沖重復作用于樣品同一位置。激光經反射鏡、平凸透鏡和平凹透鏡聚焦到樣品表面,激發出等離子體。受激發的等離子體產生的光譜信號通過收集器耦合,進入直徑為100 μm的光纖中,傳輸至光譜儀(AVANTES,3通道拼接,波長范圍170~950 nm,分辨率全波長范圍內小于0.1 nm)。該系統的光路設計如圖1。

圖1 LIBS實驗裝置示意圖Fig.1 The schematic diagram of LIBS experiment setup

2.2 樣品

采用6種鋁合金樣品作為實驗樣品,其形態為直徑Φ30×5 mm圓柱。樣品編號及雜質元素含量如表1所示。樣品固定在自制的樣品盒內,以保證LIBS的激光激發位置一致。

表1 6種待測鋁合金樣品的雜質元素含量(Wt.%)Table 1 The values concentration (Wt.%) of impurity elements in six alloys

實驗采用的激光脈沖能量為200 mJ,脈沖頻率為2 Hz,采集延遲時間為5 μs,均在一個大氣壓的實驗環境下進行。每個樣品取100個測量點,在各測量點上分別測量20次取平均,以減小誤差。每個樣品測試前,前5個激光脈沖用于對樣品表面進行剝蝕,以清除樣品表面的氧化物等雜質。最終得到6個樣品的LIBS光譜數據共600組。隨機打亂各樣本光譜數據,其中取420組光譜數據為訓練集,180組光譜數據為測試集。采用Python環境下的pandas包對數據集進行數據處理,用Python環境下XGBoost包對模型進行訓練。

2.3 特征譜線分析

為降低測定過程中波動影響,將各雜質元素譜線強度同基體元素Al 394.40 nm光譜強度相除,得到六種樣品的相對光譜強度如圖2所示,部分波段因光譜儀多通道而被重復采集??紤]到以生成模型、統計分析為主要目標,應盡可能多地選取特征元素,根據NIST原子發射光譜數據庫選擇元素的特征譜線,根據元素含量進行曲線擬合,同時避開光譜重復波段,共篩選出10種LIBS光譜數據的特征譜峰,如表2所示。選取這些譜線數據使得原本的連續譜簡化為10組光譜的特征譜峰,降低了原數據量,提高了模型的運行速率。

圖2 六種鋁合金的典型光譜矩陣圖Fig.2 The spectral matrices of six kinds of standard aluminium alloy

表2 分析所用譜線Table 2 Spectral lines for analysis

2.4 XGBoost建模

設置訓練集和測試集的數據比例為7∶3,通過對XGBoost算法超參數進行調整,使得模型模型更加穩定,具體參數設置如表3所示。

表3 XGBoost模型的超參數Table 3 Super parameters of XGBoost model

3 結果與討論

通過XGBoost自帶函數算得每種譜線的權重評分如圖3所示。結合表4中各樣品雜質元素含量變異系數可知,XGBoost算法對變異系數高的元素(如Cu,Ti,Mn和Cr等)賦予權重較高,有利于合理區分樣品類別。該權重值會隨著XGBoost超參數的不同而發生較小的變化,但總體不會有很大的改變。

圖3 XGBoost對特征的評分Fig.3 The feature importance scores given by XGBoost

表4 6種樣品雜質元素含量的變異系數Table 4 The Coefficient of Variation of all analytical elements

下面分別以權重最高的四種元素(Cu,Ti,Mn和Cr)的相對強度值作為橫、縱坐標,繪制散點圖、直方圖及等高線圖如圖4。由散點圖可以直觀地看出,這四種元素相對強度值可以有效區分六種鋁合金樣品。從等高線圖及直方圖中可以判斷出,隨著元素譜線特征權重的提高,各樣品的集中趨勢越明顯,且樣品之間重合區域越??;而較低的譜線特征權重下,各樣品點分布較為分散,且不同樣品之間重疊區域范圍較大,不易區分樣品。因此,XGBoost算法可以有效地進行特征評價,判斷出光譜中的特征譜線信息來進行樣品判斷和識別,克服了ANN等算法復雜的、難以解讀的黑箱問題。

圖4 光譜數據在XGBoost的4種特征下的分布圖Fig.4 Distribution map of spectral data under 4 featres of XGBoost model

實驗得到XGBoost分類正確率如表5所示。從表5可以看出,樣品識別正確率達到96.67%,誤報情況主要集中在1#及3#兩類,其中1#與5#中的Cu含量接近,而Cu作為影響分類最大的因素,如果含量接近會使模型因分類界限接近而產生分類錯誤;而3#同2#相比,雖然3#中Cu的含量較2#多,但其他Ti、Mn等元素含量較少,在模型中所得分數較為接近而容易產生誤判,因此這兩類樣品易產生誤報現象。

表5 測試集識別結果Table 5 Identification results of Test Sets

如果訓練集樣本量足夠多,模型將會更加的穩健,識別的準確率也會更高。模型將通過選用鋁的非自吸收弱線(如396.15 nm)來進行歸一化;選用更多的特征譜線來進一步優化分類算法,以提高模型的識別準確率。

4 結 論

通過對6種鋁合金進行LIBS光譜數據采集,選擇10個特征波長的光譜強度作為特征變量,構建出鋁合金的光譜矩陣,降低了模型負擔。結合XGBoost算法對數據進行分析和建模,可對不同鋁合金樣品進行識別,識別準確率達到96.67%,同時對元素譜線特征權重進行有效地區分。實驗結果表明,LIBS通過XGBoost算法可有效識別鋁合金樣品,為鋁合金分類回收提供了一種新的技術。

猜你喜歡
譜線鋁合金光譜
基于三維Saab變換的高光譜圖像壓縮方法
基于HITRAN光譜數據庫的合并譜線測溫仿真研究
鍶原子光鐘鐘躍遷譜線探測中的程序控制
2219鋁合金TIG焊接頭殘余應力分布
星載近紅外高光譜CO2遙感進展
鋁合金三元氣體保護焊焊接接頭金相
SVD濾波技術與Prony譜線估計算法相結合的異步電動機轉子故障檢測新方法
鋁合金板件損傷修復
苦味酸與牛血清蛋白相互作用的光譜研究
基于康普頓散射本底扣除的航空γ能譜測量譜線比大氣氡校正方法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合