?

X射線熒光光譜結合判別分析識別鐵礦石產地及品牌:應用拓展

2021-01-05 10:20安雅睿朱志秀
光譜學與光譜分析 2021年1期
關鍵詞:混合粉鐵礦石鐵礦

劉 曙,張 博,2,閔 紅,安雅睿,朱志秀,李 晨*

1. 上海海關工業品與原材料檢測技術中心,上海 200135 2. 上海理工大學理學院化學系,上海 200093

引 言

鐵礦石是鋼鐵工業的重要原材料,我國近90%的鐵礦石依賴進口[1],2018年進口量約10.38億噸,居世界第一位。澳大利亞、巴西、南非、哈薩克斯坦、印度是我國鐵礦石最主要的進口國,涉及國際大型礦業集團數十種品牌鐵礦石。海關對進口鐵礦石的檢驗包括放射性檢驗、外來夾雜物檢疫、固體廢物屬性鑒別、品質檢驗、有害元素監測等,主要目標為預防進口鐵礦石中涉及安全、衛生、環保、欺詐等方面的風險。原產地、品名等是鐵礦石入境報關時的申報信息,對進口鐵礦石的產地及品牌進行符合性驗證,可以快速篩選摻雜、摻假、以次充好等現象,支撐進口鐵礦石的風險管理,保障貿易便利化。

X射線熒光光譜具有制樣簡單、無損分析、靈敏度高、穩定性好等優點,能實現固體樣品中主次元素的測定。判別分析是一種多變量統計分析方法,當變量間相關系數較大時,逐步判別分析能剔除不合適的變量,實現有效的變量篩選。X射線熒光光譜與判別分析相結合,能實現樣品原產地及類別的識別,如: 姬建飛[2]利用波長色散-X射線熒光光譜結合Fisher判別分析實現對5種火山巖(玄武巖、英安巖、流紋巖、粗面巖、安山巖)巖性的識別; Hondrogiannis[3]利用波長色散-X射線熒光光譜結合判別分析實現了對4種孜然產地(中國、印度、敘利亞、土耳其)的識別; Nganvongpanit[4]利用手持式X射線熒光光譜結合判別分析實現了對4類物種(人類、大象、狗、海豚)骨骼的識別。課題組前期工作中[5],針對澳大利亞、南非、巴西3個國家、14個品牌的236份進口鐵礦石樣品,運用波長色散-X射線熒光光譜無標樣分析法結合逐步Fisher判別建立了包含10種有效變量的判別模型,實現了對研究樣品產地及品牌的識別。

本文是前期研究工作的應用拓展,研究對象拓展到澳大利亞、巴西、南非、哈薩克斯坦、印度5個國家的21種品牌鐵礦石共422批進口鐵礦石代表性樣品,考察了波長色散-X射線熒光光譜無標樣分析方法的準確度,對比了未檢出元素缺失值處理方式對模型準確度的影響,運用基于剩余方差的F檢驗進行了異常值剔除,考察了特征元素對分類識別模型的貢獻,分析了誤判品牌鐵礦石的元素特征??偨Y出進口鐵礦石產地及品牌判別分析模型的整體數據處理流程。

1 實驗部分

1.1 樣品收集

根據GB/T 10322.1—2014《鐵礦石取樣和制樣方法》,從我國主要的鐵礦石進口口岸采集并制備來自澳大利亞、巴西、南非、哈薩克斯坦、印度5個國家的21個品牌422批次進口鐵礦石化學分析樣品,樣品容量大、種類豐富,基本包含了海關口岸日常檢測中的鐵礦石的主要類別。所述21個品牌鐵礦石包括津布巴混合粉鐵礦、巴西鐵礦石精粉、皮爾巴拉混合塊、紐曼混合塊鐵礦、國王粉鐵礦、皮爾巴拉混合粉、澳大利亞球團礦、楊迪粉鐵礦、哈楊粉鐵礦、紐曼混合粉鐵礦、南非鐵礦石精粉、澳大利亞鐵礦石精粉、弗特斯克混合粉、卡拉加斯鐵礦石、哈薩克斯坦球團礦、哈薩克斯坦鐵礦粉、昆巴標準礦粉、超特粉鐵礦、麥克粉鐵礦、昆巴標準塊、印度球團礦。剔除異常值之后的樣品共419批,信息如表1所示。

表1 鐵礦石樣品信息Table 1 The information of iron ore samples

1.2 方法

將采集樣品分裝到玻璃廣口瓶中于105 ℃下烘干4 h。采用壓片機對烘干樣品壓片,壓片前用乙醇清洗模具,使用聚乙烯環使粉末樣品聚攏,壓制樣品在30 t壓力下維持30~60 s。檢查壓制樣品表面均勻且無裂紋、脫落現象,測量前用洗耳球吹去樣品表面浮粉。

使用德國布魯克公司S4 Pioneer波長色散-X射線熒光光譜儀中的無標樣分析方法檢測鐵礦石中元素的含量。檢測中使用銠靶光管、四個分析儀晶體(LiF200,XS-55,PET和Ge)、流氣計數器(FC)、閃爍計數器(SC)等元件。

1.3 數據處理

1.3.1 整體數據處理流程

整體數據處理流程如圖1所示,首先收集樣品的X射線熒光光譜(XRF)無標樣分析數據,然后依次進行缺失值處理、異常數據剔除,對剩余數據劃分訓練集與測試集,采用逐步判別法提取特征變量,建立Fisher判別分析模型,通過建模樣品驗證、交叉驗證、測試集樣品驗證評價模型的準確度。

1.3.2 異常數據剔除

分別對不同品牌鐵礦石的測量數據做主成分分析,根據主成分貢獻度選擇合適的主成分數,再根據式(1)和式(2)分別計算樣品剩余方差、模型剩余方差,用樣品剩余方差除以模型剩余方差得到F統計量[式(3)],再查詢F0.01檢驗臨界值表,通過比較判斷該樣品是否在99%置信區間內為異常值。

圖1 數據處理流程圖Fig.1 Data processing flow chart

樣品剩余方差公式

(1)

模型剩余方差公式

(2)

F統計量計算公式

(3)

1.3.3 逐步判別-費舍爾判別分析

逐步判別分析屬于有監督的分類方式,先對已知的樣品進行分類來建立模型,再對未知樣品進行預測分類,其判別函數的建立利用了方差分析的思想[6]。判別時將一未知樣品的變量代入判別式,根據判別函數和組質心處坐標函數,計算每個樣品坐標與質心的距離,與哪個類別的質心最近,該樣品就判定為哪個類別。

在逐步判別分析中通過費舍爾分數(F-score)算法[7]進行變量評估和特征選擇,F-score值為組間均方與總平方和的比,F-score值越大說明該變量在組間差異越大,對判別的貢獻度越大。具體描述如給定訓練樣本集Xk∈Rm,K=1, 2, …,n,其中正類和負類的樣本數分別為n+和n-,則訓練樣本第i個特征的F-score值定義為[式(4)]

(4)

對于所建立的判別模型使用判別準確率[式(5)]對模型進行評價。

(5)

式(5)中,N為樣品總數,E為判別錯誤樣品數量。

2 結果與討論

2.1 分析方法的準確度

根據GB/T 6379.1—2004《測量方法與結果的準確度(正確度與精密度) 第1部分: 總則與定義》,準確度是指測試結果與接受參照值之間的一致程度,由正確度和精密度組成。正確度指由大量測試結果得到的平均數與接受參照值之間的一致程度,精密度指在規定條件下獨立測試結果間的一致程度。波長色散-X射線熒光光譜無標樣分析方法的基本思路是由儀器和軟件制造商測定校準樣品,儲存元素譜線強度和校準曲線,然后將這些數據轉到用戶的X射線熒光分析系統中,并用參考樣品校正儀器的漂移,考慮到實際樣品與校準樣品的基體差異,無標樣分析法只能是一種半定量方法,準確度很難達到定量分析的要求。選取紐曼混合塊鐵礦、津布巴混合粉鐵礦的化學分析樣,采用波長色散-X射線熒光光譜無標樣分析方法分別進行3次獨立測量,進一步考察了方法的精密度,見表2。結果表明Fe,Si,Al,P,Mn和Ti的相對標準偏差在0.25%~2.43%之間,S,Ca和Mg三個元素含量的平均值在0.010%~0.044%之間,相對標準偏差在1.08%~9.93%之間。除紐曼混合塊鐵礦中S和Mg、津布巴混合粉鐵礦中Ca外,其余元素的相對標準偏差皆滿足GB 27417—2017《合格評定化學分析方法確認和驗證指南》對實驗室內變異系數的要求,說明采用同一臺儀器在固定的條件下檢測,無標樣分析方法的精密度基本能達到定量分析的要求。這也是X射線熒光光譜無標樣分析方法檢測結果結合判別分析能建立產地識別模型的原因。

表2 無標樣分析方法測量結果Table 2 Measurement results without standard analysis method

2.2 缺失值處理

數據缺失是實驗中不可避免的問題,數據缺失會使整個系統丟失一部分有價值的信息,增加了系統在使用過程中的不確定性,影響了最終輸出的準確性。在大部分研究中,都將其作為無效數據刪除,即使不人為刪除,在諸如SPSS,SAS,Stata和R的很多統計軟件的數據處理中,也會默認刪除缺失值從而使整個數據處理過程能流暢進行[9]。

針對采集的422個鐵礦石樣品,采用波長色散-X射線熒光光譜無標樣分析可以檢測到Fe,O,Si,Ca,Al,Mn,Tb,Ti,Mg,P,Na,Cr,K,Sr,S,Zr,Zn,V,Cu,Gd,Ba,Cl,Ni,Co,Mo和Pb共26共種元素的含量,其中Na,Cr,K,Sr,S,Zr,Zn,V,Cu,Gd,Ba,Cl,Ni,Co,Mo和Pb共16個元素含量存在未檢出的情況。對于未檢出的元素含量,對比了4種缺失值處理方式: (1)缺失值用0替代; (2)缺失值用檢測限替代; (3)缺失值用檢測限替代,并增加一組邏輯變量,元素檢出標記為1,未檢出標記為0; (4)刪除存在缺失值的元素。4種方式所建立的國家與品牌判別模型中建模驗證準確率、交叉驗證準確率、測試驗證準確率如表3所示。結果表明,方式2與方式3所建立的判別模型準確率相差不大,考慮到增加邏輯變量會使數據處理過程復雜,選取用第2種缺失值處理方式。

表3 四種缺失值處理方式比較Table 3 Comparison of four missing value processing methods

2.3 異常數據剔除

一批數據中有部分數據與其余數據相比明顯不一致的稱為異常值,或稱離群值。實驗過程中采集異常數據的可能來源包括: 樣品測試過程被污染、樣品信息、檢測結果采集錯誤等。異常數據會使樣本均值與樣本方差產生明顯偏差,因此尋找合適的方法來發現和處理這些異常數據十分重要。本文使用Pirouette多元數據分析軟件基于剩余方差的F檢驗進行異常值的剔除。皮爾巴拉混合塊、紐曼混合塊鐵礦、紐曼混合粉鐵礦各有一組數據計算得出的F統計量大于F0.01檢驗臨界值,如表4所示,認為這3組數據為異常值,因此將這3組數據剔除,剩余419組數據用于后續分析。

表4 異常樣品的樣品剩余方差、模型剩余方差、F統計量、臨界值、自由度

2.4 特征變量篩選

分析來自我國主要鐵礦石進口口岸的21個品牌共計419個鐵礦石樣品,建模過程中選取318個樣品作為訓練集,101個樣品作為驗證集檢驗模型的準確性。訓練樣品及測試樣品的選取如表1所示。鐵礦石生產國家判別模型中,經過逐步判別分析篩選出Ca,K,O,V,Mg,Sr,Na,Zn,Al,Ti,Ni,Pb,P,Cr,Cu,Mo,Mn,S,Ba,Fe和Si共21個元素含量作為特征變量(F-score值>3.84)保留在模型中,Zr,Tb,Cl,Gd和Co等元素含量因未通過F檢驗(F-score值<2.71)而從模型中剔除。鐵礦石品牌的判別模型中,經過逐步判別分析篩選出V,Ca,K,Al,O,Ti,Mn,Mo,Ni,P,Mg,Cu,Pb,Si,S,Na,Cl,Zn,Ba,Cr,Fe,Sr和Zr共23個元素含量作為特征變量(F-score值>3.84)保留在模型中,Gd和Co因未通過F檢驗(F-score值<2.71)而從模型中剔除。從地質成因上看,Ca,O,K和Na等元素反映了海相沉積背景,V,Ti和Ni等元素反映出巖漿活動、深部流體活動,篩選出的特征變量也說明地質成因差異是建立鐵礦石產地和品牌判別分析模型的原因。

2.5 判別模型及評價

2.5.1 進口鐵礦石生產國家判別模型

使用了2.4中選擇的21個元素作為特征變量,建立澳大利亞、巴西、南非、哈薩克斯坦、印度產鐵礦石的費舍爾判別模型,包括4個判別函數,5個國家的組質心處的坐標可以通過計算得到。對于測試樣品的預測,可以將該樣品21個元素含量分別代入4個判別函數,分別計算4維坐標與5個國家組質心坐標的距離,最近距離對應的國家,即為該樣品生產國家的預測結果。建模樣品驗證、交叉驗證、測試樣品驗證的結果如表5所示,模型判別準確率分別為99.1%,98.4%和100%。使用前期工作[5]建立的判別模型計算本實驗數據,判別準確率分別為96.3%,94.4%和91.1%,可以看出增加特征變量的數量,再經過缺失值的處理與異常值的剔除,可以明顯提高生產國家判別模型的準確率。不同國家鐵礦石的類型、品位、成因以及分布情況存在一定的差異,如: 澳大利亞鐵90%礦石集中在皮爾巴拉地區[10],大部分含磷低、埋藏淺、品位較高,鐵含量一般在56%~62%左右; 巴西鐵礦主要由赤鐵礦組成,具有高鐵、中硅、低鋁的特點; 南非鐵礦石主要分布在開普省北部賽申地區和德蘭士瓦的西部,多屬于赤鐵礦,品位高、雜質少,含有較高的鉀、鈉; 哈薩克斯坦的鐵礦屬于富礦,其中約60%為富礦和易選礦,鐵精礦含量可達65%左右; 印度擁有豐富的鐵礦資源且多為優質鐵礦,主要為赤鐵礦和磁鐵礦,赤鐵礦礦石鐵品位均在58%以上,磁鐵礦礦石品位較低。圖2為2.4節特征變量選擇過程中F-score值排名前十元素含量平均值的條形圖,從圖2可以看出元素含量在不同國家間有較大的差異,因此可以利用不同國家鐵礦石間元素含量的差異進行鐵礦石產地國家的判別。

表5 國家判別模型具體判別結果Table 5 National discriminant model specific discriminant results

2.5.2 進口鐵礦石品牌判別模型

品牌判別模型使用2.4節選擇的23個元素作為特征變量,建立了21種品牌鐵礦石的費舍爾判別模型,包括20個判別函數。建模樣品驗證、交叉驗證、測試樣品驗證的結果如表6所示,模型判別準確率分別為96.2%,93.1%和95.0%。使用前期工作[5]建立的判別模型計算本次實驗數據,模型判別準確率分別為95.3%,92.5%和91.1%,可以看出增加特征變量的數量,再經過缺失值的處理與異常值的剔除,可以提高品牌判別模型的準確率。鐵礦石品牌判別模型對測試樣品進行分類時,有5個樣品判別錯誤,其中1個楊迪粉鐵礦錯分為哈楊粉鐵礦、3個弗特斯克混合粉錯分為皮爾巴拉混合粉、1個超特粉鐵礦錯分為弗特斯克混合粉。選擇2.4節特征變量選擇過程中F-score值排名前10的元素,作前2個主成分的散點圖(如圖3所示,橫坐標為主成分1,縱坐標為主成分2)。從二維散點圖中可以看出,分類錯誤的品牌與其被誤判的品牌,在二維散點圖中部分樣品位置接近,甚至重疊,說明這些品牌中部分樣品元素間含量比較接近,X射線熒光光譜無標樣分析方法所建立的判別模型對這些品牌鐵礦石存在誤判的可能。

圖2 不同國家元素含量條形圖Fig.2 Bar chart of elemental content in different countries

表6 品牌判別模型具體判別結果Table 6 Brand discriminant model specific discriminant results

這些誤判品牌鐵礦石均來自澳大利亞皮爾巴拉克拉通的哈默斯利成礦省,成礦類型為受變質沉積改造型鐵礦床[14]。楊迪粉鐵礦與哈楊粉鐵礦均來自西澳皮爾巴拉地區的楊迪礦山,分別由必和必拓與力拓公司開采,由于來自相同的礦山,礦床成因一致,元素含量差異很??; 弗特斯克混合粉是澳大利亞FMG公司的產品,由位于湯姆普利斯的所羅門樞紐生產。皮爾巴拉混合粉為澳大利亞力拓公司產品,主要由布魯克曼2、布魯克曼4、霍普唐斯4、湯姆普利斯、帕拉伯杜共5個地區的鐵礦石混合而成,其中布魯克曼2、布魯克曼4、湯姆普利斯礦區與弗特斯克混合粉產區所羅門樞紐十分接近; 超特粉鐵礦與弗特斯克混合粉均為澳大利亞FMG公司產品,通過調查了解到,兩種品牌鐵礦石在元素含量方面差異比較接近。對于這幾類品牌鐵礦的識別,存在誤判的可能,如需準確識別,需進一步提高分析方法的準確度,或借助其他分析技術或手段。

圖3 分類錯誤品牌與其被誤判品牌散點圖Fig.3 Classification error brand and its misjudged brand scatter plot

3 結 論

本文是前期研究的應用拓展,研究對象為澳大利亞、巴西、南非、哈薩克斯坦、印度5個國家的21種品牌鐵礦石共422批進口鐵礦石代表性樣品,經過對比選擇用檢測限替代檢測結果中的缺失值,運用基于剩余方差的F檢驗剔除了3組異常數據,利用逐步判別分析選擇特征變量,建立了鐵礦石產地與品牌的費舍爾判別模型,最后分析了特征元素對分類識別模型的貢獻以及誤判品牌鐵礦石的元素特征。判別模型的判別結果表明增加特征變量的數量,再經過缺失值的處理與異常值的剔除,可以提高模型判別準確率。在此基礎上,總結出進口鐵礦石產地及品牌判別分析模型的整體數據處理流程。形成固定的方法經驗之后,可以進一步增加鐵礦石樣品數量,提高模型普適性,實現對更多國家、品牌鐵礦石的識別。使用X射線熒光無標樣分析法測量元素的含量將大大縮短分析時間,結合已建立的判別模型,可以對鐵礦石品牌及產地進行快速的溯源分類,有利于保障貿易安全、提高通關效率。

猜你喜歡
混合粉鐵礦石鐵礦
大紅山鐵礦找礦前景分析
6.58億噸
中藥混合粉對免疫調節作用的研究
漫畫與幽默
冀東南部鐵礦區重力異常特征
蕎麥-小麥混合粉的品質研究
鐵礦石中全鐵測定的探討
無軌斜坡道在大紅山鐵礦中的應用
麥胚糙米混合粉的擠壓制備工藝研究
小米粉含量對小米小麥混合粉及其掛面品質特性的影響研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合