?

基于動態隨機森林算法的銅浮選精礦品位預測

2023-01-13 03:39雷雨田王慶凱
礦冶 2022年6期
關鍵詞:銅精礦精礦分析儀

雷雨田 王慶凱 王 旭

(1.北京礦冶研究總院,北京 100160;2.礦冶過程自動控制技術國家重點實驗室,北京 102628;3.礦冶科技集團有限公司,北京 100160)

精礦品位作為評價浮選過程性能的重要指標之一,在一定程度上反映了工藝生產率和產品質量。精礦品位的影響因素不僅繁多,而且大都具有非線性、強耦合、大滯后等特點,導致我們很難及時得到精礦品位。實際生產中的銅精礦品位大多采用人工取樣離線化驗獲得[1],由于人為主觀因素的差異,獲得的品位數據也存在著一定的不確定性,浮選過程精礦品位的建模預測也因此受到了越來越多的關注。

浮選過程精礦品位預測模型主要分為機理模型、數據模型與混合模型。由于浮選過程十分復雜,一般的機理模型不能十分準確地描述實際的礦物浮選過程。數據模型則是根據實際生產過程中累積的大量歷史數據來構建預測模型。隨著信息化技術的高速發展與基本控制系統及各類傳感器的全面應用,浮選過程中大量的生產數據可以被及時收集和存儲,這也使得通過獲取浮選過程的過程參數建立數據模型成為了一個熱門的研究方向。因此,目前大多數的預測模型都采用數據建模方法,常見的有偏最小二乘法(PLS)[2]、主成分分析法(PCA)[3]、獨立成分分析法(ICA)[4]等多元統計數據分析法和支持向量機(SVM)[5]、人工神經網絡(ANN)[6]等機器學習方法以及基于模糊推理的模糊系統[7]。FERNANDEZ-DELGADO等[8]對比了179種分類算法在121個UCI數據集上的分類性能。結果表明,綜合來看,隨機森林算法的分類性能最優[9]。隨機森林算法不僅原理簡單、易于實現,其占用計算資源小且性能強大,在許多實際生產過程中也得到了廣泛應用。

基于上述分析,本文利用國內某大型選礦廠浮選流程中泡沫圖像分析儀獲取的泡沫特征參數及其它相關生產數據,采用動態隨機森林算法對銅精礦品位進行建模預測,并分析隨機森林算法的預測效果。

1 隨機森林算法簡介

隨機森林(Random Forest)算法是Bagging(Bootstrap aggregating)集成方法[10]中最具有代表性的算法,是BREIMAN[11]將Bagging集成學習理論[12]與隨機子空間方法[13]結合后提出的一種機器學習算法。該算法由多棵決策樹組成。決策樹因其單分類器的屬性,存在著過擬合、易收斂到局部最優解和性能提升瓶頸等問題。根據多分類器的思想由多棵決策樹組合而成的隨機森林算法由此誕生。隨機森林算法的建立分為生成森林與進行決策兩個過程,如圖1、圖2所示。

圖1 隨機森林生成圖Fig.1 Random forest generation diagram

圖2 隨機森林決策圖Fig.2 Random forest decision diagram

隨機森林的核心思想就是對訓練集進行Bootstrap有放回地重復采樣,形成多個訓練子集。每個子集生成一棵決策樹,進而組成隨機森林。最后統計所有決策樹的分類結果,根據得票數得到最終分類結果。

測試集最終所屬類別的表達式見式1。

(1)

式中,Y表示類別標簽;Ci(X)表示每棵決策樹的分類結果;D(X)表示最終分類結果。

2 隨機森林預測模型建立

國內某大型銅礦選礦廠浮選流程依次采用兩次粗選兩次掃選作業。其中,一次粗選銅精礦即粗Ⅰ銅精礦進入后續浮選柱精選流程,粗Ⅱ銅精礦經再磨分級后進入浮選柱精選流程,掃Ⅰ與掃Ⅱ浮選泡沫返回前一作業進行再選,掃Ⅱ底流作為該浮選流程最終的尾礦。本文采用機器學習里的動態隨機森林算法對浮選流程中粗Ⅰ銅精礦品位進行模擬預測。將浮選流程中泡沫圖像分析儀獲取的泡沫特征參數及其它相關生產數據中的一部分數據用來建立動態隨機森林模型,另一部分數據用于測試所建預測模型的準確性。

2.1 變量相關性分析

通過對現場浮選流程分析得知,影響粗Ⅰ銅精礦品位的操作變量和原料屬性變量,一共有15個。結合BFIPS-Ⅲ浮選泡沫圖像分析儀提取出來的15個泡沫特征參數,一共得到了30個與粗Ⅰ銅精礦品位相關的過程變量,詳細變量見圖3橫坐標描述。過程變量個數的多少很大程度上代表了其內部蘊含信息的多少,但是過程變量個數過多,復雜性也會越明顯。因此需要通過相關性分析對過程變量進行降維選擇,根據相關系數大小篩選出一定數量的關鍵變量進行研究。

在進行過程變量與粗Ⅰ銅精礦品位相關性分析之前,首先需要對收集到的數據進行預處理,包括異常生產數據清除等操作。然后進行過程變量的相關性分析,根據相關系數大小篩選出一定數量的關鍵變量進行隨機森林模型建立。30個過程變量與粗Ⅰ銅精礦品位相關性分析結果如圖3所示。

圖3 過程變量相關性分析結果圖Fig.3 Process variable correlation analysis results graph

圖3中,橫軸表示過程變量,縱軸表示過程變量與粗Ⅰ銅精礦品位的相關系數。根據過程變量的相關系數篩選出7個影響銅浮選精礦品位的關鍵變量,具體變量如表1所示。

表1 影響銅浮選精礦品位的關鍵變量Table 1 Key variables affecting the grade of copper flotation concentrate

其中Y軸流速代表溢流泡沫流出浮選槽頂部的速度。表1中7個變量里,前5個變量是泡沫圖像分析儀提取出來的粗Ⅰ浮選槽頂部的浮選泡沫特征參數,后2個變量是浮選流程中的兩個關鍵藥劑變量。

2.2 隨機森林模型建立

將7個影響粗Ⅰ銅精礦品位的關鍵變量作為動態隨機森林模型的輸入,粗Ⅰ銅精礦品位作為模型的輸出,以此建立動態隨機森林預測模型。

隨機森林決策樹數量設為500棵。模型預測結果如圖4所示。

圖4 動態隨機森林建模預測結果圖Fig.4 Dynamic random forest modeling prediction results graph

圖4a中的虛線是實際生產過程中品位分析儀測得的粗Ⅰ銅精礦品位測量值,實線是動態隨機森林模型對粗Ⅰ銅精礦品位的預測值。圖4b中實線是動態隨機森林模型預測值與品位分析儀測量值之間的絕對誤差,深色虛線和淺色虛線分別表示模型預測絕對誤差為±1%和±2%的范圍界限,以便于直觀了解模型的預測效果。

2.3 模型誤差分析

為了評價模型的預測性能,需要構建合適的評價指標體系。本文采用平均絕對誤差MAE(Mean Absolute Error)、均方誤差MSE(Mean Square Error)、預測絕對誤差在±1%的樣本數百分比和預測絕對誤差在±2%的樣本數百分比作為模型的預測性能評價指標。MAE能夠較為準確地反映模型的精礦品位預測值與品位分析儀測量值之間的平均差距大小。MSE能夠反映模型的精礦品位預測值與品位分析儀測量值之間的偏差程度?!?%和±2%預測絕對誤差在一定程度上代表了生產現場可接受的預測誤差范圍。

MAE與MSE的計算公式分別如式2~3,模型預測結果見表2。

(2)

(3)

表2 模型預測評價結果Table 2 Model prediction evaluation results

從表2數據可以看出,基于動態隨機森林算法的預測模型對粗Ⅰ銅精礦品位的預測平均絕對誤差在1%以下,預測絕對誤差在±2%的樣本數百分比在90%以上,模型的預測精度較高。

3 結論

1)采用動態隨機森林預測模型能較準確地預測下一個測量周期的銅精礦品位,預測趨勢準確,預測精度高,可用于指導作業者及時調整作業決策,確保最終精礦品位的穩定。

2)將通過相關性分析提取出的關鍵變量作為動態隨機森林模型的輸入,粗Ⅰ銅精礦品位作為模型的輸出,以此建立的動態隨機森林預測模型未涉及到原礦品位等需要依賴品位分析儀的變量,在品位分析儀故障期間也可以得到品位預測值,在一定程度上可以避免因品位分析儀故障導致缺乏品位數據無法指導作業者操作的情況發生。

猜你喜歡
銅精礦精礦分析儀
Sekisui CP3000與STA Compact Max凝血分析儀檢測項目比對分析
生物質烘干鈦精礦對其酸解性能的影響
Sievers分析儀(蘇伊士)
試論高雜鉬精礦凈化技術
試論高雜鉬精礦凈化技術
銅精礦中降低二氧化硅含量的方法研究
一種用于深空探測的Chirp變換頻譜分析儀設計與實現
影響我國進口銅精礦采購成本的因素分析
提高某選礦廠銅精礦品位的優化試驗
銅鉍混合精礦超聲波分散磁選分離工藝
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合