?

基于人工智能算法的地浸采區產量預測

2023-08-04 02:50廖文勝杜志明王亞安王立民
鈾礦冶 2023年3期
關鍵詞:日產量人工神經網絡采區

賈 皓,廖文勝,杜志明,王亞安,王立民

(1.核工業北京化工冶金研究院,北京 101149;2.中核礦業科技集團有限公司,北京 101149)

隨著地浸采鈾工藝的日趨成熟,地浸勘探領域智能化逐漸完善,通過與大數據、人工智能算法的深度融合,大幅提高了勘探工作效率與質量[1];地浸與水冶過程也基本實現了實時監控與數據集成調度,但對于在生產過程中采集的數據仍然存在只收集不處理,或僅對數據直觀判斷的情況[2]。對于海量數據,未進行深層挖掘與分析建模,不僅無法根據已有的生產參數安排未來生產計劃,也無法精準把握礦區的生產趨勢[3-4]。

在鈾礦采區開發的中后期,隨著金屬浸采率不斷增加,其浸出液鈾濃度與水量通常呈下降趨勢,通過洗井、注液過濾、增強抽注循環等方式雖能夠在短期內增加金屬產量[5];但囿于資源總量,整體上金屬產量仍呈降低趨勢,導致開采成本顯著增加。實際生產中的井場,在集控室與水冶車間對抽注液量、壓力、金屬濃度等參數的實時監控與采集,不僅能夠對生產異常即時診斷,更有利于形成廣泛全面的生產數據庫。根據長周期下的生產參數建立數據模型,從而準確預測金屬產量,可為采區未來生產制度的調整與礦區的整體經濟性評價提供參考。

1 預測算法研究現狀

1.1 智能算法應用領域

目前,鈾礦采區金屬日產量預測主要通過平均鈾濃度與日抽液量乘積求取,誤差較大?;谌斯ぶ悄芩惴ǖ牟蓞^產量預測在鈾礦領域研究較少,而在石油天然氣、煤炭、稀土等領域應用較為成熟。薛永超[6]等使用深度森林算法對油井產量做出預測,獲得92%左右的預測精度,該方法在傳統的隨機森林算法上做出了極大改進,但在精度上仍然存在優化空間。蔡光琪[7]等基于原煤剝離量等自變量提出了改進的切比雪夫神經網絡,該方式較傳統BP神經網絡運算資源小且精度更高;但未考慮儲量因素,具有一定局限性。馬承杰[8]考慮到傳統數值模擬方式的缺陷,從儲層物性出發,使用長短期記憶神經網絡與循環神經網絡建立LSTM數據模型,該模型性能優越,能夠更好地捕捉時序關系差異;但在長期預測上精度仍有局限性,需進一步優化輸入參數。

1.2 地浸產量預測適用算法分析

當前人工智能算法主要用于解決分類和回歸問題;而本研究中的地浸產量預測問題,屬于數據擬合回歸范疇,因此諸如SVM、決策樹、KNN等眾多分類算法并不適用,應當從回歸預測算法中選取合適算法進行。常見的回歸算法有人工神經網絡(ANN)、卷積神經網絡、BP神經網絡、邏輯回歸、多元線性回歸等。

礦區內抽注液井數量多,現場針對單井能夠獲取的參數較為單一(僅有流量、金屬濃度),數據維度過低,不利于高精度數值模型的建立。因此,筆者從數據集成角度考慮,以整個采區金屬日產量為研究對象,增加注液壓力、注氧壓力、浸采率等輸入參數,從資源總量與浸采工藝數據入手,建立金屬產量預測模型。

本研究中可用的數據既有相關生產參數,也有相對應的每日金屬量數據,可以采用有監督學習的算法。多元線性回歸建模速度快、算力需求小、模型可解釋性強,常被用于煤炭價格、地下水水位、煤礦井下瓦斯體積分數等具體指標數據的預測[9-11],與本研究中的數據類型較為契合。人工神經網絡屬于黑箱模型,可以充分逼近各類非線性關系,還具有并行分布處理與自適應未知參數的特點,該方法在頁巖油藏產量與地下水涌水量等地質參數預測方面都有成功運用的先例[12-13]。因此本研究擬采用多元線性回歸和人工神經網絡算法建立模型。

2 生產參數概況

以北方某礦床C10采區進行分析,該采區鈾金屬儲量為55.3 t,截至2022年2月浸采率約48%。該采區共包含21口抽液井與47口注液井(目前關停抽液井4口),礦體平均厚度為4.3 m(厚度0~13.5 m),平均鈾品位為0.016%(品位0.01%~0.054%),平均平米鈾量為1.33 kg/m2。該采區自2017年10月開始投入生產,其金屬日產量在2018年中旬達到高峰(約35 kg/d),隨后下降至約10 kg/d。從井場集控室采集了對金屬日產量存在相關性的變量(表1)。

表1 采區生產參數匯總Table 1 Summary of production parameters in mining area

該采區信息化程度較高,可獲取抽液、注液與儲量等眾多參數。針對單日金屬量的預測,需要使用每日采集一次或單日采集多次取平均值的參數。因此,舍棄取樣頻率較低的參數,如浸出液pH、離子濃度與電位等,以抽注液參數與金屬濃度為主要研究變量。

金屬平均濃度為該采區各抽孔每日采樣濃度的加權平均值,考慮到每日采樣時刻的差異與單日內濃度波動,本研究通過表1中的10個變量建立金屬日產量預測模型,通過多元線性回歸與人工神經網絡方式實現產量預測。

3 鈾產量預測模型構建

3.1 基于多元線性回歸方法的預測模型

3.1.1 多元線性回歸基本原理

多元回歸分析是指通過對多個自變量與1個因變量的相關分析,建立預測模型進行預測的方法。當自變量與因變量之間存在線性關系時稱為多元線性回歸分析,公式為

f(x)=ω1x1+ω2x2+…+ωnxn+b。

(1)

式(1)形式簡單,易于建模且可解釋性強。ω和b通過均方誤差最小化來確定,該方式又稱“最小二乘法”,即找到1條直線,使樣本到直線上的歐氏距離之和最小,均方誤差計算公式為

(2)

3.1.2 多元線性回歸模型搭建

以10個生產參數為自變量,金屬日產量為因變量進行模型搭建。首先對所有自變量計算方差膨脹系數(variance inflation factor,VIF),VIF是回歸系數估計量的方差與假設自變量無線性相關時方差的比值,表示多元線性回歸模型中的共線性程度。其計算方法見式(3),R2表示判定系數,是衡量模型擬合度的參量。

VIF=1/(1-R2)。

(3)

VIF值越接近于1,多重共線性越輕;反之越重。通常,對于VIF>10的自變量選擇放棄;但考慮到本模型流量參數選取較多(存在一定的多重共線性),因此對VIF適當放寬,對于VIF>30的自變量選擇舍棄。各自變量的VIF值見表2,平均浸采率與瞬時注液量參數的VIF>30,選擇舍棄。

表2 各生產參數VIF與標準化系數計算結果Table 2 Calculation results of VIF and standardization coefficient of each production parameter

表3 使用貝葉斯優化后的超參數取值Table 3 The value of super parameters after Bayesian optimization

f(x)=-0.005×Qp/in+8.147×10-8×Qt
+0.007×Qi/in-0.4×P1-0.56×P0+0.003×
Qp/d+1.942×ρa-6.18×10-5×Rm-14.341。

(4)

由于各變量數值在數量級上差異較大,故式中變量系數不能反映各自變量對于金屬日產量的影響程度,需要對自變量系數進行標準化處理,得到標準化后的系數(表2)??梢钥闯?金屬平均濃度起決定性作用,與常規計算方法相對應;日抽液量與日注液量的影響程度較大,表明流場循環情況對于金屬日產量也具有重要影響。

從多元線性回歸模型效果(圖1)來看,在前期單日產量增長階段,模型預測值與真實產量擬合良好;但在生產后期,預測值整體偏大且具有不穩定性。這是由于各自變量權重不變導致其某一部分適應性下降。單日金屬產量預測值平均誤差約為1.56%;自2017年11月至2020年12月的總產量預測誤差為246.8 kg,相對誤差為1.24%,整體預測效果可靠。

圖1 多元線性回歸模型訓練效果Fig. 1 Training effect of multiple linear regression model

3.2 鈾產量的人工神經網絡預測模型

3.2.1 人工神經網絡基本原理

近年來,有關神經網絡在各學科領域的運用方興未艾[14-16]。神經網絡是由具有適應性的簡單單元組成的廣泛并行連接網絡,能夠模擬生物神經系統對外界情況做出交互反應,圖2為單個神經元示意圖。

ω—權值;b—偏置;σ—激活函數。圖2 單個神經元計算原理Fig. 2 Calculation principle of single neuron

根據激活函數選取的不同,人工神經網絡既可以解決分類問題,也可用來進行回歸擬合,其模型結構見圖3。原始數據輸入之前通常進行標準化處理以消除數據尺度間的差異,標準化計算公式為

圖3 人工神經網絡結構示意圖Fig. 3 Structure diagram of artificial neural network

(5)

多個隱藏層的設置能夠識別出訓練數據的突出特征;激活函數能夠給輸出層中經過線性計算的系統添加非線性特征。其中ReLU函數能夠使神經網絡模型更快速地收斂,避免過飽和現象,有效抵抗梯度消失問題,ReLU函數的公式為

f(x)=max(0,x)。

(6)

在人工神經網絡建立中,通常需要調節模型參數,性能最優的參數組合就是所求目標。貝葉斯優化算法基于現有的參數預測結果來建立替代函數(概率模型)[17],通過替代函數得到目標函數最優解,可用來調節模型超參數。

3.2.2 人工神經網絡模型搭建

搭建的人工神經網絡產量預測模型,輸入數據包含該采區2017年11月至2020年12月的生產數據,共1 065組。由于該模型不包含時間序列相關變量,部分日期無生產數據不影響模型精度??紤]到驗證模型的泛化遷移能力,2021年1月至2022年2月的生產數據不納入模型訓練與測試。

以表1中的10個自變量為數據輸入層,在輸入之前通過標準化處理以消除不同參數間的差異??紤]到樣本的均勻覆蓋,在近3年的1 065組生產數據中,按照7∶3的比例隨機選取訓練集與測試集。使用訓練集搭建模型,使用測試集對模型進行初步檢驗。

該模型結構除了輸入層與輸出層外,還包含2個隱藏層,通過貝葉斯優化算法調節得到最優模型參數。該模型第1個隱藏層包含95個隱藏神經元,第2個隱藏層包含97個隱藏神經元,最大迭代次數196次,初始學習率為0.005?;谝陨蠀导纯傻玫饺斯ど窠浘W絡產量預測模型。

從基于1 065組訓練測試數據的模型效果(圖4)看出,實際金屬日產量與人工神經網絡模型的預測值變化趨勢基本相同;在前期到達產量峰值前,實際金屬日產量跳動較大,而人工神經網絡模型預測值變化較平緩。這可能是由于生產前期金屬濃度增長較快,地下流場不穩定且變化較快,反應速率持續增加;也可能是因每日的金屬濃度記錄時間不同造成的。對于產量下降階段,人工神經網絡模型的預測值較為精準,單日金屬產量平均誤差僅有0.88%;比多元線性回歸模型更為精確。從整體來看,人工神經網絡模型對這3年總產量的預測誤差為81.4 kg,相對誤差為0.41%;這也表明該模型預測精準,效果良好。

圖4 人工神經網絡模型訓練效果Fig. 4 Training effect of artificial neural network model

4 實例運用與分析

基于以上2個預測模型,使用該礦床C10采區的2021年1月至2022年2月的數據進行泛化能力檢驗。

4.1 多元線性回歸模型檢驗

多元線性回歸模型針對驗證數據集的預測與誤差分布見圖5??梢钥闯?在這段時間前期,金屬日產量在10~12 kg/d波動;在生產中后期,金屬日產量緩慢下降。多元線性回歸模型的預測趨勢與預期相符;但數據波動較為嚴重,預測值變化趨勢為降低-增加-降低,預測結果均衡性較差,但相對誤差大多在±5%之內。從期間金屬總產量來看,整體預測較為可靠,相對誤差為-1.68%。

圖5 多元線性回歸預測檢驗與誤差分布Fig. 5 Prediction test and error distribution of multiple linear regression

4.2 人工神經網絡模型檢驗

人工神經網絡的預測結果與誤差分布見圖6??梢钥闯?該模型整體趨勢擬合效果良好,對跳動較大的產量數據擬合效果一般;絕大多數預測值均分布在±5%以內,且無明顯變化趨勢。該模型泛化能力較多元線性回歸模型有了很大提高,從預測期間金屬總量來看,相對誤差僅為-0.63%,說明該模型不僅能夠準確預測金屬日產量,也能精準確定某段時間的金屬總產量。

圖6 人工神經網絡模型預測檢驗與誤差分布Fig. 6 Prediction test and error distribution of artificial neural network model

4.3 預測效果對比

3種方式預測效果對比見表4??梢钥闯?多元線性回歸模型和人工神經網絡模型的預測效果較簡單金屬日產量計算方法有了較大提高。通常使用金屬濃度與當日抽液量相乘求解金屬日產量,雖然計算誤差大多分布在±5%內;但由于計算值普遍偏小,因此預測值并不均衡,在日產量與總產量的預測上表現一般。多元線性回歸模型的性能介于計算值與人工神經網絡模型之間,其預測誤差較小;但存在一定比例的離群值(相對誤差大于10%)。人工神經網絡模型表現優異,其金屬日產量與總產量誤差均小于1%;雖然預測趨勢較實際日產量更為平緩;但擬合效果最好,76.2%的預測值相對誤差均在±5%以內,且離群值較少,說明該模型預測精準且泛化能力良好。

表4 3種預測方法的預測效果對比Table 4 Comparison of prediction effects of three prediction methods

5 結論

針對地浸鈾礦采區金屬日產量預測問題,搭建了多元線性回歸模型和人工神經網絡模型,2種模型較傳統的金屬日產量計算方法均有了較大提升。

1)通過對生產參數的分析,將變量精簡后建立的多元線性回歸模型能夠對C10采區的金屬產量做出較為精確的預測,預測結果準確可靠,具有一定的泛化能力。從多元線性回歸預測模型公式可以直觀看出各生產參數與金屬日產量的相關性與影響權重,可為生產制度的調整與增產提供指導。

2)人工神經網絡模型較多元線性模型在精度上進一步提高,對于近13個月采區預測的日產量平均誤差僅為-0.36%,總產量預測誤差為-0.63%,相對誤差分布集中于±10%以內,模型預測效果優異。

猜你喜歡
日產量人工神經網絡采區
稠油熱采區塊冷采降粘技術應用
2021年5月全國鋼鐵產量
利用人工神經網絡快速計算木星系磁坐標
人工神經網絡實現簡單字母的識別
基于Delphi-TOPSIS法的露天礦采區接續方案優選
西南油氣田新井日產量突破1000×104m3
露天礦首采區以及拉溝位置選擇的評價
基于聲發射和人工神經網絡的混凝土損傷程度識別
煤礦采區上、下車場氣動推車系統
波信號的解調和人工神經網絡的損傷識別算法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合