?

低合金鋼海水腐蝕監測中的雙率數據處理與建模

2022-01-14 06:45付冬梅
工程科學學報 2022年1期
關鍵詞:均值海水向量

陳 亮,付冬梅

1) 北京科技大學自動化學院,北京 100083 2) 北京市工業波譜成像工程中心,北京 100083

在海水腐蝕領域,由于海水環境的強腐蝕性,材料在服役過程中會不可避免地產生腐蝕現象,進一步導致其性能下降直至失效,從而帶來巨大的經濟損失和安全隱患[1].隨著在線監測技術的發展,對材料的腐蝕狀態進行實時監測變得更加容易[2].通過高靈敏度的前端傳感器可以采集得到大量的腐蝕數據[3?4],但由于客觀因素的影響,材料所處的海水環境數據采樣頻率與腐蝕數據的采樣頻率通常不一致,從而形成了具有不同采樣頻率的系統.這種輸入輸出量存在多個采樣頻率的系統稱為多率系統,僅有兩種不同采樣頻率的多率系統稱為雙率系統,對應的采樣數據就是雙率數據[5].因此,如何處理低合金鋼海水腐蝕實驗中的雙率數據并準確預測鋼材腐蝕狀態對于指導腐蝕防護工作具有重要意義.

雙率系統建模問題最早在系統辨識領域得到研究.Kranc[6]提出了切換分解技術,其思想是將多率系統轉化為單率系統后進行分析.Friedland[7]和Khargonekar等[8]將切換分解技術發展完善為提升技術,成為了雙率系統研究的最常用方法[9].Li等[10]采用提升技術和推理控制結果研究了雙率系統的性能以及魯棒性.Ding和Chen[11]應用提升技術提出了一種雙率系統的遞階辨識方法.然而基于系統辨識的雙率系統建模方法需先假定被辨識模型的結構形式,難以適用于結構未知的復雜非線性情況,因此需要提出一種不依賴模型結構的雙率系統建模方法.

在腐蝕研究領域,均值法是常用的將雙率腐蝕數據轉化為單率數據的處理方法.Zhi等[12]將相對濕度、pH值、二氧化硫濃度、氯離子濃度等小采樣周期的大氣環境數據用均值法統一成與碳鋼腐蝕速率相同的以年為采樣周期的單率數據,然后建立了環境因子與腐蝕速率之間的預測模型.石雅楠等[13]對溫度、相對濕度、PM2.5等以小時為采樣周期的氣象數據采用均值法進行處理,將雙率采樣數據轉換為以天為采樣周期的單率數據.Wei等[14]采用均值法對材料海水腐蝕電位數據進行處理并建立了海水腐蝕預測模型.

在將雙率腐蝕數據轉化為單率數據后,人工神經網絡(Artificial neural networks, ANN)和支持向量回歸 (Support vector regression, SVR)是常用的腐蝕建模方法.劉學慶等[15]采用電化學方法測定了3C鋼在不同海水環境參數下的腐蝕速度,并根據四層誤差反傳神經網絡(Back-propagation neural network, BPNN)分析了3C鋼腐蝕速度與海水環境參數的相關性,建立了3C鋼在海洋環境中腐蝕速度的預測模型.Shirazi和Mohammadi[16]結合帝國主義競爭算法 (Imperialist competitive algorithm, ICA)和ANN建立了海水環境與鋼材腐蝕速率間的ICA?ANN預測模型,該模型在測試集上的均方誤差約為0.01,平均絕對誤差為0.011,擬合優度為0.99,能夠較好地預測3C鋼在海水環境下的腐蝕速率.Wen等[17]利用粒子群算法優化SVR的參數,建立了3C鋼在海水環境下的腐蝕速率預測模型,并與BPNN進行了對比,結果表明SVR的泛化能力優于BPNN,可以對海水環境下碳鋼的腐蝕進行跟蹤.畢傲睿等[18]采用主成分分析方法對影響海水管道腐蝕的因素進行優選,然后將貢獻率大的腐蝕因素作為SVR的輸入,以腐蝕速率作為輸出,建立管道腐蝕預測模型,然后通過鲇魚粒子群算法對SVR進行優化,預測精度較高.

目前,在對雙率腐蝕數據的處理方法中,均值法應用廣泛,然而均值法不可避免地會忽略掉小采樣周期數據中的細節信息,從而導致建模精度下降[19].同時,在腐蝕模型的構建中,基本選擇ANN或SVR作為學習模型,而忽略了ANN容易陷入局部極小以及SVR預測精度低的問題.針對以上問題,本文以低合金鋼海水環境下的雙率腐蝕數據為例,對于材料腐蝕電位數據采樣周期遠小于海水環境因子數據的情況,提出了一種基于綜合指標值 (Comprehensive index value, CIV)并結合改進相關向量回歸 (Improved relevance vector regression, IRVR)的數據處理和建模方法.首先通過定義CIV來表征海水環境因子的綜合影響,建立CIV與海水腐蝕電位的線性回歸模型對雙率數據進行填補,能夠保留更多的原始數據信息,最終得到用于建模的單率數據集.最后,采用高斯核和二次多項式核構建IRVR的組合核,建立低合金鋼海水腐蝕電位的預測模型CIV-IRVR,解決了數據信息損失和建模精度低的問題,為低合金鋼海水腐蝕監測中雙率數據處理和建模提供了一種新的思路及方法.

1 雙率腐蝕數據

1.1 數據來源

本文數據來源于國家自然環境腐蝕平臺三亞海水站的14種海洋工程中常用低合金鋼(LAS1~LAS14)的海水浸泡實驗,實驗時間為2017年2月15日至2017年6月25日,其中低合金鋼海水腐蝕電位數據和海水環境數據構成了雙率腐蝕數據.LAS1~LAS14低合金鋼的牌號依次為Q235、Q345DZ35、D36、Q345B、921、Q450NQR1、X70、X80、E690、E460、Prue Q235、Super fine grain steel 1、Super fine grain steel 2 以及 Micro-alloy steel.

1.2 低合金鋼化學元素含量

14種低合金鋼所包含的化學元素成分(Fe除外)共有 15種,包括 C、Si、Mn、P、S、Ni、Cr、Mo、Cu、Al、Ti、Nb、V、B以及 N,其含量如表1所示.

表1 14種低合金鋼的化學元素成分(質量分數)Table 1 Elemental compositions of 14 low alloy steels

1.3 腐蝕電位數據

將14種不同的低合金鋼試樣置于近海低潮位水下約0.5 m處浸泡,同時采用多通道電位自動采集裝置[20]對實驗鋼材的腐蝕電位進行實時監測采集,采樣周期為1 h,每種材料各采集到3044條數據,如圖1所示.

圖1 試樣海水腐蝕電位Fig.1 Seawater corrosion potential of test samples

1.4 海水環境數據

海水環境因子包括海水溫度(T/℃)、海水電導率 (G/(μS·cm?1))、海水溶氧量 (DO/(mg·L?1))、海水pH、海水鹽度(S/%)以及海水氧化還原電位(ORP/mV).在浸泡實驗開展的過程中,每隔10 d采集一次低合金鋼所處的海水環境因子數據,每種環境因子各采集到14條數據,如圖2所示.

圖2 海水環境因子監測值Fig.2 Monitoring values of seawater environmental factors

2 算法分析

2.1 天牛須搜索算法

天牛須搜索[21](Beetle antennae search, BAS)算法是2017年提出的一種高效的智能優化算法.BAS算法受天牛覓食原理啟發而開發,當天牛覓食時,天牛并不知道食物位置,而是根據食物氣味強弱來覓食.如果天牛左邊觸角接收到的氣味強度比右邊大,那么下一步天牛向左爬行,否則向右爬行,依據這一簡單原理天??梢杂行д业绞澄?BAS算法無需知曉函數的具體形式和梯度信息,并且僅需要一個搜索個體,其相比于粒子群算法的運算量大大降低.同時,與遺傳算法和模擬退火算法相比,BAS算法代碼實現簡單,避免了遺傳算法中復雜的交叉、變異操作,收斂速度更快[22].其算法流程圖如圖3所示.

圖3 BAS 算法流程圖Fig.3 Flowchart of the BAS algorithm

第一步 創建天牛朝向的隨機向量且做歸一化處理:

式中,rands()為隨機函數,dim表示空間維度.

第二步 創建天牛左右須空間坐標:

式中,xlt和xrt分別表示天牛左須和右須在第t次迭代時的位置坐標;xt表示天牛在第t次迭代時的質心坐標;d0表示天牛左右須之間的距離.

第三步 根據適應度函數fitness()判斷天牛左右須氣味強度,即fitness(xlt)和fitness(xrt)的大小,并判斷天牛前進方向:

式中,xt+1表示天牛在第t+1次迭代時的質心坐標;δt表示在第t次迭代時的步長因子;sign()表示符號函數.

第四步 計算天牛移動后的適應度函數值并判斷是否滿足迭代結束條件,若滿足迭代結束條件則迭代結束并跳轉第六步,否則跳轉第五步.

第五步 更新步長因子的值并重復第二步~第四步:

式中,δt+1表示在第t+1次迭代時的步長因子;eta為步長因子的衰減系數,通常將eta取0.95.

第六步 獲得最優參數,搜索結束.

2.2 基于CIV的雙率腐蝕數據處理方法

由于腐蝕電位和海水環境因子的采樣周期各不相同,因此在建立預測模型之前需要對雙率腐蝕數據進行預處理.為了克服均值法處理帶來的數據信息損失問題,提出了一種基于CIV的雙率腐蝕數據處理方法,其具體步驟如下:

第一步 取采樣周期為T1的m維(m個海水環境因子)的輸入采樣數據序列X(kT1)=[x1(kT1),x2(kT1),···,xm(kT1)]T以及采樣周期為T2的由p個分量(p種材料)組成的1維輸出采樣數據序列Y(kT2)=[y1(kT2),y2(kT2),···,yp(kT2)],其中T1遠遠大于T2,k表示第k條樣本.對Y(kT2)采用均值法處理從而將雙率數據轉換為單率數據 {X(kT1),Y(kT1)},其樣本數量顯著減少.

第二步 定義綜合指標值CIV表征海水輸入環境因子對腐蝕電位的綜合影響,其定義式如下:

式中,m表示海水環境因子的個數,xi(kT1)表示海水環境因子數據,wi是每個海水環境因子的權重,是待優化參數.

第三步 采用2.1節的BAS算法對上一步中的參數進行尋優.尋優目標設置為:

式中,對任意一個參數向量W進行尋優判斷,最終可以得到最優的參數向量W*.其中coeff()用于計算任意兩個長度相同且均為s的序列的Pearson相關系數,其計算公式由式(7)給出,其中和分別表示序列G和H的均值.|coeff()|越大,兩變量的線性相關程度越高.尋優目標意義在于使序列CIV(kT1)與輸出中每個分量yi(kT1)的|coeff()|均值最大.

第四步 得到最優參數向量W*后,通過式(5)可以計算得到最優的CIV序列,將其表示為CIV?(kT1).此時CIV?(kT1)與輸出中每個分量序列yi(kT1)的線性相關程度最大,可以分別建立最小二乘線性回歸模型:

式中,針對p個分量共建立p個最小二乘線性回歸模型,ai和bi分別表示第i個模型的斜率和截距.第五步 將原始輸出序列分別代入式(8)中對應的最小二乘模型可以計算得到對應的CIV序列CIVi(kT2)(i=1,2,···,p),取其均值為

可以將原始的雙率采樣數據{X(kT1),Y(kT2)}轉換為采樣周期為T2的單率采樣數據 {CIVavg(kT2),Y(kT2)},保留了原始數據更多的信息,獲得了更多的建模樣本.

上述流程提出了輸入變量采樣周期大于輸出變量采樣周期(T1>T2)情況下的雙率數據處理方法.對于輸入變量采樣周期小于輸出變量采樣周期(T1

2.3 IRVR方法

2.3.1 RVR 原理

相關向量回歸 (Relevance vector regression, RVR)是由Tipping[23]于2001年提出的一種與SVM類似的監督學習方法.RVR與SVR最大的區別在于:RVR基于貝葉斯理論框架,能夠得到具有概率特性的預測結果.同時,RVR的核函數不受MERCER定理(核矩陣必須是連續對稱的正定矩陣)限制,可以任意構建核函數[24].

式中,N是輸入輸出樣本數量;w= [w1,w2, …,wN]T是權值向量;K(x,xi)是核函數;εi是獨立均勻分布的零均值高斯噪聲.對于各自獨立的輸出目標oi,輸入輸出樣本數據集的似然估計函數P(oi|w,σ2)可以表示為:

式中,o= [o1,o2.···,oN]T是樣本數據集的輸出目標向量;w是權值向量;σ2是樣本輸入的方差;Φ=[φ(x1),φ(x1),···,φ(xN)] 是基于核函數的N×N+1 的矩陣,其中φ(xi) = [1,K(xi,x1),K(xi,x2) , ··· ,K(xi,xN)].為了避免求解式(11)中w和σ2時產生過于擬合的現象,對w賦予先驗的條件概率P(w|α),即

上式中,α= [α0,α1,···,αN]T是N+ 1 維的超參數向量.根據貝葉斯公式,所有未知參數的后驗概率分布P(w|o,α,σ2)可以表示為:

式中,μ=σ?2ΣΦTo表示權重向量w的均值向量;Σ= (σ?2ΦTΦ+A)?1表示權重向量w的后驗協方差矩陣,其中A= diag(α0,α1,···,αN).此外,計算超參數向量α以及方差σ2的公式為:

式中,μi表示均值向量μ的第i個元素;γi= 1 –αiΣii,其中Σii表示后驗協方差矩陣Σ中的第i個對角線元素.對于給定的新輸入變量值x*,根據式(14)和式(15)可以求解出對應的超參數 αMP和方差,其對應輸出o*的概率分布服從高斯分布,其可以表示如式(16)所示:

其中預測均值y*和方差σ*可以分別表示為:

上式中,y*表示輸入x*對應的RVR模型預測均值;方差σ*可用于表征RVR預測結果的置信區間,例如RVR預測結果的95%的置信區間可以表示為.

2.3.2 IRVR 方法

在RVR模型的核函數中,一般采用單一核函數,比如高斯核或多項式核.高斯核是典型的局部核,而多項式核是典型的全局核[25].為了兼具局部核與全局核的優勢,選擇將高斯核與二次多項式核進行組合實現IRVR方法[26],組合核函數如下所示:

式中,組合核函數由高斯核和二次多項式核構成.xi和yj表示數據空間中的樣本點,λ1和λ2是核參數,α和β分別是核函數對應的權重參數.因此RVR核函數的待優化參數向量可以表示為V= [λ1,λ2,α,β],采用 BAS 算法可以對參數向量V進行尋優.

2.4 CIV?IRVR模型

將CIV方法與IRVR方法結合構建海水腐蝕雙率數據的CIV?IRVR預測模型.基于CIV方法得到的均勻單率腐蝕數據 {CIVavg(kT2),Y(kT2)}以及低合金鋼的化學元素成分,將CIV序列和化學元素設置為模型輸入,腐蝕電位數據設置為輸出,構建海水腐蝕電位的預測模型,其表達式如式(20)所示:

式中,N是樣本總數;Y(kT2)和 CIVavg(kT2)分別表示第k條樣本中的腐蝕電位數據和綜合指標值數據;e1,e2,···,en表示低合金鋼的n種化學元素成分含量.

3 實驗結果及其討論

3.1 評價指標

采用平均絕對誤差 (Mean absolute error, MAE)、均方根誤差 (Root mean square error, RMSE)以及決定系數 (Coefficient of determination, CD)評價模型的泛化性能,其計算公式如下:

其中,ypred(i)和ytrue(i)分別是第i條樣本數據的模型預測值和真實值,true(i)表示所有真實值的均值.當MAE、RMSE越小時,模型的預測誤差越低;當CD越接近1時,模型的擬合能力越強,預測性能越好.

3.2 海水腐蝕數據集

由圖2易知,在六種海水環境因子中海水pH和海水鹽度(S/%)監測值的變化幅度非常小,對低合金鋼的海水腐蝕電位影響甚微,因此在構建海水腐蝕數據集時選取變化顯著的包括海水溫度 (T/℃)、海水電導率 (G/(μS·cm?1))、海水溶氧量(DO/(mg·L?1))以及海水氧化還原電位 (ORP/mV)的四種海水環境因子.采用CIV方法對雙率腐蝕數據進行處理,經BAS算法尋優得到的最優CIV參數向量的結果為W?=[?4.0193,0.002962,?2.2203,?0.060905],進一步將雙率數據轉化為單率數據,并構建用于建模的數據集.如表2所示,經CIV方法處理得到的海水腐蝕數據集包含16維輸入變量以及1維輸出變量,共計1834條數據.

表2 經CIV方法處理得到的海水腐蝕數據集Table 2 Seawater corrosion dataset obtained via the CIV method

3.3 CIV?IRVR模型訓練

將表2所示的海水腐蝕數據集(樣本總數N=1834)按 6∶2∶2 隨機劃分為訓練集(樣本數N1=1100)、驗證集(樣本數N2= 367)和測試集(樣本數N3= 367).在訓練集上對模型進行訓練,在驗證集上對IRVR組合核函數的參數向量V進行尋優,最終在測試集上計算模型的各項評價指標值以實現對模型預測能力的評估.

IRVR模型組合核函數的參數向量V由隨機函數生成.BAS算法中,最大迭代次數MAXiter=50,天牛左右須初始距離d0= 0.2,初始步長因子δ0=1,衰減系數 eta = 0.95,其適應度函數設置為模型在驗證集上的RMSE,尋優目標為使驗證集上的RMSE最小,即

式中,V*為最優參數,N2為驗證集樣本數量,ypred(i)和ytrue(i)分別是驗證集中第i條樣本的預測值和真實值.

BAS尋 優 得V?=[0.25697,0.53225,1.3585,?0.26342],采用最優組合核函數參數V*構建的CIV?IRVR模型計算測試集上的三種評價指標值,并將其結果與均值法結合IRVR、BP和SVR建立的MEAN?IRVR、MEAN?ANN 和MEAN?SVR模型以及本文CIV方法結合BP方法和SVR方法建立的模型CIV?ANN和CIV?SVR進行比較.

3.4 CIV?IRVR模型訓練

3.4.1 預測結果對比

為了評估CIV?IRVR模型的性能,使用圖4來比較不同預測模型的預測結果.

圖4(a)展示了基于均值法方法建立的MEAN?ANN、MEAN?SVR以及MEAN?IRVR模型在測試集上的結果;圖4(b)展示了基于CIV方法建立的CIV?ANN、CIV?SVR以及CIV?IRVR在部分測試集上的預測結果;圖4(c)和圖4(d)分別展現了基于MEAN和CIV方法建立的預測模型在測試集上絕對誤差的分布.可以直觀看出當數據處理方法由MEAN方法轉變為CIV方法后,模型預測精度有了大幅提高,采用IRVR方法建立的模型相比于BP和SVR能夠得到帶有誤差棒的預測輸出,同時CIV?IRVR模型在測試集上的絕對誤差分布離0值最近,其建模預測結果最為理想.

圖4 不同模型在測試集上的預測結果及絕對誤差.(a)基于MEAN的三種模型;(b)基于CIV的三種模型;(c)基于MEAN的三種模型的絕對誤差值;(d)基于CIV的三種模型的絕對誤差值Fig.4 Prediction results and absolute errors of different models: (a) three models based on the MEAN method; (b) three models based on the CIV method; (c) absolute errors of the three models based on the MEAN method; (d) absolute errors of the three models based on the CIV method

3.4.2 評價指標對比

列出上述四種雙率腐蝕數據處理和建模方法的樣本數量N和測試集樣本數量N3并計算預測模型在測試集上的評價指標值,如表3所示.

表3 不同模型的樣本數量和預測誤差表Table 3 Sample size and prediction errors of different models

從表3可以看出,相比于均值方法處理雙率腐蝕數據得到的196條建模樣本,通過CIV方法得到的建模樣本數量為1834,表明CIV方法處理雙率腐蝕數據能夠更多地保留原始數據中的信息,從而減少信息損失.在預測指標上,CIV?IRVR模型的 MAE、RMSE和 CD分別為 1.1914 mV、1.5729 mV及0.9963,與其他預測模型相比,具有最小的預測誤差和最高的決定系數.與用均值法處理雙率數據后同樣結合IRVR方法建立的MEAN?IRVR模型相比,CIV?IRVR模型的MAE和RMSE分別降低了 3.7453 mV 和 4.7888 mV,CD 提升了 0.0590,進一步表明CIV方法相比于均值法保留足夠數據信息并獲得更多建模樣本在預測精度上的優勢.相比于CIV方法建立的CIV?ANN以及CIV?SVR預測模型,CIV?IRVR在MAE、RMSE以及CD指標上均取得了最優效果,凸顯了優化IRVR方法建立的模型在預測精度上的優勢.通過以上分析,基于CIV方法結合IRVR方法建立CIV?IRVR模型不僅能夠減少數據信息損失還具有很高的建模精度,對于海水腐蝕雙率數據的處理和建模是十分有效的.

4 結論

(1)提出了一種基于CIV的雙率數據處理方法,通過構建CIV表征海水環境因子對腐蝕電位的綜合影響,建立CIV與腐蝕電位的關系模型將低合金鋼海水腐蝕監測中的雙率數據轉化為單率數據用于建模,減少了原始數據的信息損失.

(2)通過BAS優化組合核函數參數的IRVR方法對CIV方法處理得到的腐蝕數據集進行建模,得到了低合金鋼海水腐蝕電位預測模型CIV?IRVR,并與包括均值法建立的MEAN?ANN、MEAN?SVR和MEAN?IRVR、CIV方法結合ANN和SVR建立的CIV?ANN和CIV?SVR進行對比.實驗表明,CIV?IRVR在MAE和RMSE兩項誤差指標上達到了最低,在CD指標上達到了最高,獲得了最佳的預測效果.

(3)CIV?IRVR在保留更多數據信息的同時還具備較高的預測精度,能夠很好地解決海水腐蝕中雙率數據的處理和建模問題,對于材料腐蝕狀態的預測及進一步指導腐蝕防護工作有一定的參考價值和現實意義.

猜你喜歡
均值海水向量
向量的分解
聚焦“向量與三角”創新題
均值—方差分析及CAPM模型的運用
均值—方差分析及CAPM模型的運用
喝多少杯海水能把人“渴死”?
海水為什么不能喝?
淺談均值不等式的應用
均值不等式的小應用
海水
向量垂直在解析幾何中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合