?

KPCA-GPR模型在常壓塔塔頂汽油干點預測中的應用

2023-01-12 07:14郭麗瑩郎憲明
遼寧石油化工大學學報 2022年6期
關鍵詞:常壓塔塔頂預處理

郭麗瑩,郎憲明

(遼寧石油化工大學信息與控制工程學院,遼寧 撫順 113001)

常減壓蒸餾過程是一個復雜的物理和化學變化過程,由于產品數目眾多,很多變量之間耦合嚴重,造成常減壓裝置控制困難[1-3]。國內多數煉油廠都沒有安裝質量分析儀表,只能間隔幾個小時對常壓塔側線產品進行抽樣離線化驗分析,根本無法實現對產品質量的實時監控。常壓塔塔頂干點直接影響產品的質量、產量以及能源消耗量,采用軟測量方法對篩選的常壓塔塔頂干點實現在線估計,可實現對篩選干點的推斷控制[4-5]。

由于軟測量技術針對過程控制可實現更為嚴格的卡邊優化控制,近些年對軟測量方法的大量研究成果不斷涌現。多變量統計建模逐漸發展成更具有代表性的方法[6],支持向量機(SVM)[7]與人工神經網絡(ANN)[8]這些方法通過訓練對主導變量具有一定的預測能力和較好的泛化能力。但是,由于常減壓蒸餾過程隨著原油生產方案的變化常常顯示動態特性,這些建模方法往往在預測精確度上達不到要求。高斯過程回歸(Gaussian Process Regression,GPR)作為一種非參數概率,根據實際工況建立基于相似準則的局部模型,不僅可以給出干點預測值,還可以得到預測值對模型的信任值[9-11]。因此,可以使用GPR軟測量模型對常壓塔塔頂汽油干點進行預測。

常減壓蒸餾過程是一項比較復雜的工藝流程,變量之間的復雜關聯導致所采集的變量數據過多,但是對過程控制有用的信息卻很少。因此,基于數據驅動的軟測量方法在建模前一定要對數據進行預處理[12-13]。目前解決信息冗余的主要算法有主成分分析法(Principal Component Analysis,PCA)[14]、偏最小二乘法(Partial least squares,PLS)[15]。近年來,很多學者都致力于二種方法的改進,在數據預處理中得到了廣泛的應用,由于變量數據間存在嚴重的耦合性和非線性,因此核主元算法(KPCA)應用較為廣泛[16-18]。本文利用KPCA對過程變量進行分析,對過程變量進行降維,解決了不同變量之間的非線性相關性,然后采用GPR建立軟測量模型,進而建立了KPCA-GPR常壓塔塔頂汽油干點模型。

1 KPCA-GPR建模算法

1.1 KPCA算法原理

設數據樣本集為X={x1,x2,…,xk,…,xn},其中xk∈Rn,n為樣本總數;Φ為一個非線性映射,對應的空間為F,F中的樣本記為Φ(xk),且滿足:

且F空間中樣本的協方差矩陣為:

式中,N=n-1。

C的特征 值λ和特征 向量V滿 足:

其中,特征向量V可由投影到F空間內的樣本映射組成。

式中,Φ(X)=[Φ(x1),Φ(x2),…,Φ(xn)];β=[β1,β2,…,βn]T。由此,式(4)可改寫為:

等式(5)兩端左乘Φ(X)T,即:

引入核函數Ki,j:

式中,i、j=1,2,…,n。

式(7)用與核矩陣K的特征值λ和特征向量β表示。

即:

對核矩陣進行中心化處理,結果如式(10)所示。

式中,In為所有元素均為的n維矩陣。

本文采用的徑向基函數為:

式中,σ為方差,σ>0;‖xi-xj‖為歐氏距離。

1.2 GPR模型

GPR模型是近幾年發展起來的一種機器學習回歸方法,并取得了許多研究成果,現已成為研究熱點,在許多領域得到了成功應用[9-11]。

GPR模型是有限個數的任意隨機變量均具有聯合高斯分布的集合,其性質完全由均值函數m(x)和協方差函數c(x,x')確定。均值函數m(x)和協方差函數c(x,x')的表達式為:

式中,x、x'∈Rd為任意隨機變量,因此GPR模型可定義為f(x)?GPR[m(x),c(x,x')],通常對數據作預處理,使其均值函數等于0?;貧w問題模型可表示為:

式中,ε為微小誤差;y為受噪聲影響的觀測值。進一步假設噪聲ε~N(0,δ2n),可得觀測值y的先驗分布為y~N[0,c(x,x)+δ2n In]以及觀測值y和預測值f*的聯合先驗分布:

式中,X為訓練集的輸入;x*為測試樣本集的輸入;C(X,X)=Cn=(cij)為n×n階對稱正定協方差矩陣;C(X,x*)=C(x*,X)T為x*與X之間的n×1階協方差矩陣;c(x*,x*)為x*自身的協方差。由此可以計算預測值f*的均值和方差。

2 軟測量建模

2.1 常減壓蒸餾工藝流程分析

常減壓蒸餾過程是將不同化學成分物質分離的過程,從蒸餾的結構上看,它是一個典型的、復雜的多側線系統。常減壓蒸餾裝置用于對原油的一次加工,將原油根據現實要求分為不同的餾分。常壓塔不同餾分的產品成分與這段時間內進料溫度、壓力,塔內各處溫度、壓力,回流量等過程變量密切相關,一旦過程變量的變化明顯,則會對產品質量造成影響。在實際生產過程中,通過抽取大量的數據樣本在一定時間間隔內進行離線化驗分析,獲得干點、凝固點、閃點等產品指標,其滯后性大,難以實現實時的自動控制,使整個常減壓蒸餾過程的產品質量。常減壓蒸餾工藝流程如圖1所示。圖中,M為自控泵。

圖1 常減壓蒸餾工藝流程

采用軟測量建模,從采集到的樣本中選擇具有代表性的、能夠覆蓋正常運行工況的適當數據作為學習樣本訓練,只要輸入實時采集的過程參數,模型就會給出相應的質量指標,從而實現產品質量指標在線測量的目標。

2.2 輔助變量的選擇

輔助變量的選擇應遵循常減壓蒸餾過程的機理及規律[14]。通過對撫順石化公司石油二廠操作規程的了解,結合現場生產數據,初步選擇影響常壓塔塔頂干點的14個輔助變量(見表1)。

表1 影響常壓塔塔頂干點的輔助變量

2.3 KPCA-GPR軟測量建模方法

基于數據驅動的軟測量建模方法是經過數值計算而實現的。一個模型的準確性和有效性依賴于輸入數據中包含的有用信息量。因此,對輸入數據的預處理也是軟測量建模前必不可少的一道工序。在常減壓蒸餾過程中,影響常壓塔塔頂干點的不同變量之間相互關聯,直接建模會增加問題分析的復雜性。對模型的輸入進行簡化,對輸入數據進行核主成分分析,可為常壓塔塔頂干點建立模型奠定一定的基礎。

干點影響變量為:

經過KPCA處理后的輸入變量為:

汽油干點輸出變量為:

3 仿真實驗

為了驗證上述KPCA-GPR模型的有效性,使用某煉油廠的實際數據進行系統仿真分析。從現場采集的數據雖然擁有大量的原始信息,但是由于所得數據易受到測量方法、人為操作因素、環境因素等因素干擾,需要在進行數據預處理之前做好篩選、誤差處理等工作。

3.1 基于KPCA算法的數據預處理

將經過處理的數據分成訓練集和測試集。根據交叉驗證法選擇模型參數,經過多次實驗,最終將其中300組數據用于訓練,100組數據用于測試。在使用KPCA提取數據信息時,貢獻率ak表示每個主成分包含原始總信息量的多少。累計貢獻率bk表示前k個主成分對原始信息提取的能力。一般情況下,當bk≥85%時,就可以用k個主成分來表示原有指標而不會損失過多信息。貢獻率ak和累計貢獻率bk表示為:

采用MATLAB軟件進行仿真實驗,分別使用PCA、KPCA算法計算貢獻率和累計貢獻率,計算結果如表2所示。表2中,R1-R6表示前6個主元。

表2 基于PCA、KPCA算法的貢獻率和累積貢獻率

3.2 GPR建模

基于離線數據訓練得到汽油干點軟測量模型,將原始數據經過PCA、KPCA處理后作為輸入變量,汽油干點化驗值作為輸出變量,代入GPR模型中進行學習,保證汽油干點模型能實時準確預測出當前時刻干點值的均值和方差。為了更好地對比,采用均方根誤差(RMSE)和平均絕對誤差(MAE)作為模型性能評價準則。

分別使用GPR、PCA-GPR、KPCA-GPR建立常壓塔塔頂汽油干點軟測量預測模型,常壓塔塔頂干點預測均值可視化結果如圖2所示。GPR、PCAGPR、KPCA-GPR模型性能如表3所示。

圖2 常壓塔塔頂干點預測均值可視化結果

表3 GPR、PCA-GPR、KPCA-GPR模型性能

從圖2可以看出,KPCA-GPR與GPR、PCAGPR相比,預測精度有所提高,基本上能滿足工藝的要求。對比表3的數據可知,KPCA-GPR模型性能優于GPR、PCA-GPR模型。因此,KPCA-GPR模型具有更好的預測精度和應用前景。

4 結論

針對常壓塔塔頂干點預測提出了KPCA-GPR軟測量方法。首先,對數據樣本采用核主成分分析進行預處理,解決變量間的非線性問題,降低數據的維數,減少噪聲的干擾,提高主成分的穩定性;用未經預處理數據和經過PCA和KPCA處理的數據進行了分析。結果表明,KPCA-GPR模型有較高的預測精度和較好的模型性能。

猜你喜歡
常壓塔塔頂預處理
求解奇異線性系統的右預處理MINRES 方法
常減壓裝置常壓塔頂腐蝕原因分析與防護
煉油廠常壓塔腐蝕與維護的研究與應用
高COD二噻烷生產廢水預處理研究
常壓塔頂部產品質量波動原因分析
寶塔
中國“巨無霸”設備啟運非洲
青蛙爬塔
青蛙爬塔
基于預處理MUSIC算法的分布式陣列DOA估計
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合