?

基于GPR-DE模型的CO2-原油體系最小混相壓力研究

2021-06-02 10:24侯智瑋官志銳楊興超
油氣地質與采收率 2021年3期
關鍵詞:精確度組分原油

侯智瑋,劉 勇,葉 鋒,官志銳,石 丹,楊興超

(中國石油遼河油田分公司勘探開發研究院,遼寧盤錦 124010)

CO2混相驅替的成功與否,在很大程度上取決于CO2與原油達到混相所需的最小混相壓力(MMP)。目前測定最小混相壓力的方法主要有實驗方法和理論方法,實驗方法主要有細管實驗法[1]、上升氣泡儀法[2]、蒸汽密度法[3]、界面張力法[4]、多級混相接觸方法、溶脹/萃取實驗方法等,其實驗過程繁瑣,費時費力,且實驗費用昂貴,比如構建一套完整的上升氣泡儀器需要15 000 美元,而構建一套完整的細管實驗儀器則大概需要40 000美元[5]。理論方法主要包含經驗公式法、圖版法、狀態方程法、數值模擬方法、智能優化算法等。其中,經驗公式法和圖版法是根據某一特定油藏或特定的流體性質而得到的,適用范圍較窄,精確度較差;狀態方程法在計算最小混相壓力時,需要根據油藏的具體特性計算出混相函數,而要確定具體混相函數比較復雜和困難;數值模擬方法要以大量的實驗數據為基礎,進行PVT 數據擬合,建立數值模型,最后確定最小混相壓力,整個過程耗時比較長。

近年來,隨著智能優化算法在油藏工程領域的廣泛應用,許多學者嘗試利用該算法來預測CO2-原油體系最小混相壓力,其具有良好的魯棒性、快速性和精確性,能夠對輸入自變量與輸出變量之間的復雜關系進行建模。目前中外學者主要利用人工神經網絡[6]、遺傳算法[7]、交替條件期望[8]、最小二乘支持向量機方法[9]、基因表達編程[10]及混合類算法[11-13]構建預測模型。目前最小混相壓力預測模型主要存在以下缺點:①模型大都是基于有限的數據點開發的,精確度差。②所使用的熱力學參數和油藏流體參數取值范圍有限。③模型預測的相關性不能準確地描述最小混相壓力隨輸入參數變化的趨勢。如根據實驗數據,最小混相壓力隨著油藏溫度的升高而增大,然而一些預測模型未能體現出這種關系。

為解決目前模型中數據點過少和模型精確度太低的問題,提出基于高斯過程回歸(GPR)和差分進化算法(DE)的GPR-DE 模型來預測CO2-原油體系最小混相壓力。

1 模型建立

1.1 數據采集和分析

通常模型或相關參數的適用性、可靠性和準確性與所使用基礎數據的全面性和有效性有關。本次采用的數據庫,比以往文獻中數據更多,各項數據的取值范圍也更廣,主要包括油藏溫度、注入氣體中不同組分的組成、原油中C5+組分的分子質量(MWC5+)、原油中揮發組分與中間組分的比值、注入氣體的臨界溫度和最小混相壓力等,其實驗數據主要來源于中外35個油田,據此總結了各項參數取值范圍(表1)。

表1 不同參數的取值范圍Table1 Value range of different parameters

1.2 模型基本原理

1.2.1 高斯過程回歸

GPR 是基于貝葉斯學習和統計理論發展起來的一種機器學習方法,在處理高維數和非線性等復雜回歸問題時具有較大優勢[14-15],主要包括以下步驟。

第一步,預測過程。假設訓練數據集為D=。f(xi)用來描述輸入變量的隨機過程。GPR 由均值函數m(x)和協方差函數k(x,x′)確定,因此,GPR可以定義為:

一般情況下,GPR模型可以表示為:

由于,ε~N(0,),因此(4)式可變為:

依據貝葉斯原理,在測試數據集D*=[(X*,y*)]可以得到訓練數據輸出和測試數據輸出的高斯分布為:

在訓練數據集和測試數據集確定后,可以計算出預測值的后驗概率分布為:

第二步,訓練過程。協方差核函數是對稱正定函數,常用的協方差核函數為平方指數函數:

通過建立訓練樣本的負對數似然函數計算超參數的初始值,并對每一項求偏導,再利用優化算法對偏導最小化得到超參數的最優解:

求得最優超參數后,利用(8)和(9)式可求得測試數據對應的預測值均值和方差,最終高斯過程回歸的關系式如下:

1.2.2 差分進化算法

DE 算法是由RAINER 等于1997 年在遺傳算法等進化思想的基礎上提出的,用于求解多維空間中的整體最優解[16]。由于該算法具有尋優能力強、收斂速度快、魯棒性強等特點[17],因而被廣泛應用在數據挖掘、模式識別、油氣田開發等各個領域。差分進化算法主要包括以下步驟。

第一步,種群初始化操作。在N維可行解空間隨機生成初始種群。

第二步,變異操作。從初始種群中隨機選取3個個體進行變異操作,得到變異后的種群:

第三步,交叉操作。將變異種群和初始種群交叉操作,得到交叉后的種群:

第四步,選擇操作?;谪澙愤x擇方法,從初始種群和變異種群中選擇適應度更高的個體進入下一代。當變異個體的適應度優于時,變異個體取代原個體,反之放棄變異個體,保留原個體,得到選擇后的個體:

第五步,參數選擇。差分進化算法的控制參數主要是種群規模、縮放因子和交叉概率,算法的性能很大程度上取決于控制參數的取值。

1.3 構建模型

構建模型的過程主要包括:第一步,確定輸入和輸出變量。輸入變量包括油藏溫度、原油中C5+組分的分子質量、原油中揮發組分(C1和N2)/中間組分(C2—C5,H2S 和CO2)、注入氣體的臨界溫度和CO2-原油體系最小混相壓力實驗數據,輸出變量包括CO2-原油體系最小混相壓力預測值。第二步,訓練和測試樣本的選取。為建立準確可靠的模型,將模型所用數據集隨機分為兩個不同的樣本,作為訓練樣本和測試樣本。其中訓練樣本包含大約80%的數據點(約260 個數據點),用于模型開發和學習CO2-原油體系最小混相壓力的物理規律。測試樣本包括剩余20%的數據點(大約65個數據點),用于評估模型的準確性和有效性。第三步,建立CO2-原油體系最小混相壓力模型。GPR-DE 模型在編程軟件MATLAB 環境下實現,其中DE 用來優化GPR 中的超參數,使模型精確度更好,構建模型的流程如圖1所示。

圖1 GPR-DE模型流程Fig.1 Flow chart of GPR-DE model

2 結果與討論

2.1 GPR-DE模型預測結果

由于樣本量過大,從預測結果中選取了15組代表性數據進行分析。由表2 可知,模型預測結果與實驗數據接近,為更加準確評價模型的誤差,利用統計誤差分析和圖形誤差分析來評價GPR-DE 模型預測精確度。

表2 GPR-DE模型部分預測結果Table2 Partial prediction results of GPR-DE model

2.1.1 統計誤差分析

為了綜合評價GPR-DE 模型預測結果的準確性和精確度,對模型預測結果的平均絕對相對誤差、平均相對誤差、均方根誤差、標準差、平方相關系數等誤差參數進行了綜合誤差研究。其表達式分別為:

其中:

分析各項誤差參數,結果表明,平均絕對相對誤差的大小最有說服力,平均絕對相對誤差越小,模型的精確度越高。GPR-DE 模型計算的平均絕對相對誤差為2.060%,標準差為0.053 2,平均相對誤差為-0.183%,均方根誤差為0.655。

2.1.2 圖形誤差分析

將GPR-DE 模型預測的最小混相壓力與實驗獲得的最小混相壓力交會(圖2),數據點在45°線(X=Y)附近集中分布,證明其精確度較高。另外,還可以用模型的相關系數平方(R2)來表示,其值越大,模型精確度越高。由圖2可以看出,R2為0.984 7,證明GPR-DE 模型精確度較高。預測結果數據點在0°線附近集中(圖3),也證明GPR-DE 模型精確度較高。

圖2 GRE-DE模型數據交會圖Fig.2 Data crossplot of GRE-DE model

圖3 GRE-DE模型結果相對誤差Fig.3 Relative error of GRE-DE model results

2.2 與現有模型的對比

2.2.1 統計誤差對比

現有預測模型多數僅能預測純CO2-原油體系最小混相壓力,而本文提出的GPR-DE 模型既可以預測純CO2-原油體系最小混相壓力,還能預測非純CO2-原油體系最小混相壓力。為證明其精確度,對比部分文獻模型預測結果的統計誤差。由表3可以看出,ANFIS-PSO,ANFIS-GA 提出的模型精確度較高。GLASO 和KAMARI 提出的模型精確度低。本文提出的GPR-DE 模型的平均絕對相對誤差為2.060%,平均相對誤差為-0.183%,均方根誤差為0.655,整體上來看誤差小。因此,本文提出的GPRDE模型精確度高于其他模型。

表3 不同模型預測結果的統計誤差對比Table3 Comparison between statistical errors in prediction results of different models

2.2.2 圖形誤差對比

分別繪制GPR-DE模型、ANFIS-PSO模型及YELLIG,SHOKIR和LEE提出的模型預測結果交會圖,并對比其相關系數平方。由圖2和圖4—圖7可看出,本文提出的GPR-DE模型的相關系數平方(R2為0.984 7)最大,證明GPR-DE模型的精確度較高。

圖4 ANFIS-PSO模型結果交會圖Fig.4 Crossplot of ANFIS-PSO model results

2.3 參數敏感性分析

為驗證模型的有效性和可靠性,需要證明模型預測結果與實驗數據隨各變量的變化趨勢是一致的。分析油藏溫度、原油中C5+組分的分子質量、揮發組分/中間組分和注入氣體臨界溫度4 個輸入參數的敏感性。

由圖8—圖11 可看出,模型預測結果與實驗數據呈較好的一致性。模型預測的最小混相壓力隨著油藏溫度、原油中C5+組分的分子質量、揮發組分/中間組分的增大而增大,隨著注入氣體臨界溫度的增大而降低,證明本文提出的GPR-DE模型可靠。

圖5 YELLIG模型結果交會圖Fig.5 Crossplot of YELLIG model results

圖6 SHOKIR模型結果交會圖Fig.6 Crossplot of SHOKIR model results

圖7 LEE模型結果交會圖Fig.7 Crossplot of LEE model results

圖8 最小混相壓力隨油藏溫度的變化Fig.8 Relationship between minimum miscibility pressure and reservoir temperature

圖9 最小混相壓力隨MWC5+的變化Fig.9 Relationship between minimum miscibility pressure and MWC5+

圖10 最小混相壓力隨揮發組分/中間組分的變化Fig.10 Relationship between minimum miscibility pressure and volatile components/intermediate components

圖11 最小混相壓力隨注入氣體的臨界溫度的變化Fig.11 Relationship between minimum miscibility pressure and critical temperature

3 結論

利用統計誤差和圖形誤差評價GPR-DE 模型的精確度,并與現有模型的預測結果進行了對比。結果表明,GPR-DE 模型預測最小混相壓力精確度最高,平均絕對相對誤差僅為2.060%,在現有模型中誤差最低。通過分析參數敏感性、統計誤差和圖形誤差,驗證了模型的有效性和可靠性。GPR-DE模型具有容易實現、精確度高、收斂速度快、魯棒性強、使用范圍廣等優點,不僅可以用于預測CO2-原油體系最小混相壓力,還可以預測其他氣體和原油體系最小混相壓力,為最小混相壓力的預測提供了一個簡單、便捷、精確度高的新方法。

符號解釋

averageMMPpred——模型預測值的平均值,MPa;

AAPRE——平均絕對相對誤差百分比,%;

APRE——平均相對誤差百分比,%;

cov(y*)——測試數據x*對應預測值y*的方差;

C——噪聲觀測矢量;

CR——交叉概率;

D——訓練數據集;

DE——差分進化算法;

Ei——相對誤差百分比,%;

E[f(x)]——期望函數;

F——縮放因子;

f(x)——高斯過程回歸函數;

GP——高斯過程;

GPR——高斯過程回歸;

In——n維單位矩陣;

i,j——個體的第i,j個分量;

k(x,x')——協方差函數;

k(x*,x*)——測試點x*本身的協方差;

K(X,X)——n階對稱正定的協方差矩陣;

K(X,x*)——訓練數據X與測試數據x*之間的n維列向量;

l——方差尺度;

L(θ)——負對數似然函數;

m(x)——均值函數;

MMP——最小混相壓力,MPa;

MMPiexp——第i組最小混相壓力實驗數據,MPa;

MMPipred——第i組最小混相壓力預測值,MPa;

MWC5+——原油中C5+組分的分子質量,g/mol;

N——構建模型數據個數,取值為325;

Np——種群規模;

randn(i)——1,2,…,N之間的隨機量;

rand(j)——[0,1]之間的隨機數;

R2——相關系數平方;

RMSE——均方根誤差;

SD——標準差;

t——種群代數;

xi——D中第i個輸入變量;

x*——測試數據X*中的測試點;

X——訓練數據;

X*——測試數據;

y——訓練數據X對應的輸出;

yi——D中第i個輸出結果;

y*——測試點x*對應的預測值;

α——估計參數;

θ——模型的超參數;

θi——模型的第i個超參數;

ε——服從高斯分布的噪聲;

猜你喜歡
精確度組分原油
近紅外定標法分析黏/錦/氨三組分纖維含量
氣體組分對低熱值氣體MILD燃燒性質的影響
煤的族組分基本特性研究
放縮法在遞推數列中的再探究
數形結合
大數據是“原油”,不是“汽油”
近似數1.8和1.80相同嗎
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合