許鑒源, 趙軍龍, 白 倩, 黃千玲
1. 西安石油大學 地球科學與工程學院, 陜西 西安 710065; 2. 陜西省油氣成藏地質學重點實驗室, 陜西 西安 710065
測井流體識別是以測井資料為主要依據, 對儲集層巖性、 物性及儲層流體情況進行有效的刻畫研究。目前, 巖性測井系列(自然電位、 自然伽馬)、 孔隙度測井系列(聲波、 密度、 中子)、 電阻率系列(雙側向、 微電阻率、 方位電阻率及陣列感應) 以及工程測井系列(井徑、 井斜方位) 是致密砂巖儲層主要的測井識別系列[1], 由于地下地質對象的隱蔽性和復雜性, 以及地球物理測井(測井) 資料信息的處理及解釋是以巖石物理機理模型為基礎, 需要許多先驗條件, 這些測井方法雖然各有所長, 但在實際情況中單獨使用某類測井方法會造成解釋結果的多解性及不確定性問題, 難以準確識別出地層的流體性質[2,3]。 傳統的巖心觀測法因有限的巖心, 而僅能反映井眼附近區域的流體分布情況, 但該方法識別效果較為準確。雖然目前儲層流體是可以通過新的特殊測井方法獲得較為準確的識別, 但受限于成本及特殊測井方法在老井中采集資料困難等原因, 導致特殊測井方法沒有大規模普及使用, 因此主要識別流體的測井方法還是依賴于常規測井資料[4]。 其中曲線重疊法和流體識別因子交會圖法是流體識別工作中應用比較多的兩種能對儲層流體進行直觀快速識別的定性方法, 任培罡等[5]基于雙孔隙度重疊法, 構建了流體識別因子—孔隙度交會圖進行流體識別取得了不錯的應用效果。
隨著物探智能化水平的提高發展, 將機器學習的算法與測井響應特征研究綜合起來, 進行海量測井數據的加工、 挖掘和利用, 最終完成測井解釋取得了較好的效果[6]。 趙倩[7]建立了以流體特征作為參數的決策樹模型, 并與傳統地球物理圖版結合有效解決了圖版法的不確定性問題; 廖廣志等[8]對壓汞毛管壓力數據使用主成分分析、 灰色關聯分析、 智能聚類和因子分析等數據挖掘算法進行深度分析, 對比預測結果和測井解釋反映的孔滲特征發現兩者一致性較高;易軍等[9]以鄂爾多斯盆地致密砂巖儲層為研究對象,提出一種基于改進 ADASYN (Adaptive Synthetic Sampling Technique) 數據增強的致密砂巖儲層流體識別集成學習方法, 提出的方法的試氣平均準確率為91.1%; 何健等[10]為了提高儲層流體識別的精度與可靠性, 選擇隨機森林算法結合地震資料識別儲層流體, 該算法減弱了單一流體識別因子所引起的多解性; 羅剛等[11]針對儲集層流體識別任務, 采用卷積神經網絡和長短期記憶網絡分別表征測井曲線時序特征以及多條測井曲線之間的相互關聯關系, 克服了儲層流體識別任務中的各種問題。
考慮到機器學習算法中的隨機森林算法引入了隨機性不容易過擬合、 能夠有效的在大數據集上運行及訓練速度快等特點, 魏佳明和韓家新[12]利用隨機森林算法預測儲層孔隙度; 任雄風等[13]利用隨機森林算法預測濁積巖儲層厚度; 李文斌等[14]使用隨機森林回歸分析預測了巖體結構面粗糙度系數; 王民等[15]建立了基于隨機森林算法的巖相識別模型,有效解決了巖相類別不均衡的分類問題, 確定了有利巖相分布, 為后續 “甜點” 提供支持; 聶云麗等[16]采用隨機森林機器學習方法結合多元信息,避免了單顆決策樹過擬合的缺陷, 有效完成頁巖氣“甜點” 預測。 本文在前人研究成果的基礎上, 針對鄂爾多斯盆地M 區塊長3 儲集層開展流體識別研究,基于收集到的研究區測井資料、 地質資料進行流體預測, 以提高流體性質識別的準確性。
前人對于利用常規測井資料識別流體性質提出了許多方法, 如測井參數曲線重疊法中的雙孔隙度曲線重疊法、 三孔隙度曲線重疊法和徑向電阻率比較法,交會圖法中的電阻率—孔隙度交會圖、 電阻率—聲波時差交會圖、 Hingle 圖版等流體定性識別方法。 定量評價有基于阿爾奇公式的計算方法、 基于Biot-Gassmann 理論的定量計算方法、 利用ΔlgR 計算公式判別含油氣性等。
徑向電阻率法是直觀定性識別油層的重要方法,泥漿侵入使得井眼附近的巖層電阻率發生變化, 從電阻率徑向變化特征將泥漿侵入造成徑向電阻率不同的情況分為兩類(以淡水泥漿為背景): 一是增阻侵入, 當地層中原有流體的電阻率比較低時, 電阻率較高的泥漿濾液侵入后造成侵入帶巖石的電阻率升高, 表現為Rxo〉Rt, 即當深探測電阻率低于淺探測電阻率時, 判別此處為地層水礦化度較高的水層;二是減阻侵入, 當地層中原有流體的電阻率比較高時, 泥漿濾液侵入后造成侵入帶巖石的電阻率降低,表現為Rxo〈Rt, 即當深探測電阻率高于淺探測電阻率時, 判別此處為地層水礦化度不高的油層。 將電阻率特征法識別流體性質應用于本研究區儲層, 其結果與試油結論對比見圖1, 針對本地區五口井使用電阻率特征法開展流體性質識別, 識別效果均表現較差。
圖1 DG-02 井電阻率特征法識別流體性質成果圖Fig.1 Results of resistivity characterisation of well DG-02 to identify fluid properties
造成深淺探測電阻率差異識別流體類型效果較差的現象是由于低孔低滲砂巖儲層流體的測井響應特征差異不明顯、 研究區儲層是低電阻率油層, 造成電性曲線劃分油水層困難, 甚至無法劃分出油層和水層。
用于表示地層的測井參數和其他參數之間關系的圖即為交會圖。 交會圖的可應用場景豐富, 如收集資料時可以檢查測井曲線質量, 進行測井資料預處理時的曲線校正, 測井解釋過程的鑒別地層礦物成分、 識別地層孔隙流體類型、 評價地層等, 因此交會圖成為了測井分析工作者實用、 強勁的工具。
研究區塊地質構造復雜, 油水層測井響應特征不明顯, 難以準確區分流體性質。 在前人研究的基礎上, 結合當前區塊儲層特征與四性關系使用交會圖版開展流體性質識別。 交會圖圖版是用來表示給定巖性的兩種測井參數關系的解釋圖版, 它們是根據測井響應關系建立的解釋圖版, 是測井解釋與數據處理的依據。 由于經研究區塊的油層中泥質含量較大,ΔGR可以反映地層中泥質含量,Rwa囊括了儲層孔隙空間、 電阻率、 油層和水層的“線索”, 所以建立Rwa-ΔGR交會圖來反映地層流體情況, 見下圖2。 其中,
圖2 Rwa-ΔGR 交會圖Fig.2 Rwa-ΔGR meeting plates
式中:ΔGR-自然伽馬相對值, API;GR-自然伽馬實測值, API;GRmax-自然伽馬最大值, API;GRmin-自然伽馬最小值, API;Rwa-視地層水電阻率,Ω·m;φ-孔隙度,%;Rt-原狀地層電阻率, Ω·m。
油層的視地層水電阻率Rwa為高值, 且油層Rwa遠大于水層, 因此油層和水層可以準確劃分出來。 大部分油層與油水有明顯界限能夠較好的區分, 但有一小部分油層與油水同層相互重疊, 不易區分。 大部分水層與油水同層交織在一起, 無法準確劃分出界線,由交會圖可得下表所示的流體性質識別的劃分依據如下表1。
表1 流體性質劃分依據表Table 1 Table of fluid properties classification basis
地層的含油氣性是巖層含油(氣) 飽和度定量描述, 含油飽和度是表征儲層含油性好壞的重要參數。飽和度是儲層定量評價、 區分流體性質, 劃分油水層等過程的重要指標。 一般情況下含油飽和度與含水飽和度是互補關系(Sw+So= 1), 因此確定了含水飽和度也就知道了含油飽和度, 由此對儲集層含油水性質做出評價。
眾多學者采用了體積模型與電阻率并聯概念及Archie 公式, 建立了不同的解釋模型, 得出的不同泥質砂巖電阻率和含水飽和度公式如下表2 所示。
表2 常用飽和度計算公式Table 2 Common saturation calculation formulae
本研究區層段流體類型主要分為三類: 油層、 油水同層、 水層。 水層:Sw〉70%; 油水同層: 70%〉Sw〉50%; 油層:Sw〈50%, 應用Archie 公式, 并且參考同一地理位置、 類型相差不大油藏的經驗公式對本區含油飽和度進行計算, 劃分油水層成果如圖3 所示,結果符合率約為72.95%。
圖3 DG-02 井飽和度結論劃分流體性質成果圖Fig.3 Map of the results of the classification of fluid properties by saturation conclusion for well DG-02
隨機森林算法的基本單元是決策樹, 通過集成學習的思路將眾多弱決策樹結合匯集成“森林”, 并對Bagging 算法進行了改進[17]。 相比于傳統決策樹在選擇劃分n個屬性是在當前結點的屬性集合中選擇一個最優屬性; 隨機森林是對基決策樹的每個結點都會先從該結點的屬性集合中隨機選擇一個包含m個屬性的子集, 再從m個屬性的子集中選擇一個最優屬性進行劃分[18]。
為了減少訓練樣本規模不同造成的影響, 隨機森林采用的是自助采樣法為基礎的 “自助法”(boostrap) 重采樣技術, 即對給定包含n個樣本的數據集K進行采樣產生數據集K’, 每次隨機從K中挑選一個樣本放入K’ 中, 然后再將該樣本重新放回原始數據集K中, 因此下一次采樣過程中該樣本仍然有幾率被抽中[19]。 這樣進行n次有放回采樣后就得到了包含n個樣本的數據集K’。 樣本在n次采樣過程中始終不被采到的概率為取極限得到:
即通過自助法重采樣技術初始數據及K中約有36.8%的樣本未出現在采樣數據集K’ 中, 這些數據被稱為袋外數據[20]。 基于自助法生成的k個決策樹即為森林。
另外隨機森林的優勢包括以下幾方面: 一是人為干擾較少。 隨機森林算法在構建流體識別因子的過程中能夠自動依據測井數據的樣本特點來確定分裂特征, 不需要人為干預對數據進行預處理, 從而減少了人為干擾。 二是它可以處理大量的輸入變數; 三是特征屬性突出。 隨機森林算法在隨機選取特征屬性進行分裂的過程中, 可以通過比較訓練集中各特征屬性之間的屬性值大小建立相互的影響關系, 再通過該關系衡量特征屬性的“價值”, 進而為研究人員利用何種特征屬性進行流體識別提供參考依據。
隨機森林是用bootstrap 方法構建k個不同的訓練數據集, 對于每個訓練集, 構造一顆決策樹, 對于每一個節點, 隨機選擇m個特征, 決策樹上每個節點的決定都是基于這些特征確定的。 根據這m個特征, 計算其最佳的分裂方式。 最終決策一般通過投票來獲得, 投票最多的為預測結果[21]。 隨機森林模型識別流體性質的流程圖見圖4。
圖4 隨機森林算法流程圖Fig.4 Flow chart of the random forest algorithm
基于收集到的測井資料, 將與流體類型具有較高相關關系的自然伽馬(GR)、 自然電位(SP)、 地層真電阻率(Rt)、 聲波(AC)、 密度(DEN)、 中感應電阻率(RILM) 作為流體識別的特征參數, 試油結論視為真值(1 代表油層, 2 代表油水同層, 3 代表水層), 在Python 環境下構建基于隨機森林算法的流體識別模型, 修改模型各參數配置。
對于本模型參與訓練的輸入特征曲線重要度如圖5 所示, 自然伽馬的權重影響因子為7.8%, 自然電位的權重影響因子為15.5%, 地層真電阻率的權重影響因子為35.4%, 聲波的權重影響因子為14.9%, 密度測井的權重影響因子為9.8%, 中感應電阻率的權重影響因子為16.6%。 因此可見, 地層真電阻率是流體識別的最重要的影響因素, 余下測井曲線數據對隨機森林識別流體模型的重要性從大到小依次為: 中感應電阻率、 自然電位、 聲波、 密度測井、 自然伽馬。地層真電阻率與中感應電阻率是評價儲層含油性的指標, 聲波時差與密度測井代表著孔隙空間, 自然電位與自然伽馬則是反映了巖性, 其重要度與實際情況基本一致, 該結果提示在判別流體類型時應該多注意對地層電阻率以及自然電位和聲波測井數據的收集與關注。
圖5 輸入特征重要性分析圖Fig.5 Input feature importance analysis diagram
檢驗隨機森林模型識別效果如圖6, “1” 代表油層, “2” 代表油水同層, “3” 代表水層。 圖中綠色為實際試油結論, 紅色為隨機森林模型預測儲層油水情況。 預測結果與試油結論基本一致, 預測成功率較高, 模型正確率達90.47%。
圖6 隨機森林模型檢測圖Fig.6 Random forest model detection map
1) 常用流體識別方法在M 區塊長3 低孔低滲儲集層中并未取得較好識別效果, 可能是由于研究區儲層包含低電阻率油層, 且徑向電阻率曲線對比法識別流體性質僅關注了電阻率特征單一因素, 無法滿足日趨復雜的實際流體情況, 導致應用效果差。 交會圖版法可以基本準確識別出油層與水層差別, 但對于區分性質接近的水層與油水同層還需要進一步研究。
2) 基于常規測井數據對M 油田低孔低滲儲層使用隨機森林方法進行流體識別, 相較于徑向電阻率法與交會圖版法等傳統地球物理解釋方法無法融匯多信息的欠缺, 隨機森林方法規避了只分析單一信息的的不足, 結果更加真實可靠, 準確率高, 且方法簡便易于操作, 在研究區內取得了較好的識別效果。
3) 運用隨機森林算法識別流體性質, 只是智能算法與地球物理科學結合解決地質問題中的一種方面, 但這一方法的實現為進一步針對低孔低滲儲層特性實現智能算法解決其他地質問題提供了思路。