?

多元逐步判別法在多屬性分析中的應用
——以大蘆湖油田沙三段五砂組為例

2015-06-23 13:54劉曉峰白晨辰
中國石油大學勝利學院學報 2015年3期
關鍵詞:判別函數區分泥巖

謝 偉, 劉曉峰, 白晨辰

(1.中國石化勝利油田分公司 物探研究院,山東 東營 257022; 2.中國石化勝利油田分公司 河口采油廠,山東 東營 257200; 3.中國石化勝利油田分公司 樁西采油廠,山東 東營 257237)

多元逐步判別法在多屬性分析中的應用
——以大蘆湖油田沙三段五砂組為例

謝 偉1, 劉曉峰2, 白晨辰3

(1.中國石化勝利油田分公司 物探研究院,山東 東營 257022; 2.中國石化勝利油田分公司 河口采油廠,山東 東營 257200; 3.中國石化勝利油田分公司 樁西采油廠,山東 東營 257237)

地震屬性種類繁多,單一屬性在應用過程中存在多解性,多屬性分析具有重要意義。本次研究將其他地質領域應用廣泛的逐步判別方法引入多屬性分析中。多元逐步判別方法從已知樣本出發建立判別方程,包含了變量自動選入—剔除的功能,既能優選最有效的屬性,又能體現所選屬性的綜合效應。以大蘆湖油田沙三段五砂組為例,利用多元逐步判別方法進行多屬性分析,實際效果表明,標準總體包含的樣本數量越多,最終結果精確度也越高。

多元逐步判別;屬性分析;大蘆湖油田

判別分析方法是一種常用的數學地質多元統計方法。判別分析法的基本原理是通過一組歸屬類型已確定的樣品,建立已知樣品的歸屬類型與相應地質變量之間的函數關系,即建立判別函數[1]。對于一個新樣品,可將新樣品的地質變量值代入通過已知樣品歸屬類型建立的判別函數,從而求得該樣品的判別值,最終確定該新樣品的歸屬類型[1]。判別分析方法在沉積相劃分、測井資料解釋、巖性識別等方面應用廣泛[2- 6],但在多屬性分析中尚未見到應用。本文中將判別分析方法引入到多屬性分析中,采用多元逐步判別分析方法,顯示良好效果。

1 多元逐步判別方法的基本原理

μ1=μ2=…=μG逐步判別方法是對變量進行篩選的一種方法,它實現的理論基礎是對附加信息加以檢驗。把已知來自于G個樣本總體具有相同協方差矩陣的多組樣本數據記為Xijk。Xijk的具體意義為第i組第j個樣品第k個變量的數值(i=1,…,G;j=1,…,Si;k=1,…,L)。首先要確定樣本總體能否被區分,也就是檢驗所選出的k個變量能否劃分G個樣本總體,即檢驗假設Eo是否成立。若假設Eo成立,說明區分G個樣本總體沒有意義。若假設Eo被否定,則說明G個總體可以被區分,從而可以通過建立判別方程進行判別。

檢驗假設Eo是否成立,可以利用維爾克斯(Wilks)統計量的計算公式:

(1)

其中

式中,C為組內離差;B為組間離差;Si為樣品總數;Λ為組內離差與總離差之比。

Λ的值越小,說明G個樣本總體之間存在的差異越大,越容易區分;,反之Λ的值越大,說明G個樣本總體越不容易區分。由此可見,可以將Λ作為一種度量參數來表示樣本總體區分的難易程度。對附加信息的檢驗是已確定所選出的k個變量能夠明顯區分G個樣本總體,從而判斷剩余L-k個變量是否對樣本總體區分有利。在實際計算中采用近似式來實現對附加信息的檢驗。

把k個變量分作兩部分,即前k-1個變量和最后第k個變量。已知前k-1個變量能夠區分G個樣本總體,討論最后第k個變量的增加對區分G個樣本總體的有無顯著影響。根據第k個變量和增加附加信息的假設構造如下統計量:

(2)

該統計量服從F分布F(G-1,N-(k-1)-G),可以進行F檢驗。與式(1)中統計量Λ一樣,F值同樣可以作為一種度量參數來判斷G個樣本總體區分的難易程度。F值越大,說明第k個變量的加入越有利于區分G個樣本總體。當計算值F>Fd(G-1,N-G-(k-1))時,認為其判別效果顯著;反之亦然。

在實際計算過程中,首先對變量的判別能力進行排序,然后依據變量的判別能力由強到弱逐個選入,同時把判別能力差甚至會起到相反作用的變量設法剔除。變量的選入和剔除遵循WilksΛ準則。假設按照上述運算原則選出了m個變量,則可以依據(1)式和(2)式分別計算判別函數中的判別系數和常數項

(3)

(4)

根據判別系數和常數項可以建立第i組的判別函數為

(5)

式中,qi=Si/m為第i組的先驗概率,可以用樣品的頻率近似代替。新樣品的歸屬類型可以根據建立的判別函數進行計算,得出相應的函數值,并通過函數值進行分組判別,從而確定新樣品的歸屬類型。

已知樣本對應的判別函數建立以后,還必須對判別函數的判別效果進行檢驗,通過最終正確判斷率的大小決定建立模型的適用性。一般能夠正常使用模型的正確判斷率最低為75%(正確判斷率最低使用標準不低于70%)。

多元逐步判別的優勢在于:一方面,從已知條件出發建立判別方程,可靠性更高;另一方面,具有變量自動引入和剔除的過程,能夠篩選出對判別方程貢獻最大的變量,這樣能夠用最少的變量達到最優的效果;最后能夠將所選出的變量通過判別函數有機結合起來,使判別系數的計算更為合理。

2 實際應用

判別分析本質上是一種類比分析,首先要建立標準模型。建立的標準模型必須包含兩個或兩個以上已知樣本。大蘆湖油田在沙三段發育三角洲前緣濁積砂體。從鉆井統計情況來看,沙三段五砂組在平面上具有“非泥即砂”的分布特點,這為多元逐步判別方法的應用提供了前提條件。

對研究區內砂巖和泥巖分別發育的24口井進行砂巖厚度統計。分別選取了對砂泥巖劃分比較有效的17種屬性。其中,GeoFrame軟件中選取了平均振幅、平均峰值、均方根振幅、平均能量、最大能量、最大振幅、零相位、能量半衰時、帶寬、瞬時頻率和瞬時振幅11種屬性,EnEn軟件中選取了小波高頻吸收系數、25%能量對應傅氏頻率比值、25%能量對應小波頻率比值、值峰態、傅氏高頻吸收系數、時窗弧長6種屬性。將各個單一屬性與統計結果比較,發現有很多井位與統計結果不相符,由此看出,單一屬性應用效果較差,有必要進行多屬性綜合應用。

利用地質統計軟件中判別分析模塊的Bayes判別,對17種屬性進行判別分析,最終優選出6種屬性:瞬時振幅、最大能量、傅氏高頻吸收系數、小波高頻吸收系數、值峰態和時窗弧長,并計算6種屬性對應的判別系數(表1)。

表1 優選屬性對應的判別系數

注:C1—Ains;C2—Mmax;C3—CFA;C4—CMA;C5—Kur;C6—Larc;C0—常數項。

將判別系數代入式(5)中,可以得到砂巖和泥巖的判別方程

Y(砂巖)=13.97Ains+1.44Mmax-4.59CFA-32.21CMA+34.45Kur+1.79Larc-49.76,

(6)

Y(泥巖)=23.75Ains-4.73Mmax-27.59CFA+25.71CMA+34.56Kur-0.35Larc-43.09.

(7)

式中,Ains為瞬時振幅;Mmax為最大能量;CFA為傅氏高頻吸收系數;CMA為小波高頻吸收系數;Kur為值峰態;Larc為時窗弧長。

將統計井所對應的6種屬性值,分別帶入式(6)和式(7)中,以檢驗判別方程的有效性。驗證結果(表2)顯示,砂巖的正判率為86.7%,泥巖的正判率為88.9%,總體的正判率為88%。正判率遠大于下限值75%,說明該判別方程有效。因此,可以使用上述砂巖和泥巖的判別方程(式(6)和式(7))對未知樣品進行巖性判別。

表2 統計井砂泥巖判別分析結果

注:帶星號結果為判別錯誤的結果。

3 效果分析

利用砂巖和泥巖判別方程(式(6)和式(7))對大蘆湖地區沙三段五砂組進行砂泥巖分布范圍進行預測(圖1)。圖1中的淺色區域為砂巖發育概率較大的區域,深色區域為泥巖發育概率較大的區域。

將預測結果與手工勾繪的砂巖厚度圖對比可知,各井點預測結果與統計結果吻合度較高;平面上砂泥巖分布趨勢,除部分井區外預測結果與統計規律一致;與單一屬性相比,基于逐步判別分析的多屬性分析與地質統計規律吻合度更高。

圖1 大蘆湖沙三段五砂組砂泥巖分布預測

4 結 論

(1)利用已知巖性的屬性值,依據多元逐步判別方法建立判別方程,對大蘆湖地區沙三段五砂組進行巖性識別,效果良好。

(2)地震層位解釋精度對判別結果影響顯著,標準總體包含的樣本數量影響最終結果,數量越多精確度也越高。

(3)本次研究選取了兩類樣本作為研究對象,多元逐步判別法可以推廣到3類及3類以上樣本。

[1] 趙繼文, 李能根,楊光惠,等.用模糊聚類和逐步判別分析方法識別低電阻率油氣層的方法研究[J].物探化探計算技術,2000,22(2):168-171.

[2] 于建國,姜秀清.地震屬性優化在儲層預測中的應用[J].石油與天然氣地質,2003,24(3):291-295.

[3] 姜秀清.儲層地震屬性優化及屬性體聯合解釋[J].油氣地球物理,2003,1(2):25-29.

[4] 陳燁菲,彭仕宓.沉積微相定量研究方法[J].石油勘探與開發,2003,4(30):51-53.

[5] 王研,張靈軍,嚴桂林,等.七參數判別法及其在松遼盆地東南隆起區油、氣、水層判別中的應用[J].中國海上油氣:地質,2002,16(1):5- 8.

[6] 韓學輝,支樂菲,李峰弼,等. 應用Bayes逐步判別方法識別東辛油田沙四段儲層流體性質[J].地球物理學進展,2011,26(4):1243-1248.

[責任編輯] 胡秋媛

2015-06-03

謝 偉(1985—),男,山東臨朐人,中國石化勝利油田分公司物探研究院工程師,主要從事油氣地質綜合研究。

10.3969/j.issn.1673-5935.2015.03.001

P631

A

1673-5935(2015)03- 0001- 03

猜你喜歡
判別函數區分泥巖
泥巖路基填料抗剪性能實驗研究
靈活區分 正確化簡
Fisher判別法在個人信用風險評估中的應用
勝利油田墾119區塊塑性泥巖鉆井模式研究
風化泥巖地質斷層水疏排工藝探討
游樂設施事故與危險量化判別函數的構建
怎么區分天空中的“彩虹”
區分“我”和“找”
探究上市公司財務預警的數學模型
怎祥區分天空中的“彩虹”(一)
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合