?

利用土壤地球化學數據和BP神經網絡預測松嫩平原油氣資源

2023-01-17 03:47朱建新戴慧敏劉國棟宋運紅杜守營
地質與資源 2022年6期
關鍵詞:油氣田油氣神經網絡

劉 凱,朱建新,戴慧敏,劉國棟,許 江,宋運紅,杜守營

1.中國地質調查局 沈陽地質調查中心,遼寧 沈陽 110034;2.中國地質調查局 黑土地演化與生態效應重點實驗室,遼寧 沈陽 110034;3.遼寧省物測勘查院有限責任公司,遼寧 沈陽 110031;4.沈陽市鵬德環境科技有限公司,遼寧 沈陽 110034

0 前言

20世紀80年代以來,眾多學者利用土壤中常量、微量等全量元素特征對油氣資源進行預測,并取得了一系列成果[1].近年來,地質數據量的爆發式增長為油氣資源預測帶來了新的機遇.截至2018年,中國地質調查局已在中國平原區完成區域多目標地球化學調查250×104km2以上[2],獲得了海量的高精度土壤地球化學數據.這些數據中蘊含著豐富的基礎地質、生態地質、礦產地質等信息,覆蓋了中國中東部大型、中小型含油盆地,為利用該數據進行油氣資源前景預測提供了可能[3-4].但正是由于樣本數量龐大,元素種類多,且地表土壤元素特征與深層油氣資源的關系復雜,數據的處理方法顯得尤為關鍵.

近年來,大數據方法在地學中的應用得到了快速發展,尤其在礦產資源預測方面表現出明顯優勢[5-6].陳坤等[7]以1∶25萬水系沉積物數據為基礎,利用神經網絡模型對湖南白馬山-龍山地區金礦成礦遠景進行了預測,并劃定了4個成礦遠景區.也有眾多學者將神經網絡應用于油氣資源預測,取得了較好的預測效果[8-12].

利用大數據計算方法進行礦產資源預測是勘查地球化學的發展趨勢,但目前仍處于起步探索階段[13].本文基于東北地區松嫩平原多目標地球化學調查數據,嘗試利用BP神經網絡的模式識別技術,通過訓練學習獲得土壤元素特征與油氣田空間位置之間的判別模型,并利用模型進行油氣資源前景預測.

1 研究區概況

松嫩平原是東北三大平原之一,行政區跨黑龍江、吉林兩省和內蒙古自治區一小部分,北自黑龍江省嫩江縣,南至吉林省長嶺縣南部的松遼分水嶺,西側以大興安嶺低山丘陵區與山前傾斜平原分界線為界,東側邊界至小興安嶺-長白山西緣山麓臺地,總體呈南北長、東西窄的橢圓形(圖1).松嫩平原內油氣資源豐富,北部為大慶油田探區,面積為11.6×104km2,南部為吉林油田探區,面積6.9×104km2[14].

圖1 松嫩平原多目標地球化學數據范圍及油氣開采區分布圖Fig.1 Distribution map of multi-target geochemical data and oil-gas fields in Songnen Plain

2 數據及處理

2.1 數據來源

本次研究采用的土壤地球化學數據全部來源于多目標區域地球化學調查,樣品采集及測試分析方法參考《多目標區域地球化學調查規范(1∶250000)》[15]和文獻[3].多目標區域地球化學調查采用雙層網格采樣方式,分別采集了表層(0~20 cm)和深層(150~200 cm)土壤樣品.本研究采用的數據為松嫩平原深層土壤樣本,樣本密度為1個/16 km2.每個樣品屬性包括54個元素或氧化物含量,具體指標為Ag、Au、As、B、Ba、Be、Bi、Br、Cd、Cr、Cl、Co、Ce、Cu、F、Ga、Ge、Hg、I、La、Li、Mn、Mo、N、Ni、Nb、P、Pb、Rb、S、Sb、Sc、Se、Sn、Sr、Th、Ti、Tl、U、V、W、Y、Zn、Zr、SiO2、Al2O3、TFe2O3、K2O、Na2O、CaO、MgO、TC、Corg、pH.

2.2 數據預處理

本次研究共使用松嫩平原土壤樣本11 291個,樣本在地圖上均勻分布,每個樣本可代表4 km×4 km的網格范圍.由于土壤屬性在空間上存在連續性和變異性,因此將土壤樣本的空間坐標X、Y值也作為兩個屬性賦予樣本屬性中.同時在樣本屬性中增加含油性字段,將樣本點與油氣田分布圖在ArcGIS中進行空間疊加,若樣本落在油氣田范圍內,則定義該字段為1,否則定義為0.經統計,油氣田內樣本數量為972個,油氣田外樣本數量為10 319個.經處理后,該數據屬性中共含有56個字段作為自變量,含油性字段為因變量,為下一步建立模型做準備.

3 BP神經網絡預測

3.1 BP神經網絡建立

BP(Back Propagation)神經網絡是一種按照誤差逆向傳播算法訓練的多層前饋神經網絡,是最常用且有效的人工神經網絡之一,具有高度非線性映射能力.BP神經網絡通常具有3層或3層以上的神經元,包括輸入層、中間層(隱層)和輸出層,上下層實現全連接,而每層神經元之間無連接.當一對學習樣本提供給網絡后,神經元的激活值從輸入層經各中間層向輸出層傳播,在輸出層的各神經元獲得網絡的輸入響應.接下來,按照減少目標輸出與實際輸出之間的誤差方向,從輸出層反向經過各中間層回到輸入層,從而逐層修正各連接權值,這種算法稱為“誤差反向傳播算法”.隨著誤差逆向傳播修正不斷進行,網絡對輸入模式響應的正確率也不斷上升.

本研究利用Matlab 2018b軟件實現神經網絡模型的建立、訓練和仿真,建立的網絡結構如圖2.Lippmannn等[16]研究發現,3層神經網絡(只含有1個隱層)可以解決任意復雜的分類問題,隱層過多會造成誤差方向傳播過程計算過于復雜,并容易陷入局部最小誤差.因此本次研究采用3層神經網絡結構,輸入層神經元數量為樣本的地球化學指標等屬性,共56個.因為判別目標為兩類,分別為0(油氣田外)和1(油氣田內),因此輸出層神經元為2個,傳遞函數為S型的對數函數(logsig).隱層神經元數量沒有明確通用的公式,一般根據經驗及多次試驗結果來確定.隱層神經元個數太少會造成網絡的學習容量有限,個數太多會造成輸入過多的無關細節,造成模型的泛化能力較弱.使用傳遞函數為S型的正切函數(tansig).設置最大訓練步數為1000,訓練的目標誤差為0.01,訓練方法為梯度下降動量BP算法,該算法的優點是運行收斂速度較快.

圖2 本研究采用的BP神經網絡結構Fig.2 The BP neural network structure adopted in this study

3.2 網絡模型訓練

網絡模型的訓練僅需要少量典型樣本即可.本次研究利用Rand函數隨機從油氣田內和油氣田外的樣本中各抽取500個加載入模型中,并將樣本的70%作為訓練樣本,15%作為檢驗樣本,15%作為測試樣本.這樣可以防止網絡模型學習過程中發生“過擬合”現象,并可評價網絡模型的性能和泛化能力.為了消除訓練過程中的隨機性對判別結果的影響,對網絡進行20次訓練,并將20次訓練得到的網絡輸出取平均值.

3.3 網絡模型檢驗

訓練后,利用交叉熵(CE)、混淆矩陣圖和誤差柱狀圖來評價網絡的準確性.CE能夠刻畫兩個概率分布之間的距離,是分類問題中使用比較廣的一種損失函數,CE越低表明兩者間的誤差越小.而判斷BP神經網絡推廣能力的好壞,不僅要關注測試樣本CE大小,還要看檢驗樣本的CE是否接近于訓練樣本,檢驗樣本CE明顯低于訓練樣本則可能出現了過擬合現象.如圖3,本模型在第41次訓練時,CE達到穩定值0.235,測試樣本CE接近于訓練樣本和檢驗樣本,且變化趨勢較為一致,說明該BP神經網絡模型泛化能力較好.

圖3 BP神經網絡性能評價圖Fig.3 BP neural network performance evaluation

混淆矩陣是通過每個目標輸入值與模型的實際輸出值進行比較,以驗證模型的模式識別和分類效果.它分為訓練混淆矩陣、驗證混淆矩陣、測試混淆矩陣和總混淆矩陣.從圖4來看,訓練數據的準確率為92.6%,驗證數據的準確率為90.0%,測試數據的準確率為88.7%,總準確率為91.6%,說明分類效果比較理想.

圖4 混淆矩陣圖Fig.4 The confusion matrix diagram

BP神經網絡的誤差柱狀圖可以直觀看到網絡模型訓練的誤差分布狀況.圖5顯示,該BP神經網絡訓練樣本、檢驗樣本和測試樣本的誤差大部分接近于零誤差線(Zero Error),可用來進行模式識別和分類.

圖5 預測誤差柱狀圖Fig.5 The error prediction histogram

3.4 網絡模型預測

將訓練獲得的神經網絡模型保存成代碼,并將松嫩平原全部數據輸入模型,得到各樣本的含油概率預測結果,統計結果見表1.為了更直觀反映預測情況,利用樣本的含油概率(大于0.5)繪制樣本含油氣概率預測圖(圖6).圖中所示,油氣概率大于90%的區域與已有油氣田范圍吻合度較好,說明了模型的可行性.同時,在油氣田外圍局部地區也顯示出了較好的油氣概率.其中松原市東部油氣概率普遍大于90%,長嶺縣周圍油氣資源概率大于60%的區域較集中,有資料顯示兩個區域內目前已有油氣田開采[17-19],反映出該模型的準確性,也預示該區具有很好的油氣資源前景.預測結果顯示,農安縣西南部、齊齊哈爾市東部等油氣開采空白區顯示出較高的油氣資源概率,可作為油氣資源勘查的依據.

圖6 松嫩平原含油氣概率預測圖Fig.6 Prediction map of hydrocarbon-bearing probability in Songnen Plain

表1 樣本含油氣概率預測結果統計表Table 1 Prediction results for the hydrocarbon-bearing probability of samples

4 結論

當前,地質調查正不斷獲取到海量的地學數據,隨著數據量的增加、數據類型的多元化、解決問題的復雜化,傳統的統計方法已顯得力不從心,神經網絡等大數據算法在礦產資源預測、生態風險評價等地學領域正發揮越來越重要的作用[20-21].

本次研究基于多目標區域地球化學數據,利用BP神經網絡對松嫩平原油氣資源進行預測,結果顯示預測區與油田開采區吻合度較高,并在農安縣西南部、齊齊哈爾市東部等油氣開采空白區顯示出較高的油氣資源概率,可為劃定油氣資源遠景區提供依據.同時,該BP神經網絡模型可在大比例尺油氣勘查區推廣應用.

猜你喜歡
油氣田油氣神經網絡
油氣田工程造價控制要點及其管理模式
《非常規油氣》第二屆青年編委征集通知
《中國海上油氣》2021年征訂啟
神經網絡抑制無線通信干擾探究
基于神經網絡的中小學生情感分析
大數據統計在碳酸鹽巖油氣田開發中的應用
油氣體制改革迷局
春曉油氣田勘探開發的歷史
基于神經網絡的拉矯機控制模型建立
我國產量最高的油氣田長慶油田
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合