?

基于隨機森林算法的新疆木吉一帶金礦區域成礦預測

2024-04-17 08:55呼冬強何福寶李輝郝延海張強馮昌榮廖風云
新疆地質 2024年1期
關鍵詞:隨機森林機器學習

呼冬強 何福寶 李輝 郝延?!垙姟●T昌榮 廖風云

摘? ?要:木吉-烏孜別里山口一帶位于印度-歐亞大陸碰撞造山帶西段的帕米爾構造結,發育多處金銅等礦床(點),砂金礦床大量發育,顯示巨大的金礦找礦潛力。在總結木吉一帶金礦區地質特征基礎上,剖析區域Au元素異常,提取區內各類遙感蝕變異常,構建地質-地球化學-遙感綜合預測模型,利用隨機森林算法,開展多信息集成的定量預測?;陔S機森林算法定量預測找礦概率,結合研究區目前的研究現狀及已知礦床點的類型、數量、代表性、規律等信息,對找礦靶區進行優選,圈定A級找礦靶區3個,B級找礦靶區2個,C級找礦靶區1個?;陔S機森林算法的機器學習,在地物化遙感多數據區域中,預測精度較好,提高了預測效率,為該區域實現高效定量預測提供了依據。

關鍵詞:成礦預測;金礦床;隨機森林;機器學習

隨著地質找礦工作不斷深入,積累了大量地質找礦信息,需要成熟的預測理論方法獲取礦產資源分布位置、產出機率、資源潛力,實現高效成礦預測。葉天竺全面利用物探、化探、遙感等地質找礦信息,運用體現地質成礦規律內涵的預測技術,全面、全過程應用空間數據庫及GIS技術,在圈定成礦預測區基礎上估計潛在資源量[1];王世稱提出以研究地質、地球物理、地球化學和遙感信息為基礎綜合信息礦產預測理論[2];趙鵬大以地質異常分析為基礎,以成礦多樣性分析與礦床譜系研究為指導,將地質異常、成礦多樣性及礦床譜系3方面定量化研究緊密結合,形成“三聯式”礦產預測及定量評價[3];嚴光生歸納總結了主要礦床類型的地質特征,構建了反映礦體賦存位置的成礦地質體-成礦結構面-成礦作用特征標志“三位一體”找礦預測地質模型[4];左仁廣基于數據科學的礦產資源定量預測理論與方法,采用機器學習方法挖掘地質找礦大數據與礦床的相關性,豐富了礦產資源定量預測的理論[5-6];肖克炎通過構建地質空間數據庫、圈定成礦預測類型和工作區、編制專題預測底圖-綜合信息預測要素圖、建立綜合信息預測模型,進行礦產資源的定位-定量預測,提出礦床成礦系列綜合信息預測理論方法[7]。王欣采用證據權重與基于遺傳優化的BP神經網絡(WOE-GA-BP)模型,對寧蕪盆地陸相火山巖型銅礦進行成礦預測,進一步豐富了預測模型[8];劉嘉情等借助機器學習隨機森林算法,開展機器學習模型訓練,建立能夠識別該地區斑巖?矽卡巖多金屬礦床成礦巖體和非成礦巖體的新方法[9];董賽娜使用支持向量機和隨機森林兩個機器學習分類模型可有效區分密西西比河谷型、火山塊狀硫化物型、噴流-沉積型、矽卡巖型4種類型鉛鋅礦床[10];鄭孝誠運用卷積神經網絡模型實現了金礦區高效預測[11]。礦床基于機器學習的成礦預測方法,實現了礦產資源定量預測,但算法對數據的依賴度高,在小樣本區域內需要尋找預測敏感度高的算法。隨機森林算法由于其天然的并行特性,良好的模型可解釋性,廣泛用于各種應用領域,不同于一般的“黑箱”模型,隨機森林算法可給出變量的重要性排序及變量間的偏依賴關系,從而能識別重要的預測因子并進行解釋,在礦產資源預測中有很好的應用。

木吉-烏孜別里山口一帶位于印度-歐亞大陸碰撞造山帶西段的帕米爾構造結,發育多處金銅礦床(點),且砂金礦床較發育,顯示出巨大的金礦成礦潛力。

1? 區域背景

研究區位于印度-歐亞大陸碰撞造山帶西段的帕米爾構造結中帕米爾區木吉一帶(圖1),自震旦紀以來經歷了長期的地體裂離、寒武紀至古新世俯沖增生、始新世的最終造山及始新—全新世大型走滑-伸展、逆沖推覆及構造隆升,巖漿、構造活動十分強烈[12],已發現鐵、錳、金、銅、鉬、鉛、鋅等礦產,成礦條件十分優越。

區內岀露地層主要為甜水海巖群、下志留統溫泉溝群、中上志留統達坂溝群、下上石炭統恰提爾群、上白堊統鐵龍灘群等(圖2)。下志留統溫泉溝群沉積環境為被動陸緣環境下的半深海-淺海斜坡扇濁積巖相復理石建造,整體為一套區域低溫動力變質作用類型的低綠片巖相變質相帶的“黑色巖系”,為區域內金礦賦礦重點層位。

區內處于西藏三江造山系(Ⅰ)-羌塘弧盆系(Ⅱ)-塔什庫爾干-甜水海地塊(Ⅲ)之早古生代陸緣盆地(Ⅳ)構造單元,位于印度板塊與歐亞板塊碰撞帶的前緣區附近,屬擠壓應力最強烈的地帶,褶皺、斷裂發育。斷裂構造極其發育,按規??蓜澐譃?級;Ⅰ級為NWW向恰特-奧依巴勒根斷裂(F2)、近EW向展布的烏孜別里山口斷裂(F7);Ⅱ級為呈近EW、NW向F1、F3、F4、F8、F9斷裂;Ⅲ級為近NE向F5、F6斷裂,另外也發育有NNW、SN向分支小斷層及裂隙構造。不同級別的斷裂構造對區內以金、銅、鉛、鋅為主的多金屬礦產的形成與分布起著分級控制作用。

區域上巖漿巖以酸性侵入巖為主,巖漿活動始于寒武紀,結束于新生代古近紀。寒武紀、奧陶紀僅有少量酸性巖侵入,泥盆紀表現為少量中性-超基性巖的侵入與噴出,石炭—侏羅紀以大規模的中酸性巖漿侵入及中基性巖漿噴出為特點,古近紀僅有較小規模的酸性巖漿侵入活動。該區巖漿活動整體較弱,巖漿巖出露面積不大,主要為沿斷裂帶侵入的少量輝綠巖、閃長巖脈,伴有不同程度的孔雀石化。

2? 礦床特征

在帕米爾構造結中帕米爾木吉一帶已發現多處金銅等礦床(圖2),且砂金礦床發育[13],顯示出巨大的金礦成礦潛力。區域內金礦床產于下志留統溫泉溝群下段含碳酸鹽硬綠泥石絹云千枚巖建造中,與NW向展布的韌-脆性剪切帶密切相關,含金熱液沿韌-脆性剪切帶上升至硅-鈣界面有利空間沉淀而形成,顯示典型的造山型金礦宏觀地質特征。

研究區內控礦地層主要為下志留統溫泉溝群一段,巖石類型主要為綠泥絹云千枚巖夾石英巖脈,多伴有褐鐵礦化,部分伴有菱鐵礦化、孔雀石化,成果顯示此類具有菱鐵礦化和銅礦化的石英脈,多為含金石英脈,共發現有12條金礦化蝕變帶,為區內主要賦礦層位;區內韌性剪切作用強烈,巖石發生擠壓變形,常見有“S”型、“M”型扭曲褶皺、緊閉劍鞘褶皺、層間褶皺、膝折現象,由于構造應力集中,層間破碎帶發育,沿斷裂發育不同期次、規模不等、密集遍布的石英脈帶。區內巖漿巖不發育,脈巖發育,主要為石英脈,是金礦床的主要脈石礦物及含金載體,石英脈較純凈時,不含金。當石英脈中混雜有圍巖和金屬硫化物時,可形成金礦體,以褐黃色、破碎成粉末狀、糖粒狀的石英脈含金性最好。區內礦化主要有褐鐵礦化、菱鐵礦化和孔雀石化,發育絹云母化、綠泥石化等,區內礦體礦石中金屬含量較少,礦物種類較多,金屬礦物以毒砂、黃鐵礦、黃銅礦為主,次為褐鐵礦、孔雀石、銅藍、黝銅礦、斑銅礦、輝銅礦等,鏡下可見自然金,非金屬礦物以硬綠泥石、絹云母、石英為主,次為白云石、紅柱石、碳質、黑云母等。礦石屬具千枚狀構造的低級變質巖石,含特征變質礦物硬綠泥石,原巖可能為泥質巖、酸性凝灰質巖等。晚期在脆性狀態下,受動力變質作用,局部發生破碎,形成裂隙,裂隙由細碎物質充填。

3? 研究方法

3.1? 隨機森林算法概述

在機器學習中,隨機森林是一個包含多個決策樹的分類器,輸出類別是由個別樹輸出類別的眾數而定。每棵決策樹均是一個分類器,對一個輸入樣本,N棵樹有N個分類結果。隨機森林集成了所有分類投票結果,將投票次數最多的類別指定為最終輸出,是一種最簡單的機器學習領域的團體學習算法思想,隨機森林算法的過程見圖3。

3.2? 技術流程

基于隨機森林算法的礦產預測資源定量的技術流程主要包括數據收集、數據預處理、數據特征提取、預測模型建立和驗證、模型預測等過程。本次用于區域金礦定量預測的數據主要包括地質、地球化學、遙感等3類數據。首先需要對地質找礦大數據進行預處理和清洗,包括坐標轉化、空間配準、數據拼接、缺失值、重復值、異常值處理等,然后利用數據科學方法對地質找礦大數據進行特征提取,包括巖漿巖識別、有利地層提取、構造緩沖區分析、地球化學、遙感異常識別等。最后建立預測模型,并對預測模型的參數進行調整,使預測性能達到最優,再利用預測模型進行預測,最終圈定找礦靶區。

4? 預測過程及結果

進行礦產預測前,需對地質找礦大數據進行特征提取,利用mapgis進行空間分析,提取研究區金礦床空分布有關的侵入巖、有利地層、構造,在此基礎上進行緩沖區分析。針對地球化學和遙感數據,用異常提取方法進行異常識別。

4.1? 有利地層提取

根據研究區金礦床地質特征,區內控礦地層主要為下志留統溫泉溝群一段,將礦區內已發現的金礦(化)點疊加到地層上,所有礦化點均落入下志留統溫泉溝群一段中,可作為區內重要預測要素,在研究區內,利用mapgis軟件,提取出下志留統溫泉溝群一段圖層(圖4-B),供后期機器學習。

4.2? 構造緩沖區分析

緩沖區分析是據空間數據庫中的點、線、面自動地在其周圍建立一定寬度的多邊形區域。通常用于確定地理空間目標的一種影響范圍或服務范圍。研究區內斷裂走向整體為近NW向,多為逆沖斷層,韌性剪切作用強烈,中部巖石發生擠壓變形,層間破碎帶發育,沿斷裂發育不同期次、規模不等、密集遍布的石英脈帶,控制礦體產出,具明顯的導礦、容礦作用,是重要的控礦因素。在mapgis平臺,基于線要素的緩沖區,以近NW向斷層為中心軸線,距中心軸線一定距離的平行條帶多邊形,形成斷裂構造控礦有利區(圖4-A)。

4.3? 化探異常分析

選取研究區內1∶5萬水系沉積物測量原始數據進行分析,14種元素相對全疆豐度值,Ag,Sb,Cu,Zn,W,Sn,Mo等7個元素較接近,Au元素明顯高于全疆豐度值。Au元素高背景或高值區主要分布于研究區西南一帶,中部地區零星出現高背景或高值區,Au異常為主要成礦元素,密集區分布于西南角,受群層及斷裂帶控制,分布有砂金、巖金礦(化)點多處。Au異常密集區異常強度高、規模大、濃集中心明顯,分帶清晰,具“礦致異?!被咎卣?,提取Au元素含量大于1.5×10-9 區域,套和已發現的礦(化)點,具很好的包含關系,選取Au元素含量大于1.5×10-9 的區域為重要的預測要素。

4.4? 遙感蝕變信息提取

遙感蝕變信息提取是在遙感影像上以礦物光譜特征為依據,利用數字圖像處理技術提取與近礦圍巖蝕變有關的信息,遙感礦化蝕變信息的提取能夠對礦產資源的勘查及評價提供科學的參考依據。研究區金礦床為熱液礦床,區內熱液活動強烈,發育多種熱液蝕變,主要有硅化、褐鐵礦化、菱鐵礦化、絹云母化和綠泥石化等?;诠ぷ鲄^自然地理、蝕變類型和遙感科學技術方法現狀,主要采用ASTER和Sentinel2數據對工作區蝕變信息進行提取。收集購買的遙感數據時相在4~10月,盡可能減少高山積雪對研究區遙感解譯的干擾,且單景影像平均云量小于10%,輻射畸變、幾何畸變和噪聲均較小,目標地物大小、形狀、陰影、色調、紋理等標志信息突出,能夠準確反映地物各種特征。采用主成分分析法提取Sentinel2數據中的鐵化蝕變,ASTER數據中的絹云母化、高嶺石化、青磐巖化、硅化蝕變(圖5)。

4.5? 隨機森林模型預測

結合研究區金礦床的分布特征及預測數據集特點,選取網格單元法開展預測,選取150 m×150 m作為預測單元格標準,共劃分出71 466個單元格,其中含礦單元格有577個,在PYTHON軟件下,通過機器學習,最終計算出每個預測單元的成礦有利程度,確定預測單元所屬的礦產資源靶區級別,達到預測區優選的目的。

在隨機森林模型預測的基礎上,將預測區內集中的區塊進行圈定,根據木吉一帶金礦區大地構造演化、區域地質特征,依據化探異常、遙感異常和找礦概率,結合研究區目前的研究現狀及已知礦床點的類型、數量、代表性、規律等信息,對找礦靶區進行優選,并將找礦靶區劃分為A、B、C三級。其中靶區劃分標準為:A級找礦靶區為成礦條件很有利,有大中型以上金礦床分布,直接找礦信息強,找礦概率0.6~0.9;B級找礦靶區為成礦條件有利,有一定的金礦點分布,直接找礦信息較強,有一定的找礦潛力,找礦概率在0.6~0.8;C級找礦靶區為地質工作程度低,成礦條件有利,有一定的遙感蝕變異?;蚧疆惓7植?,具一定找礦潛力,找礦概率在0.4~0.6。最后,圈定找礦靶區6個(圖6):A級找礦靶區3個,B級找礦靶區遠景區2個,C級找礦靶區1個。

4.6? 靶區特征及驗證

A1靶區位于研究區西南側,找礦概率為0.8~1.0,區內成礦地質條件優越,找礦信息豐富,成礦潛力巨大,已發現闊克吉勒嘎、闊克吉勒嘎東、克熱格塔什、木吉西等金礦點,目前正在開展評價工作,有望實現中大型金礦勘查突破。A2靶區位于研究區南側,找礦概率為0.6~0.9,已發現克孜捷克金礦點,位于韌性剪切帶內,地表已發現一定規模金礦(化)體,成礦潛力好;A3靶區位于研究區最南端,區內已發現金礦化點;B2靶區找礦概率為0.6~0.8,經野外查證,圈定2條含金銅礦化蝕變帶,呈層狀、似層狀近EW向展布,地表斷續出露長1.4~1.6 m,地表寬10~14 m,有進一步工作的價值;B1、C3靶區還未查證,區內成礦地質條件良好,疊加的成礦信息較多,有良好的找礦前景。

5? 結論

(1)? 圈定找礦靶區6處,其中A級靶區3處,B級靶區2處,C級靶區1處,為區域進一步開展金礦床勘查提供了方向。

(2)? 基于隨機森林算法的機器學習,在地物化遙感多數據區域中,有較好的效果,從預測模型的AUC值得出預測精度較好(圖7),提高了預測效率,為該區域實現高效定量預測提供了依據。

參考文獻

[1] 葉天竺,肖克炎,嚴光生.礦床模型綜合地質信息預測技術研究[J].地學前緣,2007(5):11-19.

[2] 王世稱.綜合信息礦產預測理論與方法體系新進展[J].地質通報,2010,29(10):1399-1403.

[3] 趙鵬大.“三聯式”資源定量預測與評價-數字找礦理論與實踐探討[J].地球科學,2002(5):482-489.

[4] 嚴光生,葉天竺,龐振山,等.成礦地質體找礦預測理論與方法[J].地質通報,2023,42(6):857-882.

[5] 左仁廣.基于數據科學的礦產資源定量預測的理論與方法探索[J].地學前緣,2021,28(3):49-55.

[6] Zuo R G.Data science-based theory and method of quantitative prediction of mineral resources[J].Earth Science Frontiers,2021,28(3):49-55.

[7] 肖克炎,樊銘靜,孫莉,等.礦床成礦系列綜合信息預測理論方法及其應用[J].地球學報,2023(5):1-12.

[8] 王欣,白世彪.基于WOE-GA-BP神經網絡模型對陸相火山巖型銅礦成礦預測研究-以寧蕪盆地(江蘇部分)為例[J].南京師范大學學報(工程技術版),2023,23(3):67-74.

[9] 劉嘉情,鐘世華,李三忠,等.基于機器學習和全巖成分識別東昆侖祁漫塔格斑巖-矽卡巖礦床成礦巖體和貧礦巖體[J].西北地質,2023,56(6):41-56.

[10] 董賽娜,王達,馬國桃,等.機器學習在閃鋅礦微量元素特征識別鉛鋅礦床類型研究中的應用[J].成都理工大學學報(自然科學版),2023(12):1-21.

[11] 鄭孝誠,張明華,任偉.卷積神經網絡在山東金礦勘查預測中的應 用[J].物探與化探,2023,47(6):1433-1440.

[12] Robinson A C.Mesozoic tectonics of the Gondwana terranes of thePamir plateau[J].Journal of Asian Earth Sciences,2015,102:170-179.

[13] 杜亞龍,李智明,姜寒冰,等.新疆地區金礦分布特征及找礦潛力分析[J].西北地質,2016,49(1):121-134.

[14] 歐陽淵,劉洪,李光明,等.基于隨機森林算法的找礦預測-以岡底斯成礦帶西段斑巖-淺成低溫熱液型銅多金屬礦為例[J].中國地質,2023,50(2):303-330.

Gold Mine in Muji Area of Xinjiang Based on Random Forest

Algorithm-Regional Metallogenic Prediction

Hu Dongqiang1, He Fubao2, Li Hui2, Hao Yanhai2, Zhang qiang2,

Feng Changrong2, Liao Fengyun1

(1.School of Mining Engineering and Geology,Xinjiang Institute of Engineering,Urumqi,Xinjiang,830023,China;

2.The Second Geological Brigade of Xinjiang Bureau of Geology and mineral resources,Kashi,Xinjiang,844000,China)

Abstract: The Pamir tectonic junction in the western section of the Indian-Eurasian continental collision orogenic belt is located in the muji-Wuzibieli mountain pass. It is found that there are many gold-copper deposits (points), and a large number of gold deposits are developed, showing great gold prospecting potential. With the deepening of geological prospecting work in the area, a large amount of geological prospecting information has been accumulated. Mature prediction theory and method are needed to obtain the distribution location, output probability and resource potential of mineral resources in the area, so as to achieve efficient metallogenic prediction. On the basis of summarizing the geological characteristics of the gold mining area in Muji area, the regional Au element anomaly is analyzed, and various remote sensing alteration anomalies in the area are extracted. The geological-geochemical-remote sensing comprehensive prediction model is constructed, and the quantitative prediction of multi-information integration is carried out by using the random forest algorithm. Based on the random forest algorithm to quantitatively predict the probability of prospecting, combined with the current research status of the study area and the type, quantity, representativeness and regularity of known ore deposits,the prospecting target areas are optimized, and three A-level prospecting target areas are delineated. Two B-level prospecting target areas and one C-level prospecting target area. The machine learning based on random forest algorithm has better prediction accuracy and improves the efficiency of prediction in the multi-data area of geophysical and geochemical remote sensing, which provides a basis for efficient quantitative prediction in this area.

Key words: Metallogenic prediction; Gold deposits; Random forest; Machine learning

項目資助:新疆地質局自籌資金項目、克州戰略性礦產資源成礦規律與找礦靶區優選(XGMB202363)資助

收稿日期:2023-11-16;修訂日期:2024-01-12

第一作者簡介:呼冬強(1988-),男,陜西延川人,副教授,碩士,現主要從事成礦規律與成礦預測研究和教學工作;E-mail: hdq@xjie.edu.cn

通訊作者:何福寶(1985-),男,高級工程師,學士,現從事礦產勘查相關工作;E-mail: 28130924@qq.com

猜你喜歡
隨機森林機器學習
隨機森林在棉蚜蟲害等級預測中的應用
基于二次隨機森林的不平衡數據分類算法
拱壩變形監測預報的隨機森林模型及應用
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
前綴字母為特征在維吾爾語文本情感分類中的研究
基于隨機森林算法的飛機發動機故障診斷方法的研究
基于支持向量機的金融數據分析研究
機器學習理論在高中自主學習中的應用
基于隨機森林算法的B2B客戶分級系統的設計
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合