?

基于集成遷移學習的機械鉆速預測①

2022-11-07 09:08楊順輝郭珍珍張洪寶高明亮
計算機系統應用 2022年10期
關鍵詞:鉆井實例權重

楊順輝,郭珍珍,張洪寶,高明亮

1(中國石油化工股份有限公司 石油工程技術研究院,北京 100101)

2(西南石油大學 計算機科學學院,成都 610500)

3(西北民族大學 電氣工程學院,蘭州 730124)

近代工業革命后,能源成為了人類社會生活中賴以生存生活的重要構成部分.石油資源被稱為“工業的血液”[1],不僅是一種不可再生的資源,更是國家生存和發展不可或缺的戰略資源,是當今世界各國的經濟命脈.石油的形成過程極其復雜緩慢,不可再生的石油資源就變得十分關鍵.伴隨著經濟社會的快速發展,帶動著自然資源的消耗也逐年增大,對石油、天然氣等自然資源的使用急劇增長[2].全球從陸地到海洋,從淺層到中層、再到深層的勘探來滿足日常的生活需求.經過長達多年來的石油勘探,我國在淺層和中層的石油儲量已經基本勘探清楚,剩下不多井正在開采.然而,這已遠遠無法滿足社會需要[3].同時,由于實際鉆井過程施工情況復雜,工況變化多樣,獲取的錄井參數環境呈現出明顯的非平穩性,并且采用人為的方式獲取錄井參數成本昂貴,影響因素極多難以考慮完全,鉆井效率受到嚴重的影響.因此,如何提高鉆井效率、提升鉆井速度是當今國內外研究的熱點課題[4].

在鉆井工程中,鉆頭鉆破巖石加深鉆孔的速度稱為機械鉆速.機械鉆速是反映鉆井效率的一個關鍵指標,受到鉆頭尺寸、鉆井參數、巖石巖性等諸多因素的影響和制約[5],它與開采成本、開采時間有著直接關聯[4].鉆速預測對于鉆井參數的確定和鉆井成本的優化是必要的.鉆井機械鉆速的準確預測,能夠有效地估算鉆井周期,從而根據預測結果優化配置資源,可以減少鉆井開采成本、增大石油產量,這對于企業降低鉆井施工成本、減少鉆井風險,對于國家能夠解決能源緊缺問題等有著重大意義.

隨著大數據技術的飛速發展以及數據規模的急速增長,采用機器學習的方法對數據進行挖掘并應用到鉆井過程當中,與基于物理模型的方法相比,機械鉆速的預測精度有著顯著的提高.傳統的機器學習方法通常建立于數據獨立同分布這一假設之上[6],然而在實際鉆井過程中,不同的油田信息具有明顯不同的模式,現有的機器學習方法使用已鉆井數據預測新油田時,預測精度顯著下降,如何高效地進行機械鉆速預測并將其應用于后續各種油田處理在石油領域中面臨著長期的挑戰.優秀的網絡模型皆是基于大量標注數據集(如COCO、ImageNet)訓練得到,然而實際應用中高質量且具有標簽的大型井下數據集資源匱乏,難以支撐優秀網絡模型,可能產生嚴重的過擬合問題.遷移學習不受訓練數據集與目標數據之間關系的約束,能夠根據不同任務之間的相似性,實現源域的已有知識遷移,可有效解決過擬合問題.目前,遷移學習方法已經在鉆井工程中的巖性識別、鉆頭選擇、異常工況檢測等多種場景得到了廣泛的應用[7].針對鉆井過程中機械鉆速預測這一回歸問題,本文以真實歷史鉆井數據鉆頭尺寸、鉆壓等字段為特征,以機械鉆速為標簽,采用將遷移學習與物理模型相結合的方法,提出一種基于集成遷移學習的機械鉆速預測模型.實踐中,采用真實鉆井數據,嘗試了包括linear regression (線性回歸)[8]、傳統的AdaBoost 回歸、只有目標域數據進行訓練和幾種先進的基于特征與基于實例的遷移學習方法[9]等建模方法,采用多種回歸評價指標衡量模型的性能,證明了本文提出的方法進行跨領域機械鉆速預測的有效性,鉆速預測精度也得到顯著提高.

1 相關工作

在鉆井過程中,提速提效是永恒不變的追求目標.機械鉆速(ROP)的準確預測可顯著縮短鉆井作業時間,節約鉆井成本.機械鉆速受到多種因素的影響和制約,有可控因素和不可控因素[10].可控因素是指通過一定的設備和技術手段可進行人為調節的因素,如地面機泵設備、鉆頭尺寸、鉆井液性質、鉆壓、轉速.不可控因素是指客觀存在的因素,如所鉆的地層巖性、儲層埋藏深度以及地層壓力等.針對機械鉆速預測,其研究進展大體可以分為3 個階段: 用現場數據直接統計出鉆速方程,考慮所鉆地層性質和鉆頭結構的鉆速方程,用計算機仿真方法來預測機械鉆速.

1.1 傳統方法

國內外學者都提出了各自與地層特性和鉆頭結構性質相關的鉆速方程.1974年,Bourgoyne 等[11]將機械鉆速視為鉆頭壓力、轉速等8 個參數的函數,但該方法存在局限性,只適用于牙輪鉆頭情況.2008年,Rastegar 等[12]在前人的基礎上提出改進的ROP 預測模型,同時考慮了鉆頭水力參數、鉆頭的磨損情況和巖石強度等因素的影響.傳統的物理建模方法給機械鉆速預測帶來了可見的影響,但方法大多根據專業知識經驗,建模方法高度依賴于巖石巖性,模型泛化性能不佳.且由于校準需要進行不斷變化,從而限制了其函數的形式.隨著大數據和機器學習的迅速發展,很多學者開始將機器學習方法應用到機械鉆速預測方面.2004年,Rommetveit 等[13]提出了一種新型的鉆井自動化模擬系統,通過對比實測數據和預測數據得到鉆井過程中的實時診斷結果,但是該系統還處在功能設想階段,目前尚未實現全部功能,且考慮的ROP 影響因素較少; 2008年,Bahari 等[14]基于文獻[11]提出的模型井結合遺傳算法計算了機械鉆速預測模型參數,但該研究只對ROP 進行了計算預測,并沒有作進一步的優化分析.在數據量較充足、數據質量較高的條件下,采用多元回歸[15]等機器學習方法構建的預測模型的預測準確度較高,能夠在當前設備和資源條件下準確找尋影響機械鉆速的若干個核心因素.

傳統的機器學習方法大多借助監督學習的推動,依賴于已有數據,即需要足夠多的標注好的訓練樣本進行學習,在數據樣本稀少的場景下,性能會顯著下降.對新領域執行機器學習常遇到標注稀缺問題,獲取大量標注數據成本較高且耗時,嚴重制約了經典監督學習方法的效果.同時,伴隨著多領域、多媒體大數據的不斷涌現,如何研究自動方法對其進行跨領域分類和組織變得愈加重要[16].在機器學習的領域中,已經開發了許多用于遷移學習的方法,通過將在源數據上的預訓練模型遷移到感興趣的目標數據上,遷移學習思想被證明是更具有普遍有用的.遷移學習放寬了經典監督學習中關于訓練數據和測試數據服從獨立同分布這一基本假設,將相似但具有不同分布的源域和目標域數據映射到同一個特征空間,盡可能地保留映射后數據的屬性同時縮小數據的維度,最小化兩個領域的概率分布差異.當源域和目標域數據來自不同的分布時,通常采用領域分布自適應(domain adaptive,DA)算法[17]來彌補分布差異.

1.2 深度學習

近年來,深度學習方法在計算機視覺中取得了令人矚目的成功.劉勝娃等[18]結合人工神經網絡技術領域知識,提出一種基于人工神經網絡的定向井機械鉆速預測模型,該模型在數據量充足的情況下,預測準確性較高.文獻[19]通過建立渤中區域深層機械鉆速預測神經網絡模型,能夠在當前特定區域條件下準確找尋影響機械鉆速的若干個核心因素.目前使用的深度網絡模型假設訓練數據和測試數據為相同的分布,然而在實際鉆井過程中,訓練數據和測試數據的分布往往并不相同,高質量且具有標簽的大型井下數據集資源匱乏,難以支撐優秀的深度網絡模型,這導致訓練得到的模型魯棒性能較差.遷移學習不受源域數據與目標數據之間關系的約束[9],對于缺乏標記數據的目標任務,有很強的動機來構建有效的學習者,利用來自相關源域的豐富標記數據,將已訓練好的模型參數遷移到新模型進行訓練.研究表明,先前對象的認識與新對象的相似性和聯系,有助于新對象的學習.在特定數據集或任務上訓練的CNN 模型可以針對不同領域的新任務進行微調.

隨著深度學習在各個領域的廣泛應用,大量的深度遷移學習[20]方法被提出.深度遷移學習(deep transfer learning,DTL)通過將深度學習與遷移學習相結合,將輔助領域訓練的深度模型重用于目標領域,能夠有效地降低模型的訓練時間,使現有數據得到更充分的利用,提高深度網絡在實際應用中的泛化能力.對比傳統的非深度遷移學習方法,深度遷移學習方法在不同的學習任務上得到一定的提升.神經網絡體系結構基于豐富標記的源域數據和標注缺失的目標域數據進行訓練,根據目標任務進行結構調整,經過目標數據的再次訓練,形成最終的目標網絡,能夠有效地促進特征的出現.若此目標網絡優于未經遷移的網絡,則該遷移為正遷移,反之則為負遷移[7].

2 基于集成遷移學習的機械鉆速預測方法

2.1 問題定義

在遷移學習當中,包含兩個基本的概念,分別是領域(domain)和任務(task).領域D是進行知識學習的主體,主要有數據以及生成這些數據的概率分布P所組成[21].在遷移學習中對應兩個基本的領域,分別是源領域(source domain,Ds)和目標領域(target domain,DT).源領域是指有知識、有豐富數據標注的領域,屬于遷移對象.目標領域就是需要最終賦予知識的對象,一般來說,目標領域當中大部分都是未標注數據.任務T指的是學習的目標,由標簽和標簽對應的函數組成.遷移學習旨在從一個或多個源領域中提取知識,并將知識應用于目標任務當中.

給定一個有標簽的源域數據Ds=和一個無標簽的目標域DT=.兩個領域的數據概率分布P(xs)和P(xt)不同,即P(xs)≠P(xt).遷移學習的目標就是要借助源域DS的先驗知識來學習目標領域DT的知識(標簽)[22].

假定源域和目標域的特征空間和樣本空間分別相同,即XS=XT且YS=YT,但兩個領域的特征分布不同,即存在條件概率分布不同QS(ys|xs)≠QT(yt|xt)或者邊緣分布不同PS(xs)≠PT(xt).領域自適應就是源域和目標域不一樣,具體來說,兩個領域的數據概率分布不同,但是兩個領域共享相同的特征和類別,其維度是一致的[17].此刻,遷移學習的目標就是利用有標記的數據來學習一個分類器f來預測目標領域xt.

2.2 鉆前機械鉆速預測模型簡介

集成學習是通過將許多弱分類器進行集成提升為強學習器的過程[23].一般來說,用得比較多的是同質學習器,即同質集成中的個體學習器屬于同種類型.同質學習器根據基學習器之間是否存在依賴關系分為Boosting 系列算法[24]和隨機森林系列算法.AdaBoost 作為提升算法(Boosting)的一種,根據基學習器的學習誤差率來更新訓練樣本的權重值,增加學習誤差率高的訓練樣本權重,再基于調整樣本權重后的訓練集訓練基學習器,不斷調整基學習器的權重,將這些弱學習器進行線性組合形成一個強學習器,進而達到提升整體準確率的效果.算法的性能通過“少數服從多數”這一方法進行投票決出結果.隨著集成中基學習器數目的不斷增加,集成的錯誤率將指數級下降,最終將趨于0.

基于Boosting 的遷移學習算法,也稱為TrAdaBoost算法,是由Dai 等[25]提出的一種典型遷移學習算法.TrAda-Boost 算法假設源領域和目標域數據具有完全相同的特征與標簽空間,但兩者的數據分布不同.將源域數據與部分目標域數據整合得到訓練實例,由于源域與目標域之間的分布差異,源域數據樣本可能會對目標任務的學習有利,有可能沒有,甚至有可能有害.TrAdaBoost 算法通過對訓練實例賦予權重,增加被錯誤分類的目標實例的相對權重[26].當源實例被錯誤分類時,降低其權重值,具體來說,就是給數據乘上一個0 到1 的值.在下一次分類,被錯誤分類的樣本對分類模型的影響就會比上一次迭代小一些.通過這種方式,TrAdaBoost 旨在識別和利用與目標數據最相似的源實例,而忽略那些不相似的實例.TrAdaBoost 算法模型具體描述如圖1.

圖1 TrAdaBoost 模型架構圖

2.3 帶物理模型約束的集成機械鉆速回歸模型

將鉆井數據看作連續的,在統計學上稱為回歸問題.結合TrAdaBoost 的原理與傳統的回歸算法產生了新的回歸算法TrAdaBoostR2[27].作為一種基于樣本實例的遷移學習方法,TrAdaBoostR2 對每個訓練實例進行加權,確保遷移的源域知識與目標任務相關.然而,當源域樣本數遠大于目標域時,目標實例的總權重可能需要多次迭代才能接近源實例的總權重,此時目標數據的權重可能會嚴重偏斜,那些異常值或與源數據最不相似的目標實例可能會代表大部分權重[28].其次,即使是那些代表目標概念的源實例,它們的權重最終也趨于零.

基于Bingham (1965)提出的基本ROP 模型[29],已知轉速(ROP)、鉆頭壓力(RPM)和鉆頭直徑(Db)等參數,可以通過式(1)計算得到機械鉆速的預測值.其中,α 和γ 為巖性模型的經驗參數:

物理模型雖然源自鉆井物理原理,但是涉及經驗參數和擬合函數的約束,這常常會導致較差的結果.為了克服上述缺點,選擇基于樣本實例遷移方法TrAda-Boost.R2 作為基礎,提出一種帶物理模型約束的集成遷移學習方法,分兩個階段對樣本實例進行調整.算法在第一階段,源實例的權重逐漸向下調整,直到達到某一個值(該值采用交叉驗證確定得到); 在第二階段,首先對所有源實例的權重凍結,而目標實例的權重在Ada-Boost.R2 中被正常更新,只有在第2 階段生成的假設被存儲并用于確定結果模型的輸出.

假定存在n個源域訓練數據DS1,···,DSn,m個用于訓練的目標域數據DT1,···,DTm,遷移學習的目的就是充分利用有標記的源域數據來提高目標分類器fT的學習效率.首先,定義第h次迭代訓練實例的權重向量,其中,wS表示源域數據樣本實例的權重,表示目標域數據用來訓練的m個樣本權重向量.初始化權重為:

清空候選基學習器并對現有的權重進行規范化,選擇基學習器ft對訓練集Dtrain=DS∪DT-train進行訓練.為了保證模型不會因為目標實例劃分成訓練集和測試集而造成誤差,采用十折交叉驗證.將目標領域數據集隨機劃分10 份,隨機選擇其中一份作為測試集,剩下的9 份與源實例進行整合作為訓練集進行實驗,依次進行10 組實驗.同時,采用Bingham 提出的基本ROP 模型對算法進行物理約束,采用式(3)計算基學習器ft在DT-test上的誤差值,選取平均絕對誤差最小的用于后續模型.

其中,(ytp)j表示采用物理模型(即式(1))計算得到的ROP值,ytj表示目標域數據的真實標簽值,(fti)k表示第i個基分類器進行k折交叉驗證預測得到的ROP值.根據誤差估計來更新訓練樣本實例的權重值,誤差越大,其權重設置越小.對其進行S次迭代,并對權重進行更新,Zt是一個歸一化的常量,使得最終目標實例的權重為

對源實例的權重更新采用加權多數算法(即WMA[27])機制,第2 階段首先對所有源實例的權重凍結,采用Bootstrap 對觀測信息進行多次重復抽樣,建立起充足的樣本,采用基學習器對取樣的樣本進行預測,并計算損失函數,采用TrAdaBoostR2 來更新目標實例的權重向量,最后對權重進行規范化處理,生成的模型被存儲并用于確定結果模型的輸出.

本文選用決策樹回歸(decision tree regressor)算法[30]作為基學習器進行集成遷移回歸,對模型參數進行調整,不斷更新模型權重.在模型優化問題中,通過計算真實值與預測值的平均絕對誤差(mean absolute error,MAE)作為模型性能的一個衡量指標.平均絕對誤差作為回歸損失函數中常用的誤差計算,通過計算預測值與真實值之間差值絕對值和的均值,可以有效地避免誤差相互抵消,因而可以較準確地反應實際預測誤差的大小.其中,ypred表示模型最終的預測值,yi表示相應的實際值.

本文提出了一種帶物理模型約束的集成遷移回歸模型來對鉆前機械鉆速進行預測,算法具體描述如算法1.

算法1.基于集成遷移回歸的機械鉆速預測算法輸入: : 源域數據集; : 目標域數據集err DsDT輸出: : 平均絕對誤差MAE 值1. 初始化源域數據集,目標域數據集;fT Ds=[ns×ms]DT=[nT×mT]2. 確定基學習器 為決策樹回歸算法;feature=D[:,1:m-1] label=D[:,-1]3. ;4. 采用One-Hot 和Z-score 標準化對數據集進行預處理;Dtrain Dtest 5. 將目標域劃分為訓練集和測試集: 和;nestimatorS K=10 6. 確定最大估計次數,步驟數,;W1i =1/(n+m)7. 初始化權重為;8. for do D←(Dtrain+Ds)i=1→S 9.10. 清空候選基學習器,對現有權重進行規范化;model 11. 采用TrAdaBoostR2 進行訓練得到模型;j=1→K 12. for do Dj train=(DS+DT-train)13.14. //對用于訓練的目標實例進行權重更新Dj trainDT-test 15. 采用TrAdaBoostR2 對進行訓練并計算的預測值;16. 采用式(3)計算誤差估計;Wi(j+1)17. 采用式(4)更新權重;18. 確保目標實例總權重不隨交叉分割而改變;19. end for X 20. 采用Bootstrap 對 進行多次重復采樣;21. 使用基學習器更新目標實例的權重向量;Wi 22. 返回樣本權重 ;23. end for W*24. 得到最優的樣本權重 ;ypred=model(fT,W*)25. 計算目標域數據的預測值;26. 采用式(5)計算預測值與真實值的誤差值 ;err err 27. 返回 .

3 實驗分析

3.1 實驗設置

本論文采用的數據集共包括156 次測量,這些測量是從特定區塊的26 口S 井和3 口WD 井收集得到的歷史鉆井數據.實驗數據具體描述如表1,每個樣本數據包含斜深(depth)、鉆壓(wob)、大鉤載荷(hook_load)、泵壓(spp)、轉盤轉速(bit_rpm)、泵排量(flow_rate)、扭矩(torque)、地層類型(formation)、鉆頭類型(bit_type)、鉆頭尺寸(bit_size)、巖性類型(lith)等51 個特征參數和1 個機械鉆速(ROP)樣本標簽.通過對數據進行預處理操作,有效保留數據樣本在各個維度上的信息分布.同一口井有多次測量,其測量結果是連續的,為了保證井口數據的完整性和獨立性,將同一鉆井數據作為一個整體,目標域共有3 口井數據,分別是WD1、WD2 和WD3,采用交叉驗證進行模型預測,通過隨機選擇目標域數據將其與源域數據整合作為訓練集,剩下的鉆井數據作為測試集樣本.

表1 實驗數據介紹

本文使用51 個特征參數作為機械鉆速預測模型的輸入,由于數據集中的字符類型特征無法被機器模型學習,因此在建模時需要將其轉化成易于機器利用的數值型特征.獨熱編碼(one-hot)用N位狀態寄存器來對N個狀態進行編碼,從而將類別變量轉換為數值變量,由于one-hot 編碼后的特征值只有0 或1,因此采用該方法不會影響原類別特征在模型中的權重比例.采用獨熱編碼進行數據類型轉換會將數據維度擴大,為了進一步排除數據集維度擴大對實驗的影響,再對其采用主成分分析[31]對數據維度進行降維.同時,利用原始數據的均值和標準差對其進行標準化,使處理后的數據符合標準正態分布.數據的標準化處理能夠有效地提升模型精度,加快訓練網絡的收斂性.Z-Score標準化對樣本數據在不同特征維度進行伸縮變換,使得不同度量之間的特征具有可比性,并且不會改變原始數據的分布,通過將不同量級的數據轉化為統一量級的Z-Score 分值進行比較,能夠在特征提取時有效保留樣本各維度上的信息分布.Z-Score 標準化的數學表達如下,其中 μ,σ表示原始數據的均值和標準差.

采用決策樹回歸模型作為該模型的弱學習器,同時對模型參數進行調整,得到具體參數設置如表2,其中,n_estimators 表示的是迭代次數,也就是本次實驗中采用弱學習器的個數; learning_rate 表示學習率;steps 表示的是步驟數; folds 表示的是交叉驗證的折疊次數; max_depth 表示的是每一個學習器的最大深度,用于限制回歸樹的節點數目.

表2 模型參數的選擇

3.2 結果分析

對預處理后的數據進行模型訓練與驗證.根據領域特點,采用交叉驗證對模型進行訓練與預測,通過對目標域WD 數據中隨機選擇一份作為測試集,剩下兩口井與源域數據整合用于模型訓練,使用線性回歸、物理模型作為基線方法,同時,為了驗證該模型的有效性并保證實驗的嚴謹性,采用傳統的AdaBoostR2 (即沒有采用遷移學習)模型與基于集成遷移學習的機械鉆速預測方法進行實驗對比.通過對模型參數的不斷調節,得到WD1、WD2 和WD3 作為測試集下基于集成遷移學習的機械鉆速方法的MAE 值分別為1.476 04、0.826 26 和0.857 51.本文模型算法的性能在表3 以數字方式進行描述,在圖2 中以圖形方式展示.

表3 該模型算法的性能對比

以WD3 作為測試集為例,得到該實驗設置下線性回歸、物理模型、AdaBoostR2 和本文提出算法預測值與真實ROP 值的對比圖.很明顯,從圖2 中可以看到,基于集成遷移學習的機械鉆速模型大大降低了模型的誤差值.與傳統的AdaBoostR2 方法相比,基于集成遷移學習的機械鉆速預測方法在對峰值進行預測時更接近真實值.具體來說,本文方法在3 種實驗設置下的性能分別提升0.877 36、-0.077 11 和0.040 2.同時,該模型下的MSE 值也得到了提升,較傳統的Ada-BoostR2 模型MSE 值降低了3.003 6.

圖2 WD3 做測試集下預測值與真實值對比圖

3.3 對比實驗

對實驗數據進行同類型操作處理,設計并進行對比實驗.本文選擇了6 種先進的機器學習方法用于驗證本模型方法的有效性.領域自適應(DA)方法通過在一個領域上學習的知識遷移到另一個領域上,自適應方法分為基于特征的自適應、基于實例的自適應和基于參數的自適應方法.本文分別選用3 種基于實例的方法(KMM[32]、KLIEP[33]、TrAdaBoostR2[27])和3 種基于特征遷移的方法(DANN[34]、DeepCORAL[35]、MDD[36])用于進行實驗對比.同時,添加直接采用目標域數據進行訓練(即TgtOnly)作為基線方法.

在實驗設置上,為了保證井口數據的完整性和獨立性,以井為單位選取部分目標域數據與源域數據合并一起進行訓練,剩下的目標域作為測試集,這樣達到交叉驗證的效果.將本文提出的基于集成遷移學習的機械鉆速預測方法與其他方法進行性能對比,得到實驗結果如表4.采用TgtOnly 分別對WD1、WD2、WD3 進行機械鉆速預測,計算預測值與真實值的最大均值誤差MAE 值分別為9.341 4、3.739 9 和6.632 3.領域自適應方法通過將一個領域上學習的知識遷移到另一個領域上,其性能遠遠好于TgtOnly.同時,采用傳統的TrAdaBoostR2 進行對比驗證,得到本文提出的模型效果明顯改善.實驗表明,本文提出的基于集成遷移學習的機械鉆速預測模型擬合效果最佳,算法的性能遠遠好于其他幾種先進的領域自適應方法,具有較好的魯棒性能.在以WD2 作為測試集中,MAE 值減小到0.826 3,相較于這里面最優的方法KMM 誤差減小了1.387 2,性能提升了1.68 倍.

表4 本文方法與其他方法的性能對比

在以WD2 為測試集中,得到本文方法與其他幾種主流機械鉆速預測方法在目標域數據預測的機械鉆速值與真實ROP 的對比圖(圖3),從圖中可以清晰地看到,本文算法預測得到的機械鉆速值與真實標簽值具有良好的一致性,誤差值遠遠小于其他幾種主流的機械鉆速預測方法,能夠為模型提供相對穩定的效果.

圖3 本文方法與其他機械鉆速預測方法在WD2 上預測值與真實值對比圖

為了更直觀進行實驗對比,分別計算本文方法與其他幾種機械鉆速預測方法的決定系數(R2)、均方根誤差(RMSE)、均方根相對誤差(RMSRE)和平均絕對百分比誤差(MAPE),多種回歸評價指標的對比結果如圖4 所示.圖4 的結果表明,本文方法的R2值為0.868 6,RMSE 值為0.999 7,RMSRE 值為0.291 1,MAPE 值為17.67%,在多種評價指標中性能最優.同時圖4 也顯示結合遷移學習的機械鉆速預測方法相較于不使用遷移學習的方法(TgtOnly)性能有明顯的提升.

圖4 WD2 數據集上各種方法多種回歸評價指標圖

4 結論與展望

本文提出了一種結合物理模型和遷移學習的鉆前機械鉆速預測方法,能夠在目標油田數據樣本缺失或標注的數據樣本較少的情形下更準確地預測機械鉆速.本文方法結合機械鉆速物理模型,通過遷移學習識別并利用與目標數據相似的源實例,確保遷移的知識與目標任務相關.實驗表明,本文方法機械鉆速預測值與實際值之間具有良好的一致性,與幾種主流機械鉆速預測方法相比,在多種回歸評價指標中性能最優.鉆前機械鉆速的準確預測能給施工現場提供高效有力指導依據,為進一步有效地提高鉆井效率提供可靠的保障.

猜你喜歡
鉆井實例權重
權重望寡:如何化解低地位領導的補償性辱虐管理行為?*
權重常思“浮名輕”
權重漲個股跌 持有白馬藍籌
中國建成全球最大海上鉆井平臺
浮式鉆井平臺將迎來史上最大拆解潮
未來2年將有超過100座鉆井平臺報廢
各省輿情熱度榜
振華重工研制國內首個鉆井VFD控制系統
完形填空Ⅱ
完形填空Ⅰ
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合