?

基于雙向長短期記憶循環神經網絡和條件隨機場的鉆井工況識別方法

2023-04-08 13:12王海濤王建華邱晨毛金濤李輝
石油鉆采工藝 2023年5期
關鍵詞:鉆具雙向正確率

王海濤 王建華 邱晨 毛金濤 李輝

關鍵詞:鉆井工況;智能識別;雙向長短期記憶循環神經網絡;條件隨機場;深度學習

0 引言

當前,國內鉆井工況識別主要通過基于機理模型與現場鉆井作業人員判斷的方式進行識別,具有一定主觀性與滯后性。國內外主要是運用大數據和機器學習[1]對鉆井故障進行預測及預防或研究相關理論問題,近年來對鉆井工況識別的研究開始逐漸增多。2019 年,孫挺等[2]基于支持向量機模型識別倒劃眼、接立柱、下套管、下鉆及旋轉鉆5 種工況。2020 年候欣欣等[3]通過數據清理、樣本標定,采用基于人工神經網絡的技術識別9 種常見鉆井工況,包括接單根、起鉆、下鉆、正劃眼、倒劃眼、循環、旋轉鉆進、滑動鉆進和其他。郭長杰等[4]深入分析了國內油氣行業機器學習的應用場景,并從大數據分析等角度提出了油氣公司應用機器學習技術的建議。Ben 等[5]指出由于頂驅振動,僅根據地面轉盤轉速很難將“旋轉鉆進”和“滑動鉆進”2 種鉆井工況分類,而機器學習模型遠優于基于規則的計算模型。Oliveira 等[6]通過建立自動鉆井工況識別方法和計算鉆井時效關鍵績效指標,發現鉆井過程中的不可見損失時間。Coley[7]開發了新設備,以報告整個鉆井作業中的非作業時間,并研發了基于監督機器學習的常見鉆井工況分類引擎。鉆井現場工況類型繁多,鉆井工況的業務邏輯復雜,要想實現更多種類的工況識別,獲取不同工況下的實時數據做進一步研究,需解決各工況多條件判斷的業務邏輯模型,還要解決工況之間的邏輯沖突問題,這是多工況識別技術的開發難點所在。因此,采用近年來熱門的人工智能算法[8],基于雙向長短期記憶神經網絡加條件隨機場建立了鉆井工況實時智能識別模型,精準進行鉆井工況識別[9]。

1 鉆井工況識別模型人工智能算法優選

錄井工程會對鉆機各項參數進行傳輸與記錄,其數據的特點是具有實時性、數據特征變換規律性、鉆機動態邏輯性,基于以上特性,選取3 種人工智能算法進行優勢對比,優選出鉆井工況智能識別模型的人工智能算法[10]。

決策樹算法工況識別模型[11]是由決策點、策略點及輸出結果構成的模型,以最大收益值或最低期望作為決策準則,求解在不同條件下各類數據的效益值,通過比較輸出識別結果。但該方法適合對識別結果進行精準度校正,對復雜多變的鉆井工況識別正確率不高[12]。

ANN 全連接神經網絡[13],是機器學習和認知科學領域中一種模仿生物神經網絡的結構和功能的數學模型,對一組輸入信號和一組輸出信號之間的關系進行模擬。全連接神經網絡可以用來解決回歸任務、預測任務和分類任務,通過設置深層次的網絡模型可以取得很好的擬合效果,但不適合處理時序性較強數據,因此不適合進行鉆井工況智能識別。

BiLSTM+CRF[14],其計算是基于細胞狀態中信息遺忘和新信息輸入,實現時序性計算信息從前到后與從后到前的雙向信息捕捉,并引入遺忘門、輸入門、輸出門,對雙向時刻的信息遺忘、記憶、輸出進行控制,同時添加CRF 層,計算輸出序列的條件概率分布,用以糾正錯誤識別結果,提高識別精度。雙向長短期記憶循環神經網絡如圖1 所示。

圖1 中x 是某一時刻的輸入特征,對應的y 是該時刻的鉆井工況識別結果?;谏鲜? 種人工智能算法的優勢分析,研究優選雙向長短期記憶神經網絡和條件隨機場作為鉆井工況識別模型的算法,開展后續研究。

2 樣本數據預處理

2.1 錄井綜合實時數據特征參數

錄井綜合數據的參數種類繁多,可分為鉆井參數、鉆井液參數、氣測參數共3 種類型,具體分類及內容見表1。若將錄井綜合數據一并納入模型進行訓練,會導致模型過于復雜,既增加模型訓練難度,又可能影響模型輸出效果。

鉆井液參數、氣測參數是反映鉆井液性能與地層氣狀態特征的參數,與鉆井工況特征相關性差。而鉆井參數中井深、鉆頭位置、大鉤高度、大鉤載荷等9 個參數,與鉆井工況特征密切相關[15]。如復合鉆進時,井深與鉆頭位置相等,且逐漸增加,大鉤高度逐漸降低,鉆壓、轉速、扭矩、排量、立管壓力均不為0。這說明不同鉆井工況下,9 個鉆井參數的特征具有特定規律,故本次選取錄井綜合數據中的井深、鉆頭位置、大鉤高度、大鉤載荷、鉆壓、轉速、扭矩、排量、立管壓力9 個鉆井參數作為特征參數進行模型訓練。

2.2 樣本數據收集與處理

鉆井工況的人工識別方式,是通過錄井綜合實時數據的特征變換規律及現場求證方式進行識別。邀請鉆探企業錄井專家,結合工況人工識別邏輯,對錄井綜合實時數據進行特征標注。下面介紹工況的人工識別邏輯。

鉆進時,鉆頭切削地層,井深隨之增加,鉆頭位置與井深時刻保持一致[16];轉速數據特征取決于鉆進類型,如滑動鉆進,轉速為0,復合鉆進,轉速大于0;扭矩數據特征與鉆進類型同樣相關,如滑動鉆進,地面扭矩為0,如復合鉆進,地面扭矩大于0。鉆進類工況具體識別邏輯見表2。

活動鉆具時,鉆頭位置小于井深,鉆壓理論上為0?;顒鱼@具分上提下放鉆具與劃眼[17],上提下放鉆具時鉆柱無旋轉,轉速為0,劃眼時鉆具旋轉,轉速大于0;活動鉆具時,大鉤載荷大于空大鉤載荷;活動鉆具時鉆柱上提下放交替進行,大鉤高度變化趨勢不定?;顒鱼@具類工況具體識別邏輯見表3。

鉆具位置暫停時,鉆機主要為坐卡、靜止工況類型。鉆頭位置小于井深;靜止或坐卡時鉆柱無旋轉,轉速為0;靜止或坐卡時鉆機不循環,則排量為0,立壓為0。鉆具位置暫停類工況識別邏輯見表4。

結合現場求證結果可總結鉆進類、活動鉆具類、鉆具位置暫停類3 種類型的鉆井工況人工識別邏輯,其中鉆進類總結工況類型有復合鉆進、滑動鉆進,活動鉆具類總結工況類型有上提鉆具、下放鉆具、開泵上提鉆具、開泵下放鉆具、上提干劃眼、下放干劃眼、上提開泵劃眼、下放開泵劃眼、起鉆、下鉆、短起鉆、短下鉆;鉆具位置暫停類總結工況類型有坐卡、靜止、原地循環、旋轉循環、空轉、空井,共可識別鉆井工況共計20 種。表2、表3、表4 給出了部分典型工況的人工識別邏輯,其余工況的人工識別邏輯與此類似,讀者可參考總結歸納。

基于不同工況的人工識別邏輯,對塔里木油田滿深區塊10 口井的錄井綜合實時數據進行工況人工劃分[18],得到模型訓練樣本數據共1 209 533條,第1~7 口井的樣本數據為訓練集(853 246 條),第8~10 口井的樣本數據為測試集(356 287 條)。

3 雙向長短期記憶循環神經網絡和條件隨機場架構設計

3.1 遺忘門、輸入門、輸出門設計

雙向長短期記憶循環神經網絡單元可通過設計遺忘門、輸入門、輸出門進行信息存儲的取舍判斷[19]。通過遺忘門設計選取舍棄與保存的數據信息,通過輸入門設計用于更新細胞狀態,通過輸出門設計用來確定下一個隱藏狀態的值,將新的細胞狀態和新的隱藏狀態輸送至下一序列中。

3.2 CRF 層設計

BiLSTM 模型的輸入是上層的輸出向量,輸出是該時刻的預測工況標簽,在獨立使用BiLSTM 模型時,模型可以通過計算標簽識別分數,選取識別分數最高的標簽進行預測標簽的輸出,但該模型可能存在識別錯誤的可能,例如“上提鉆具”工況之后不能自動識別為“坐卡”工況,這需要對鉆井工況的前后組合條件進行約束,通過CRF 層設計來對鉆井工況前后組合條件進行約束。

CRF 即條件隨機場模型,善于通過鄰近標簽的關系獲取最優預測序列,適合用于計算某個序列中的最優聯合概率。該模型優化的是整個序列,而不是將每個時刻的最優解拼接起來, 在這一點上CRF 要優于LSTM。故本方法采用CRF 對BiLSTM的輸出進行解碼,得到優化后的鉆井工況智能識別結果[20]。鉆井工況智能識別模型如圖2 所示。

在設計CRF 層的損失函數時,設置發射得分、轉移得分2 種得分類型。發射得分從BiLSTM 層獲取。如圖2 所示,x1 為時刻1 的9 項輸入特征參數組成的向量,經過正向LSTM 層,得到一個與20 種鉆井工況對應的20 維向量輸出,每一維的值對應一種鉆井工況在此時刻的預測得分。再經過反向的LSTM 層,也得到一個對應各種鉆井工況的預測得分。正向LSTM 層的預測得分除了受當前輸入參數的影響,還受前面各時刻輸入參數的影響;反向的LSTM 層的預測得分則受當前時刻和后面各時刻輸入參數的影響。將正向LSTM 層和反向LSTM 層的預測得分合并即為BiLSTM 層的預測得分,作為發射得分。x1 對應各鉆機狀態的得分中,上提劃眼是1.50,復合鉆進0.73 等,上提劃眼得分最高,即經BiLSTM 層預測的鉆機狀態為上提劃眼。

轉移得分為訓練集鉆機各項動態前后約束條件的統計結果,是通過統計所有鉆井工況相互轉移之后的得分矩陣,如表5 所示。矩陣中每個數值表示該行標識的鉆井工況變為該列標識的鉆井工況的統計概率,如第1 行第3 列的數值0.85,表示復合鉆進工況變為上提開泵劃眼工況的統計概率為0.85。該矩陣中的數值在訓練開始時先隨機初始化,在訓練過程中會不斷地對鉆進狀態的轉移情況進行統計,來更新該矩陣的數值,隨著不斷的訓練,這些數值也會越來越合理。

在模型建立后,需利用損失函數,計算預測標簽與訓練集的正確率,并不斷調優以求損失函數的值降至盡可能低,從而保證模型精度。CRF 的損失函數說明如下。

對于輸入序列x 對應的輸出鉆井工況序列y,定義分數函數為

3.3 超參數優選

輸入層神經元個數與錄井綜合實時數據特征參數項個數相同,為9 個;輸出層的神經元個數與所識別工況類型個數相同,為20 個。神經網絡的隱藏層個數的選取影響著模型訓練的準確性[21],在選擇時,既要保證模型訓練準確性,又要防止模型結果“過擬合”??紤]輸入項與輸出項的復雜程度,本文分別測試5 層、10 層、15 層隱藏層的神經網絡模型,每層隱藏層的神經元數均在10~100 之間,共測試30 組模型。如圖3 所示,10 層隱藏層、70 個神經元數的模型準確率最高,為95.12%,因此優選10 層隱藏層、70 個神經元數的模型進行模型訓練。

4 鉆井工況識別實驗

4.1 雙向長短期記憶循環神經網絡和條件隨機場神經網絡訓練過程

使用雙向長短期記憶循環神經網絡和條件隨機場神經網絡結構進行訓練,每次訓練持續100 次迭代,計算驗證模型識別正確率[22]。不同迭代的正確率(Accuracy) 與損失值(Loss) 如圖4 所示,經過100 次迭代,訓練集和測試集的正確率均達到較高水平,不再有較明顯的提高,已經達到訓練目的。訓練集、測試集的正確率分別為96.49% 和97.23%,訓練集損失值為0.000 23。

4.2 雙向長短期記憶循環神經網絡和條件隨機場神經網絡正確率驗證

根據上文各鉆井工況判別條件及特征化處理結果,結合10 口井連續一周記錄的共計1 209 533 條錄井實時數據,對實驗井段的原始數據進行工況識別,識別結果按混淆矩陣[23]統計見圖5、圖6。

在二分類模型的評價中,正確率是全部樣本中預測正確的樣本比例,精準率是預測為正樣本中預測正確的樣本比例,召回率是正樣本中預測為正樣本的比例。在多分類模型中,可以先將每一個類別單獨視為正,其他類別都視為負,計算該類別的正確率、精準率和召回率,然后再取平均值作為多分類模型的評價。F1 分數通過精準率和召回率計算得到[24]。

利用F1 分數計算模型對訓練集、測試集的模型識別結果正確率分析驗證,結果如表6、表7 所示。

根據實驗結果與現場實際情況驗證表明,采用雙向長短期記憶循環神經網絡和條件隨機場神經網絡所訓練的鉆井工況識別模型的識別精準率達到91%~97% 左右,平均識別精準率為94.3%,由此可見本模型識別結果準確有效,可用于現場進行鉆井工況識別判斷。

5 結論

(1) 對比了決策樹、ANN 全連接神經網絡、BiLSTM+CRF 算法的使用原理,認為BiLSTM+CRF算法更適合用于應對處理工況復雜多樣且時序性強的鉆井工況識別問題。

(2) 設計了一種基于雙向長短期記憶循環神經網絡和條件隨機場架構的鉆井工況識別模型,該模型通過學習錄井實時數據的變換特征與鉆井工況類型的關聯性,得到鉆井工況智能識別模型,并通過條件隨機場模型對鉆井工況識別序列的精度進行優化。

(3) 研究模型最終測試集工況識別正確率達97.23%,滿足應用需求,該算法可將錄井綜合數據賦予“工況狀態”信息,為鉆井時效分析、各工況數據深度挖掘提供了研究基礎,后續應對“發送旋導指令”、“下套管”等復雜工況識別做進一步研究。

猜你喜歡
鉆具雙向正確率
雙向度的成長與自我實現
門診分診服務態度與正確率對護患關系的影響
生意
品管圈活動在提高介入手術安全核查正確率中的應用
國外潛孔鉆具研發方面的新動向
生意
施必牢螺紋在采樣鉆具防松連接中的應用研究
一種軟開關的交錯并聯Buck/Boost雙向DC/DC變換器
旋挖鉆機鉆具產品類型
一種工作頻率可變的雙向DC-DC變換器
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合