?

基于LeNet 模型的游梁式抽油機工況診斷研究

2024-01-12 07:17葉哲偉易欽玨
關鍵詞:示功圖池化抽油機

葉哲偉,易欽玨,羅 良

西南石油大學機電工程學院,四川 成都 610500

引言

某油田游梁式抽油機井占機采井的97.6%,抽油機井由于受復雜的井下工況影響易出現故障。因此,及時準確地判斷井下工況并對抽油機井出現的故障進行實時處理在抽油機井實際生產過程中顯得尤為重要。目前,判斷抽油機井下工況的主要方式為示功圖,示功圖表示抽油機的一個運行周期中,抽油機懸點載荷隨懸點位移變化的關系曲線圖,通過分析示功圖能夠判斷“抽油桿斷脫”“供液不足”等井下故障,從而及時處理故障,避免井下事故的發生,油井工人對于示功圖的判斷通常依靠個人經驗,該方法誤差大且效率低[1]。在示功圖工況診斷領域,研究人員多年來運用專家系統、機器學習等人工智能的方法來實現示功圖的識別[2-5],但由于專家系統需要依靠專家經驗,傳統機器學習的特征需要人為預先選取,會導致出現相似示功圖時,識別的準確度降低,不能很好地滿足實際需求。

本文通過深度學習算法模型來實現對示功圖的識別,深度學習能夠挖掘原始輸入數據中具有泛化能力的特征表示[6],深度學習目前在人臉識別、目標檢測等領域應用廣泛,深度學習無需人工預先進行特征提取,在圖像識別領域,其卷積神經網絡分支有著廣泛的應用。將深度學習卷積神經網絡引入到示功圖識別領域,通過卷積神經網絡學習示功圖的本質特征,從而實現示功圖的自動識別。

在卷積神經網絡與示功圖診斷結合領域,李鈺通過搭建MiniAlexNet 卷積神經網絡模型實現了示功圖的自動分類與識別,但其僅考慮了4 種類型的示功圖數據且當示功圖數據類型變多時,模型需要繼續優化[7]。樊浩杰通過搭建CNN-SVM 卷積神經網絡模型實現了示功圖的自動識別、分類及診斷,并將此模型應用到抽油機井故障智能診斷系統中,但其僅考慮了8 種類型的示功圖數據且模型算法較為復雜需要繼續優化[8]。杜娟等通過搭建一種輕量型卷積神經網絡LA-CNN,實現了抽油機的故障診斷[9]。Abdalla 等采用深度學習人工神經網絡分析了井下示功圖特征,識別了有桿抽油系統工況[10]。He 等通過搭建CNN-LSTM 卷積神經網絡模型,提高了對于示功圖進行診斷的精度[11]。

在前人研究的基礎上,本文搭建了基于LeNet的卷積神經網絡模型,在簡化算法以及模型結構的同時考慮了油井抽油機常見的15 種井下工況,并通過混淆矩陣對所搭建模型進行了可視化分析,證明了所搭建的模型是合理的。實驗結果表明,該模型在驗證集上對于示功圖進行識別的準確度為94.68%,具有較高的工況診斷精度。

1 模型建立

本文介紹了LeNet 卷積神經網絡模型和示功圖的圖像特點,以MATLAB 作為開發平臺,搭建了基于LeNet 的卷積神經網絡(Convolutional Neural Network,CNN)模型。

1.1 LeNet 卷積神經網絡模型

卷積神經網絡至今已有30 多年的歷史[12]。CNN 為前饋型神經網絡,能提取輸入圖像的本質特征,因此,廣泛應用于圖像識別領域。CNN 的三個基本思想是“局部感受野”、“權值共享”和“池化”,局部感受野指隱藏層每個神經元只連接上一層一定區域內的神經元[13];權值共享指特征圖上每個窗口數據都共用一套卷積核參數[14];池化的作用在于特征降維,池化技術主要有最大值池化和均值池化[15]。

LeNet 模型的結構如圖1 所示[16],其為CNN 模型中的經典架構。LeNet 模型通過卷積、池化等操作來進行特征的提取,極大程度上減少了訓練參數的數量,并通過全連接層進行分類識別,LeNet 模型從提出之日起,主要應用于銀行支票上手寫字符的識別,并在該計算機視覺任務上取得了較好的識別效果。

圖1 LeNet 模型結構圖Fig.1 LeNet model structure diagram

如圖1 所示,LeNet 模型的組成包括卷積層、池化層和全連接層。卷積層的作用為提取輸入圖像的本質特征,卷積操作公式為[1]

池化層的作用為對輸入的特征圖進行壓縮,縮小參數矩陣的大小,進而減小網絡模型參數計算的數量,池化操作的公式為[1]

全連接層的作用在于綜合經卷積、池化后所提取到的特征,從而形成完整的圖,由此實現分類,全連接操作公式為[1]

LeNet 模型具體實現過程為:通過多個不同的卷積核對輸入層的圖像數據進行卷積操作得到卷積層C1;對卷積層C1 進行池化操作得到池化層S2;對池化層S2 進行卷積操作得到卷積層C3;對卷積層C3 進行池化操作得到池化層S4,將池化層S4 的特征輸入全連接層,由此實現圖像的識別、分類及輸出。

1.2 示功圖圖像特點

示功圖是抽油機懸點載荷隨其位移變化規律的圖形表示,不同特征類型的示功圖對應抽油機井不同的工況,因此,示功圖通常用于工況診斷,且對示功圖的綜合研判是掌握抽油機井工況以及動態的重要手段[17]。在油田抽油機井的實際生產過程中,會出現“油層出砂”“油井結蠟”“抽油桿斷脫”和“柱塞脫出泵筒”等故障,當出現故障時,相比正常示功圖在橫坐標位移區間變化不大,在縱坐標載荷區間呈現不規律變化[18]。圖2 為典型故障示功圖。

圖2 典型故障示功圖Fig.2 Typical fault indicator diagram

圖2a 為“油層出砂”情況下的示功圖,當油層中出現細小的砂粒,使得柱塞在上下沖程中受到附加阻力的影響,從而使得光桿負荷在上沖程增大、下沖程減小,示功圖圖像特征表現為柱塞在上下行程線上波動較大,波峰和波谷沒有規律。圖2b 為“油井結蠟”情況下的示功圖,由于油井結蠟,使得活塞在運行過程中受到附加阻力的影響,并會產生振動載荷,圖像特征表示為上下載荷線出現波浪型彎曲。圖2c 為“抽油桿斷脫”情況下的示功圖,抽油桿斷脫后的懸點載荷為斷脫點以上的抽油桿柱在液體中的重量,且由于摩擦,使得上下載荷線不重合,圖像特征表示為條帶狀。圖2d 為“柱塞脫出泵筒”情況下的示功圖,由于防沖擊距離過大,柱塞在上沖程中會從泵筒中脫離出來,施加在光桿上的液柱負載會突然卸載,由此導致卸載線迅速下降并引發柱塞跳動,因此,從示功圖的圖像特征來看,右下角呈現不規則的波浪曲線。上述示功圖的案例表明,示功圖的圖像內容由曲線組成,且曲線內容較少,空白內容較大,因此,對于示功圖的識別無需特別復雜的網絡模型就能實現較好的識別效果。

抽油機示功圖的自動識別與分類問題,可以看作是一類圖形識別與分類問題,且深度學習CNN能夠分布式表示輸入數據的特征,從而完成對特征的提取,進而可以較好地解決示功圖工況間存在相似性的問題。因此,研究深度學習CNN 在示功圖自動識別和分類方面的應用在技術上可行且有很大的實際應用價值[7]。

1.3 基于LeNet 模型的網絡架構

LeNet 模型深度適中,至今仍廣泛應用。針對示功圖的圖像特點,本文以MATLAB 作為開發平臺,搭建了基于LeNet 的CNN 模型。在搭建模型的過程中,對輸入到CNN 模型的示功圖數據進行歸一化、二值化及細化處理并且引入了Dropout層和局部響應歸一化(LRN)層,其模型結構如圖3所示。

圖3 基于LeNet 的CNN 模型結構圖Fig.3 LeNet-based CNN model structure diagram

第一、第二層為圖像處理以及輸入層,考慮到不同油井、懸點所承受的載荷以及光桿運行到上死點和下死點的距離不同,會導致示功圖形狀大致相同但尺寸不同。為了提高示功圖的通用性,對示功圖進行歸一化操作,使得示功圖的橫縱坐標都在[0,1]內。歸一化操作公式為[8]

圖4 為實測示功圖的歸一化處理。

圖4 實測示功圖的歸一化處理Fig.4 Normalization processing of measured indicator diagram

為了突出示功圖的圖像特征以及避免噪聲的干擾,對歸一化后的示功圖進行二值化及細化處理。圖5 為二值化及細化處理后的實測示功圖圖像。將圖像處理后的示功圖變為100×100 個神經元并輸入到CNN 模型中。

圖5 實測示功圖的二值化及細化處理Fig.5 Binarization and thinning of measured indicator diagram

第三層為卷積層,卷積核大小為10×10,步長為1,采用Same 策略,卷積核數量為20,卷積結束后會形成20 個通道。

第四層為激活函數,本文的激活函數采用Re-LU,旨在通過加入非線性因素的方式提高神經網絡對模型的表達能力。為了防止ReLU 函數出現Dead ReLU 現象,因此,基礎學習率設置為0.001,每5 個階段學習率降低0.2 倍。

第五層為LRN 層,該層為局部神經元的活動創建了競爭機制,使較大的響應值變得相對較大,并抑制其他反饋較小的神經元,其主要作用在于提高模型的泛化能力,其實現公式為[19]

第六層為池化層,池化規則為最大池,最大池化操作是選取圖像區域的最大值作為該區域池化后的特征值,池大小為6×6,步長為3,經過池化后為32×32 個神經元。

第七層為Dropout 層,Dropout 層在模型訓練的過程中,為了使模型不依賴于局部特征,讓某些神經元的激活值以一定的概率停止工作,以達到防止模型過擬合的效果[20]。第八層為全連接層,該模型全連接層含15 個神經元,輸入的神經元通過全連接層實現分類。

第九層為Softmax 層,用以將分類輸出標準化成概率分布,其實現的公式為

第十層為分類輸出層,根據概率得到分類序號。模型訓練時的損失函數選用交叉熵,用以刻畫預測概率分布和真實概率分布間的距離。

2 案例研究

本文通過某油田的實測示功圖數據對本文搭建的基于LeNet 的CNN 模型進行了驗證,并通過實驗選取了符合該模型的優化器以及超參數,旨在提高模型的收斂速度、識別精度。此外,為了證明Dropout 層和LRN 層的優勢,對未加入該兩層的基于LeNet 的CNN 模型進行了對比分析。

2.1 數據準備

本文使用的示功圖數據集由中國某油田不同的游梁式抽油機井提供,每張示功圖數據由144 組坐標點組成,在數據集中,有一些數據是無效的,原因為采集示功圖數據時,儀器電源或接觸不良引起的故障,或因儀器老化引起的故障[21],需要在使用前對數據集進行清理。

對實測示功圖數據集進行清理后,共獲得5 116張抽油機示功圖,并按以下15 種類型進行人工分類,各類別對應關系見表1。

表1 抽油機示功圖分類表Tab.1 Pumping unit indicator diagram classification

對上述數據集進行如下操作:生成每組數據對應的圖像并存儲在文件夾中,供模型讀??;隨機抽取50%的數據作為模型的訓練集,剩余50%的數據作為模型的驗證集;由此得到的訓練集包括2 558張示功圖,驗證集包括2 558 張示功圖。

2.2 基于LeNet 的CNN 模型

2.2.1 優化器的選取

為了提高本文搭建的基于LeNet 的CNN 模型的收斂速度,避免網絡模型在訓練過程中出現局部最優化現象,需要為本文搭建的模型選取合適的優化器。目前,應用最廣泛的優化器包括SGDM、RMSprop 和Adam,因此,本文選取這3 種優化器進行實驗驗證,實驗流程如下。經實驗分析,對于該模型,SGDM 優化器效果最佳。

實驗保證單一變量原則,訓練模型周期為30 輪,最大迭代次數為1 080 次,這里僅使用前700 次模型迭代的數據進行繪圖。圖6 為模型實驗結果圖,由圖6可知,SGDM 優化器相比RMSprop 和Adam 優化器,驗證集上模型的輸出損失最小,即預測概率分布與真實概率分布之間的距離最接近,因此,對于該模型,SGDM 優化器的識別效果最好。

圖6 優化器選取圖Fig.6 Optimizer selection

2.2.2 超參數的選取

本文在訓練模型的每個周期中,將數據集中的樣本數據分若干次讀入,網絡模型每讀取一次樣本數據稱為一個Batch,使用Batch 對網絡模型進行參數更新的過程稱為迭代。本文搭建的模型在訓練過程中,將Batch 進一步拆分,并在拆分后的Batch 上進行梯度下降,由此能夠提高網絡模型的收斂速度以及識別精度。

Batch 拆分后的每一部分數據的數據量稱為最小批量更新次數,本文通過實驗選取了最小批量更新次數這一超參數的最優值。實驗保證單一變量原則,實驗結果如圖7 所示,由圖7 可知,當最小批量更新次數的值設定為71 時,模型對于示功圖樣本數據進行識別準確度最高。

圖7 超參數選取圖Fig.7 Hyperparameter selection

2.2.3 基于LeNet 模型的實驗

在程序中設置好相關參數后,依據本文搭建的基于LeNet 的CNN 模型進行實驗,將實測示功圖數據導入模型,用2 558 張實測示功圖對模型進行訓練,再用2 558 張實測示功圖對模型進行驗證。實驗過程如下,實驗訓練模型周期為30 輪,每輪迭代次數為36 次,最大迭代次數為1 080 次。

圖8 為該模型在驗證集上的實驗結果,這里使用前1 080 次模型迭代的數據進行繪圖,由圖8 可知,當模型收斂時,驗證集上模型的識別準確度為94.68%,損失為0.262 2。

圖8 模型實驗結果圖Fig.8 Model experiment result

2.3 基于LeNet 模型的對比實驗

為了證明Dropout 層和LRN 層的優勢,搭建了未加入該兩層的基于LeNet 的CNN 模型,其網絡結構如圖9 所示,并對搭建的模型進行了實驗,當模型收斂時,驗證集上模型的識別準確度為93.55%,損失為0.292 4,用時13 分13 秒。

圖9 對比實驗網絡結構圖Fig.9 Comparative experiment network structure

3 實驗結果及分析

3.1 實驗對比

傳統的機器學習方法包括BP(Back Propagation)神 經 網 絡 以 及SVM(Support Vector Machine)診斷方法,上述兩種方法屬于淺層學習,其特點為隱藏層的數目通常情況下小于3,淺層學習由于理論分析難度大、對復雜函數的逼近能力有限且訓練的過程中需要較多的經驗和技巧,如需要人工預先選取矩或矢量曲線特征,導致在實際應用過程中不能達到較好的識別效果。

為了證明本文方法較傳統的機器學習方法具有更好的性能,將參考文獻[22]中提出的BP 神經網絡和SVM 診斷方法與本文提出的基于LeNet 的CNN 模型方法進行比較。各方法對比結果如表2所示。

表2 診斷方法比較表Tab.2 Comparison of diagnostic methods

由表2 可知,基于LeNet 的CNN 模型的識別準確度高于傳統的機器學習方法(BP 和SVM)。由“矩特征”方法到“自動特征”方法,識別準確度由70.24%提高到了90.06%,由此可知,機器自學習方法優于特征提取方法。

為了證明Dropout 層和LRN 層的優勢,將含有該兩層的基于LeNet 的CNN 模型(LeNet 2)與未含該兩層的基于LeNet 的CNN 模型(LeNet 1)進行比較,對比結果如表3 所示。由表可知,Dropout 層和LRN 層的加入使得識別準確度由93.55%提高到了94.68%。

表3 LeNet 卷積神經網絡模型比較表Tab.3 Comparison of LeNet models

為了進一步證明,Dropout 層和LRN 層的引入,提高了在各類工況上識別的準確度,依據實驗結果繪制了如圖10 所示的柱狀圖。由圖10 可以看出,隨著Dropout 層和LRN 層的引入,提高了在驗證集上對于“氣體影響”“上行碰泵”“油層出砂”“氣液影響油層出砂”和“油井結蠟”識別的準確度。

圖10 驗證集準確度的柱狀圖Fig.10 Accuracy of the validation set

3.2 實驗分析

對基于LeNet 的CNN 模型LeNet 1 和LeNet 2的實驗結果進行分析,結果見圖10。由圖可知,LeNet 2 模型在抽油機大部分工況下具有較高的診斷精度。其中,“供液不足”“固定凡爾漏失”“氣鎖影響”“氣體影響”“上行碰泵”“抽油桿斷脫”“下行碰泵”“液擊影響”“油層出砂”“游動凡爾漏失”“正常工作”和“柱塞脫出泵筒”的診斷準確度均超過92.00%;平均診斷準確度為94.68%。

圖11 為抽油機工況診斷結果的混淆矩陣,對角線表示驗證集中各種工況正確診斷樣本的數目。由圖11 可知,對于“供液不足”類別,使用驗證集的樣本去回代訓練集訓練過的網絡,有8 個樣本誤放入“氣液影響油層出砂”類別,有5 個樣本誤放入“氣體影響”類別。這是因為“供液不足”“氣液影響油層出砂”和“氣體影響”都表現為右下方面積的缺失,只是“氣液影響油層出砂”在上下沖程中,出現砂卡的波動比“供液不足”大;“供液不足”在下沖程卸載的過程中,卸載線較“氣體影響”的卸載線陡而直[23],因此容易混淆。通過分析混淆矩陣可知本文搭建的模型是合理的。

圖11 診斷結果的混淆矩陣Fig.11 Confusion matrix of diagnosis results

綜上所述,本文搭建的基于LeNet 的CNN 模型(LeNet 2)在大多數工況下具有較高的識別準確度,滿足抽油機工況檢測的診斷精度要求。并且本文通過混淆矩陣對搭建的模型(LeNet 1 和LeNet 2)進行了可視化分析,證明了所搭建的模型是合理的。

4 工程應用

用基于LeNet 模型的油井抽油機工況診斷方法構建抽油機井工況智能監控預警系統,該系統邏輯框圖如圖12 所示。由圖12 可知,一方面,該系統能對示功圖的識別結果進行實時判斷,當出現井下故障時,能通過生成實時預警報告的方式指導油井監控人員進行故障處理;另一方面,該系統能對示功圖的識別結果進行論證,使得該系統始終處于更新、學習以及強化的過程。通過該系統能夠在一定程度上解決因抽油機井故障引起的油田減產、停產等現象,對油田的高效生產具有重要意義。

圖12 工況智能監控預警系統邏輯框圖Fig.12 Logical block diagram of working condition intelligent monitoring and early warning system

5 結論

1)基于LeNet 的CNN 模型考慮了抽油機常見的15 種井下工況,且搭建的模型在驗證集上對于工況識別的準確度為94.68%,具有較高的工況診斷精度。

2)在搭建模型的過程中引入了Dropout 層防止模型過擬合,引入了LRN 層提高模型的泛化能力,進而提高了網絡模型的收斂速度以及識別精度。

3)對輸入到CNN 模型的示功圖數據進行歸一化、二值化以及細化處理,避免噪聲影響的同時利于模型的訓練。此外,將不同抽油機的示功圖和同一抽油機不同時段的示功圖放入同一模型框架中進行自動識別,表明該模型具有通用性。

4)基于LeNet 的CNN 模型經過訓練后具有較強的泛化能力,從而使得該模型對新的示功圖樣本具有較強的適應性,進而保證對新的示功圖樣本的識別精度。本文研究為基于工況診斷的卷積神經網絡模型的搭建提供了一種新的思路,對于智慧油田建設具有重要意義。

符號說明

猜你喜歡
示功圖池化抽油機
面向神經網絡池化層的靈活高效硬件設計
基于Sobel算子的池化算法設計
抽油機井泵效影響因素的確定方法*
卷積神經網絡中的自適應加權池化
基于卷積神經網絡和池化算法的表情識別研究
油井示功圖相似性的研究與應用
沁水盆地南部煤層氣井抽油機偏磨防治分析
基于示功圖的往復壓縮機故障診斷技術
基于MATLAB的抽油機減速器優化設計
淺談示功圖及示功圖分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合