?

深度學習在煤礦水力壓裂微震檢測中的應用

2023-08-01 05:49高林生
西安科技大學學報 2023年4期
關鍵詞:背景噪聲微震時域

李 昊,高林生,劉 麟,邵 坤

(1.西安科技大學 能源學院,陜西 西安 710054;2.華北科技學院 礦山安全學院,河北 廊坊 065201;3.華北科技學院 安全工程學院,河北 廊坊 065201)

0 引 言

水力壓裂是指通過鉆孔注入高壓流體,鉆孔壁產生破裂并擴展,進而達到強度弱化、增透、應力轉移等工程要求[1]。通過這種方法能夠使煤巖體產生水壓裂縫,從而達到使煤巖體強度弱化和增透的目的,進而提高瓦斯抽采效率[2]。水力壓裂過程中會造成巖石破裂,巖石破裂過程中會向外輻射微震能量。通過微震監測獲取微震數據,并對其進行定位、震源機制反演等處理能夠獲得巖石破裂的情況。進而根據巖石破裂情況調整水力壓裂的壓裂液、加砂量等工藝,獲得更好的水力壓裂效果。水力壓裂過程中會產生大量的微弱微震信號[3],極大增加了識別微震波形的工作量。同時,煤礦井下監測過程中還會出現大量干擾信號,對微震波形的準確識別造成不同程度的干擾[4]。此外,與頁巖、砂巖等致密脆性巖石相比,煤作為非均質較強的特殊軟巖,微震信號識別難度更大。

在早期的探索中,人們提出了不同的微震波形自動識別方法,例如長短窗法(STA/LTA)[5]、赤池信息準則(Akaike Information Criteria,AIC)[6]。之后也有人聯合使用幾種方法進行微震波形自動識別或者改進原方法[7-8]。這些波形識別方法都是利用一個或幾個統計特征進行的[9],特征的閾值需要人為設定,很難找到一個完美的閾值進而同時提高召回率和準確率[10]。另外,這2種方法對于信噪比較高的波形能夠達到較好的識別效果,但是對于低信噪比波形識別效果較差[11]。朱權潔等利用分形技術識別微震波形,但主要針對爆破、巖石破裂等信號,對于煤礦井下水力壓裂微震波形識別效果不得而知[12]。為了在盡量減少誤識別的前提下增加對微震波形的檢測能力,很多學者嘗試使用模板識別的方法。這種方法大幅度的增加了檢測到的微震數目,但是該方法極大的依賴于已有微震模板,對于因種種原因沒有模板的微震,盡管信號很強,也會被該方法漏識別[13]。

進入90年代,SVM等機器學習方法被應用到微震領域,然而隨著神經網絡層數增加,易出現梯度擴散、過擬合等問題。近幾十年來,計算機技術迅猛發展,使得機器學習被應用到實際中[14]。日益成熟的機器學習算法和強大的計算能力,提供了將過去積累的大量數據利用起來的可能。譚文侃、湯志立等對機器學習算法進行了改進[15-16]。大多數研究通過選取多個特征,并利用機器學習方法進行波形識別,在微震波形識別方面取得了一定的成就[17-18]。但方法未深入到深度學習領域中。

近年來,深度學習和人工智能技術快速發展,在地震學領域獲得一系列成功應用。卷積神經網絡是深度學習中一種常用的計算方法,最先應用于信號處理識別方向[19]。其權值共享的特點使得本身擁有更深網絡層數,提取特征的能力大大提高[20]。在使用大量標簽數據進行監督學習之后,訓練好的模型通常在一些與訓練數據相似的測試數據集或者研究區域具有可媲美甚至超過傳統方法的效果[21-22]。不過,深度學習方法實用化的關鍵在于模型能否達到比較高的泛化能力,即是否能在訓練樣本以外的數據上也取得不錯的效果。得益于海量的數據集,經過預處理后輸入深度學習模型,一部分深度學習算法模型取得了較高的泛化能力[23-24]。近年來,深度學習卷積神經網絡被引入至地震、油氣、巖爆等方面的微震波形識別[25-27]。深度學習方法在上述方面已經展現出了優于傳統方法的波形識別能力,煤礦井下水力壓裂方面卻鮮見研究。

文中對山西某礦水力壓裂微震監測數據進行加噪和平移預處理,作為深度學習CNN模型的訓練和測試數據,搭建適用時域圖像和小波圖像CNN模型。對比分析2種深度學習模型與傳統的STA/LTA和AIC微震識別方法識別水力壓裂微弱微震事件的優劣,從而為煤礦井下水力壓裂的弱微震事件識別提供一種新的方法。

1 微震波形CNN模型

1.1 CNN模型工作原理

CNN模型是深度學習中一種常用計算方法,能自動從圖像中提取抽象特征,把握波形整體信息,從而實現對數據進行分類。煤礦水力壓裂微震數據包含大量微弱微震信號,這個特點使得深度學習模型適用于該數據微震波形識別。訓練開始前需要對深度學習模型的初始化權值矩陣Wl進行設定:批次值(batch-size)為128、最大迭代次數為57,初始學習率η為0.000 5。若測試精確率連續3次未提升,學習率η降低為原來的一半。訓練過程主要包括波形向前傳播與誤差反向傳播。

首先是波形向前傳播。訓練時從數據集的一個批次中取出一個數據x,將該數據輸入至神經網絡輸入層。在向前傳播經過各個層和函數的過程中,數據會輸出不同大小的特征圖或向量。輸入層輸出為RGB三通道圖像x,卷積計算或者全連接層作用后輸出zl,批量標準化函數作用后輸出N,激活函數σ激活后輸出al。公式(1)是經過激活函數激活后再經過卷積作用的輸出。公式(2)是經過批量標準化函數作用后再經過激活函數作用后的輸出。

zl=Wlal-1

(1)

al=σ(Nl)

(2)

然后是誤差反向傳播。根據神經網絡的輸出和標注y,使用損失函數計算損失值C。再計算損失值C對神經網絡輸出層delta誤差δl,利用相鄰層之間δl遞推公式求得每一層δl。

如果l+1層是卷積層,那么l層δl誤差為

δl=δl+1·ROT180(Wl+1)·σ′(al)

(3)

如果l+1層是池化層,那么l層δl誤差為

δl=upsample(δl+1)·σ′(al)

(4)

如果l+1層是全連接層,那么l層δl誤差為

δl=(Wl+1)Tδl+1·σ′(al)

(5)

式中 ROT180為將矩陣順時針旋轉180°;upsample為上采樣操作。

再利用每一層δl求出損失函數對該層參數的導數?C/?W。將一個批次內所求層的所有導數相加(初始化為0),根據梯度下降法更新參數,參數更新公式為

其中后兩個詞“眉眼”“眉宇”與第一個詞“眉目”在義項① “借指容貌”上是義項對應的同義詞關系。[注] 葛本儀:《現代漢語詞匯學》, 濟南:山東人民出版社, 2004年, 第202-207頁。三個詞互相對應的這個義項恰好也都是借代意義。

(6)

參考經典“LeNet-5”[28],搭建用于識別煤礦井下水力壓裂微震波形的二維CNN深度學習模型,如圖1所示。圖中上方數字從上到下分別為特征圖的長、寬、深度,下方數字從上到下分別為卷積核的深度和數量。卷積核參數是深度學習模型中至關重要的部分,卷積核的長和寬都為3×3(像素),步長都為1(像素),全部采用0填充方式。池化作用會導致特征圖的長和寬逐漸減小,提取足夠的信息就需要更多的特征圖,所以卷積核的深度和數量隨著模型層數的增加而逐漸提高。

圖1 水力壓裂微震波形檢測的二維CNN模型結構Fig.1 Two-dimensional CNN model structure for microseismic waveform detection of hydraulic fracturing

模型結構從前往后依次為:輸入層、3層卷積層和最大池化層、1層卷積層和全局平均池化層、Relu層、Softmax層。輸入層輸出RGB三通道圖像數據,大小全部降維到128×128,全局平均池化層將特征圖轉變為256×1的列向量,之后Relu層將256×1的列向量轉變為128×1的列向量,最后Softmax層將128×1的列向量轉換為2個0~1的數值。這2個數值代表該波形片段是微震波形和背景噪聲的預測概率,將用于識別波形片段是否為微震波形或者背景噪聲。

1.2 數據預處理

山西某煤礦6號煤層為突出煤層,用水力壓裂增透煤層,治理消除煤與瓦斯突出危害,在此基礎上開展瓦斯防治和抽采工作。通過微震監測獲取水力壓裂裂縫擴展情況,評價水力壓裂工藝效果。采集數據所用微震傳感器靈敏度為200 V/(m/s),頻帶范圍為4.5~1 500 Hz;系統采樣率為4 k。在鉆孔中安裝傳感器,最大程度屏蔽噪聲。深度學習模型需要大量數據樣本以避免過擬合,因此選取了4 d的水力壓裂微震監測數據,為深度學習模型提供了大量的訓練樣本。

訓練數據的質量對一個良好的深度學習模型起重要作用。從原始數據中截取5 860條含有微震波形的片段,標注為1;排除微震波形后隨機截取8 341條背景噪聲片段,標注為0。對挑選后的數據仍需要再次檢查,更正明顯的標注錯誤,盡可能減少人工標注錯誤。數據集中微震事件震級范圍主要在-3~0級(2~5.410J),微震波形持續時間最長可達到1.2 s。為了盡可能地將不同震級微震的波形包含在波形片段內,將深度學習模型滑動窗口長度和步長都設定為1.5 s。

為了數據集更加適應深度學習模型,需要進行加噪處理。首先需要計算被加噪波形能量,然后增加與該能量固定比例能量的噪聲,為了保證數據的準確性,微震波形總體加噪程度偏低。為使加噪后波形數量和背景噪聲數量大致相同,對所有微震波形各自加噪自身原有微震波形能量的1/32,1/33,…,1/48,共17種不同程度噪聲;對所有背景噪聲各自加噪原有背景噪聲能量的1/14,1/15,…,1/25,共12種不同程度噪聲。原始微震波形和加噪層度1/32的波形對比如圖2(a)和圖2(b)所示。不同加噪程度的微震波形占加噪后總微震波形數量的1/18。不同加噪程度的背景噪聲占加噪后總背景噪聲數量的1/13。

圖2 不同加噪和平移程度時域微震波形Fig.2 Time domain microseismic waveform with different degree of noise adding and translation

微震波形加噪程度要低于背景噪聲。這是因為數據集內微震波形信噪比差別較大,如果以高信噪比微震波形為標準加噪,那么將其加噪至微弱波形所需能量比就比較大。然而,以這較高能量比對低信噪比微震波形進行加噪,低信噪比微震波形就會被背景噪聲淹沒成為背景噪聲。數據加噪測試表明,信噪比最低的波形加噪程度大于等于1/31時便幾乎被背景噪聲淹沒,所以微震波形加噪最高選為1/32。背景噪聲在加噪過程中不存在被背景噪聲淹沒的情況,所以加噪程度相對偏大。

對數據加噪和平移預處理后,最終得到102 546條微震波形數據和101 123條背景噪聲數據。

圖3是與圖2對應的小波變換圖像,可以看出,加噪前后圖像在100 Hz的低頻部分幾乎沒有變化,但在100 Hz以上的高頻部分有更多分布。無論數據如何平移,微震波形總是在100 Hz左右有較為明顯的分布,且在時間上與微震波形對應。

圖3 不同加噪和平移程度微震波形小波變換Fig.3 Wavelet transform with different degree of noise adding and translation

有些原始背景噪聲(圖4(a))與微震波形類似。從小波圖像來看(圖4(c)),這類波形在100 Hz左右的低頻部分有較為明顯的分布,這個特點與微震波形較為類似。然而,低頻部分的分布是近乎連續的,這類波形是工人井下作業時造成的干擾信號,屬于背景噪聲。對原始背景噪聲加噪1/25的小波圖像(圖4(d))可以看出,加噪后波形在100 Hz以下的低頻部分有了更多的分布,明顯區別于微震波形。

圖4 背景噪聲圖像Fig.4 Images before and after adding background noise

1.3 2種深度學習模型搭建

深度學習模型對微震波形的識別流程如圖5所示。首先,對原始數據進行加噪、平移等預處理,生成訓練集、測試集和待檢測集圖像。然后,從微震波形和背景噪聲中隨機選取80%,20%的數據用于深度學習模型的訓練和測試。如果模型表現良好,則保存其性能。如果模型表現不佳,則需要對模型參數或數據集進行調整,直至模型性能達到預期。使用性能良好的深度學習模型來檢測待檢測數據,并將輸出結果。對于每個波形片段,根據其被識別為微震波形還是背景噪聲,輸出1或0。由于通常需要4個微震波形才能定位微震事件,因此需要根據同一時間窗口內含有微震波形通道數是否大于3為判據進行微震事件的判斷。如果被判定為微震事件,將該事件對應的所有通道波形存儲,并從中提取出含有微震波形的通道數據,然后將這些數據與存儲的波形進行對比。如果不是微震事件,則該數據被丟棄。

圖5 CNN模型的煤礦井下水力壓裂誘發微弱波形識別流程Fig.5 Identification process of weak waveform induced by hydraulic fracturing in coal mine based on CNN model

適用時域圖像、小波圖像的CNN模型訓練測試正確率和損失函數分別如圖6(a)和圖6(b)所示。通過2種圖像識別的訓練、測試數據集的準確率都達到了99%以上,損失函數都在0.02以下。2種方法測試集準確率和損失函數在起始階段出現了震蕩,這是因為初始設置的部分模型初始參數值(權值矩陣、學習率等)與最優值差別較大。但隨著訓練的不斷進行,模型參數逐漸向著最優值靠近,之后明顯震蕩消失。最終保存使用的是訓練效果最好的模型。

圖6 訓練、測試準確率與損失函數Fig.6 Accuracy and loss functions of training and testing

2 波形識別結果

2.1 事件準確率和召回率

分別使用深度學習訓練好的2個模型檢測一個小時連續水力壓裂數據,并將檢測結果與傳統AIC和STA/LTA微震事件檢測方法的結果作對比。在這一個小時的數據中,共確定了328個事件。以這328個事件作為對比,分析時域CNN模型、小波CNN模型、STA/LTA和AIC 4種方法微震事件識別精確率和召回率。精確率Pe和召回率Re的定義分別為

Pe=Tp/(Tp+Fp)

(7)

Re=Tp/(Tp+Fn)

(8)

式中Tp為真正例,即算法識別的微震事件為真實微震事件,反之為假正例Fp;Tn為真反例,即算法識別的背景噪聲是真實背景噪聲,反之為假反例Fn。精確率高代表誤檢率低,召回率高說明算法漏檢率低,只有兩者都高時模型或者算法才擁有實用價值。對濾波前后檢測數據進行檢測,濾波器階數為128,各種方法濾波前的檢測結果分別見表1和表2。無論濾波前后,精確率和召回率均為時域CNN模型>小波CNN模型>AIC>STA/LTA。時域CNN模型的正確率和召回率是最高的,且隨著波形信噪比的提高,各種方法的精確率、召回率都有了不同程度的提高。

表1 濾波前STA/LTA,AIC和CNN模型識別精確率和召回率Table 1 Identification accuracy and recall rate of STA/LTA,AIC and CNN models before filtering

表2 濾波后STA/LTA,AIC和CNN模型識別精確率和召回率Table 2 Identification accuracy and recall rate of STA/LTA,AIC and CNN models after filtering

微震波形與背景噪聲在幅值、頻率等方面有許多不同之處。AIC,STA/LTA方法主要是依靠單一的幅值信息(幅值大小和變化),缺少對波形總體信息的提取和分析。CNN模型將一張圖像看作是一個個像素組成的矩陣,對圖像的分析就是對矩陣的數字進行分析,而圖像特征就隱藏在這些數字規律中。該模型通過圖像向前傳播和誤差反向傳播使模型參數逐漸向最優值靠近,最終獲得優于AIC,STA/LTA的波形識別能力。

時域CNN的識別微震事件召回率和精度是最高的,這是因為時域圖像由傳感器采集的數據直接轉換,內部包含最豐富的原始信息。小波圖像是經過原始數據變換之后轉換成的圖像,不可避免的會丟失部分原有信息,所以時域CNN模型優于小波CNN模型。

水力壓裂常見的背景噪聲信號是電壓噪聲和水流噪聲,兩者都有明顯的起跳點,容易被傳統方法誤判定為微震事件,影響壓裂效果的評價。時域CNN方法能夠準確識別這2種噪聲。上述2種噪聲信號在時域、頻域方面又存在明顯區別。如圖7(a)所示,電壓噪聲信號波形信號特點是在每個通道同一時間只有一道垂直向上的信號;如圖7(b)所示,由于裂縫貫通后的水流噪聲持續時間較長,水流噪聲波形信號在較長時間內存在連續頻帶分布。對比2種噪聲的小波圖像,進一步證明了上述規律。如圖7(c)所示,電壓信號在1 000 Hz內有較為明顯的分布,且分布頻帶范圍較廣。如圖7(d)所示,水流噪聲500 Hz以內有較為明顯的分布,且持續時間較長。

2.2 水力壓裂微震事件識別實例

選取15 s的水力壓裂微震數據,共12個通道的波形片段,分別用時域CNN模型、小波CNN模型、AIC,STA/LTA 4種方法識別微震事件。微震事件識別標準是至少4個通道含有微震波形,而各通道內微弱微震波形的識別是關鍵。圖8(b)、圖8(c)中事件是4種方法共同識別出的事件,其中C4,C6,C7,C8和C10通道都含有明顯的微震波形,容易達到至少4個通道含有微震波形的識別標準。圖8(a)是時域CNN方法識別出,但其他3種方法未識別出的事件,其中C6,C8和C10通道存在微弱微震波形,識別難度較大,只有時域CNN方法識別出C6,C8,C10通道的微弱波形,加上較為明顯易于識別的C7波形,從而達到至少4個通道的微震事件識別標準。由此看出,在微弱波形識別方面,時域CNN方法要優于小波CNN方法,AIC,STA/LTA。

圖9是2種深度學習模型分別與STA/LTA,AIC聯合識別在一個小時連續數據中識別出真實微震事件的對比。時域CNN模型、STA/LTA,AIC在一個小時連續數據中,聯合識別出257個真實微震事件。其中,3種方法共同識別出真實微震事件占比約為50%,時域CNN模型單獨識別的真實微震事件占比約為36%,時域CNN模型未識而被其他2種方法識別的真實微震事件占比約為14%。小波CNN模型、STA/LTA,AIC在一個小時連續數據中,聯合識別出229個真實微震事件。其中,3種方法共同識別出真實微震事件占比約為52%,小波CNN模型單獨識別的真實微震事件占比約為28%,小波CNN模型未識別而被其他2種方法識別的真實微震事件占比約為20%。

圖9 CNN模型、STA/LTA,AIC識別真實微震事件占比Fig.9 Proportion of real microseismic events identified by CNN model,STA/LTA and AIC

時域CNN模型或者小波CNN模型與STA/LTA和AIC共同識別出的真實事件大多是較為明顯的真實微震事件。2種CNN模型識別出但STA/LTA,AIC未識別出的事件大多為真實微弱微震事件。在微弱真實事件識別方面,CNN深度學習模型擁有優于傳統方法的識別效果,且時域CNN模型優于小波CNN模型。

3 結 論

1)將水力壓裂數據進行加噪和平移預處理后,分別轉換為時域圖像、小波圖像。然后分別輸入CNN模型進行訓練,2種CNN模型訓練、測試的準確率都達到99%以上,損失函數都在0.02以下,為微震事件識別提供了一種更優的方法。

2)在識別中發現,水力壓裂常見的背景噪聲有電壓噪聲和水流噪聲。電壓噪聲波形雖然持續時間較短,但有明顯的起跳點;水流噪聲波形持續時間較長,但起跳點不明顯。STA/LTA,AIC,小波CNN模型較難識別這2種噪聲,時域CNN模型能夠識別。

3)在微震事件識別精確率和召回率方面,時域CNN模型優于小波CNN模型,優于AIC,優于STA/LTA。能夠提取抽象特征的CNN深度學習模型擁有優于傳統方法的識別效果。小波變換會使圖像不同程度的丟失掉部分信息,所以時域CNN模型具有更好的微震事件識別效果。研究內容為煤礦井下微弱波形識別提供一定參考價值。

猜你喜歡
背景噪聲微震時域
環境背景噪聲對飛機噪聲監測結果的影響
淺談KJ768煤礦微震監測系統的應用
長平煤業5302 綜放工作面頂板巖層移動規律研究
基于時域信號的三電平逆變器復合故障診斷
應用背景噪聲成像研究祁連山地區地殼S波速度結構
基于極大似然準則與滾動時域估計的自適應UKF算法
基于隸屬度分析的回采面沖擊地壓微震能量閾值判定
基于時域逆濾波的寬帶脈沖聲生成技術
海上單道地震勘探中船舶等背景噪聲的影響分析及壓制
基于時域波形特征的輸電線雷擊識別
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合