?

基于循環一致性生成對抗網絡的地震數據隨機噪聲壓制方法

2021-10-23 11:38吳學鋒張會星
石油地球物理勘探 2021年5期
關鍵詞:壓制剖面閾值

吳學鋒 張會星*

(①中國海洋大學海底科學與探測技術教育部重點實驗室,山東青島 266100;②青島海洋科學與技術國家實驗室海洋礦產資源評價與探測技術功能實驗室,山東青島 266100)

0 引言

地震勘探在地下地質構造研究、油氣資源勘查等領域起著重要的作用。在實際地震資料采集過程中,有效信息通常與復雜的背景干擾混合在一起,因此需要處理之后地震資料才可用于地質解釋。噪聲壓制是地震資料處理中的重要一環,目的是提高地震數據的信噪比,改善成像質量。而隨機噪聲是一種不規則噪聲,頻率、傳播方向不固定,很難直接去除。因此,隨機噪聲壓制的研究具有重要的意義。

目前,地震數據隨機噪聲壓制方法大致可分為兩類,即基于模型驅動和基于數據驅動?;谀P万寗拥娜ピ敕椒ㄓ衒-x域預測去噪[1-3]、S變換去噪[4-5]、曲波變換去噪[6-7]、小波閾值去噪[8-14]等。該類方法提出時間較早,以較為常用的小波閾值去噪方法為例,其發展至今已有二十余年。1995年,Donoho[8]首次提出小波閾值去噪方法,奠定了小波變換在信號去噪領域的地位。之后,張宇等[9]、王勇等[10]利用小波閾值去噪方法完成了地震數據隨機噪聲的壓制。在此基礎上,不同學者對小波閾值去噪方法進行了不同程度的改進。付燕[11]在小波閾值去噪基礎上,對隨機噪聲控制的尺度一上的小波系數進行第二次多尺度小波變換,并將二次小波變換后的尺度一上的小波系數置零,完成了對隨機噪聲的壓制。劉軍等[12]將廣義交叉驗證函數作為一種新的閾值函數,優化了小波閾值的選取過程。除了對小波閾值去噪方法進行改進外,還有學者將小波閾值去噪方法與其他理論相結合,對地震資料進行聯合去噪。夏洪瑞等[13]將小波閾值去噪與加權疊加理論相結合,提出了小波時空域變閾值去噪方法。趙迎等[14]將小波閾值去噪與完備總體經驗模態分解理論相結合,提出了一種相對保幅、有效的去噪方法。

不論是小波閾值去噪方法,還是其他基于模型驅動的去噪方法,其發展時間相對較長,技術逐漸趨于成熟。但是,壓制噪聲的初始條件及數學原理均是從頻率差異、區域統計規律、振幅差異等某一特定角度出發,因此,方法本身存在一定的局限性。

近年來,隨著計算機硬件水平的提高,基于數據驅動的去噪方法得到了較快發展。主要代表為不同深度學習框架下的噪聲去除方法,如韓衛雪等[15]提出了基于深度學習卷積神經網絡的地震數據隨機噪聲去除算法,并通過對不同類型實際地震數據去噪測試,驗證了算法的可行性和有效性;王鈺清等[16]改進了卷積神經網絡的訓練策略,提出了基于數據增廣和卷積神經網絡的地震隨機噪聲壓制方法;李海山等[17]將殘差卷積神經網絡應用于疊前隨機噪聲壓制,取得了較好的效果。卷積神經網絡主要依靠卷積層提取地震數據的紋理特征壓制噪聲,但當網絡層深度增加時,會導致非凸目標函數產生局部最優解。另外,由于卷積神經網絡自身結構相對簡單,存在模型訓練速度慢、對訓練樣本要求高等問題[18]。生成對抗網絡(Generative Adversarial Networks, GAN)[19]在一定程度上解決了這些問題。生成對抗網絡作為一種新的無監督學習算法,具有較強的自主學習和生成樣本能力,降低了對訓練樣本的要求[20-21]。Wang等[22]、Dong等[23]將GAN用于地震數據的噪聲壓制,取得了一定的效果。Radford等[24]將卷積神經網絡與GAN相結合,提出了深度卷積GAN,此網絡具有更強的特征學習能力及生成能力,但網絡訓練不穩定。針對此問題,Zhu等[25]在GAN的基礎上提出循環一致性生成對抗網絡(CycleGAN),通過引入循環一致性損失強化訓練過程的穩定性,從而更好地實現網絡對抗學習的過程。

因此,本文提出一種基于CycleGAN的地震數據隨機噪聲壓制方法。通過對簡單模型、復雜模型的地震剖面及實際地震數據的測試,并與經典的小波閾值去噪方法對比,驗證本文方法的可行性和有效性。

1 基本原理

1.1 生成對抗網絡

GAN由Goodfellow等[19]提出,是一個通過對抗過程估計深度學習中生成模型的新框架。GAN主框架由一個生成器G(Generator)和一個判別器D(Discriminator)組成(圖1)。

GAN的基本思想來源于博弈論中的一個經典問題——“零和博弈”。在GAN中,參與“零和博弈”的雙方為生成器G和判別器D,主要通過對抗學習的方式訓練、優化模型,達到納什平衡[26],此時模型參數達到最優。GAN目標函數為

Ex~Px(x){lg[1-D(G(x))]}

(1)

式中:V(D,G)表示關于G和D的價值函數;y為輸入的真實數據;x為服從高斯分布的隨機變量;Px(x)為x的概率分布;Pdata(y)為y的概率分布;x~Px(x)表示隨機變量服從Px(x)的采樣;y~Pdata(y)表示真實數據服從Pdata(y)的采樣;D(y)、D[G(x)]分別表示將y、G(x)判別為真實數據的概率,其中G(x)為x經生成器G后生成的數據;Ex(·)表示在x采樣下“·”的期望值。

目標函數可以是最大化判別器判定正確的可能性,同時訓練生成器使lg{1-D[G(x)]}最小。

1.2 循環一致性生成對抗網絡

CycleGAN的設計初衷是在不需要其他額外信息的前提下,將圖像從源領域映射到目標領域。相較于傳統GAN,CycleGAN主要有兩點改進[25]:

(1)在CycleGAN里,輸入數據可以為不成對的訓練數據,無須建立訓練數據間一對一的映射,即可實現輸入數據到目標數據之間的轉換;

(2)引入循環一致性損失函數強化訓練過程。

CycleGAN的基本結構是由兩個GAN組成,并且構成一個環形網絡(圖2a)。在CycleGAN內的兩個GAN(圖2b、圖2c)共享兩個生成器GX,Y、GY,X(GX,Y表示該生成器作用是將X域內的數據轉換至Y域,下標“X,Y”不具有實際物理意義,僅為一種命名方式,GY,X同理),并且各自帶一個判別器Dx、Dy。其中,為避免生成器GX,Y、GY,X將域內的所有數據都轉換為另一個域內的某一數據,CycleGAN使用循環一致性損失(Cycle Consistency Loss)作為約束,即x和y從源域轉換到目標域后,同樣也可以從目標域返回源域[27]。

由于CycleGAN的結構發生變化,目標函數也隨之發生變化。CycleGAN的目標函數由對抗損失和循環一致性損失兩部分組成。

(1)對抗損失。在CycleGAN中,對于GAN1,目標函數為

lossGAN1(GX,Y,Dy,x,y)=Ey~Pdata(y)[lgDy(y)]+

Ex~Px(x){lg[1-Dy(GX,Y(x))]}

(2)

同理,對于GAN2,目標函數為

lossGAN2(GX,Y,Dx,y,x)=Ex~Pdata(x)[lgDx(x)]+

Ey~Py(y){lg[1-Dx(GY,X(y))]}

(3)

(2)循環一致性損失。在對GAN1、GAN2進行對抗訓練時,僅使用對抗損失不能保證學習得到的映射會將一個輸入x生成期望的輸出y。為了進一步提高對抗訓練的準確性,減少可能的映射函數空間,學習得到的映射函數GX,Y(·)、GY,X(·)還應滿足循環一致性條件,如圖2d所示,將X域(含噪聲數據)內的數據x轉換至Y域(去噪后數據)后,再轉換為x′,即x→GX,Y(x)→GY,X[GX,Y(x)]→x′,使得x與x′接近,甚至相同,這樣可以避免模型網絡將所有X域內數據轉換為Y域內某一固定數據;同理如圖2e,將Y域內的數據y轉換至X域后,再轉換為y′,即y→GY,X(y)→GX,Y[GY,X(y)]→y′。循環一致性損失為

圖2 CycleGAN基本結構及不同模塊構成

losscycle(GX,Y,GY,X)=

(4)

循環一致性損失使輸入的x、y與輸出的x′、y′之間保持高度一致性,從而使生成器的學習更具有目標性,可防止網絡對抗性學習的退化[28]。

最終的損失函數由上述三部分組成,即

lossall(GX,Y,GY,X,Dx,Dy)=lossGAN1(GX,Y,Dy,x,y)+

lossGAN2(GY,X,Dx,y,x)+λlosscycle(GX,Y,GY,X)

(5)

式中λ為控制系數(通常為10),用來控制對抗損失和循環一致性損失在最終損失中的比重。最終的目標函數為

lossGAN1(GX,Y,Dy,x,y)+lossGAN2(GY,X,Dx,y,x)+

λlosscycle(GX,Y,GY,X)

(6)

2 CycleGAN構建

在CycleGAN中,本文用深度殘差網絡[29](Deep Residual Network,ResNet)構建生成器網絡,用馬爾柯夫判別器[30](PatchGAN)構建判別器網絡。

2.1 生成器網絡

在深度學習過程中,卷積神經網絡通過不斷堆疊卷積層進行特征提取,并且隨著層數增大,特征也變得更豐富。但是,層數與準確率并不是單純的正比關系,即不是神經網絡中卷積層數越大越好,因為當達到一定層數時會出現網絡退化現象。而ResNet可有效解決此問題。

本文利用ResNet網絡構建CycleGAN的生成器(圖3),與圖像處理領域中的RGB三通道數據不同,地震數據類似于單通道灰度圖。因此,網絡的輸入數據為256×256的矩陣,使用64個7×7大小的卷積核(Conv)進行卷積處理,經批量標準化(BN)、ReLU 激活函數、下采樣,進入由6個殘差塊組成的ResNet網絡;然后經過上采樣、64個7×7大小的卷積核進行卷積處理及Tanh激活函數,輸出數據為256×256的矩陣。

圖3 本文CycleGAN生成器網絡結構

2.2 判別器網絡

普通GAN判別器輸出一個實數,是對輸入數據整體進行判別的結果;而PatchGAN輸出一個矩陣,矩陣中的每個元素代表輸入數據中某一部分的判別結果,因而具有更高的分辨率及準確性。

本文判別器(圖4)使用PatchGAN,與生成器網絡輸入數據相同,判別器網絡的輸入數據大小同樣為256×256的矩陣,使用不同層深、卷積核大小均為4×4的卷積層處理,每次卷積處理后,需經批量標準化、斜率為0.2的Leaky ReLU激活函數處理,最終輸出30×30的矩陣,該矩陣的每個元素值代表某部分輸入數據為真實數據的概率。

圖4 本文CycleGAN判別器網絡結構

3 數據測試

本文研究使用Dell臺式工作站,Linux64位操作系統,版本為Ubuntu.18.04,GPU為NVIDIA.GTX1070。為驗證CycleGAN對地震數據隨機噪聲的去除效果,分別利用理論數據(簡單模型、復雜模型)和實際數據進行測試,同時對上述地震數據進行小波閾值去噪(綜合對比應用不同小波及不同閾值的去噪結果,本文最終選用了sym3小波、固定式閾值、軟閾值函數,小波分解層數為3層,見附錄A),通過結合不同的信號去噪效果評估指標(本文使用信噪比SNR、均方根誤差RMSE兩種評估方法,見附錄B),對比、評估地震剖面噪聲壓制效果;并抽取單道數據進行頻譜分析,通過剖面細節進一步明確CycleGAN方法的噪聲壓制效果。

3.1 理論數據測試

3.1.1 簡單模型數據測試

簡單模型無噪聲剖面如圖5a所示,添加一定程度的高斯白噪聲得到含噪聲剖面(圖5b,SNR為0.31)。剖面共250道,每道時長2000ms,包含水平、傾斜、不連續和孤立等多種同相軸。對于Cycle-GAN算法,需建立合適的訓練集進行訓練,在對模型進行去噪試驗時,訓練集樣本分別選取2750幅無噪聲和含隨機噪聲剖面(圖6)。其中,含噪聲剖面與無噪聲剖面無需一一對應,每幅訓練集剖面中含有水平、傾斜、不連續和孤立等不同類型同相軸。

圖5 簡單模型地震剖面

圖6 簡單模型訓練集樣本示例

利用制作好的訓練樣本集,經歷100Epoch,用時約40h,可得到訓練好的網絡結構,通過該網絡對含噪剖面進行隨機噪聲壓制測試。圖7為該網絡的損失函數曲線。由圖也可看出,本文網絡中的各部分達到了一種相對平衡的狀態,網絡可以完成對剖面內隨機噪聲的壓制。

圖7 CycleGAN損失函數曲線

從圖8可以看出,小波閾值去噪方法與Cycle-GAN去噪方法均對噪聲進行了一定程度的壓制,但后者去噪效果明顯優于前者。由表1可知,Cycle-GAN去噪后數據SNR為10.38,明顯大于小波閾值,RMSE也小于小波閾值。

表1 簡單模型地震剖面去噪效果對比

對比剖面細節,圖8b紅框內同相軸在去噪后形態存在部分畸變,對比剖面內其他同相軸及訓練集樣本,可知是由訓練集內與其類似剖面訓練樣本較少,導致網絡對于該形態的同相軸去噪能力不夠所致。抽取每幅剖面第60道數據進行頻譜分析,結果如圖9所示。由圖可見,原始無噪聲地震數據的頻譜較為光滑,而加入隨機噪聲之后的含噪聲地震數據頻譜發生了較大變化;通過小波閾值去噪后,頻譜雖有所改善,但仍與原始數據頻譜差別較大;而CycleGAN去噪后的數據頻譜毛刺狀干擾基本消除,并且頻譜特征與原始地震剖面基本一致。

圖8 簡單模型地震剖面兩種方法去噪效果對比

圖9 簡單模型地震剖面第60道去噪前后頻譜對比

3.1.2 復雜模型數據測試

使用Overthrust模型(圖10a)的反射系數與主頻為40Hz的Ricker子波進行褶積得到無噪聲地震剖面(圖10b),剖面共500道,每道時長640ms。對無噪聲數據添加高斯白噪聲得到含噪聲數據(圖10c,SNR為0.65)。為了制作足夠數量的訓練樣本,可將數據進行一系列的處理,如上下倒轉、左右倒轉、插值等。由于此噪聲模型相對復雜,需要選取比簡單模型更多的訓練樣本,本文選取10000幅含隨機噪聲剖面和10000幅無噪聲剖面作為訓練樣本,圖11為部分訓練樣本示例。

圖11 復雜模型訓練集樣本示例

利用訓練好的網絡,對含噪聲數據進行去噪測試,結果如圖12所示。對比圖12a與圖12b可知,在圖10c中受隨機噪聲影響較為嚴重的同相軸(圖10c中紅色箭頭處),經過兩種去噪方法處理后情況均有所改善,但CycleGAN去噪效果明顯優于小波閾值;對比圖12c與圖12d可見,圖12c中除隨機噪聲外,還存在部分同相軸,可知小波閾值去噪算法將部分有效信息去除,而CycleGAN去噪結果中無此現象。同樣,由表2也可以看出,本文去噪算法性能更佳。

表2 Overthrust模型地震剖面去噪效果對比

圖10 Overthrust模型及地震剖面

對于Overthrust模型地震剖面的細節部分,如圖12a和圖12b中紅框內區域,抽取第240道數據進行頻譜(圖13)分析,在90~180Hz范圍內,可發現CycleGAN去噪方法幾乎完全消除了隨機噪聲;

圖12 Overthrust模型地震剖面去噪效果對比

圖13 Overthrust模型地震剖面第240道去噪前后頻譜對比

在0~90Hz范圍內,CycleGAN去噪方法也能夠很好地保留有效信號,最大限度地消除了隨機噪聲的影響。

3.2 實際數據測試

選用中國東部A工區實際地震數據進行測試。對于受噪聲影響較小的數據進行常規噪聲壓制處理,即可獲得成像較為清晰的地震剖面。從中選取10幅作為訓練集中無噪聲剖面,圖14為其中的兩幅剖面,每幅剖面有250道,每道時長為1024ms。通過對無噪聲剖面進行上下反轉、左右反轉及插值處理,擴充訓練數據集數量,得到5000幅無噪聲剖面。對無噪聲剖面添加一定程度高斯白噪聲,得到5000幅含噪聲剖面。利用上述數據作為訓練集進行網絡訓練。取該工區內另一隨機噪聲嚴重的剖面(圖15a,SNR為0.55)為測試數據,測試數據共250道,每道時長為1024ms,去噪結果如圖15b、圖15c所示。

圖14 A工區高信噪比疊后地震剖面經常規噪聲壓制處理后效果示例

對比圖15b、15c可以發現,由于原始數據在進行小波閾值去噪時,小波分解得到的小波系數無法對有效信號進行完美的表達,因此,雖然“雪花狀”隨機噪聲得到壓制,但其中部分連續同相軸變為多個不連續塊狀同相軸(如圖15a、15b內紅框內部分),有效信號損失較為嚴重。圖15d、圖15e分別為兩種方法去除的噪聲,其中,小波閾值去噪方法去除的噪聲(圖15d)存在類似條狀同相軸,相比之下,CycleGAN在壓制隨機噪聲的同時,有效信息也得到了最大程度的保留。表3為實際地震數據去噪效果對比,由表3也可以看出,本文去噪方法性能更佳。

“電聲樂器和其他產品一樣,也要經歷一個從規?;骄せ倪^程。鄌郚鎮的樂器行業要想不被取代,必須下力氣抓產品質量,打品牌,將產品做到極致,做出不可替代性,既要有形,也要有神。同時,我們還在研究旅游和電聲產業的結合,搞吉他音樂節、電聲產業論壇、音樂家村等,研發圍繞電聲產業的旅游商品,擴大鄌郚鎮電聲產業的影響力、提升旅游活力?!编o郚鎮鎮長李克鵬說。目前,鄌郚鎮已經規劃建設了“昌樂縣鄌郚樂器產業園”,按照國內一流標準,統一規劃設計,統一服務管理,統一配套設施,并形成了樂器制作產業鏈,同時音樂節和吉他大賽的舉辦也吸引了數以萬計的游客。

圖15 A工區疊后地震數據及去噪效果對比

表3 實際地震數據去噪效果對比

4 結論

本文提出一種適用于地震數據隨機噪聲壓制的循環一致性生成對抗網絡,該網絡生成器由ResNet網絡構成,有效避免了梯度爆炸(消失)及網絡退化問題;判別器由PatchGAN構成,可以更好地對生成結果進行識別;同時,該網絡在傳統對抗損失的基礎上引入循環一致性損失,提高了訓練過程的穩定性。通過訓練好的網絡分別對簡單模型數據、復雜模型數據及實際地震數據進行隨機噪聲壓制測試,并以常規去噪算法(本文應用小波閾值去噪方法)作為對照組,利用去噪前后數據信噪比、均方根誤差等參數,證明了本文構建的網絡去噪方法優于小波閾值去噪方法;通過對比單道頻譜分析結果進一步說明CycleGAN去噪效果優于常規去噪算法,驗證了本文方法在地震數據隨機噪聲壓制方面的可行性。

目前,深度學習算法在地震資料處理領域的應用才剛剛起步,還存在許多問題亟待加以改進。本研究下一步工作是:如何在維持當前去噪效果的同時,縮短網絡訓練時間,改善CycleGAN去噪的泛化能力,提高本文方法的實用性。

附錄A 固定式閾值和軟閾值函數計算公式

文中小波閾值去噪的閾值計算規則為固定式閾值,閾值函數為軟閾值函數。

去噪過程中首先需要估計閾值,然后保留大于閾值的系數,舍棄小于閾值的系數。閾值選擇過大則可能去除有效信號,過小則不能完全消除噪聲,因此需要選擇一個合適的閾值規則。文中固定式閾值為

(A-1)

式中:σ為噪聲的標準方差;N為信號的長度。

(A-2)

附錄B 信噪比和均方根誤差計算公式

信噪比(Signal to Noise Ratio,SNR)是有效信號能量與噪聲能量之比,為振幅比的平方。假設有效信號為s(t),去噪后信號為g(t),則

(B-1)

式中Es、En分別為有效信號能量、噪聲能量。通常認為,SNR越高,去噪后的信號殘留噪聲能量越小,去噪效果越好。

均方根誤差(Root Mean Squared Error,RMSE)是均方誤差的算術平方根,用來表示有效信號與去噪后信號之間的差異

(B-2)

通常認為,RMSE越小,去噪效果越好。

猜你喜歡
壓制剖面閾值
ATC系統處理FF-ICE四維剖面的分析
土石壩壩體失穩破壞降水閾值的確定方法
采用紅細胞沉降率和C-反應蛋白作為假體周圍感染的閾值
空射誘餌在防空壓制電子戰中的應用
復雜多約束條件通航飛行垂直剖面規劃方法
基于遲滯比較器的雙閾值穩壓供電控制電路
船體剖面剪流計算中閉室搜索算法
對GPS接收機帶限高斯噪聲壓制干擾的干擾帶寬選擇分析
一種改進的小波閾值降噪方法
近年來龍門山斷裂GPS剖面變形與應變積累分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合