?

基于U-Net 的海洋鋒智能檢測模型*

2024-01-21 18:04任詩鶴韓焱紅李競時趙亞明匡曉迪吳湘玉楊曉峰
空間科學學報 2023年6期
關鍵詞:鋒面中心線梯度

任詩鶴 韓焱紅 李競時 趙亞明 匡曉迪 吳湘玉 楊曉峰

1(國家海洋環境預報中心 自然資源部海洋災害預報技術重點實驗室 北京 100081)

2(中國氣象局公共氣象服務中心 北京 100081)

3(北京市5111 信箱 北京 100094)

4(中國科學院空天信息創新研究院 遙感科學國家重點實驗室 北京 100101)

0 引言

海洋鋒是海洋中兩種不同性質的水體之間的邊界,在鋒面處對應的水文要素(例如溫度、葉綠素濃度、鹽度、密度等)急劇變化,形成對應水文要素的高梯度區域[1-2]。海洋鋒對漁業、軍事和海洋環境保護等許多領域有重要影響,目前也成為海洋交叉學科研究中的一個重要課題。由鋒面引起的輻聚等動力過程為魚類提供了豐富的餌料[3],使得鋒面區域成為漁業活動的熱點[4]。鋒區的輻聚作用還能將浮游碎屑、油污、微塑料等物質聚集在鋒面附近。鋒面對于海洋軍事領域也有重要的影響,鋒面兩側的聲波的傳播過程具有明顯差異特征,所以水下作戰和通信、艦艇操作和海上搜救都需要準確及時的鋒面分析預報數據[5]。鋒區附近的動量、熱量的交換十分活躍,在海氣相互作用過程中,對天氣和氣候的影響很大,不僅成為海上風暴的易發區,也對局地海霧的形成有著重要影響。

海洋鋒的自動提取識別工作是海洋鋒分析預報的基礎,衛星遙感技術的快速發展,使得分析識別海洋鋒變得更簡單可行。目前廣泛應用的海洋鋒診斷方法可以分為以下幾類:梯度法、邊緣檢測法和直方圖分析法[6],梯度法和邊緣檢測法都是基于鋒區內具有高梯度的性質,直方圖法是基于水團分類的定義。梯度法主要通過設置適當的水平溫度梯度閾值來進行海洋鋒的診斷識別,梯度法原理直觀,計算方便,是海洋學研究中診斷鋒區位置最常用的方法[7,8]。其基本原理是首先遍歷計算各像素點的水平溫度梯度,并根據經驗選取合適的梯度作為鋒面閾值,然后將溫度梯度大于鋒面閾值的點設為鋒面像素點。鋒面往往是不同水團之間的分界面,其溫度有比較明顯的變化,直方圖法直接利用此定義通過設計一系列統計算法來劃分兩個水團,從而實現鋒面的檢測。鋒面在溫度直方圖中表現為兩個尖峰,該方法相比梯度法更適用于弱鋒面檢測[9,10]。邊緣檢測法最早用于圖像處理和計算機視覺識別等問題。Canny 邊緣檢測算法通過高斯濾波降低圖像中的噪聲影響,也具有很高的邊緣檢測準確性,是抗噪聲與精確定位之間較好的折中方案[11,12],Canny 鋒面檢測方法已被廣泛應用在海洋鋒識別診斷中。海洋鋒面的快速準確識別不僅對于理解和預測氣候、海洋循環和生態系統具有重要的科學意義,對提高漁業資源和漁場預測水平、服務軍事等也具有十分重要的實際應用價值[10]。

傳統的海洋鋒檢測和時空演化分析方法都是基于前人的文獻或根據經驗得到的,而海洋鋒是動態變化的,對于不同季節不同區域的海洋鋒面識別和診斷都需要尋找合適的閾值,主觀性較大并難以保證較高的準確性,不能很好地實現自動化檢測[13,14]。另外目前基于梯度法和邊緣檢測法的海洋鋒面的識別方法,其識別精度沒有統一標準[15]?;谥狈綀D的檢測算法盡管對梯度不敏感,但在鋒面精細化檢測方面也存在兩點限制:一是較大的檢測窗口對于近岸和云層覆蓋區域難以準確識別鋒面;二是多個重疊窗口的獨立檢測會導致鋒面檢測出現不連續和重復。隨著深度學習在海洋數據重構、分類識別和預測等領域不斷發展,國內外學者利用深度學習方法從海量海洋遙感影像中自動學習海洋鋒全局特征并實現診斷識別,實現了從像素級的分類到對象級的檢測。目前已有相關研究將深度學習模型與海洋鋒物理機理相結合, 調整目標檢測模型相關參數并進行訓練, 可以避免閾值選取的主觀性, 大大提高了鋒面檢測速度和準確度[16]?;谏疃葘W習的海洋鋒智能識別診斷技術已成為中尺度海洋鋒提取和診斷的有力工具,隨著當前各個行業對于準確快速的海洋預報需求日益迫切,精細化中尺度過程的快速準確的診斷預報能夠為海洋漁業、國防安全提供預報保障服務,基于深度學習技術進一步研發中尺度智能預報數據對于未來海洋預報的智能化、輕量化都具有重要意義。

Lima 等[17,18]基于卷積神經網絡(Convolutional Neural Networks)提出了一種用于海洋鋒自動識別的深度學習方法,通過遷移學習的方式克服了海洋鋒小樣本訓練的問題,實驗結果表明,該模型可以產生準確的識別結果。Sun 等[14]在海洋鋒檢測分類模型的基礎上對之前算法做了進一步改進,對不同尺度的SST 圖像進行鋒面識別,實現了海洋鋒的像素級自動化檢測和定位。針對傳統的邊緣檢測算法并不能很好地檢測到海洋鋒的弱邊緣信息這一問題,Li 等[19]收集了相關的海洋溫度梯度圖像,找到相關專家對海洋鋒數據進行校準以獲得海洋鋒的基準值,并提出了一種用于海洋鋒檢測的弱邊緣識別網絡。曹維東等[20]基于Mask R-CNN 模型得到了海洋鋒像素級智能識別模型,并統計每一類鋒特有的梯度分布,對鋒面模型進行精細化調整,提高了模型的可靠性。Xie 等[13]建立了基于編碼-解碼器的端到端海洋鋒面精細化弱邊緣識別模型,該方法網絡結構簡單,能夠從不同尺度提取海洋鋒,實現了中國近海的多條主要海洋鋒面的自動識別,并能夠輸出位置、類別、形狀、走勢等鋒面參數信息。Li 等[21]采用U-Net 框架基于遙感SST灰度圖像建立了一個海洋鋒提取和識別模型,該模型不但能夠提取鋒面的整體特征,也能夠連接許多細小的鋒面結構。

現有方法大多都是針對海洋鋒區的智能識別和提取研究,而針對海洋鋒中心線的提取方法則很少提及,這些研究中的鋒面樣本集很多時候都需要采用主觀方法進行標注。本文利用Ren 等[8]提出的一種融合梯度法和邊緣檢測法的鋒面自動提取算法進行樣本集制作,該方法能更好地適用于目前高分辨率的遙感和數值模擬結果,既保證了鋒面診斷的準確性,又提高了鋒面的連續性。將深度學習圖像分割網絡與提取鋒面特征的方法相結合,利用基于U-Net 架構的實例分割模型,分別建立海洋鋒區和鋒面中心線的智能檢測模型,同時在編解碼過程中采用殘差學習單元對模型特征提取網絡進行改進,經過實驗驗證,與以往研究結果對比,該模型在一定程度上提高了鋒面檢測精度,為海洋鋒的自動識別提供了新思路。

1 研究方法

1.1 模型選取

U-Net 網絡作為語義分割領域的一個重要架構,前半部分就是特征提取,后半部分是上采樣,也叫做編碼器-解碼器結構,由于網絡的整體結構是一個大寫的英文字母U,所以叫做U-Net。通過嵌入殘差學習單元對U-Net 進行改進,模型結構如圖1 所示,模型將上一個殘差塊的特征信息加入下一個殘差單元中,有效地避免了網絡過深引起的性能退化和特征信息丟失問題。模型使用了3 階的全32 位過濾器架構,采用了典型的“編碼器-解碼器”網絡架構,編碼器路徑具有3 個階段,每個階段的殘差單元模塊主要包括兩組批歸一化處理層(Batch Normalization,BN)、ReLU 激活函數層和3×3 卷積層,進行殘差連接后,通過2×2 最大池化層(Max Pooling)進行下采樣。其中3×3 卷積層主要用于提取SST 場的特征信息,在每個最大池化層之前和每個轉置卷積層之前添加Dropout 層(Dropout=0.5),提高了檢驗損失的性能并且優化了過擬合問題。解碼器路徑同樣具有3 個階段,每個階段首先對上采樣(Up Sampling)特征圖與對應層級的編碼器卷積層進行拼接,以返回到圖像原始分辨率,之后再進行相應的特征提取工作。

圖1 基于U-Net 的鋒面檢測模型Fig. 1 Front detection model based on U-Net structure

1.2 損失函數

對于深度學習中圖像分割的二分類問題,一般采用分類交叉熵或Dice 系數作為損失函數進行訓練,基于U-Net 的EddyNet 中尺度渦智能提取模型采用了基于Dice 系數的損失函數,獲得了更好的分類效果[22]。因此本模型同樣使用基于Dice 系數(Dice coefficient)實現的Dice Loss 作為損失函數。Dice 系數是一種集合相似度度量函數,通常用于計算兩個樣本的相似度,取值范圍在[0,1]之間,即圖像分割效果好則傾向于1,分割效果差則傾向于0。Dice 系數對正負樣本嚴重不平衡的場景具有較好的性能,訓練過程中更側重對前景區域的挖掘,因此更適合于海洋鋒檢測這類場景。Dice 系數計算公式如下:

其中,P為預測區域,G為真實區域,|P|+|G|表示兩個區域中元素的總和,Dice 系數值D為P與G區域交集與區域總和之比的兩倍,直觀解釋可以理解為鋒面預測正確的結果與真實結果+預測結果比值的兩倍。

海洋鋒圖像分割模型的分類為鋒面像素及背景像素,且數據集存在樣本嚴重不均衡的問題。對于鋒面檢測這類樣本量嚴重不平衡的場景來說,加權Dice 系數比分類準確率更適合作為判斷模型好壞的標準。本文在建立模型之前,分別對鋒區檢測模型和鋒面中心線檢測模型計算每類樣本的權重,根據每類樣本的占比倒數確定Dice 系數的權重,加權Dice 系數與損失函數計算公式如下:

其中,Dfront和Dbg分別為類別屬于鋒面區域和背景區域的Dice 系數,α和β分別為二者的權重,Dweighted為數據總體加權Dice 系數,L為模型計算得出的損失函數值。通過2008—2017 年10 年的數據統計分析得出,鋒區檢測模型的α和β分別為0.88 和0.12,鋒面中心線檢測模型的α和β分別為0.97 和0.03。

2 結果與分析

2.1 實驗環境與參數

實驗環境基于python 3.9 搭建,GPU 為NVIDIA GeForce RTX 3090,CUDA 版本為11.5,Keras 版本為2.6.0,Tensorflow-gpu 版本為2.6.0。實驗選擇Dice Loss 作為損失函數,采用計算高效、善于處理非平穩模型的Adam 優化器來優化模型。實驗訓練時按照9∶1 劃分訓練集和測試集,為避免過擬合問題,實驗設置早停機制,patience 設置為100 epoch,監聽參數fitness 設置為評估損失val_loss。實驗中選擇分類準確率(Categorical Accuracy)和加權Dice 系數(Weighted Dice Coefficient)兩種評價指標為模型進行評估。

2.2 樣本集制作

實驗數據來自哥白尼海洋環境監測中心(Copernicus Marine Environment Monitoring Service,CMEMS)提供的高分辨率的全球融合衛星觀測數據OSTIA(Operational Sea Surface Temperature and Sea Ice Analysis)[23],該數據是由GHRSST-PP 計劃提供的一套結合了多種觀測得到的SST 融合數據集,空間分辨率為0.05°。實驗選擇2008 年1 月1 日至2017 年12 月31 日共10 年的日平均數據,范圍為南海北部海域(10°—25°N,105°—121°E),水平格點數為300 ×320。

樣本集制作方法采用Ren 等[8]提出的一種融合梯度法和邊緣檢測法的鋒面自動提取算法,其中鋒面閾值為自適應設置方案,高低閾值分別設置為梯度值大于當天圖像中90%和80%像素點的溫度梯度值。處理流程如圖2 所示。

2.3 結果分析

為了驗證本文鋒面模型的可靠性和有效性,采用2008—2016 年鋒面樣本集分別將樣本集中的鋒區和鋒面中心線數據作為標簽數據進行模型訓練,在2017年測試集上進行測試。設置4 組模型,將SST 和SST 梯度分別作為輸入數據進行訓練,以測試其在鋒區檢測模型和鋒面中心線檢測模型中的檢測效果。圖3 給出了4 種模型訓練過程中訓練集的損失率及測試集加權Dice 系數的變化情況。從圖3(a)可以看出對于鋒區檢測模型來說,采用SST 梯度作為輸入數據訓練收斂速度比采用SST 訓練更快,大約25 次訓練之后,二者基本持平,均收斂至0.1 附近。對于鋒面中心線檢測模型,采用溫度梯度訓練的結果要明顯好于采用SST 訓練的模型,其收斂速度更快且損失率更低。測試集Dice 系數曲線也證明了這一點,采用溫度梯度訓練的模型的Dice 系數也略高于采用SST 訓練的結果。表1 給出了4 種模型測試集的分類準確率和加權Dice 系數,4 種模型的分類準確率均超過了0.98。

表1 4 種模型測試集的評價指標Table 1 Evaluation metrics of four models in the test set

圖3 4 種模型訓練集損失率(a)與測試集加權Dice 系數(b)的變化Fig. 3 Variation of loss rate in the training set (a) and Dice coefficients in the test set (b) of four models

圖4 給出了前述4 種模型的預測結果與測試集中2017 年第139 天的鋒面中心線和鋒區真值的對比圖,圖4(a)(b) 為日平均的SST 和SST 梯度分布,圖4(c)~(e)和圖4(f)~(h)分別為鋒區檢測模型和鋒面中心線檢測模型的結果,圖4(c)(f)為測試集真值,圖4(d)(g) 為采用SST 訓練的模型結果,圖4(e)(h)為采用SSTgrad 訓練的模型結果??梢钥闯?,鋒面中心線和鋒區模型均表現了較好的準確性和魯棒性,但也出現了一些漏檢的情況,如在越南東側沿岸的梯度較弱的鋒面沒有檢出,而且檢測模型的結果連續性還有待增強??紤]到這一情況,嘗試降低樣本數據集鋒面檢測的閾值,設置為長度大于50 km,梯度閾值大于0.01℃·km-1,這一閾值標準基本上是南海海表溫度閾值的最下限。用新制作的樣本集重新訓練了4 組模型,將該實驗命名為exp_base,前述自適應閾值的實驗命名為ctrl,并測試其在鋒區檢測模型和鋒面中心線檢測模型中的檢測效果。圖5 給出的是exp_base試驗的4 種模型訓練過程中訓練集的損失率及測試集加權Dice 系數的變化情況,對于鋒區和鋒面中心線檢測模型,采用SST 梯度作為輸入數據訓練的收斂速度、損失率和加權Dice 系數全部優于采用SST 訓練的結果。通過表2 也可以看出,與ctrl 試驗相比,exp_base 試驗中降低了樣本閾值之后,Dice 系數提高明顯,其中鋒區訓練模型由原來的0.92 左右提高至約0.97,鋒面中心線訓練模型由原來的0.88 提高至0.92。

表2 exp_bases 實驗中4 種模型測試集的評價指標Table 2 Evaluation metrics of four models in the test set of exp_base

圖4 (a)(b)測試集2017 年第139 天的SST 及其梯度分布。(c)~(e)為鋒區檢測模型結果(0 表示背景,1 表示鋒面),(f)~(h)為鋒面中心線檢測模型結果(0 表示背景,1 表示鋒面)Fig. 4 (a) (b) SST in Day 139 in 2017 and SST gradient. (c)~(e) are frontal area model results (0 expresses backgroud, 1 expresses front); (f)~(h) are frontal line model results (0 expresses backgroud, 1 expresses front)

圖5 exp_base 試驗中4 種模型訓練集損失率(a)與測試集加權Dice 系數(b)的變化情況Fig. 5 Variation of loss rate in the training set (a) and dice coefficients in the test set (b)of four models in the experiment of exp_base

圖6 給出了exp_base 試驗下2017 年第139 天的鋒面中心線和鋒區真值的對比圖,圖6(a)~(c)和(d)~(f)分別為鋒區檢測模型和鋒面中心線檢測模型的結果,圖6(a)(d)為測試集真值,圖6(b)(e)為采用SST 訓練的模型結果,圖6(c)(f) 為采用SSTgrad 訓練的模型結果??梢钥闯鰺o論是鋒區模型還是鋒面中心線模型,和ctrl 試驗相比,均有了顯著的提升,沒有存在明顯的誤檢和漏檢情況。在鋒面閾值降低的情況下,由于其刻畫出了更多的鋒面細節,對于南海北部近岸區的較強的鋒面,高閾值的影響不大,但對于南海海盆內部的中尺度鋒面,由于其瞬變性較強,降低閾值之后擴充了鋒面樣本數量,經過充分的訓練之后,模型能夠更好地擬合鋒面的精細結構。與以往研究結果鋒區檢測準確率比較,本文基于U-net 方法的準確率有了一定的提升。

圖6 exp_base 實驗中測試集鋒區檢測模型和鋒面中心線檢測模型結果對比 (0 表示背景,1 表示鋒面)Fig. 6 Comparison of frontal area model and frontal line model in the test set of experiment exp_base (0 expresses backgroud, 1 expresses front)

盡管降低閾值能夠提高鋒面檢測模型的精度,但在實際的海洋鋒分析預報業務中,閾值過低會造成鋒面的過量檢出,對海洋鋒監測和預報數據的解釋應用帶來困擾。所以在后續的研究工作中,仍然需要從海洋鋒的動力機理出發,開展基于深度學習的海洋信息挖掘和對象級目標檢測,利用多源海洋數據將相應的深度學習模型與海洋中尺度過程的物理機理進行結合,在預處理和后處理環節與傳統檢測方法的機理結合,以提升鋒面檢測模型的精度。

3 結論

將深度學習圖像分割網絡與提取鋒面特征的方法相結合,基于U-Net 架構的實例分割模型,分別建立海洋鋒區和鋒面中心線的智能檢測模型,同時在編解碼過程中采用殘差學習單元對模型特征提取網絡進行改進。實驗結果表明,基于U-Net 的鋒面智能檢測模型能夠準確提取鋒區和鋒面中心線特征,達到了很好的檢測效果。通過比較不同閾值制作的樣本數據模型訓練結果,發現無論是鋒區模型還是鋒面中心線模型,在降低樣本集閾值之后模型精度均有了顯著的提升。在實際海洋監測預報業務中,還需要進一步從海洋鋒的動力機理出發,將相應的深度學習模型與海洋中尺度過程的物理機理進行結合,例如將傳統方法對于鋒面的預處理和后處理流程加入智能算法中,以進一步改進鋒面檢測模型的整體性能。

隨著當前各個行業對于準確快速的海洋預報需求的日益迫切,精細化中尺度過程的快速準確的診斷預報能夠為海洋漁業、國防安全提供預報保障服務,基于海洋再分析數據開展的海洋鋒智能診斷算法同樣可適用于海洋預報數據的解釋應用??焖贆C動的中尺度智能預報數據制作和發布,對于未來海洋預報的智能化、輕量化都具有重要意義。

猜你喜歡
鋒面中心線梯度
熱聲耦合燃燒振蕩中火焰鋒面識別分析
一個改進的WYL型三項共軛梯度法
2019年夏季長江口及鄰近海域鋒面控制下葉綠素a的分布特征及其環境影響因素分析
一種自適應Dai-Liao共軛梯度法
基于核心素養的高中地理“問題式教學”——以“鋒面氣旋”為例
一類扭積形式的梯度近Ricci孤立子
第十講 幾何公差代號標注示例10
——目鏡套筒
X線攝影中中心線對DR攝影質量的重要性
基于Meanshift和Hough變換的秧苗行中心線提取
基于曲率計算血管中心線特征點的提取方法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合