?

眼底數據頻域增強算法

2024-02-28 08:18劉義鵬曾東旭
小型微型計算機系統 2024年1期
關鍵詞:頻域頻段分量

劉義鵬,曾東旭

(浙江工業大學 計算機科學與技術學院,杭州 310023)

0 引 言

眼底分布著豐富的毛細血管,這些毛細血管負責滋潤眼球,給眼球提供必要的營養物質.眼底血管疾病,如糖尿病視網膜病變、視網膜靜脈阻塞、高血壓性視網膜病變、高度近視性視網膜病變等,會引發毛細血管出現出血紅腫等癥狀,病情嚴重時甚至會導致患者失明.

現代成像技術可以幫助醫生直接通過眼底圖像觀察到視網膜的微血管結構.一張正常的眼底圖像通常包括中心凹、黃斑、視乳頭、視網膜中央動脈、靜脈和毛細血管等,這些特征的變化在一定程度上反映了某些器官的病變程度.例如,糖尿病患者的眼底圖像中往往能看見毛細血管瘤、滲血和出血點,高血壓患者能在眼底血管中觀察到動脈硬化現象.這些眼部血管的病變在一定程度上也反映了全身的血管狀況,不僅如此,眼部血管的病變也會影響患者的視力.醫生通過眼底檢查可以分析判斷疾病的類型和嚴重程度.因此,眼底檢查是一種重要的眼底疾病診斷手段,而眼底血管分割可以為疾病分析和診斷提供輔助量化工具.

眼底圖像細節豐富,如果依靠醫生的人工分析,這對醫生的觀察能力和從醫經驗有較高的要求.計算機輔助診斷技術可以幫助醫生提高診斷的效率和精度.傳統的計算機輔助診斷技術由算法提取人工預先設定的特征,醫生根據這些特征進行判斷.近年來隨著深度學習的快速發展,使計算機的視覺識別準確率在特定領域超過了人類.訓練好的深度神經網絡通過逐層提取特征,學習圖像中的語義信息,在網絡輸出端自動輸出眼底血管分割結果,這將顯著減少醫生的工作量,提高篩查和診斷的效率.在實際應用場景中,深度學習訓練集和測試集的樣本在光照、對比度、采樣設備等各方面都存在差異,這些差異導致深度神經網絡往往無法在測試階段取得令人滿意的血管分割結果.

提高模型泛化性能的一個重要方式是增加訓練樣本的數量和多樣性,而眼底血管分割數據集因為收集和標注困難,公開數據集往往樣本量少、多樣性不足.傳統數據增強和對抗生成網絡方法能在一定程度上增加樣本的多樣性,已經作為一種通用的預處理步驟嵌入在深度神經網絡的訓練中,但是上述方法生成的數據常常包含噪聲,破壞眼底圖像中細小血管的語義信息,導致血管分割算法精度下降.

1 研究現狀

1.1 域泛化

域泛化研究的是如何讓在訓練集上訓練的算法能夠在測試數據集上取得優異的預測精度,這是各個應用領域中的關鍵科學問題,例如行人再識別[1,2]、工業檢測[3,4]和醫學圖像[5]等.現有的研究方向包括域對齊(Domain Alignment)、元學習(Meta-Learning)、集成學習(Ensemble Learning)、自監督學習(Self-Supervised Learning)、解耦表征(Disentangled Representations)、數據增強(Data Augmentation)等.

解決域泛化問題最常見的方法是域對齊,其中心思想是通過最小化源域之間的差異以學習域不變特征,這類方法的優點是訓練階段收斂速度快.Li等人[6]通過最小化所有類的跨域條件分布方差,讓模型學習可遷移的特征;Hu等人[7]通過減弱對邊際分布的最小化約束來獲取更小的泛化誤差,并提出了幾種差異度量來評估學習到的泛化特征;Li等人[8]認為可以在隱含層上減小源域之間距離,通過對抗學習獲得更具有泛化性能的特征.許夙暉等人[9]將目標域分類器參數投影到源域參數空間中,使其最大限度地與源域分類器參數分布相同來保證源域模型和目標域模型的相關性.這類方法的思路和作用相較于其它方法更加直接,調試步驟較少,方便實現,但對源域數據集的數量要求較高,當源域數量不足時,域對齊的方法難以發揮其優勢.

元學習的核心思想是先學習對任務有幫助的先驗知識,再進行后續深度學習任務的訓練,其中會用到輔助域數據集.Balaji等人[10]提出將網絡中的歸一化參數用作元學習;Du等人[11]通過訓練一個隨機神經網絡來減弱元學習中的不確定性;Liu[12]等人使用元學習方法訓練MRI分割模型,使用兩個形狀感知損失函數,以確保分割結果的緊湊性和平滑性.這類方法更接近人類學習認知的過程,缺點是需要獲得多個源域的輔助信息,然而在眼底血管分割任務中,只存在單一的圖像數據,因此元學習往往難以適配該場景.

集成學習對同一個模型,采用多次不同的初始化方法,或者將訓練數據集拆分成多份,用集成算法將這些模型合為一個.文獻[13]和文獻[14]提出對每個源域都單獨訓練一個模型,構建特定域的批歸一化層,但是模型的其它部分仍然保持參數共享,這種設計后來在被用于MRI圖像分割[15];文獻[16]使用測試樣本統計信息與源域批歸一化層統計信息之間的距離作為權重,聚合出可用于進行域判別的特征.這類方法往往能得到高精度的模型,但是集成算法在模型數量較多時才能發揮其作用,這會大大增加訓練的時間開銷.

自監督學習從無標注數據中生成偽標簽用于訓練,例如打亂像素塊順序[17]、旋轉度數[18].Carlucci等人[19]訓練一個用于解決拼圖問題的網絡,該網絡可以學習跨鄰域的通用知識;Wang等人[20]以拼圖任務作為內監督,以度量學習作為外監督提升模型的泛化性能;在文獻[21]中,研究者結合3個輔助訓練任務達到更好的泛化精度,分別是重建Gabor濾波器響應、預測旋轉和預測特征聚類分配[22].自監督學習的優勢在于可以在無標簽的數據上完成訓練,前提是需要設計良好的替代任務用以幫助訓練血管分割網絡.

表征解耦的中心思想是學習具有域不變的特征或模型層.Khosla等人[23]基于SVM將分類器分解為域相關偏差和域無關偏差,在測試階段保留后者的網絡權重,這種方法后來擴展到神經網絡[24];在文獻[25]中,每個域都有獨自的二進制掩碼,處理最后的特征向量,以區分域相關和域不變分量;在文獻[26]中,變分自動編碼器(Variational Auto-Encoder,VAE)用于分別學習類、域和對象的3個獨立隱藏子空間.Wang等人[27]通過對抗訓練得到兩個獨立的編碼器,分別捕獲身份和域信息以進行人臉識別.在文獻[28]中,作者提出可泛化的特征應學習全局結構,而非圖像的局部細節信息.這類方法可以達到較高的精度,前提是通常需要人為先驗信息的輔助,才能解耦出域的高維抽象特征用以輔助下游任務,然而在眼底血管分割中,重要的語義信息一般存在于低維結構,例如血管的邊緣、背景的色塊等,因此該類方法往往難以適用于本文關注的應用場景.

數據增強是一類重要的方法,它通過增加數據集的多樣性和數量來防止模型過擬合并增強泛化性,在1.3節中將重點介紹數據增強算法.

1.2 深度學習中的頻域分析方法

頻域分析通過理論和實驗證明的方法,尋找深度神經網絡訓練過程在頻域上的規律,探究其對網絡泛化性能和收斂性能的影響.Xu等人[29]證明神經網絡的訓練過程會更多的關注低頻分量,而高頻分量往往破壞網絡的泛化性能,這一訓練過程中的偏差被定義為頻率法則,即神經網絡通常從低頻到高頻擬合目標函數.Zhang等人[30]從頻域角度解釋為什么參數比樣本多的深層神經網絡通常具有較好的泛化性能,使用線性動力學模型,準確預測包含兩層線性整流激活函數(Rectified Linear Unit,ReLU)模型的訓練效果.Xu等人[31]利用連續分段線性結構對ReLU網絡的傅里葉頻譜分量進行分析,發現譜分量偏差來源于低頻分量,然而對低頻分量的學習,有助于增強網絡在對抗干擾過程中的魯棒性.神經網絡可以擬合任意函數,但Rahaman等人[32]發現深度神經網絡往往更喜歡低頻分量,因此表現出對平滑函數和平滑數據的偏倚,這一現象被定義為譜偏移現象.研究表明,頻率法則也并不總是有效的,Ma等人[33]發現了該法則的生效邊界,具有理論指導意義.Yin等人[34]表示關注魯棒性不能完全丟失高頻特征,網絡在訓練過程中會涉及到高頻特征的學習,其中部分高頻特征能夠增強網絡魯棒性能.Wang等人[35]的實驗則再次確認在訓練階段關注低頻信息,有助于提高模型的泛化性能,但是高頻分量可能與對抗攻擊有聯系,許多對抗生成網絡往往無法生成正確的高頻分量,這一結論也被用于后續檢測人臉偽造圖像.此外,該工作還通過大量的實驗證明批歸一化對于擬合高頻分量,提高泛化性是有幫助的.

1.3 數據增強

數據增強也被稱為數據增廣,僅在原始訓練數據的基礎上,增加訓練數據集的多樣性,讓有限的數據產生等價于更多數據的價值,提高模型泛化能力.傳統的數據增強包括翻轉、旋轉、縮放、裁剪等,這些數據增強算法被普遍用于模型的訓練過程中,能夠防止訓練過擬合.

此外,還有一類基于深度學習的數據增強方法,這類方法借鑒了生成對抗模型的思想.Peng等人[36]提出不僅要增強圖像,還要使用生成對抗網絡(Generative Adversarial Networks,GAN)增強標簽.Shankar等人[37]使用貝葉斯網絡對標簽、域和輸入實例之間的依賴關系進行建模,并提出了交叉梯度法,在盡可能少地更改類標簽的同時,沿著最大域變化的方向擾動輸入.Volpi等人[38]提出一種隨機搜索數據增強算法,通過隨機組合數據增強算法,觀察各種組合的測試結果,搜索最優的組合策略.Huang等人[39]提出一種自學習表示算法,通過關閉訓練期間具有最大梯度的主導神經元來虛擬地增加較難擬合的數據樣本.Zhuo等人[40]在對訓練框架中引入熵最大化的方法生成擾動樣本.然而,現有數據增強算法存在以下問題:1)生成對抗模型不是端到端訓練的,在訓練血管分割網絡之前首先需要訓練好眼底圖像生成網絡,這會降低模型訓練的效率;2)生成對抗模型往往難以調參,訓練過程難以控制;3)由于缺乏未標記的目標域數據和其它源域數據,現有方法很難拓展源域的語義空間,生成帶有偽影和噪聲的樣本,這些樣本最后會損害模型性能.

針對現有方法存在的問題,本文在頻域分析的基礎上提出眼底數據增強算法,主要貢獻包括:1)端到端訓練,數據生成模塊不需要額外訓練;2)只有一個用于區分頻段的閾值參數,并且已通過實驗和調參找到最佳取值;3)生成樣本去掉了噪聲頻段,并在頻域上擴展語義空間.

2 相關原理和介紹

2.1 數據集和評判指標

本文在DRIVE數據集上訓練模型,然后在DRIVE、STARE、CHASE、IOSTAR和DRHAGIS 5個眼底血管分割數據集測試精度,以評估當前模型的泛化性能.各個數據集的圖像實例如圖1所示.

圖1 數據集樣本和標簽Fig.1 Dataset samples and labels

眼底圖像的數據集樣本小,多樣性不足,模型容易過擬合,因此訓練前需要對其進行基礎的數據增強,主要包括隨機旋轉、水平隨機翻轉、垂直隨機翻轉,隨機亮度、對比度和飽和度增強.實驗選用最值歸一化將數據映射到0~1之間,其公式定義如(1)所示.

(1)

其中,x為輸入的圖像像素值,min為樣本數據中的最小值,max為樣本數據中最大值,xout為歸一化處理后的像素值.本文所有實驗中,對于模型輸出的分割結果,采用0.5作為閾值區分背景像素和血管像素.采用DICE系數作為血管分割的評價指標,需要將模型分割的結果與標準分割結果進行比較,統計以下4種情況像素的數量:真陽性(TP)表示實際上是血管也被正確識別成血管;假陰性(FN)表示實際上是血管卻被錯誤識別為非血管;真陰性(FN)表示實際上不是血管被標識為非血管;假陽性(FP)表示實際上不是血管但被誤標識為血管.根據公式(2)計算DICE系數:

(2)

為了方便比較,本文中所有的實驗都遵循以下設置:

1)數據集訓練、測試樣本的劃分方法.當某個數據集作為源域(目標域)進行訓練(測試)時,那么默認使用數據集的所有樣本進行訓練(測試),為避免不同劃分方式造成的結果不確定性,不作數據集內部的樣本劃分.

2)有效眼底范圍以及分辨率選擇方法.不將視網膜區域外的像素納入網絡計算,因此先使用圖形學方法裁去圖像多余的黑色邊緣,隨后使用線性插值的方法將分辨率統一為512×512.

3)采樣方法.對所有分辨率為512×512的圖像,在訓練階段的每一次迭代中都進行隨機位置采樣,采樣大小為64×64;與訓練不同的是,在測試階段使用的是分辨率為64×64的連續裁剪,以確保裁剪出來的圖像塊能覆蓋測試圖像的所有像素,保證評估結果的穩定性.

2.2 血管分割網絡

實驗使用W-Net[41]作為血管分割的基準模型,具體如圖2所示.

圖2 眼底血管分割模型Fig.2 Fundus blood vessel segmentation model

網絡由兩個小型U-Net網絡逐級相連構成.對于輸入的眼底圖像,首先經過第1個U-Net網絡得到血管分隔初步結果,隨后與原圖連接作為第2個U-Net網絡的輸入,得到最后的輸出結果ypred2.整體網絡輸出如公式(3)所示.

ypred2=φ2(Cat(xinput,φ1(xinput)))

(3)

其中,φ1、φ2分別代表兩個U-Net網絡,Cat代表矩陣拼接操作.第1個U-Net網絡的輸出作為一個注意力矩陣,能夠加強模型對第2個輸入中血管區域的關注,提取更具有泛化能力的特征[41].引入二進制交叉熵計算網絡預測和標簽之間的損失.本文中所有實驗都使用Adam算法優化網絡參數,訓練階段的權值衰減系數為0.0001.每個批次送入256個圖像塊,初始學習率設置為0.01,每次訓練進行4000次迭代后停止.

3 頻域分析

本節將對眼底血管分割數據集進行頻域分析.以DRIVE數據集為例,首先使用完整的原圖訓練一個血管分割模型MDRIVE.在測試階段,模型輸入的大小為64×64,使用離散余弦變換(Discrete Cosine Transformation,DCT)將圖像轉換為大小為64×64頻域系數矩陣,并按圖3的方式截取某個頻段分量,最后通過逆DCT變化得到該頻段分量對應的空域圖像Fa,b,其中a,b分別代表分量在頻域上的起止位置,這一過程可表示為公式(4).

圖3 頻域分解Fig.3 Frequency domain decomposition

Fa,b=IDCT(DCT(F)(a,b))

(4)

其中,F代表原始輸入的圖像塊,DCT和IDCT分別代表離散余弦變換函數和逆離散余弦變換函數.通過設置a、b的取值,均勻地拆分出64個頻域分量,每個分量都包含了不同頻段的信息.為方便直觀理解各頻段特征的異同,本文選取幾組a、b值用以展示,具體如圖4所示.

圖4 頻域分量示意圖Fig.4 Schematic diagram of frequency components

從圖4中可以看出,低頻特征集中在DCT系數矩陣的左上角,主要包含圖像大面積的色塊和背景信息.沿著向右下角的對角線頻率逐漸升高,(6,16)和(16,32)的中頻部分包含了大部分的血管邊緣信息,而在(32,64)的分量中,主要是人眼無法識別的高頻噪聲.將頻段分量Fa,b輸入到血管分割模型MDRIVE中,能夠得到相應的分割準確度,如公式(5)所示.

MDRIVE(Fa,b)→DICE(Fa,b)

(5)

使用公式(6)定義某個頻段的語義貢獻度.

(6)

例如,對于DRIVE數據集,假設使用全頻數據F(0,64)進行預測時,能達到DICE(F0,64)=80的總DICE準確度,當使F(0,10)用頻段分量進行預測,得到準確度DICE(F0,10)=60,當使用F(0,20)頻段分量進行預測,得到準確度DICE(F0,20)=70,此時根據定義,10~20之間的頻段分量提供(70-60)/80=12.5%的語義信息.

對每一個單獨的數據集都采取相同的頻域分析方法得到對應的語義頻段分布,如圖5所示.橫坐標表示頻段的位置,縱坐標表示頻段的語義貢獻度.不同數據集的背景風格和對比度存在較大差異,導致語義信息在頻域上存在分布差異,例如STARE的語義頻段分布比較尖銳,集中分布在[5,17]的頻段上,而DRHAGIS的語義分布比較平緩,頻段覆蓋范圍較大,主要集中在[3,19]區間的頻段上.

圖5 不同域的語義頻段分布Fig.5 Semantic frequency distribution of different domains

以DRIVE數據集為例,設定1%為語義貢獻度閾值,用以劃分低頻、中頻和高頻的范圍.在此閾值設定下,低頻一般不會包含血管的邊緣信息,中頻包含了分割血管所必須的大部分頻段特征,高頻范圍的噪聲分量不會額外增加有助于人眼判斷的血管信息.因此,設定第1個低于1%語義信息貢獻度的頻段范圍為低頻Rlow,高于語義信息貢獻度的頻段范圍為中頻Rmid,第2個低于語義信息貢獻度的頻段部分為高頻Rhigh.

4 頻域數據增強

頻域數據增強,針對不同頻段分量的特點,在訓練階段和測試階段采取相應的數據增強策略,在保持原有語義特征不變的前提下,增加訓練樣本的數量和多樣性,提高模型泛化性能.算法流程具體如圖6所示.

圖6 頻域數據增強流程圖Fig. 6 Flow diagram of data augmentation in frequency domain

4.1 低頻

低頻分量是圖像像素值變化比較平緩的部分,主要構成圖像的眼底背景.在眼底血管分割任務中,眼底的背景與分割結果無關,即使因為拍攝時光照條件、設備參數發生變化,導致眼底背景顏色或亮度發生變化,血管的分割結果也不會隨之改變.但是這部分頻段分量不能直接刪除,因為該頻段分量包含眼底圖像的主體結構信息,刪除后網絡將難以收斂.為減少網絡學習到這部分非語義特征,在訓練階段,設計基于隨機圖像融合的低頻增強策略,增加該頻段分量的多樣性;在測試階段,使用低頻分量聚類減小源域和目標域數據在該頻段上的差異.

在模型訓練階段,對于同批次的網絡輸入XS∈RB×C×H×W,其中S代表該樣本來自源域數據集,B表示批次中圖像的數量,C代表圖像維度,H和W分別代表圖像的高和寬,首先使用DCT函數將其轉換至頻域空間MS∈RB×C×H×W,如公式(7)所示.

MS=DCT(XS)

(7)

然后根據公式(8)、公式(9)分離出其中的低頻信號,并轉換到空間域Xlow.

(8)

(9)

在空間域圖像的批次維度進行隨機交換,打亂原本的批次順序,得到擾亂后的低頻空間域圖,這一過程使用ShuffleB(X)函數表示,具體定義如公式(10)、公式(11)所示.

(10)

(11)

設置比例系數α∈(0,1)調整原圖與另一張隨機圖像在低頻分量上的混合比例,得到隨機混合后的圖像Xlow,這一過程由公式(12)給出,在本文實驗中,α由隨機數生成.

(12)

(13)

(14)

(15)

(16)

以目標域圖像的低頻分量作為初始聚類中心,計算其與源域圖像低頻分量之間的歐氏距離Dis:

(17)

(18)

(19)

(20)

再將真實的目標域低頻分量和“虛擬的”目標域分量通過系數α=0.6進行融合,如公式(21)所示,得到最后測試階段網絡輸入的低頻部分.

(21)

此時得到的低頻分量融合了部分訓練數據集和測試數據集的特征,通過加權融合縮小了兩者之間的域偏移.

4.2 中頻

中頻主要包含血管的邊緣信息,是擬合二維分割標注的關鍵語義信息,因此不能像低頻分量一樣在訓練和測試階段進行替換和重組.對于一個固定的數據集,如果將中頻按照步長為1的方式拆分成多個頻段分量,這些頻段分量之間存在固定的比例關系,這種比例關系在不同域上表現得各不相同,會影響網絡的泛化性能.為了在中頻分量上去除這種有偏向的偽相關性信息,在訓練階段引入隨機權重.隨機權重會改變頻域分量之間的比例信息,改變血管跟背景的對比度,對眼底血管分割任務而言,對比度的大小不影響中頻的語義信息,只有當對比度為0時,血管跟背景完全無法區分,才會導致中頻語義信息的變化;在測試階段,同樣需要使用直方圖匹配算法對齊中頻分量位置,但是不進行隨機權重處理,保留原始目標域頻段分量的強度比例關系.首先,根據中頻分量的范圍Rmid提取整體中頻分量:

(22)

N=Len(Rmid)

(23)

(24)

(25)

其中,向量中的每個權重參數,在每次迭代中都會重新取值,取值的分布滿足均勻分布w~U(-1,1).

(26)

(27)

4.3 高頻

高頻分量主要由不規則的噪聲構成.根據頻域法則,在模型訓練的末尾階段,當依靠低頻和中頻信息無法充分擬合目標函數時,深度神經網絡會借助高頻噪聲使得損失函數下降,而這些噪聲是一類域信息,它不包含分割所需的語義信息,在每個域上的分布也各不相同,會造成模型泛化性能的下降.因此,高頻分量不參與到模型的訓練和推理中.最后在訓練階段,將低頻和中頻段分量進行相加,得到模型輸入.

(28)

(29)

5 實驗結果和分析

為驗證本文所提出頻域數據增強算法的有效性,使用基礎數據增強(隨機旋轉、隨機翻轉以及裁剪)、加入顏色變換,以及頻域數據增強和低頻對齊算法進行圖像預處理,比較模型泛化性能.實驗設置如下:使用DRIVE作為源域,分別使用5種不同的數據增強策略,每次訓練都從初始模型開始,相關參數和W-Net一致,以DICE系數作為評價指標.本文設計的頻域數據增強和低頻聚類算法屬于顏色變換,不屬于幾何變換,這種數據增強方式不會改變像素的空間分布規律.因此,幾何變換作為基礎的數據增強方式,將本節的頻域數據增強算法、低頻特征聚類算法跟一些常見的顏色變換數據增強算法做對比,例如隨機對比度、隨機飽和度、隨機色調等.如表1所示,A表示幾何變換,B表示顏色變換,C表示頻域數據增強,D表示低頻聚類算法.

表1 頻域數據增強算法和低頻聚類算法性能Table 1 Algorithm performance of data augmentation in frequency domain and low frequency clustering

當僅使用幾何變換時,模型的泛化性能普遍較差,這是因為樣本多樣性不足,容易讓深度神經網絡陷入到局部最優解中.引入顏色變換可以提升模型泛化性能.對比表格的后3行,可以發現當單獨使用頻域數據增強算法或低頻特征聚類算法時,模型泛化能力有小幅提升.當兩者結合使用后,模型的泛化性能會進一步增強.這是因為頻域數據增強算法對低頻分量采用隨機融合,可以理解為在源域樣本的低頻分量之間生成許多虛擬的“插值點”,而低頻聚類算法正是通過計算目標域和源域之間的距離,從源域圖像中合成虛擬的“插值”低頻分量,再送入模型中進行測試.因此,頻域數據增強和低頻分量聚類算法是相輔相成的,兩者一起使用有助于更大限度地提高模型的泛化性能.

生成對抗網絡近年來常被用于生成額外的眼底數據集樣本,防止網絡過擬合,例如RF-GAN[42]、Ret-GAN[43]和RV-GAN[44].這類生成對抗網絡類方法往往需要長時間調參和訓練,才能達到理想的圖像生成效果,這是因為在損失函數的中高頻段容易產生過擬合現象,導致生成圖像中出現中高頻偽影,擾亂血管分割所必要的語義分割信息.如表2所示,頻域增強算法在CHASE、STARE和DRHAGIS數據集上的泛化精度都超過了上述3種眼底圖像生成方法.

表2 GAN類方法和頻域數據增強算法Table 2 GAN methods and frequency data augmentation

因為這3個數據集包含較多的病變眼底圖像,這些病變體現在細小血管的滲血、腫脹和扭曲形變,屬于高頻語義信息的改變.整體來看,GAN類方法能在低頻空間上很好地還原目標數據集的色彩和色調,但當放大生成圖像的細節時,發現GAN類方法容易產生高頻特征偽影,如圖7所示,這些偽影會改變細小血管分布,或者生成原本不應該存在的視盤區域(虛線圈部分),影響生成圖像的語義信息,進而導致泛化精度降低.與之相比,頻域數據增強由于只對非語義信息的中低頻分量進行增強,不會引入高頻偽影,因此圖像生成質量較高,能夠得到泛化性能較好的眼底血管分割模型.

圖7 GAN類方法和頻域增強生成樣本實例Fig.7 Generated samples by GAN methods and frequency augmentation

IOSTAR數據集中的圖像來自于正常的眼底,語義信息的高頻部分改變不大,因此相比其它數據集,本文方法的提升效果不明顯.在測試圖像為病變圖像時,本文的方法對模型泛化性能有較大的提升,并且頻域數據增強算法不需要長時間復雜的訓練和調參,在訓練血管分割網絡前不需要額外訓練生成網絡產生訓練樣本,能提高模型的訓練效率.

6 總 結

本文提出一種頻域數據增強算法,通過對眼底圖像進行頻域分析,將其拆分為不同的頻段分量,根據每個頻段分量的特點,采取不同的數據增強策略,提高數據集的數量和多樣性,主要包括隨機融合算法、特征聚類算法和隨機權重算法,分別作用于低頻特征訓練和測試,以及中頻特征訓練.實驗結果表明該方法對比傳統數據增強和GAN類數據增強算法能夠取得更好的圖像生成效果,能有效提升訓練模型的泛化性能.

猜你喜歡
頻域頻段分量
大型起重船在規則波中的頻域響應分析
5G高新視頻的雙頻段協同傳輸
帽子的分量
gPhone重力儀的面波頻段響應實測研究
論《哈姆雷特》中良心的分量
頻域稀疏毫米波人體安檢成像處理和快速成像稀疏陣列設計
分量
推擠的5GHz頻段
基于改進Radon-Wigner變換的目標和拖曳式誘餌頻域分離
基于頻域伸縮的改進DFT算法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合