?

多尺度自適應融合的肝臟腫瘤檢測

2023-02-18 03:07馬金林歐陽軻馬自萍毛凱績陳勇
中國圖象圖形學報 2023年1期
關鍵詞:瓶頸尺度卷積

馬金林,歐陽軻,馬自萍,毛凱績,陳勇

1.北方民族大學計算機科學與工程學院,銀川 750021;2.北方民族大學圖像圖形智能處理國家民委重點實驗室,銀川 750021;3.寧夏醫科大學總醫院放射介入科,銀川 750004

0 引 言

隨著卷積神經網絡(convolutional neural network,CNN)的發展,深度學習(deep learning,DL)已經成為研究肝臟疾病診斷的主要方法。Che等人(2021)設計了一種多特征引導的多尺度殘差卷積神經網絡(multi-feature guided multi-scale residual convolutional neural network)來捕獲不同感受野的特征,用于非酒精性脂肪肝(nonalcoholic fatty liver disease,NAFLD)分類,但忽視了模型參數骨架優化關系,且引入的3種大卷積核增大了網絡的參數量和計算量。Guo等人(2019)采用深度學習模型Mask-RCNN(region convolutional neural network)對成團的脂肪變性液滴進行識別,用于檢測邊界框和預測對象掩碼,但是該方法的區域建議網絡生成的預選框對小物體檢測效果不佳。Lee等人(2018)將分組卷積(group convolution)應用到單級多框檢測器SSD(single shot detector)中,有效利用了多階段數據的豐富信息,但無法解決低層病灶特征圖語義性偏弱和高層病灶特征圖對細節感知較差的問題。Tao等人(2019)提出了一種注意特征聚合機制,通過引入上下文注意模塊(contextual attention module)和空間注意模塊(spatial attention module)提取更重要的判別特征,并通過軟重采樣選擇性地聚合不同肝腫瘤切片的信息,但忽略了病變與非病變特征之間的通道相關區域。Kesav和Jibukumar(2022)利用兩通道卷積神經網絡進行腦瘤檢測,基于RCNN進行兩階段檢測,但是雙階段的檢測算法具有執行時間長和執行效率低的問題。Zhang等人(2021)提出基于蒙特卡羅dropout(Monte Carlo dropout,MC-Drop)的貝葉斯YOLOv4(you only look once version 4)網絡,為乳腺腫瘤檢測網絡引入不確定性。由于特征提取階段的理論感受野較小,該網絡易遺漏大陰影附近的小腫瘤??梢钥闯?,肝臟腫瘤檢測存在以下亟待解決的問題:1)小病灶的檢測能力較弱;2)模型參數量較大導致模型運行效率低、對設備性能要求高;3)模型對低層特征圖病灶的語義特征描述能力偏弱,對高層特征圖病灶的細節感知能力較差。

針對上述問題,為提升肝臟疾病的診斷精度,優化不同尺寸病灶的檢測能力,本文提出一種用于肝臟腫瘤檢測的多尺度自適應融合網絡(multiscale adaptive fusion network,MAEfficientDet),本文主要完成以下工作:1)設計高效倒置瓶頸塊(efficient inverted bottleneck convolution,EFConv)有效解決移動倒置瓶頸塊的擠壓激勵網絡維度和參數量較大問題;2)設計關注肝臟病灶區域特征的多尺度塊(Multiscale-A,Multiscale-B),擴大網絡有效感受野,提高了體積偏小病灶的檢測能力;3)設計多通路自適應加權特征融合塊(multi-channel adaptive weighted feature fusion block,MAWFF),自適應地融合肝臟腫瘤圖像的高層語義特征與底層細粒度特征,提高特征的利用率和模型的檢測能力。

1 相關工作

1.1 EfficientDet

隨著深度神經網絡的發展,基于深度學習的目標檢測(object detection)成為目標檢測的主要方法(Liu等,2020;Ma等,2020)。神經網絡模型通過縮放網絡寬度、網絡深度或圖像分辨率取得了更高的準確率。為了滿足資源受限設備的需求,Google(Tan等,2020)提出輕量級、可擴展的高效目標檢測網絡(EfficientDet),如圖1所示,該網絡包括EfficientNet、加權雙向特征金字塔網絡(bidirectional feature pyramid network,BiFPN)、分類預測網絡和邊界框回歸預測網絡。

圖1 EfficientDet模型

EfficientDet系列網絡通過神經結構搜索算法(neural architecture search,NAS)(Zoph和Le,2017)對網絡深度、網絡寬度和圖像分辨率復合縮放,并平衡3個維度的縮放比例,提出了包含EfficientDet-D0—EfficientDet-D7的8個模型,依次作為主干網絡提取特征映射。BiFPN利用跨尺度連接在不增加過多計算成本的情況下融合更多特征,加權特征融合使網絡學習不同特征的重要性,分類預測網絡判定目標所屬類別,邊界框回歸預測網絡定位目標位置。與單維度檢測網絡(He等,2017;Lin等,2017a, b;Liu等,2016;Redmon和Farhadi,2018)相比,EfficientDet網絡更容易提取更多的語義信息,在更少參數量的前提下獲得更高的準確率。本文使用EfficientDet-D0和EfficientDet-D1作為基礎框架。

1.2 自適應融合方法

特征融合(feature fusion)方法廣泛應用于目標檢測任務(尉婉青 等,2021;謝星星 等,2022),用于整合不同深度、不同層次的特征,充分利用多尺度特征縮小不同層之間的語義鴻溝,獲得更具判別力的輸出特征層,使檢測器能夠同時學習到足夠的細節信息和語義信息。

特征金字塔(feature pyramid network,FPN)(Lin等,2017a)是一種典型的特征融合方法,采用自上而下等權重的特征融合方法,但存在以下兩個問題:1)自上而下等權重的特征融合方法未區分不同特征層的重要程度;2)金字塔不同層對同一特征采取不同的處理方式易造成特征沖突,這種特征沖突在訓練期間會干擾梯度計算,降低特征金字塔的有效性。

自適應空間特征融合方法(adaptively spatial feature fusion,ASFF)包括重新縮放和自適應融合兩個步驟(Liu等,2019),旨在解決單階段目標檢測特征金字塔存在的不一致性問題。自適應空間特征融合方法通過學習有效權重,自適應地調整不同特征層的融合比例,優化融合過程,在空間上過濾其他層的無用信息,改善特征融合中的圖像空間信息沖突和特征金字塔中的不一致性問題。

2 多尺度自適應融合的肝臟腫瘤檢測方法

本文提出多尺度自適應融合的肝臟腫瘤檢測方法MAEfficientDet,網絡結構如圖2所示。MAEfficientDet包括7個高效倒置瓶頸大結構塊、2個多尺度塊A、3個多尺度塊B、1個多通路自適應加權特征融合塊、肝腫瘤類別預測網絡和肝腫瘤位置預測網絡6個部分。與EfficientDet模型相比,MAEfficientDet進行了3方面改進:1)用高效倒置瓶頸塊替換移動倒置瓶頸塊,實現了跨通道信息交互,在顯著降低模型復雜性的同時保證檢測性能;2)使用多尺度塊提高有效感受野,增強肝臟腫瘤區域識別能力和模型魯棒性;3)用多通路自適應加權特征融合塊替換雙向加權特征金字塔網絡,抑制不同尺度特征圖之間的不一致性,同時,采用多通路自適應加權特征融合塊選擇性地整合多個特征層,保證特征的尺度不變性。

根據高效倒置瓶頸大結構塊和多通路自適應加權特征融合塊的層結構差異和多尺度塊的特征維度差異,MAEfficientDet分為MAEfficientDet-D0和MAEfficientDet-D1兩種網絡,結構如圖2所示。MAEfficientDet-D1模型的7個高效倒置瓶頸大結構塊從1層到7層分別包含1、2、2、3、3、4、1個高效倒置瓶頸塊。模型包含2個多尺度塊A和3個多尺度塊B。多尺度塊A和多尺度塊B均采用最大池化,從淺層特征層P3_in到深層特征層P7_in輸出維度分別是(64,64,40)、(32,32,112)、(16,16,320)、(8,8,64)和(4,4,64)。模型的多通路自適應加權特征融合塊中含有3個自頂向下特征提取塊、3個自底向上特征提取塊和1個自適應空間特征融合塊。MAEfficientDet-D0的7個高效倒置瓶頸大結構塊從1層到7層分別包含2、3、3、4、4、5、2個高效倒置瓶頸塊。多尺度塊A和多尺度塊B從淺層特征層P3_in到深層特征層P7_in輸出維度分別是(80,80,40)、(40,40,112)、(20,20,320)、(10,10,88)和(5,5,88)。MAEfficientDet-D1的多通路自適應加權特征融合塊中含有4個自頂向下特征提取塊、4個自底向上特征提取塊和1個自適應空間特征融合塊。

圖2 MAEfficientDet的網絡框架

圖3列出了EfficientDet-D0、MAEfficientDet-D0和MAEfficientDet-D1的網絡結構,描述了輸入和輸出特征的尺寸。

圖3 EfficientDet-D0、MAEfficientDet-D0和MAEfficientDet-D1網絡結構

2.1 高效倒置瓶頸塊

擠壓激勵網絡(squeeze-and-excitation networks,SE-Net)(Hu等,2018)的主要思想是增強提供更多有用特征的通道,抑制提供較少有用特征的通道。實際部署中,SE模塊存在占用過多計算資源和網絡推理過程較慢的問題。因此,本文在移動倒置瓶頸塊(mobile inverted bottleneck convolution,MBConv)的基礎上設計了高效倒置瓶頸塊(efficient inverted bottleneck convolution,EFConv)。EFConv在移動倒置瓶頸結構中加入1維卷積和殘差連接,用于替代擠壓激勵網絡,其原理如圖4所示。

圖4 高效倒置瓶頸塊結構

高效倒置瓶頸塊的結構如下:通過擴展卷積擴展輸入圖像的通道,獲得更多特征層;使用深度可分離卷積(Howard等,2017)提取各層特征;引入無降維的局部交叉信道交互策略實現跨通道信息交互,利用1維卷積顯著降低模型復雜性的同時保持性能;使用降維卷積壓縮通道數量;使用殘差連接緩解梯度彌散的同時提高參數傳遞效率,使網絡模型易于訓練。

擠壓激勵網絡使用全連接層捕獲跨通道交互信息,使用降維操作減少模型復雜度,但維度減少對通道注意力預測產生了消極影響。另外,捕獲所有通道之間的依賴關系是低效而非必要的。為解決此問題,本文在全局平均值池化后使用1維卷積捕獲跨通道交互信息,在保證計算效率的同時,提升模型有效性。通過加入反向殘差結構解決梯度彌散和梯度爆炸問題,加速網絡收斂。為了盡可能保持圖像特征的多樣性,增強網絡表達能力,高效倒置瓶頸塊的最后一層使用線性激活函數有效保留低維輸入信息。

MAEfficientDet-D0和MAEfficientDet-D1分別使用16個和23個高效倒置瓶頸塊。其中,頂層塊在保證特征圖通道數的前提下降低分辨率,低層塊在不丟失太多信息的情況下從高維特征圖提取特征。將高效倒置瓶頸大結構塊3、5、7最后一層輸出特征作為多尺度塊的輸入特征。

2.2 多尺度塊

深層卷積的有效感受野遠小于理論感受野,多通路自適應加權特征融合塊(MAWFF)的感受野不足以捕捉肝臟腫瘤圖像的上下文信息。因此,本文設計多尺度塊(Multiscale-A,Multiscale-B)添加在MAWFF之前,以擴展MAWFF的有效感受野。多尺度塊的結構如圖5所示。多尺度塊A、B參考了Inception(Szegedy等,2016)的多分支結構,在其上加入殘差連接和不同尺度的最大值池化操作,用于提取深層網絡的上下文特征,從而使檢測器更加準確、快速。多尺度塊的內部結構可分為不同內核的多分支卷積層和最大值池化操作。其特點為:1)使用1 × 1卷積過濾無用信息;2)不同分支使用不同的卷積核獲得多個不同大小的特征圖,網絡深度的增加和網絡寬度的擴展提高了模型對網絡規模的適應性;3)使用不同感受野的最大值池化操作減小特征圖尺寸并防止網絡過擬合;4)使用殘差連接提高網絡參數傳遞效率。

圖5 多尺度塊的結構

在卷積神經網絡的參數學習過程中,標準方形卷積的參數是隨機初始化的,因此內核矩陣可能朝著4個邊(角)方向優化,忽略了平均重要性更高的中心點參數,易導致網絡特征提取能力降低。本文采用非對稱卷積(asymmetric convolution)結構,將水平卷積和垂直卷積添加到標準卷積中,形成非對稱卷積塊,其原理如圖6所示。非對稱卷積塊通過中心十字組成的增強骨架關注中心點特征。

圖6 非對稱卷積塊結構圖

多尺度塊使用1維非對稱卷積增強平方卷積核,在不增加推理時間和計算負擔的前提下,不引入額外超參數。3 × 3卷積總是學習每一層的中心十字增強骨架,突出了中心點參數的重要性。

MAEfficientDet-D0和MAEfficientDet-D1均包含5個多尺度塊(2個多尺度塊A和3個多尺度塊B),用于提取圖像的深層病灶特征,解決深層語義信息在向低層傳輸的過程中逐漸稀釋的問題。

2.3 多通路自適應加權特征融合塊

自頂向下的特征提取塊是任務驅動型特征提取塊,用于獲取語義信息,結構如圖7所示。

圖7 自頂向下特征提取塊

自底向上的特征提取塊是數據驅動型特征提取塊,用于將空間的細節信息從低層網絡傳遞到高層網絡,結構如圖8所示。

圖8 自底向上特征提取塊

自適應空間特征融合塊過濾空間沖突信息,以抑制不同尺度特征圖之間的不一致性,提高特征的尺度不變性,并進一步解決因簡單添加特征產生分類錯誤而導致的錯誤識別問題,結構如圖9所示。

圖9 自適應空間特征融合

圖9中,α,β,γ,δ,η是網絡通過反向傳播自動生成的。

第i層自頂向下的特征提取公式為

(1)

第i層自底向上的特征提取公式為

(2)

自適應空間特征融合塊位于自頂向下特征提取和自底向上特征提取塊之后,用于融合特征層P3到P7的深層特征和淺層特征。自適應空間特征融合塊自適應地學習不同尺度上的特征融合權重,其特征融合公式為

Ki=α×Vj+β×Vj+1+γ×Vj+2+

δ×Vj+3+η×Vj+4

(3)

MAEfficientDet-D0和MAEfficientDet-D1在多尺度塊之后加入MAWFF,利用自底向上特征提取塊將病灶的細節信息從底層特征矩陣傳遞到了高層特征矩陣,彌補了高級語義特征的空間信息不足,提高了腫瘤病灶邊界檢測的準確性;利用自頂向下特征提取塊加強了網絡對模糊病灶的類別檢測精度;自適應空間特征融合塊有效地融合兩條路徑的細節特征,突出重要病灶并抑制背景噪聲。

3 實驗設置

3.1 肝臟腫瘤檢測數據集

使用肝臟腫瘤分割挑戰數據集(liver tumor segmentation,LiTS)(Bilic等,2019)和3D-IRCADb數據集(3D image reconstruction for comparison of algorithm database,3D-IRCADb)(Ircad France,2020)開展實驗。

3D-IRCADb數據集由3DIRCADb-01和3DIRCADb-02組成。3DIRCADb-01包含10名男性和10名女性的靜脈期數據,其中15個患者有肝臟腫瘤。3DIR CADb-02數據集包含兩組3D CT掃描數據。

實驗以17∶3的比例將帶有標簽的CT圖像劃分為訓練集和測試集。

3.2 數據處理與檢測標簽生成

LiTS和3D-IRCADB的分割標簽的灰度級直方圖具有明顯的雙峰特性,如圖10所示。因此,用雙峰算法進行數據預處理。首先,使用全局閾值245過濾圖像。然后,使用高斯濾波平滑和Sobel算子得到梯度圖。最后,將得到的圖像進行拓撲結構分析、邊界跟蹤、提取邊界輪廓,得到檢測標簽。

圖10 肝臟腫瘤分割標簽灰度直方圖和肝臟腫瘤

3.3 實驗環境

實驗采用搭載Intel i7處理器的Windows10 64位操作系統,內存為32 GB,英偉達2080 GPU。使用Adam優化器進行優化,不同網絡模型在同一數據集上使用相同參數訓練,達到固定周期時停止訓練,最后選擇損失達到穩定時的權重對模型架構進行測試評估。

3.4 訓練參數設置

3.5 先驗框的設置

使用K-means算法對數據集的真實框進行聚類,獲得新的先驗框。為減少聚類偏差,使用遺傳算法對K-means聚類算法的結果進行隨機改變,并將效果變好的結果賦值給先驗框。最終生成的先驗框尺寸如表1所示。表中特征圖P3—P7對應的是高效倒置瓶頸大結構塊③—⑦的輸出特征層。

表1 K-means算法生成的先驗框

3.6 評價指標

為了客觀全面地評價網絡性能,方便與其他算法進行比較,選用精確率(precision,P)、召回率(recall,R)、F1分數(F1 score)、AP(average precision)和mAP(mean average precision)作為評價指標。

4 實驗分析和討論

4.1 消融實驗與分析

為了評估模型每個模塊和組件的有效性,在肝臟腫瘤分割調整數據集上進行消融實驗。本文模型是在EfficientDet的基礎性加入高效倒置瓶頸塊、多尺度塊和多通路自適應加權特征融合塊實現的。因此,首先考察在EfficientDet的兩個子模型上分別增加高效倒置瓶頸塊、多尺度塊、多通路自適應加權特征融合塊的消融實驗。

4.1.1 高效倒置瓶頸塊的有效性

實驗使用高效倒置瓶頸塊代替EfficientDet-D0和EfficientDet-D1模型的移動倒置瓶頸塊,得到EIR_EfficientDet-D0和 EIR_EfficientDet-D1模型,實驗結果如表2和表3的模型2所示。

由表2模型1、2對比可得,加入高效倒置瓶頸塊后,EfficientDet-D0的精確率提高了4.19%,參數量下降了16.64%,運行總時間減少了4.73%,mAP值由0.811 0提高至0.854 6。

由表3模型1、2對比可得,加入高效倒置瓶頸塊后,EfficientDet-D1的精確率提高了0.29%,參數量下降了17.13%,運行總時間減少了4.51%,mAP值由0.821 9提高至0.855 6。

由此可見,高效倒置瓶頸塊能夠提升模型對肝臟疾病的檢測能力,并具有更高的效率和更少的參數。

4.1.2 多尺度塊的有效性

實驗在EfficientDet-D0和EfficientDet-D1模型上添加多尺度塊,得到M_EfficientDet-D0和M_EfficientDet-D1模型,實驗結果如表2和表3中的模型3所示。

由表2中模型1、3對比可得,EfficientDet-D0加入多尺度塊后的精確率提高了4.49%,mAP值由0.811 0提高至0.849 8,AP值由0.760 1提高至0.801 0,參數量增加了16.64%,運行總時間增加了4.67%。

由表3中模型1、3對比可得,EfficientDet-D1加入多尺度塊后的精確率提高了0.29%,mAP值由0.821 9提高至0.855 6,AP值由0.787 0提高至0.822 4,參數量增加了15.18%,運行總時間增加了8.61%。

由此可見,多尺度塊能夠有效提升網絡特征提取和識別能力,對小目標識別檢測有較好提升效果。

4.1.3 多通路自適應加權特征融合塊的有效性

實驗在EfficientDet-D0和EfficientDet-D1模型上添加多通路自適應加權特征融合塊,得到EfficientDet-D0(MAWFF)和EfficientDet-D1(MAWFF)模型,實驗結果如表2和表3中的模型4所示。

表2 MAEfficientDet-D0消融實驗結果分析

表3 MAEfficientDet-D1消融實驗結果分析

由表2中模型1、4對比可得,EfficientDet-D0加入多通路自適應加權特征融合塊后的精確率提高了4.64%,mAP值由0.811 0提高至0.852 8,參數量增加了14.86%,運行總時間增加了5.84%。

由表3中模型1、4對比可得,EfficientDet-D1加入多通路自適應加權特征融合塊后的精確率提高了0.28%,mAP值由0.821 9提高至0.858 6,參數量增加了16.28%,運行總時間增加了9.10%。

由此可見,多通路自適應加權特征融合塊在提高少量網絡復雜性的同時,可以有效提高網絡對模糊圖像的類別檢測精度。

上述3個實驗驗證了高效倒置瓶頸塊、多尺度塊和多通路自適應加權特征融合塊3個模塊的有效性,其中,多通路自適應加權特征融合模塊的性能提升尤為突出,原因在于該模塊融合了含有上下文信息的深層特征和含有細節信息的淺層特征,提高了模型對病灶特征的表達能力。

4.2 損失函數對檢測性能的影響

本實驗考察不同損失函數對分類結果的影響,分類任務常用的損失函數有交叉熵損失、焦點損失、合頁損失、指數損失和softmax損失等。交叉熵損失函數利用梯度下降方法找到最優解,而焦點損失對交叉熵損失進行改進,解決了單階段目標檢測中正負樣本比例嚴重失衡的問題。因此,本文方法選取焦點損失作為分類任務的損失函數。邊界框回歸損失都采用smooth L1 loss,分類損失和邊界框回歸損失按照1∶1等比例混合。表4為EfficientDet模型在肝臟腫瘤分割調整數據集上不同分類損失下的實驗結果。

使用焦點損失替換交叉熵損失后,表4中模型1、2對比可得,EfficientDet-D0的精確率提高了1.06%,mAP值由0.807 6提高至0.810 8。表4中模型3、4對比可得,EfficientDet-D1的精確率提高了3.28%,mAP值由0.822 9提高至0.828 5。表4中模型5、6對比可得,MAEfficientDet-D0的精確率提高了1.56%,mAP值由0.854 7提高至0.863 0。表4中模型7、8對比可得,MAEfficientDet-D1的精確率提高了4.41%,mAP值由0.869 8提高至0.873 9。

圖11描繪了基于EfficientDet的不同模型(對應表4中模型1—8)在種交叉熵損失函數和焦點損失下的雷達圖。由圖可知,采用焦點損失優化模型的mAP值均優于交叉熵損失函數優化的模型。本文基于EfficientDet-D1改進的MAEfficientDet-D1網絡模型,采用焦點損失和Smooth L1損失作為總損失,在精確率、mAP值和F1分數3項檢測指標上獲得了最高數據。較表4中模型4在精確率、mAP值和F1分數上分別提高7.4%、5.48%和6.34%。較表4中模型7在精確率、mAP值和F1分數上分別提高了4.41%、0.47%和1.87%。采用交叉熵損失和smooth L1損失作為總損失的EfficientDet-D0網絡模型,在召回率、精確率、mAP值和F1分數3個檢測指標獲得最低數據。較表4中模型2分別降低了1.06%、1.06%、0.4%和1.06%。

圖11 基于EfficientDet不同模型在兩種分類損失函數下的雷達圖

表4 EfficientDet模型在兩種分類損失函數下的實驗結果

圖12描繪了4種算法在肝臟腫瘤分割挑戰數據集上進行腫瘤檢測的PR曲線。由圖可知,使用二分類焦點損失函數的EfficientDet-D0、EfficientDet-D0、EfficientDet-D1、MAEfficientDet-D0和MAEfficientDet-D1模型的召回率、精確率、mAP和F1都有較大提升,尤其是代表檢測性能的mAP值。使用二分類焦點損失函數的模型更加關注困難樣本和正樣本,減少樣本不均衡,檢測性能明顯優于交叉熵損失函數,精確率也更高。MAEfficientDet-D0和MAEfficientDet-D1模型檢測性能整體上均優于其他模型,說明該模型能較好地識別形態各異的肝臟腫瘤病灶區域,對難于識別的樣本也能進行更精準的檢測。

圖12 EfficientDet模型在兩種損失函數下的PR曲線

4.3 不同模型的檢測性能對比

為驗證模型的檢測性能,將EfficientDet-D0、EfficientDet-D1、MAEfficientDet-D0和MAEfficientDet-D1模型與其他6種SOAT算法(SSD512(single shot multibox detector)(Liu等,2016)、YOLOv3(you only look once)(Redmon和Farhadi,2018)、YOLOv4(Bochkovskiy等,2020)、YOLOv5、Faster-RCNN(faster region convolutional neural network)(Ren等,2015)和CenterNet(Zhou等,2019))在LiTS和3D-IRCADb數據集上的性能進行對比,探究不同算法在不同樣本空間上的檢測精度和檢測效率。LiTS和3D-IRCADb數據中像素面積小于32×32的病灶目標為小目標,實驗時均勻地從每個病例中隨機挑選100幅包含肝臟腫瘤病灶小目標的圖像,用于驗證不同模型體積偏小病灶的檢測能力,結果如表5和表6所示,雷達圖如圖13所示。

圖13 不同模型在不同數據集上的雷達圖

表5 不同模型在LiTS數據集上檢測的結果

表6 不同模型在3D-IRCADb數據集上檢測的結果

可以看出,采用MAEfficientDet-D0和MAEfficientDet-D1檢測網絡模型時,召回率、精確率、mAP、AP和F1等5項檢測指標均高于其他方法。在LiTS數據集上,MAEfficientDet-D0較EfficientDet-D0分別提高7.48%、9.57%、6.42%、7.96%和8.52%。MAEfficientDet-D1較EfficientDet-D1分別提高3.47%、6.64%、6.33%、8.12%和5.02%。在3D-IRCADb數據集上,MAEfficientDet-D0較EfficientDet-D0分別提高5.51%、9.82%、6.16%、7.39%和7.63%。MAEfficientDet-D1較EfficientDet-D1分別提高5.87%、6.24%、5.81%、9.39%和6.05%。

MAEfficientDet-D0和MAEfficientDet-D1與雙階段檢測網絡Faster-RCNN(Res50)、Faster-RCNN(mobilenet_v2)和Faster-RCNN(Res50 + FPN)相比,在更少參數量、計算量和運行總時間下,能更精準地提取圖像中具有區分度的特征,具有更高的模型效率。MAEfficientDet-D0和MAEfficientDet-D1與經典單階段檢測網絡SSD512(VGG)相比,相同點是三者都結合來自不同分辨率的多個特征圖進行預測,不同之處在于單級多框檢測器SSD直接使用特征圖進行類別和位置預測,而MAEfficientDet-D0和MAEfficientDet-D1使用多通路自適應加權特征融合塊融合低層信息和高層語義,提升了檢測性能。MAEfficientDet-D0、MAEfficientDet-D1的骨干網絡和SSD相比,SSD借鑒VGG網絡,層層堆疊卷積層和池化層,而MAEfficientDet-D0和MAEfficientDet-D1骨干網絡引入高效倒置瓶頸塊,使用跳躍連接緩解深度增加帶來的梯度消失問題,使網絡更易于優化。MAEfficientDet-D0和MAEfficientDet-D1各項檢測評價指標較使用特征金字塔結構的YOLOv4(CSPDarknet)和YOLOv3(Darknet53)均有提升,進一步論證了多通路自適應加權特征融合能在一定程度上過濾沖突信息,抑制不同尺度特征圖之間的不一致性,提高特征的尺度不變性,更好地識別肝臟腫瘤的病變區域,提升了模型檢測性能。MAEfficientDet-D0和MAEfficientDet-D1與無錨框檢測網絡CenterNet相比,不同點是CenterNet構建模型時采用關鍵點估計來找到中心點,將目標用一個中心點表示(anchor free),而MAEfficientDet-D0和MAEfficientDet-D1使用基于先驗框的檢測算法,結合K-means聚類,并利用Genetic algorithm遺傳算法對聚類結果上進行mutation變異,計算出適用于肝臟腫瘤檢測數據集的錨框尺寸,取得了比anchor free技術更好的準確性和效率。MAEfficientDet-D0在參數量、計算量和運行總時間上均遠小于CenterNet模型。

圖14為12種網絡的PR曲線,橫坐標是召回率(查全率),縱坐標是精確率(查準率),由圖可見,性能最好的3個模型依次是MAEfficientDet-D1、MAEfficientDet-D0和YOLOv5。3個模型的mAP值均大于0.85。Faster-RCNN(mobilenet_v2)的檢測效果最差,mAP為0.682 78。另外,本文算法的目標檢測性能明顯優于其他模型,MAEfficientDet-D1具有更好的性能,能較好地學習和識別在空間尺度上差異較大的病變特征。MAEfficientDet-D1模型同時考慮骨干網絡的分辨率、深度、寬度,進行混合縮放,在召回率、精確率、mAP、參數量和計算量方面均優于MAEfficientDet-D0模型。MAEfficientDet-D0和MAEfficientDet-D1模型增加了多尺度模塊,擴展了MAWFF的有效感受野,聚集強相關性特征,并保持網絡結構的稀疏性。另外,多尺度模塊的殘差連接緩解了梯度彌散和梯度下降問題。MAEfficientDet-D0和MAEfficientDet-D1添加多通路自適應加權特征融合塊,進一步融合高級語義特征和底層病灶的細節特征,突出重要的腫瘤病灶并抑制背景噪聲。MAEfficientDet-D0和MAEfficientDet-D1模型的檢測性能明顯優于EfficientDet-D0和EfficientDet-D1模型,進一步提高了肝臟圖像中疾病檢測的準確性。

圖14 不同算法在肝臟腫瘤數據集上的PR曲線

4.4 病灶可視化

圖15顯示了不同模型對肝臟腫瘤CT圖像的檢測結果圖。如圖所示,MAEfficientDet-D1的檢測結果比EfficientDet-D1的置信度高,說明本文模型能更好地關注肝臟病變區域,可以有效檢測病變位置和病變類型。進一步證明其在進行檢測分析和病變類型識別時所依據的特征信息更加準確、有效。另外,病灶區域的可視化展示能夠幫助醫生在臨床中進行快速精確診斷病情。

圖15 肝臟腫瘤CT圖像的檢測結果

不同模型對肝臟小目標腫瘤CT圖像的檢測結果如圖16所示??梢钥闯?,本文模型對于小目標腫瘤同樣有較好的識別效果,其結果優于現階段其他主流檢測模型。

圖16 肝臟小目標腫瘤CT圖像的檢測結果

5 結 論

本文針對EfficientDet網絡在肝臟腫瘤檢測中效果不佳及小病灶無法精確識別問題,提出MAEfficientDet-D0和MAEfficientDet-D1網絡。研究工作的主要內容包括:1)通過自適應融合各層特征圖,解決了特征融合中圖像空間信息沖突和特征金字塔中的不一致性問題;2)使用高效倒置瓶頸塊降低模型復雜性,同時提升模型的有效性,解決EfficientDet模型的骨干特征提取網絡參數效率低的問題,減少網絡運行時間;3)使用多尺度塊提升有效感受野,對病灶區域特征進一步關注,解決部分體積偏小的肝臟腫瘤病灶難以檢測問題;4)使用先驗框聚類和數據增強方法,從模型和數據兩方面加強模型對肝臟腫瘤數據集的檢測能力和泛化能力,解決肝臟腫瘤的形狀大小不一及位置各異的問題。

然而,本文算法也存在不足:1)相比于當前檢測速度最快的單階段檢測網絡,存在提升空間;2)在更深的網絡(例如EfficientDet-D7)上,本文算法可能比較難收斂。

在今后的研究中,一方面,針對肝臟腫瘤檢測任務,將提升網絡模型檢測速度作為研究方向,進一步優化高效倒置瓶頸塊結構的設計;另一方面,針對更深的網絡,通過調參和優化提高算法普適性。

猜你喜歡
瓶頸尺度卷積
基于3D-Winograd的快速卷積算法設計及FPGA實現
財產的五大尺度和五重應對
卷積神經網絡的分析與設計
從濾波器理解卷積
基于傅里葉域卷積表示的目標跟蹤算法
突破霧霾治理的瓶頸
宇宙的尺度
突破瓶頸 實現多贏
民營醫院發展瓶頸
如何渡過初創瓶頸期
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合