?

改進YOLOv5s的輸液瓶目標檢測

2022-07-23 06:36長江大學電子信息學院周籮魚熊莉婭鄒學玉
電子世界 2022年1期
關鍵詞:中心點預測性能

長江大學電子信息學院 喻 旸 周籮魚 熊莉婭 鄒學玉

針對醫療環境趨于復雜,為提高輸液瓶目標檢測的精度,本文利用視頻和圖像素材,提出一種改進的YOLOv5s方法檢測輸液瓶目標。采用CIoU Loss和DIoU NMS等方法進行優化。在PASCAL VOC數據集和自建輸液瓶目標數據集上檢測mAP(mean Average Precision)和FPS(Frames Per Second)。相較于原始YOLOv5s,改進后的YOLOv5s_CIoU在mAP上提高5.53%,檢測速度可達34.7FPS。

目標檢測在監測、追蹤等領域發揮著重要作用,將目標檢測與醫療輸液相結合,可以提高醫護工作效率。傳統目標檢測通過手工提取特征,其中可變形組件模型(Deformable Parts Model,DPM)具有代表性意義:提取人工特征后再用latentSVM分類。

KRIZHEVSKY等首先提出深度卷積神經網絡,GIRSHICK等將深度神經網絡應用到目標檢測中,從R-CNN(Region-CNN)到Fast R-CNN,再到Faster R-CNN。但由于R-CNN系列結構復雜,犧牲了計算速度,實時性無法保障。因此,REDMON等提出YOLO(You Only Look Once),提高速度的同時擁有一定準確率。LIU等將YOLO的回歸思想和Faster R-CNN的anchor box機制結合提出SSD(Single Shot MultiBox Detector)。隨后,REDMON等對YOLO進行優化,提出了YOLOv3等。Bochkovskiy等在YOLOv3基礎上,從數據處理、主干網絡等方面引入優化方法,提出YOLOv4,Jocher等通過馬賽克數據增強、自適應圖片縮放等優化方法提出YOLOv5。

目前,YOLO系列應用廣泛于目標檢測,王灃使用YOLOv5對口罩佩戴進行檢測。Yuwen Chen等使用YOLOv5對圖像中船舶進行檢測。Kuznetsova等使用YOLOv5對果園蘋果進行檢測。輸液瓶目標檢測對精度和速度有著高要求,而YOLOv5的優秀性能可以勝任。本文主要分析YOLOv5的損失函數,制作實驗所需數據集,并對YOLOv5優化并驗證性能。

1 YOLOv1-YOLOv4

YOLO的核心思想是將整張圖作為輸入,直接在輸出層回歸目標位置和類別,具有較強的泛化能力。在一個卷積神經網絡中進行特征提取、分類和回歸,不再生成候選區域,充分考慮圖片所包含背景信息。YOLOv1到YOLOv4的演變如圖1所示。

圖1 YOLO系列主要改進

YOLOv1直接擬合坐標位置x,y,物體寬和高w,h,置信度。但x,y還可能取負值,不符合實際場景。因此,YOLOv2采用anchor機制進行局部預測,通過gird預測x,y的坐標,通過anchor框的寬和高預測w,h的值。YOLOv2在Backbone上改為darknet19,使用卷積層連接檢測頭部分,但在小目標檢測上有待提高。YOLOv3的性能提升得益于殘差網絡,可以構建更多層的網絡,Backbone改為darknet53,使用多尺度檢測頭。YOLOv4的Backbone改為CSPDarknet53,使用mosaic數據增強等方法,mish損失函數,采用SPP、PAN、SAM等網絡結構。

2 YOLOv5

YOLOv5按網絡深度大小分為YOLOv5s、YOLOv5m、YOLO5l、YOLOv5x,其中YOLOv5s深度最小,模型大小僅有27M。因此本文采用YOLOv5s作為試驗模型,分為Input,Backbone,Neck,Prediction四個部分。

在Input部分采用Mosaic數據增強,增加小目標樣本數量。YOLOv5s在訓練過程中自動計算不同訓練集的anchor值,通過自適應圖片大小的縮放模式,減少圖片黑邊避免算力消耗,提高檢測速度。

在Backbone部分采用CSPDarknet53網絡。提高網絡學習能力,在保證準確率的同時減少計算量,降低了存儲成本。下采樣階段,通過Focus模塊最大的減少信息損失。

在Neck部分加入SPP和FPN+PAN結構,更好地提取目標融合特征。CSP2結構使網絡特征融合能力得到提高。使用SPP模塊擴大主干特征的接受范圍,并顯著分離上下文特征。FPN+PAN結構將不同主干層的不同檢測層的參數進行聚合,進一步提高網絡特征提取能力。

3 YOLOv5s優化

YOLOv5s在目標檢測上表現優異,但可以針對特定的輸液瓶目標作出相應優化,獲得更好地檢測結果。

3.1 使用CIoU Loss(Complete Intersection over Union Loss,完全交并損失)

損失函數對于檢測效果有著直接影響,因此需要不斷調整網絡參數,將損失函數的值降到最低。目標框示意圖如圖2所示。

圖2 目標框圖

對于A和B,二者的IoU(Intersection over Union)的計算公式分別如下:

式中,A表示目標的標注框,B表示目標的預測框,C代表一個能夠包住A和B的最小方框。當標注框完全包裹預測框時,IoU和GIoU(Generalized Intersection over Union)得到的結果是相同的,這時無法保正檢測的準確性。DIoU(Distance Intersection over Union)把目標與anchor之間的距離、重疊率以及尺度都考慮在內,使目標框回歸更加穩定,訓練過程中不會出現發散等問題。

好的回歸損失函數會考慮覆蓋面積、中心點距離和長寬比這三個方面。而DIoU只考慮到覆蓋面積和中心點距離,所以基于DIoU引入入長寬比,提出CIoU Loss。因此本文選擇CIoU Loss,將覆蓋面積、中心點距離和長寬比這三個方面都考慮在內。

3.2 使用DIoU NMS(Non-Maximum Suppression)

在數據后處理階段,通常使用NMS篩選出最好的預測框。通過NMS給每個預測框一個分數,得分越高證明效果越好。當兩個目標高度重疊,所得IoU值很大。經過NMS處理只會得到一個預測框信息,導致漏檢。YOLOv5s采用的就是NMS。相較于NMS,DIoUNMS將兩個框中心點之間的距離也考慮在內。即使兩個預測框的IoU值較大,但是考慮到中心點距離也大,便認為是兩個物體。本文使用CIoU Loss和DIoU-NMS分別代替原始YOLOv5s中的GIoU Loss和NMS,能更有效的檢測重疊目標和小目標。

4 結果分析

本文使用PC進行試驗,基于Windows10。硬件配置為Intel-Core i5-8300H CPU,GTX-Gforce 1060(6G),使用PyTorch深度學習框架。試驗選取SSD、YOLOv5s以及優化后YOLOv5s進行性能對比,驗證優化效果。超參數設置:最大訓練輪數為100,初始學習率為0.01,權值衰減為0.0005,動量和批量大小分別為0.937和2.0。本文通過平均精度均值(mean Average Precision,mAP)和FPS(Frames Per Second)進行性能評價。

4.1 YOLOv5s_CIoU和YOLOv5s mAP比較

通過PASCAL VOC2012公共數據集訓練測試,原始算法為YOLOv5s,優化后為YOLOv5s_CIoU,2種算法的mAP變化曲線如圖3所示。通過輸液瓶數據集訓練測試,結果如圖4所示,檢測數據結果如表1所示。

圖3 mAP變化(公共數據集)

圖4 mAP變化(輸液瓶數據集)

表1 算法對比結果

由圖6和表1可知:經過13輪訓練以后,YOLOv5s_CIoU的mAP超過YOLOv5s,訓練完成后,mAP提高5.47%,速度上有所下降,但也超過30FPS,在實時性和精度上可以滿足輸液場景的要求。

圖6 多目標檢測對比

4.2 YOLOv5s_CIoU和YOLOv5s性能比較(輸液瓶目標數據集)

4.2.1 模型訓練

YOLOv5s_CIoU(虛線)和YOLOv5s(實線)的損值曲線圖見圖5所示??梢钥闯鯵OLOv5s_CIoU的各類損失可以更快的收斂,mAP也得到提高。

圖5 算法各項性能對比

表2 輸液瓶目標檢測數據集(張)

圖7 重疊目標檢測對比

4.2.2 數據集制作

由于沒有公開數據集,本文自建輸液瓶目標檢測數據,采用YOLO數據集格式,通過預處理和篩選后選取10000張不同分辨率和大小的圖片充分訓練,自建數據集見表2所示。

4.2.3 結果分析

在多目標場景中:圖6(a)和圖6(b)均檢測到了2個輸液瓶目標,圖6(b)中YOLOv5s_CIoU的預測框置信度更高。

在重疊目標場景中,圖7(a)中的YOLOv5s_GIoU未能檢測出重疊目標,而圖7(b)中的YOLOv5s_CIoU可以檢測到重疊目標,并準確標記出來??梢妰灮呗蕴岣吡薡OLOv5s對于重疊目標的檢測能力。

本文基于YOLOv5s,采用CIoU loss、DIoU NMS等策略對YOLOv5s進行優化。試驗結果表明在小目標和重疊目標上的有良好的檢測效果。通過試驗SSD、YOLOv5s等進行性能比較,結果表明:改進后的YOLOv5s_CIoU與原始YOLOv5s相比,mAP提高5.47%,同時檢測速度達到34.7FPS,滿足輸液場景對實時性和準確率的高要求。將YOLOv5s_CIoU與計算機相結合,在復雜多變的醫療環境中檢測輸液瓶目標,可以提高醫療工作效率。在后續的研究中,系統性能需要更大的數據集和更復雜的分類才能得到更好的效果。

猜你喜歡
中心點預測性能
無可預測
選修2-2期中考試預測卷(A卷)
選修2-2期中考試預測卷(B卷)
選修2—2期中考試預測卷(A卷)
保暖襪透濕性能測定的不確定度分析
一種基于標準差的K-medoids聚類算法
Scratch 3.9更新了什么?
如何設置造型中心點?
提供將近80 Gbps的帶寬性能 DisplayPort 2.0正式發布
Al-Se雙元置換的基于LGPS的thio-LISICON的制備與性能表征
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合