?

基于YOLOv5-nS 算法的絕緣子串銷釘檢測方法

2023-12-12 11:28杜景博姜勇
應用科技 2023年6期
關鍵詞:銷釘絕緣子尺度

杜景博,姜勇

1. 沈陽理工大學 自動化與電氣工程學院,遼寧 沈陽 110158

2. 中國科學院 網絡化控制系統重點實驗室,遼寧 沈陽 110016

3. 中國科學院 沈陽自動化研究所,遼寧 沈陽 110016

4. 中國科學院 機器人與智能制造創新研究院,遼寧 沈陽 110169

絕緣子主要用于電氣絕緣和機械支撐,是架設輸電線路過程中的必要部件。絕緣子在長期運行過程中受高壓場強、機械負荷、酸雨、雷擊以及大氣環境的影響,導致其電氣性能與機械性能下降,以致其被擊穿或破壞。對于這些劣化的絕緣子必須及時更換,若不及時處理則會引發一系列的突發事件,在經濟上造成巨大的損失,嚴重時甚至會導致電力系統運行的停滯[1-2]。目前,變電站更換絕緣子的作業方式主要采用人工現場作業,這種作業方式危險性高、勞動強度大、效率低而且更換作業難以操作[3]。因此研發具有更換絕緣子功能的機器人成為了電力系統的實際迫切需求。在機器人進行更換作業時,機器人需要具備識別出絕緣子銷釘位置的能力,因此在戶外復雜光景環境中準確地識別絕緣子銷釘位置是本文的研究重點。

近年來,深度學習技術已在圖像檢測和識別方面取得了突出成果,主要包含一步檢測算法與兩步檢測算法2 類。一步檢測典型算法主要有單次多邊框檢測(single shot multibox detector,SSD)[4]和YOLO 系列[5-7]等,該類算法將目標檢測轉換為先驗框(Anchor)回歸問題,能在滿足實時性的同時保持較高檢測精度;兩步檢測典型算法主要有基于區域的卷積神經網絡(region-based convolution neural networks,R-CNN)[8]、Fast R-CNN[9]、Faster RCNN[10]等,該類算法第一階段提出候選目標邊界框,第二階段采用感興趣區域(region of interest,ROI)操作,從每個候選框中提取特征用于接下來的分類和邊界框回歸任務。

目標檢測作為目前任務場景理解感知的重要組成部分,已經在實際工程中得到廣泛應用,但是,基于深度學習的絕緣子銷釘識別任務研究起步較晚,研究成果較少。李瑞生等[11]采用基于SSD 單階段檢測算法改進優化來檢測輸電線路中存在缺陷故障的銷釘,并與傳統檢測方法進行對比實驗,結果顯示所提出的方法檢測精度更高。郝帥等[12]在基于YOLOv3 網絡算法模型中添加了性能突出的視覺注意力機制模型,并驗證了該方法相比于其他目標檢測算法模型如SSD、Faster R-CNN 等在全類別平均正確率(mean average precision,mAp)和幀率上都具有較好的性能表現。徐文靜等[13]基于YOLOv5 網絡算法模型針對絕緣子圖片實現自動標注,該方法能夠快速、有效地對絕緣子圖進行自動標注,但如果目標處于相對復雜光照的背景條件下,圖片中有效目標特征難以獲取,且模型體積龐大、檢測速度低。

本文為了降低模型復雜度、提高識別速度,基于ShuffleNetV2[14]所改進的nSNet 模塊提出一種輕量型神經網絡主干部分;為了更好地實現不同尺度下目標特征的高效融合,在Neck 中增加了特征融合層并對原有Neck 進行了輕量化操作;用Alpha-IoU[15]作為邊框回歸損失函數,以提升檢驗框檢測的準確率;采用K-means 聚類算法對Anchor 尺寸重選取,以提高對絕緣子串銷釘的檢測精度和訓練效率。

1 YOLOv5 算法原理

YOLOv5 是目前較為先進的單階段目標檢測算法,其Backbone 借鑒參考了CSPNet[16]思想,采用改進版的CSPNet 作為主干網絡的主要結構,并在Neck 端進行多尺度融合,以提高預測精度[17]。同時,它采用Pytorch 框架使其網絡規模比YOLOv4 更小。YOLOv5 網絡結構如圖1 所示。

圖1 YOLOv5 模型結構

輸入部分主要完成圖像預處理。將輸入圖像尺寸轉換為網絡的輸入大小、數據增強以及自適應錨框計算工作。

Backbone 部分主要完成提取圖像的特征信息。在該部分中,Focus 模塊將圖片進行切分、連接再卷積,相當于下采樣操作,目的在于保留圖像的全部信息;CBS 模塊由卷積操作Conv 層、歸一化操作、BN 層以及SiLU 激活函數組成;CSP1_X結構中X 代表CSP 結構中使用的殘差組件,每個殘差組件都使用了2 個CBS 結構,目的在于減小模型大小的同時保證精度不會下降;SPP 模塊通過使用內核為1×1、9×9 以及13×13 來進行最大池化,滿足最終輸入一致。

Neck 部分主要完成多尺度的特征融合,采用FPN+PAN 的結構。

輸出部分主要完成輸出檢測到的目標信息。

2 YOLOv5-nS 算法設計

在本節介紹了YOLOv5-nS 模型Backbone 的設計思想和策略,提出了Neck 的增強優化策略,描述了對于邊界框回歸損失函數的改進方式,對于Anchor 尺度重選取策略進行了描述。YOLOv5-nS結構如圖2 所示。

圖2 YOLOv5-nS 結構

2.1 Backbone 網絡設計策略

現階段在移動設備上ShuffleNetV2 網絡結構比其他網絡更可靠。針對本文任務,為了進一步提高YOLOv5 模型的性能,我們遵循PPLCNet[18]的一些方法來增強ShuffleNetV2 網絡結構并構建新的骨干網絡,即nSNet(new ShuffleNetV2)。圖3詳細描述了nSNet 的nS Block 結構。

圖3 nS Block 結構

Channel shuffle 為ShuffleNetV2 網絡結構提供了信道間的信息交換,但會導致融合特征的丟失。為了解決這個問題,在步長為2 的結構塊中,增加了深度可分離卷積和點卷積用來整合不同信道間的信息。此外,還采用了卷積核為5×5 的深度可分離卷積結構擴展接受野,這種結構以增加少量參數帶來了精度的提高。

GhostNet[19]的作者提出了一種新的Ghost 模塊,可以用更少的參數生成更多的特征圖,以提高網絡的學習能力。在步長設置為1 的區塊中添加Ghost 模塊,以進一步增強nSNet 的性能。

深度可分離卷積[20]由2 種不同的卷積操作組成:第一步先進行逐通道卷積,對輸入層的每個通道獨立進行卷積運算,省略了通道域中的卷積,大大降低了計算量,但是沒有融合通道間信息;第二步再進行逐點卷積運算操作,將上一步的特征圖在其通道間進行加權線性組合,生成新的特征圖。深度可分離卷積的參數的數量約是常規普通卷積的1/3,可以降低原網絡的計算量和參數個數。其簡要結構原理如圖4 所示。

2.2 Neck 端改進策略

YOLOv5 模型以FPN+PAN 結構對Backbone提取的多尺度特征圖進行融合。由于這種融合方式將特征圖變換成相同尺寸后進行級聯,無法充分利用不同尺度間的特征,造成網絡模型的檢測精度受到限制。為了提高網絡模型對于多尺度特征圖的融合性能,在YOLOv5 的Neck 中增加了一層特征融合,使網絡模型在多尺度特征融合過程中獲得更多的有效信息,對于目標物體的檢測更加準確;同時,增加了網絡模型的感受野層次結構,使網絡模型的多尺度特征融合更加充分。

此外,文中對Neck 端還進行了輕量化的改進,將Neck 端原有的3 個殘差結構降為1 個殘差結構;對原有將Neck 端的卷積通道數進行了降維,使其算法模型加輕量化。

2.3 邊界框回歸損失函數改進

YOLOv5 的損失函數L的定義為

式中:lobj為置信度損失,lcls為分類概率損失,lbox為真實框和預測框的位置損失。

YOLOv5 網絡模型中真實框和預測框的位置損失函數采用CIoU Loss 損失函數實現:

式中: ρ為計算預測目標框中心點b與真實目標框中心點bgt這2 個中心點之間的歐氏距離;c是可以框住預測目標框和真實目標框最小長方形的對角線的長度;RIoU為預測目標框與真實目標框的交集與并集之比; β為權衡長寬比例造成的損失和IoU 部分造成的損失的平衡因子:

其中v為預測框和真實框長寬比歸一化值:

式中:h、hgt分別為預測目標框和真實目標框的高度,w、wgt分別為預測目標框和真實目標框的寬度。

本文任務中,數據集小并且需要高精確度的目標定位,因此采用性能更優的Alpha-IoU 來計算真實框和預測框的位置損失。Alpha-IoU 是基于IoU Loss 采取冪變換提出了一個新的損失函數,通過調節參數α,使探測器更靈活地實現不同水平的邊界框回歸精度,對含有噪聲的小數據集上魯棒性更強。Alpha-IoU 損失函數為

2.4 Anchor 尺度重選取策略

在大多數應用場景下的目標檢測任務中,對于初始Anchor 大小的選取非常重要,Anchor 大小是否合適將直接影響目標物體檢測的結果,同時還會影響訓練速度。 YOLOv5 模型算法對COCO 數據集設計生成不同大小的9 種Anchor,有3 種不同尺度,且每種尺度對應3 種不同大小的比例。針對本文任務,被檢測目標的真實框尺寸較小且變化幅度小。在訓練之前采用Kmeans 聚類算法對Anchor 尺度進行重選取,提高對絕緣子串銷釘的檢測精度和訓練效率。Kmeans 聚類算法采用歐氏距離聚類得到n個Anchors,再使用遺傳算法隨機對Anchor 的長寬進行變異,變異后效果更好的保留,否則跳過。通過以上操作完成Anchor 的重新選取,先驗框尺度如表1 所示。

表1 先驗框尺度

3 實驗

3.1 數據集以及實驗環境

由于目前沒有變電站懸式絕緣子的公開數據集,因此數據集為自行搭建,采集絕緣子圖像進行篩選、標注等處理后,一共1 400 張圖像,其中劃分訓練集1 000 張,驗證集200 張,測試集200 張。

實驗采用的操作系統為Windows10,GPU 型號為NVIDIA GeForce GTX 1050 Ti,顯存大小為4 GB,內存大小為8 GB,CPU 型號為Intel(R) Core(TM)i5-10400F CPU @ 2.90 GHz,模型基于Pytorch1.7.1實現。

3.2 實驗過程

3.2.1 nSNet 與ShuffleNetV2 性能對比實驗

基于YOLOv5s 網絡模型,在絕緣子銷釘的小型數據集上比較了nSNet 模塊構建的主干網絡與ShuffleNetV2 模塊構建主干網絡的性能,參數為主干網絡參數個數,評價指標mAP@0.5 是實際框與預測框交并比等于0.5 時的目標檢測準確率,mAP@0.5:0.95 是指實際框與預測框交并比從0.5 開始,以0.05 間隔直到0.95 的平均目標檢測準確度,實驗結果如表2 所示。

表2 nSNet 與ShuffleNetV2 性能對比

表2表明,ShuffleNetV2 構建的Backbone 雖然結構更加簡單、更加輕量化,但實驗證明nSNet 模塊構建的 Backbone 性能更優, 其mAP@0.5:0.95 比ShuffleNetV2 模塊構建的主干網絡高19.2%,mAP@0.5 高7.2%。

此外文中還比較了卷積核分別為為3×3、5×5 的深度可分離卷積的nSNet 模塊構建的主干網絡的性能,參數為主干網絡參數個數,實驗結果如表3 所示。

表3 nSNet 模塊與卷積核為3×3 與5×5 性能對比

表3 表明,大尺寸卷積核比小尺寸卷積核在參數個數小范圍增加下,其構建的nSNet 性能更優。

3.2.2 消融實驗

在絕緣子銷釘的小型數據集上進行了消融實驗,其結果如表4 所示。

表4 YOLOv5-nS 的消融實驗

消融實驗結果顯示,本文提出的Backbone 結構可以有效降低網絡算法模型大小,大大減小了特征提取的參數量,但是精度較原始算法模型有一定幅度的下降;通過增加特征融合層、提高感受野的層次結構,在參數量小幅度上升的情況下mAP@0.5:0.95 提高了6%;采用K-means 聚類算法對Anchor 尺度重新選取、改進邊界框回歸損失函數,二者對于算法模型的檢測精度均有一個較小的提升。

3.2.3 YOLOv5-nS 先進性驗證

為了驗證本文YOLOv5-nS 改進算法的先進性,我們與目前先進的相關目標檢測算法在自建數據集上進行了模型算法對比。本文對比的模型有兩階段目標檢測模型Faster-RCNN、單階段目標檢測模型SSD 以及YOLOv3-SPP,其實驗結果如表5 所示。

表5 YOLOv5-nS 與其他算法對比

由表5 可以看出,本文改進算法YOLOv5-nS 與其他檢測算法相比,在mAP@0.5:0.95 與mAP@0.5 上取得了最優的識別效果;與SSD 算法相比,mAP@0.5 提高了12%、mAP@0.5:0.95 提高了12.2%;在每張圖片檢測速度方面,YOLOv5-nS 比SSD 快了0.016 s,算法模型相對更小。

3.2.4 實驗結果分析

對本文所提出的改進算法與原算法模型進行比對,其結果如表6 所示。

表6 YOLOv5-nS 與YOLOv5s 性能比對

由表6 可以看出, 在mAP@0.5:0.95 下降1.8%的情況下,YOLOv5-nS 比YOLOv5s 的參數少了89.7%,模型大小減小了87.5%,幀率提升了7 f/s。雖然YOLOv5-nS 的mAP@0.5:0.95 有所下降,但是滿足絕緣子串銷釘的檢測任務需求,且檢測速度更快,算法模型更加輕量化。

為了進一步驗證YOLOv5-nS 在戶外復雜光照場景下對多姿態絕緣子銷釘的檢測的適用性,選取了數據集中非訓練集的部分數據進行檢測,結果如圖5 和圖6 所示。

圖5 光照不充足場景下絕緣子銷釘檢測結果

圖6 強光場景下絕緣子銷釘檢測結果

由圖5 與圖6 可以看出,YOLOv5-nS 可以有效地檢測出不同光照場景下的多姿態絕緣子銷釘,不易受到復雜光照與姿態的影響,具有良好的魯棒性。

4 結論

針對復雜光照場景中多姿態絕緣子銷釘檢測檢測困難和檢測速度慢的問題,本文基于YOLOv5 提出了一種適應性強、更加輕量化的YOLOv5-nS 算法模型。

1) 基于nSNet 模塊所提出的一種新的Backbone 網絡結構,可以有效減少網絡特征提取部分的參數,使其算法模型更加輕量化。

2)在特征融合部分,通過增加特征融合層的方式提高算法模型的感受野層次結構,使算法模型在多尺度特征融合過程中獲得更多的有效信息,對于目標物體的檢測更加準確。

3)采用K-means 聚類算法對Anchor 尺度重選取與改進邊界框回歸損失函數可以進一步提升算法模型的檢測精度與訓練效率。

雖然實驗結果證明了本文方法的有效性,可以準確并快速地檢測出不同光照場景下的多姿態絕緣子銷釘,為變電站絕緣子更換機器人在單片絕緣子更換中提供有效地視覺信息,但其仍然有很大的改進空間。采用輕量級網絡結構是輕量化算法模型的有效方式之一,但是如何保證檢在測精度不變甚至提升的條件下進一步降低計算量和參數量需要進一步研究。

猜你喜歡
銷釘絕緣子尺度
縱連板式軌道-銷釘體系動力響應及參數影響分析
更正
財產的五大尺度和五重應對
鍋爐膜式壁管屏銷釘自動焊工藝及系統開發
宇宙的尺度
1000kV耐張絕緣子串單片絕緣子的帶電更換技術
9
500kV絕緣子串含零值絕緣子時的電暈放電分析
絕緣子的常見故障及排除方法
輸電線路污閃及絕緣子選用探討
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合