?

基于YOLO v3的輸電線路缺陷快速檢測方法

2020-09-18 05:06周仿榮方明馬御棠潘浩
云南電力技術 2020年4期
關鍵詞:錨框卷積線路

周仿榮,方明,馬御棠,潘浩

(1.云南電網有限責任公司電力科學研究院,昆明 650217;2.云南電網有限責任公司,昆明 650051)

0 前言

隨著電網規模的不斷擴大,巡線的工作量增加,傳統的人工巡檢方式成本高,效率低,且實施具有一定的危險性。近年來,國家電網以及各個電力研究機構投入了大量的人力物力進行無人機電力巡檢的研究,包括無人機飛控技術以及輸電線路巡檢航拍圖像的目標識別及故障檢測技術研究。采用無人機巡檢具有低成本、高效率、適應復雜環境的能力更強的優點,能快速采集輸電線路的圖像和視頻信息,大大降低巡線工作的難度和危險性,在輸電線路巡檢中有著廣闊的應用前景[1,2]?;谏疃葘W習的缺陷識別方法能自動對非結構化數據進行有效地分析,利用深度學習算法對巡檢采集的圖片進行快速處理,實現輸電線路設備異常狀態的自動檢測與識別,這對于提升電網智能化具有重要意義[3]。

無人機通過搭載攝像頭采集輸電線路的狀態信息,但仍需要人工對采集的影像進行辨識。為了進一步提高機巡的自動化程度,許多學者提出了基于圖像的輸電線路設備和缺陷的識別方法。目前應用于輸電線路目標檢測的算法大多數需要依賴于人工提取圖像特征,再通過Hough 變換、Canny 算子、Gabor 算子等方法來分割出圖像中的目標[4-6]。這些算法的效果取決于特征的提取情況,一方面,特征提取是一項復雜的工作,需要很強的專業知識;另一方面,輸電線路缺陷繁多,人工提取的特征不足以表達,導致傳統算法的檢測目標類型單一。一些算法采取了支持向量機、神經網絡等淺層學習算法配合預測目標類型[7-9],但仍需要先對圖像特征進行提取。

近年來,基于深度學習的機器視覺技術得到了極大的發展,相應的圖像目標檢測算法也取得了很好的表現。2012 年AlexNet 在圖像識別大賽中取得不凡的表現之后,以卷積神經網絡(CNN)為核心的深度學習算法成為圖像分類和目標檢測的主要研究方向[10]?;谏疃葘W習的目標檢測算法可分為“雙階法”和“單階法”,“雙階法”準確率高,代表算法有SPP Net[11]和Faster R-CNN[12];“單階法”速度快,代表算法有YOLO[13-14]和SSD[15]?!半p階法”在電力系統設備的圖像檢測中已經有一定的研究[16-18],但仍處于理論研究階段,且其檢測速度慢,不能滿足實時檢測的需求。而在日常無人機巡檢工作中,會產生大量圖像和視頻數據,這對于目標檢測算法的速度要求非常高[3,19]。因此,本文建立基于YOLO 算法的輸電線路機巡影像缺陷識別模型,利用實際工程運維中得到的巡檢圖像進行訓練,并通過參數調整提高缺陷檢測模型的實際應用能力,能夠實現輸電線路機巡影像的缺陷實時檢測,具有較高的工程實用性。

1 巡檢圖像缺陷檢測模型構建

YOLO 算法直接在輸出層回歸目標位置和目標類別,實現端到端的訓練與檢測,這與最初基于區域建議的雙階目標檢測方法不同。YOLO v3 增加了多尺度預測,使得網絡對于尺寸變化范圍大的目標檢測能力更強,具有較高的檢測速度與識別精度[14]。本文基于YOLO v3模型對輸電線路巡檢圖像中的設備缺陷進行檢測與識別,模型框架如圖1 所示。

對于任意一張機巡圖片,首先將尺寸調整到統一大小,并將圖片劃分為S×S 個區域,再通過多個卷積層提取圖片特征,對于每一個區域,如果一個電力設備缺陷的中心落在這個區域內,則該區域負責預測這個缺陷,隨后通過回歸調整該設備缺陷的中心位置以及缺陷的大小,模型預測的輸出結果為S×S×(B×5+C),即S×S 個區域,每個區域輸出B 個不同尺寸的缺陷預測選框的位置和C 個缺陷類型信息,而對于每個缺陷預測選框有4 個坐標值以及1 個置信度值。最后,模型采用極大值抑制以去除重復的選框,最終預測得到巡檢圖片中實際包含的電力設備缺陷類型及位置。

圖1 YOLO v3模型框架

1.1 巡檢圖像缺陷檢測模型初始化

本模型首先將輸入的巡檢圖像按照三個尺度劃分檢測區域,分別有19×19,38×38,76×76 個檢測區域。隨后將樣本庫中獲得的9個缺陷先驗尺寸按照大小分配給三個尺度的檢測區域,即每個區域內有3 個先驗缺陷檢測錨框。對于每一個尺度的檢測區域,如果缺陷的中心落在一個區域內,則該區域就負責預測這個物體,如圖2 所示。

圖2 目標預測

1.2 卷積神經網絡的巡檢圖像多尺度特征提取

模型直接對整張輸入圖片進行特征提取,對大目標和小目標都能實現較好的檢測效果。本文采用DarkNet-53 卷積神經網絡框架來提取巡檢圖像的特征,該框架由53 個卷積層組成,每個卷積層后都有帶泄露的線性分段函數(Leaky ReLu)作為激活函數以適應非線性情況,其中有5 個卷積核的步長為2,對卷積結果進行上采樣得到多尺度的特征圖。特征提取模型如圖3 所示。

圖3 特征提取網絡

模型輸入一張任意RGB 色彩模式的巡檢圖像,對于卷積層,第l 個層卷積操作后輸出的特征向量可由公式(1)表示:

其中:xil-1為第l-1 層的第i 個特征圖,為第j 個卷積核,*表示卷積操作,為偏置項,f(*)表示激活函數,此處選擇Leaky ReLu 函數作為卷積層激活函數,即:

本模型不采用池化層,而是在部分卷積層采用步長為2 的卷積核,與這些卷積核進行卷積操作之后,圖片的特征向量大小變為原來的1/4,特征向量的深度隨著卷積窗口的增加而逐漸加深。

1.3 基于邏輯回歸的缺陷類型與位置預測

本模型在訓練前首先對樣本的缺陷大小進行聚類,得到9 個先驗錨框,每個尺度的特征圖負責檢測3 個尺度的錨框。將DarkNet-53 卷積神經網絡提取得到的圖像特征向量輸入到全連接層,由全連接層進行邏輯回歸,最終輸出維度為N×N×(3×(4+1+20))的預測向量,即對于三個尺度的特征圖,每個有N×N 個區域,每個區域3 個預測框的位置信息和置信度以及缺陷類型信息組成一個105 維的特征向量。

1.3.1 缺陷類型預測

本文共設計了20 種設備缺陷類型,每一個框都采用一組20 維的向量來表示缺陷類型,若預測為第n 種缺陷,則向量中的第n 個值為1,其余的值為0。每一個預測框都有一個置信度,包括該區域內有目標的可能性、缺陷類型和IOU 值三個部分,如公式(3):

本模型根據Darknet 網絡提取到的特征來判斷一個區域內有第l 類故障的可能性為P(Classi),預測區域面積與實際區域面積的交并比為

式中:A 和B 分別表示設備缺陷的實際區域和預測區域的面積,交并比即為預測區域和實際區域的交集與其并集的比值。

為了克服直接預測的不穩定問題,本模型采用相對位置來預測缺陷的位置,即預測缺陷中心相對于區域左上角頂點的偏移來進行定位,如圖4。

圖4 目標定位方法

中心點位置的學習公式為:

其中,(cx,cy)為區域左上角的位置坐標,(tx,ty)為預測位置與實際位置的偏差。

預測錨框大小的調整公式為:

其中,pw和ph表示先驗錨框的大小,tw和th表示預測錨框與實際錨框的大小偏差。

在對錨框參數進行學習時,首先對框內的區域進行一個目標評分得到置信度,若錨框置信度過低則直接忽略該錨框,對于置信度高于0.5 的選框,若相互之間的IOU 較高且預測同一個對象,則只保留置信度最高的錨框進行學習,以提高學習速度。

1.4 基于非極大值抑制的重復檢測目標消除

通過上述步驟將會得到過多的錨框,因此需要進行合理選擇以消除重復的錨框。本文選擇極大值抑制方法對重復錨框進行消除。首先對置信度過低的錨框進行抑制,這些錨框中很可能不包含需要檢測的目標。隨后將剩余的選框按照預測缺陷的類別進行分類,對于預測同一類缺陷的目標,首先選擇置信度最高的一個,如果其他錨框與之的IOU 高于0.5,則將閾值較低的錨框抑制,低于0.5 則不做處理;再對剩下的未被抑制的錨框重復該操作。循環結束后,剩余的錨框即被認為是最終預測的缺陷目標。

2 巡檢圖像樣本庫的模型訓練與優化

深度學習算法需要通過大量的數據訓練來實現較好的檢測效果,本章節介紹模型訓練過程的主要工作。本文基于DarkNet 深度學習框架搭建仿真模型[20],計算機配置為Ubuntu 14.0操作系統,32 核Xeon CPU,GTX 1080Ti 顯卡,64G 內存。

2.1 訓練樣本庫構建

本文利用從某省獲得的5000 張巡檢圖像組成訓練樣本庫,其中4000 張圖片組成訓練集,另外1000 張圖片組成測試集。樣本圖片按照Pascal VOC 標準[21]進行標準,標記對象包括架空線路缺陷、桿塔缺陷、絕緣子缺陷、金具缺陷,組成一個輸電線路典型缺陷的樣本庫。巡檢圖像的尺寸不完全一致,考慮到在無人機巡檢過程中拍攝目標往往會位于圖片中間位置,為了避免尺寸不一導致圖像的壓縮和形變,方便模型進行統一的數據處理,本文將訓練圖片從中心剪裁至3:2 大小并調整像素為4800×3200,去除邊緣的無關部分。

2.2 基于聚類算法的缺陷先驗尺寸選擇

本文利用聚類算法得到缺陷的先驗尺寸。模型的初始參數對于訓練收斂速度和訓練效果具有十分明顯的影響,一個好的初始值能加快模型的收斂。本文對樣本圖像進行分析,發現不同圖片中故障的形態雖然有較大差異,但同一類故障的大小卻很接近,比如絕緣子故障和桿塔故障普遍尺寸較大,導線故障的區域較小等。因此本文對缺陷大小使用k 聚類,得到9個聚類中心。這9 個聚類中心的值作為缺陷檢測模型的先驗錨框的尺寸,使得錨框的選擇能夠更好的匹配輸電線路中缺陷的尺寸,加快模型的收斂,提高缺陷檢測的精度。

表1 先驗尺寸大小

2.3 損失函數設計

本模型的損失函數由三部分組成:坐標損失函數、類別損失函數、置信度損失函數,對三個尺度的預測結果分別進行計算,最后相加得到整個網絡的損失函數。坐標損失函數表示為:

類別損失函數為:

置信度損失函數為:

其中,S2表示網格區域數,B 表示每個區域內的錨框數,表示若區域i 中的第j 個錨框負責預測目標則為1,否則為0,則相反。

2.4 損失函數權重調整

通過對巡檢圖像進行分析發現,大部分圖像上只存在不超過四處缺陷,而每張圖片產生的網格區域數量則遠大于缺陷數量,因此本文通過參數λnoobj來調整有目標的區域和沒有目標的區域的損失權重,經過實驗,本文選擇權重λnoobj=0.1。

在模型的設計中,缺陷類型有20 類,而坐標參數只有4 個,若直接相加則會導致坐標參數對損失函數的影響太小。為了增加位置坐標對損失函數的影響以加快收斂,本文為坐標損失函數增加權重λcoord=5。最終的損失函數表示為:

3 模型測試與結果分析

本章節基于YOLO 算法在輸電線路巡檢圖像數據集上進行仿真試驗,并與其他深度學習算法進行性能比較,探究YOLO 算法在輸電線路巡檢應用的優勢與不足。

3.1 缺陷樣本分析

本文采用的數據集可分為訓練集和測試集兩個部分,各自包含的故障類型與對應的數量如表2 所示。

表2 缺陷數量統計結果

訓練集中,四類故障所占的比例分別為33.29%、25.69%、21.90%、19.12%;測試集中,四類故障所占的比例分別為32.29%、27.27%、23.10%、17.34%。從統計結果可以看到,四類故障的數量相當,能夠較好的滿足模型訓練和測試的需求。

3.2 模型評價指標介紹

本文采用查全率(recall)、查準率(precise)和平均精度(map) 來對輸電線路缺陷檢測模型的檢測效果進行評價。

查全率是指正確檢測出的目標占所有需要檢測出的目標的比例。對于任意一個置信度高于設定閾值的檢測框,如果與某一標記目標的交并比大于0.5,且預測的類別與該目標相符,則認為檢測的目標正確。統計所有檢測正確檢測框的數量記為NTP,實際需要檢測的目標數量為NG,查全率的計算公式為:

同樣,記所有置信度滿足要求的檢測框數量為ND,查準率的計算公式為:

平均精度結合查全率和查準率,通常情況下作為一個更全面的指標來評價一個模型的好壞。

3.3 巡檢圖像缺陷識別結果分析

本文使用訓練好的模型對實際運維中采集得到的巡檢圖像進行缺陷定位與識別試驗,當預測目標與實際目標的交并比大于0.5 時,認為預測準確。本文訓練了目前效果較好的幾個模型來作為對比,實驗結果如表3 所示。

從實驗結果可以看出,單階法的SSD 和YOLO v3 雖然在性能上稍差于雙階法的Faster RCNN,但在計算速度上有著明顯的優勢,YOLO v3 的預測所需時間僅為Faster RCNN 的1/9 左右。經過改進后的YOLO v3 模型在輸電線路巡檢圖像上的性能也有了很大提高,其查準率已經遠超過Faster RCNN 模型的查準率,查全率也相差不多,但仍保持著單階法在速度上的優勢。

表3 模型效果對比

4 結束語

目前,應用于輸電線路缺陷檢測的目標檢測算法主要為Faster RCNN 等方法,這些方法的識別精度較高,但檢測速度較慢,無法實現無人機巡檢中產生的大量視頻數據進行識別。本文提出基于YOLO v3 的輸電線路缺陷快速檢測方法,其檢測速度接近50 幀每秒,能夠滿足視頻檢測的需求。同時,在本文的數據集中,基于YOLO v3 的輸電線路缺陷快速檢測方法實現了78.2% 的檢出率,僅比基于Faster RCNN 的檢測方法低5.4%。因此,本文認為基于YOLO v3 的輸電線路檢測方法可以彌補Faster RCNN算法的不足,實現基于視頻圖像的輸電線路缺陷快速檢測。

猜你喜歡
錨框卷積線路
錨框策略匹配的SSD飛機遙感圖像目標檢測
基于SSD算法的輕量化儀器表盤檢測算法*
基于GA-RoI Transformer的遙感圖像任意方向目標檢測
基于3D-Winograd的快速卷積算法設計及FPGA實現
基于深度學習的齒輪視覺微小缺陷檢測①
卷積神經網絡的分析與設計
輸電線路工程造價控制
從濾波器理解卷積
10kV線路保護定值修改后存在安全隱患
10kV線路保護定值修改后存在安全隱患
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合