?

基于改進YOLOX的變電站設備缺陷檢測方法

2023-12-26 09:36羅簫瑜
吉林大學學報(信息科學版) 2023年5期
關鍵詞:濾波變電站樣本

羅簫瑜,張 志

(廣西電網有限責任公司 來賓供電局,廣西 來賓 546100)

0 引 言

變電站作為電力系統的關鍵基礎設施,其安全穩定運行是電能供應的重要保障。受人們生活和自然環境的影響,變電站設備可能會有破損、臟污等缺陷,這會給變電站的安全運行帶來隱患,并有可能導致電力系統危害發生。因此不可忽視變電站日常的巡檢。目前,我國變電站巡檢基本還是以人工巡檢方式為主,但這種巡檢方式存在效率低,限制多等問題。為減輕電力工作人員的巡檢負擔,實現變電站智能巡檢,迫切需要開展變電站設備的無人智能化運維管控,提高變電站巡檢的質量與效率[1-4]。

目前,隨著目標檢測算法技術的蓬勃發展,許多學者將目標檢測算法引入到變電站和輸電線路巡檢的工作中,旨在提高電力系統的自動化程序。目標檢測算法能在各種復雜的環境下提取使用者感興趣的信息,極大地加速了工業領域自動化的進程[5]。根據訓練方式的不同,變電站目標檢測方法可分為雙階段法和單階段法,雙階段法以基于區域建議的R-CNN(Region-based Convolutional Neural Network)系列為代表,將檢測和識別分成兩個步驟,需要先產生目標候選框,再對候選框做分類與回歸; 單階段法是一種端到端的檢測算法,它將檢測和識別作為類別概率和邊界框的回歸問題,主要有SSD(Single Shot multiBox Detector)模型、YOLO(You Only Look Once)網絡模型等[6-15]。劉黎等[7]提出了基于Faster-RCNN(Faster Region-based Convolutional Neural Network)的變電站懸掛異物檢測方法,實現了懸掛物和鳥巢兩類常見異物的檢測。尹子會等[8]提出了一種基于Faster-RCNN的變電站設備缺陷檢測系統,實現了包括呼吸器變色、呼吸器漏油、絕緣子破損和鳥巢在內的4類常見變電站設備缺陷的檢測與識別。陳婷等[9]提出了基于YOLOv4的變電站缺陷檢測方法,對呼吸器變色類缺陷實現了高精度的檢測與識別。琚澤立等[10]提出了一種耗時較短的基于SSD的變電站缺陷圖片檢測方法,實現了表盤故障與呼吸器故障的高效檢測與識別。由此可見,單階段的YOLO系列將目標檢測作為回歸問題,在產生候選區域的同時完成分類和定位,推理速度較快[11-15]。

然而,針對變電站缺陷檢測任務仍存在以下難點:1) 數據采集成本高,神經網絡需要大量樣本學習,由于缺陷場景的稀缺性,收集足夠的考慮復雜光照條件的缺陷樣本成本很高; 2) 變電站背景信息復雜,由于缺陷圖片中同時包含小目標和大目標,不同層次特征之間的不一致性干擾了訓練過程,降低模型檢測的有效性; 3) 由于同一類別部件的破損或模糊種類較多、形狀多樣,尤其是樣本數量有限且正、負樣本存在不均衡問題時,將導致模型準確度降低。

為此,考慮到YOLO網絡本身運算速度快、精度高的優點,而變電站缺陷監測與識別恰好需要準確性和實時性兼備。筆者首先用數據增強方法對有限的初始數據集進行擴充,利用多種圖像處理方法增加數據集的復雜度,生成考慮復雜光照環境的數據集; 然后從提高特征提取能力和預測能力兩點上對原始YOLOX-s算法進行改進,采用自適應空間特征融合(ASFF:Adaptively Spatial Feature Fusion)的方法緩解特征金字塔中不同尺度特征的不一致性問題,并將置信度損失函數改為Focal損失函數以緩解正負樣本不平衡的問題。實驗結果證明了兩項改進的有效性,表明改進后的YOLOX-s算法能更好地實現變電站設備缺陷的檢測任務。

1 數據集構建

深度學習依賴龐大的訓練數據實現,訓練數據的合適與否對網絡訓練模型的訓練效果具有重要影響,嚴重時會導致過擬合甚至模型不收斂。目前獲得的缺陷樣本數據集容量較小,而樣本容量大小對卷積神經網絡的訓練效果有很大影響,因此需要通過數據增強的方法對數據集進行擴容。常用的數據增強方法有空間變換、顏色變換等。

空間變換數據增強方法可通過簡單的圖像矩陣坐標變換實現,多數變換中初始圖像(x0,y0,1)與變換后的圖像(xc,yc,1)為

(xc,yc,1)T=M(x0,y0,1)T,

(1)

其中圖像變換效果及變換說明如表1所示。

顏色變換數據增強方法通過調節RGB(Red Green Blue)圖像三通道的像素值大小實現,筆者主要采用亮度調節方式進行亮度方面的數據增強,調節亮度只需在3個通道對其像素值按照一定規律增減即可改變圖像的亮度。RGB圖像的亮度計算公式如下:

L=0.299R+0.587G+0.114B。

(2)

采取調節亮度措施可對變電站中圖像采集的明暗環境進行一定的模擬,亮度調節處理后的圖像如圖1所示。

圖1 亮度調節效果

對圖像進行加噪和加霧可分別對圖像采集過程中的噪聲和惡劣天氣下的環境進行模擬,環境模擬效果如圖2所示。

圖2 環境模擬效果

Mixup數據增強方法將兩張圖片進行混合而生成新的訓練圖片,可擴大數據集容量,在有限的圖片中獲得更多的異物信息,如下:

(3)

圖3 Mixup數據增強效果圖

Mosaic數據增強方法使用4張圖片進行拼接生成新的訓練圖片,可豐富異物檢測時的背景,其實現思路可以分為如下3步:隨機讀取4張圖片; 將讀取到的4張圖片進行簡單的空間、顏色變換,并將4者按左上、左下、右上、右下的位置進行擺放; 進行4張圖片的組合和其目標框的對應組合,并保留有效的目標框。Mosaic數據增強方法的效果如圖4所示。

筆者采用Jung等[16]設計的Python庫Imgaug進行數據增強,先定義一組變換方法,規定JPEGImages中每張原始圖片從該變換方法中隨機選擇若干種方法作為一個數據增強的策略并進行變換,并使每個策略不盡相同,最后將增強后的圖片保存作為數據集的擴充部分,與之前的異物初始數據集合成為新的數據集。

2 基于YOLOX-s的變電站缺陷檢測算法設計

2.1 卷積神經網絡模型

卷積神經網絡是一種人工神經網絡和一類包含卷積計算且具有深度結構的前饋神經網絡,目前以其作為核心的深度學習算法被廣泛使用。卷積神經網絡主要用于識別位移、縮放和其他形式扭曲不變性的二維圖像,每張圖像的像素可看作是一個多維輸入向量,同一特征映射圖上的權值共享減少了權值的數量,降低了網絡的復雜性。卷積神經網絡主要由輸入、卷積、激活、池化、全連接和輸出層構成[17]。當一個樣本圖片輸入后,經過多層的卷積、激活和池化層后,逐層地提取圖像特征信息、加強特征信息,并且在保留圖片重要特征信息的同時,壓縮特征數據,提高模型的計算速度,最后得到的特征向量輸入到全連接層中進行分類輸出。

2.2 圖像預處理模型

由于筆者考慮復雜光照環境下的變電站缺陷檢測識別,數據集中引入了圖像噪聲、光線環境等因素的影響,因此在進行圖像預處理過程中需要采用一定的算法進行圖像去噪,提高圖像特征[18]。圖像的去噪也可稱為圖像的平滑處理,主要是對圖像采用各種濾波算法以減少噪聲,常用的方法有均值濾波、高斯濾波、中值濾波和雙邊濾波等。

1) 均值濾波。其為典型的線性濾波算法,主要方法為鄰域平均法,即通過模板求像素鄰域的均值代替原像素值。均值濾波的變換公式如下:

(4)

其中m為該模板包括當前像素在內的所有像素總個數。

2) 高斯濾波。其是一種線性平滑濾波,對圖像中的高斯噪聲有一個很好的去除作用,在圖像的去噪過程中得到了廣泛使用。高斯模板中各元素值的計算公式如下:

(5)

3) 中值濾波。其是一種典型的非線性濾波技術,采用鄰域內像素的中值代替原像素值去除噪聲。中值濾波由于不依賴領域內與典型值差別很大的值,所以椒鹽和斑點噪聲的去除有顯著效果,且能保護信號邊緣不被模糊,但需要進行像素排序,計算量大。中值濾波各像素值計算公式如下:

g3(x,y)=median{sort(f(x+i,y+j))}, (i,j)∈a×a。

(6)

在實際進行圖像處理時,應當綜合考慮噪聲消除與細節保留因素,選擇合適的圖像去噪方法。均值濾波不能很好地保存圖像的細節,在去噪的同時也對圖像的細節部分造成了一定程度破壞,會造成邊緣模糊; 高斯濾波在有利于去除高斯噪聲,能較柔和的保留邊界,但依然較難完全去除椒鹽噪聲; 中值濾波在去除椒鹽噪聲的效果較好,能在去除圖像噪聲的同時,對圖像的邊緣特性進行保存,但由于需要進行排序操作,花費的時間是均值濾波的5倍以上。由于所拍攝的照片中可能包含高斯、椒鹽和斑點等噪聲,筆者考慮將多種方法相結合,根據具體情況選擇合適的濾波方法。

2.3 改進的YOLOX-s網絡模型

YOLOX網絡YOLO系列的anchor-free版本,根據其網絡結構大小可以分為標準網絡結構和輕量網絡結構,前者包括YOLOX-s、YOLOX-m、YOLOX-l、YOLOX-x和YOLOX-Darknet53,后者包括YOLOX-Nano和YOLOX-Tiny。其中YOLOX-s是在YOLOv5s的基礎上進行了改進。YOLOX-s網絡結構主要由輸入端、網絡主干、特征增強與預測模塊4部分構成,即圖5中所示的Input、Backbone、Neck與Prediction 4部分。

圖5 YOLOX-s網絡總結構

為進一步提升YOLOX-s網絡的檢測效果,筆者改進了原YOLOX-s算法,將置信度損失函數改為Focal損失函數以緩解正負樣本不平衡問題,并采用自適應空間特征融合(ASFF:Adaptively Spatial Feature Fusion)的方法緩解特征金字塔中不同尺度特征不一致性。

1) Focal損失函數。原YOLOX-s網絡的損失計算中置信度損失采用二分類交叉熵損失函數,雖然一定程度上解決了正負樣本不平衡的問題,但并未區分是易分類還是難分類樣本,可能導致整個過程針對易分類負樣本進行,使過程的損失增大。因此采用Focal損失函數進行改進,Focal函數的計算公式如下:

F(pt)=-αt(1-pt)γlog(pt),

(7)

其中(1-pt)γ為調制因子,用于降低易分類樣本的損失貢獻并增加難分類樣本的損失比例;αt為平衡參數,用于抑制正負樣本數量失衡問題。

2) ASFF機制?;谔卣鹘鹱炙膐ne-stage目標檢測算法不同特征尺度之間具有不一致性,即在采用FPN(Feature Pyramid Network)結構的網絡中,不同層之間的特征將會影響最后的檢測結果,當某一目標在某一層被判別為正類后,其他層會將其判別為負類。而在特征融合時,其他層的無用信息也可能會被融合。因此采用ASFF機制自適應地學習各尺度特征映射融合的空間權重,而非之前基于元素和抑或級聯方式進行的多層次特征融合。ASFF機制如圖6所示,其將PAFPN中3個不同尺度的特征圖分別融合為對應尺度的3個特征圖,然后學習一個融合權重,了解不同特征尺度對預測特征圖的貢獻。

圖6 ASFF機制示意圖

2.4 網絡模型相關參數

為使訓練取得一個較好的效果,筆者采用了如下幾種訓練策略。

1) 遷移學習。其是指將一個任務的網絡結構和權值遷移到另一個任務中,使其可以在該任務中產生較好的效果。適合樣本不足的情況,將通用特征的學習從已訓練好的網絡模型中遷移到變電站缺陷檢測網絡中,既可節省訓練時間,又可得到較好的識別效果。

2) 學習率余弦退火衰減。其是指通過余弦函數的形式對學習率進行調整,先緩慢下降,然后加速下降,再緩慢下降,學習率的更新機制如下:

(8)

其中Lrate為初始學習率,Gstep為用于衰減計算的全局步數,Dsteps為衰減步數,α為最小學習率。

3) 優化器選擇。其是在深度學習網絡反向傳播過程中使損失函數不斷逼近全局最小的一種權值參數更新算法,筆者選用收斂能力更強且計算效率更高的Adam梯度下降法。其權重更新方式如下:

(9)

該訓練模型的全部超參數如表2所示。

表2 模型訓練超參數表

2.5 評價指標

為衡量模型訓練效果,筆者選用的評價指標有權重平均精度值(WAP:Weighted Average Precision)、F1分數(F1-score)和每秒幀率FPS(Frame Per Second)。

由于模型需要針對變電站多種類缺陷進行識別,為整體衡量模型對變電站各類設備缺陷的檢測精度,需要合理考慮不同種類缺陷在系統中所占的比例。筆者提出了考慮變電站設備缺陷權重的平均精度評價指標及不同種類設備缺陷的重要性,對不同種類設備缺陷賦予不同權值。權重平均精度值WAP公式如下:

(10)

其中αi為第i類檢測目標的權重,筆者使用的實驗樣本中,共有3類主要設備缺陷類型:絕緣子一類、二類和間隔棒缺陷,對3類設備缺陷圖片數目進行計算,得到3類缺陷的權值分別為0.19,0.57,0.25。由于PAPi為第i類檢測目標的平均精度,欲計算PAP值,需要先計算準確率(Precision)和召回率(Recall)。準確率p表示預測樣本中實際正樣本數占所有正樣本數的比例,召回率r表示實際正樣本數占所有預測樣本的比例,如下:

(11)

其中TP(True Positives)為正確地被劃分為正例的數量,FP(False Positives)為被錯誤地劃分為正例的數量,FN(False Negatives)為被錯誤劃分為負例的數量。按照IOU(Intersection Over Union)閾值評估,即分別為IOU值大于0.5的預測框數量、小于0.5的預測框數量和未檢測到目標的數量。

用召回率r作為橫坐標,準確率p作為縱坐標,則PAP值為該p-r曲線與坐標軸圍成的面積,如下:

(12)

類似的指標還有F1分數,其是統計學用于衡量二分類模型準確度的一種指標,是模型準確率和召回率的調和平均數,如下:

(13)

每秒幀率FPS表示算法每秒可以處理的圖片數量,表征模型運行的速度,其值越大,表示模型運行的速度越快。如下:

(14)

其中N為從圖片處理起始時間tstart到結束時間tend時間內處理的圖片數量。

綜上,當WAP、F1得分與FPS指標均取值越大時,模型的訓練效果越好。

3 實驗結果與分析

筆者分別對SSD、Faster-R-CNN與YOLO各系列算法效果進行對比,采用WAP、F1分數與FPS 3項評價指標。各類算法的PAP值如表3所示,3類設備缺陷PR和F1曲線如圖7,圖8所示。

圖7 改進YOLOX-s算法的3類設備缺陷PR曲線

圖8 改進YOLOX-s算法的3類設備缺陷F1曲線

表3 各類算法檢測精度對比

由表3可看出,各類算法在絕緣子缺陷的檢測上PAP值均較高,其中重要的原因是絕緣子缺陷數據集比較豐富,間隔棒缺陷相對單一。雖然各種算法在每種異物上的檢測效果變化很大,但可以看出,相比于SSD與Faster RCNN,YOLO系列算法,YOLO算法結果較好,而筆者所提出的改進的YOLOX-s檢測精度WAP更是達到了98.07%,相較于原始YOLOX-s算法提升了約1.16%,相較于其他算法更是有明顯優勢。

從圖7可看出,3類典型缺陷的PR曲線與坐標軸所圍成的面積均比較大,表明每種檢測物體的AP值均比較高。而間隔棒缺陷的PR曲線均不太光滑,因為數據集中這3者所占的比例比較低,由此可看出一個豐富的數據集也能較好地反映模型檢測的泛化能力。

從圖8可看出,F1曲線反映的是在不同的IOU閾值下的F1分數值,在筆者設定的閾值IOU為0.5時,3類典型缺陷的的F1分數值均較高,且其大小規律與PAP值相同,均為絕緣子一類缺陷最大,間隔棒缺陷最小。因為PAP值和F1得分都是綜合反映各檢測物體的準確率和召回率,區別是PAP值不隨IOU閾值變化。

由此看出,對于準確性和實時性,YOLOX-s模型均要優于另外幾種模型,而改進的YOLOX-s模型以一定的模型大小增長為代價,獲得了WAP上一定的提升。如圖9所示,基于改進YOLOX網絡的變電站設備缺陷算法可以對典型設備缺陷進行檢測和識別。

圖9 基于改進YOLOX-s模型對變電站設備典型缺陷的檢測結果

4 結 語

筆者為提高變電站缺陷檢測精度,提出了基于改進YOLOX的復雜光照下變電站設備缺陷檢測方法??偨Y了常用的數據增強手段,利用目前有限的數據集對其進行數據增強,盡可能模擬復雜光照條件下的變電站缺陷圖片,最終完成了變電站缺陷的數據集設計。在此基礎上,給出了基于YOLOX-s的變電站缺陷檢測算法,并對YOLOX-s進行了改進,使用Focal函數作為新的置信度損失計算函數以及ASFF機制,采用多種訓練策略,并與幾種其他深度學習的算法進行效果對比,得出使用YOLOX-s網絡進行變電站缺陷檢測更具有優勢的結論。

猜你喜歡
濾波變電站樣本
用樣本估計總體復習點撥
推動醫改的“直銷樣本”
關于變電站五防閉鎖裝置的探討
超高壓變電站運行管理模式探討
隨機微分方程的樣本Lyapunov二次型估計
220kV戶外變電站接地網的實用設計
村企共贏的樣本
變電站,城市中“無害”的鄰居
RTS平滑濾波在事后姿態確定中的應用
基于線性正則變換的 LMS 自適應濾波
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合