?

基于Faster R-CNN的火電廠冷卻塔檢測及工作狀態判定

2021-07-08 10:42安健健孟慶巖胡蝶胡新禮楊健楊天梁
自然資源遙感 2021年2期
關鍵詞:冷卻塔電廠卷積

安健健,孟慶巖,胡蝶,胡新禮,楊健,楊天梁

(1.昆明理工大學國土資源工程學院,昆明 650093;2.中國科學院空天信息創新研究院,北京 100094;3.三亞中科院遙感研究所,三亞 572029;4.中國科學院空天信息研究院海南研究院,三亞 572029)

0 引言

電能是國家重要的戰略能源?;鹆Πl電是歷史上最久遠且最重要的發電方式之一[1]。國際能源署(International Energy Agency,IEA)公布的2016年全球電力來源分布圖顯示,煤、天然氣、石油等化石燃料燃燒產生的電量占全球總發電量的65.1%,進一步證明了其重要的戰略地位。因此,在大區域范圍內,對于火力發電廠的精確檢測及其工作狀態自動、有效判定變得日益重要。

隨著遙感技術的飛速發展,遙感圖像目標檢測技術也迅速發展[2-3],區域建議方法[4]和基于區域的卷積神經網絡(region-based conoolational neural network,R-CNN)[5]的出現極大提高了目標檢測的準確性,但訓練時間長且占用空間大。Ren等[6]提出使用區域建議網絡(region proposal network,RPN)來生成有效且準確的區域建議,它與檢測網絡共享完整圖像的卷積特征,因此區域建議幾乎實現了零成本。生成的區域建議提供給Fast R-CNN作檢測使用,從而大大減少了檢測網絡的運行時間,提高了目標檢測精度。在此基礎上,國內外一些學者將其應用到遙感圖像目標檢測中[7-15]:Yao等[16]選取高分辨率遙感影像中油罐目標進行驗證實驗;Zhang等[17]以機場為檢測場景,將飛機作為檢測目標進行實驗;Zhang等[18]通過自然場景中水面物體的檢測,及時發現并處理水面漂浮物。上述實驗在檢測目標時均取得較好效果,有力推動了Faster R-CNN模型在目標檢測中的應用。目前,Yao等[19]利用該模型提出了一種冷卻塔和煙囪的檢測方法,但尚未有研究對火力發電廠的工作狀態進行有效判定。

綜上,本文基于火力發電廠冷卻塔工作狀態下的排氣特征和Faster R-CNN的深度卷積神經網絡方法,提出一種以冷卻塔為關鍵地物目標的火力發電廠檢測方法,并根據冷卻塔是否排氣判定其工作狀態。首次將深度學習方法應用于目標工作狀態判定。此外,本方法亦可遷移至煉油廠、煉鋼廠、核電站等具有排煙、排氣現象的其他大型工業地物目標,快速獲取工業生產活動的工作狀態信息。研究成果可有效幫助相關部門對周邊環境進行監測,減輕空氣污染、改善空氣質量。

1 實驗原理

1.1 冷卻塔特征

因為單葉雙曲面是一個雙直紋曲面,所以可以用直鋼梁來構造,這樣不僅能夠減小風阻,而且可以用最少的材料來保持結構的完整性。這種結構不僅可以提高空氣的對流速度,而且可以提高冷卻效率。因此,大多數電廠的冷卻塔結構采用單葉雙曲面結構。如圖1(a)所示,電廠運行時,燃燒產生的余熱隨冷卻水進入冷卻塔,塔內水泵將其壓入灑水系統。在下落過程中,灑水管將水均勻分布,它與塔內空氣進行熱交換,形成大量的水蒸氣從冷卻塔頂排出。如圖1(b)所示,本實驗將冷卻塔上方水蒸氣液化形成的霧狀水汽作為發電廠處于工作狀態下的判定標志,進行目標檢測。

(a)非工作狀態下的冷卻塔 (b)工作狀態下的冷卻塔

1.2 網絡模型

1.2.1 Faster R-CNN模型

Faster R-CNN共分為兩大模塊,第一個模塊是RPN網絡,第二個模塊是使用建議區域的Fast R-CNN檢測器[20],具體結構如圖2所示。首先,將原始圖像輸入網絡,由特征提取網絡提取特征圖;之后,將特征圖分別輸入到區域建議網絡和Fast R-CNN,由區域建議網絡中生成一組矩形目標建議和相應的目標得分,采取非極大值抑制(non-maximum suppression,NMS)方法使用前N個得分的目標建議區域,并將其輸入到Fast R-CNN中,提取區域建議特征;最后,通過全連接層對目標分類和邊框回歸,得到最終的目標檢測結果。

圖2 Faster R-CNN目標檢測網絡結構圖Fig.2 Faster R-CNN target detection network structure

1.2.2 RPN模型

RPN是一個卷積神經網絡,其作用是將以特征提取網絡輸出的特征圖輸出為多種尺度和寬高比的矩形候選區域。這個卷積神經網絡會首先讓一個滑動窗口(實質上為3×3的卷積核)在特征圖上滑動,然后把滑動窗口每次停留的位置上的特征映射成一個512維(選用VGG16作為特征提取網絡時為512維,若選用其他網絡時,則該維度會發生變化)的特征向量,然后將每個特征向量分別輸入到分類層和位置回歸層這兩個全連接層之中,這樣會分別得到分類信息和位置信息。在每個滑動窗口的中心位置定義了9個錨點(anchor),每個錨點對應錨盒(anchor box),而每個對應的錨盒其尺度和長寬比是不同的;分類層具有2×9個輸出,估計每個建議是否是檢測目標的概率;回歸層具有4×9個輸出,是編碼邊界框的坐標。Faster R-CNN中為訓練RPN將圖像損失函數定義為:

(1)

(2)

(3)

1.2.3 訓練卷積網絡模型

VGG16網絡訓練模型部分結構如圖3所示,網絡使用了16個層,包括13個卷積層和3個全連接層。根據VGG16模型結構,13個卷積層被分成5個組,相鄰的兩個組之間會有1個池化層。冷卻塔作為火力發電廠必不可少的冷卻裝置,因此將其作為檢測電廠的典型地物目標,且火力發電廠在工作時冷卻裝置也會同時啟動,在冷卻塔上方冒出大量白霧,這些白霧的有無將作為電廠工作狀態的判定標志,而VGG16模型網絡更深,通道數量更多,能很好提取冷卻塔及周圍特征,取得理想的檢測效果。

圖3 VGG16部分結構示意圖Fig.3 Partial structure diagram of VGG16

2 結果與分析

2.1 實驗數據

本實驗采用NWPU-RESISC45 dataset[21]數據集中的的冷卻塔圖像作為原始訓練集,選取540張質量較好的冷卻塔圖像,像素大小統一為256×256,然后通過數據增強技術對訓練集進行擴充(具體數據增強技術見2.3.1)。測試集部分來自于Google Earth的遙感影像,共計190張彩色圖像,空間分辨率優于1 m。本文算法需要通過對TXT文本的讀取來獲得訓練圖像的存儲路徑以及圖像中目標的標記像素坐標和目標類別。在制作數據集的過程中,依據VOC2012的數據集格式,對影像進行統一格式的命名,再利用labelImg圖片標注工具對影像進行標注,生成包含有目標類別位置信息的XML文件,通過Python程序生成對應的TXT文件,將這些文件組合成VOC2012格式的數據集,標注示例如圖4所示。

圖4 標注示例Fig.4 Annotation example

2.2 實驗環境及參數設置

本實驗基于Ubuntu16.0.4操作系統,使用tensorflow-gpu 1.7.0作為深度學習框架,GPU型號為NVIDIA TESLA C2050,代碼運行環境為Python3.7.1。訓練階段,采用在ImageNet數據集上預訓練得到的模型進行權重初始化,超參數設置:學習率為0.001;動量(momentum)為0.9;權重衰減率(weight_decay)為0.000 1。

2.3 精度驗證與評價

2.3.1 不同特征對檢測精度的影響

由于電廠中冷卻塔周圍常分布有煙囪,其排放出的大量濃煙會對冷卻塔進行遮擋,干擾冷卻塔的檢測與工作狀態判定。增強數據集,擴大樣本容量可以較好地解決該問題。為了驗證不同數據特征對電廠冷卻塔工作狀態檢測精度的影響,分別選用改變亮度、旋轉、CutMix和Mosaic的數據增強技術進行實驗,其中改變圖像亮度值與圖像旋轉作為傳統數據增強方法的代表,數據集擴增效果如圖5所示。

(a)改變亮度(b)分別旋轉90°,180°和270° (c)CutMix (d)Mosaic

采用不同數據增強技術進行電廠冷卻塔工作狀態檢測,結果如表1所示。表中,AP值為精確率(precision)和召回率(recall)曲線下的面積,mAP為AP均值。

表1 不同數據增強技術實驗結果Tab.1 Experimental results of different data augmentation technologies

由表1實驗數據可知,僅采用Mosaic數據增強技術比單獨采用其他方法檢測精度要高,且在前3種數據增強方法都使用時,增加Mosaic技術要比沒有Mosaic技術精度更高,這說明Mosaic數據增強技術混合了4種不同的技術,確實能夠提高模型從不同環境獲得的圖像的能力,從而使模型具有更高的檢測精度,因此,在接下來電廠冷卻塔工作狀態檢測實驗中,使用該技術進行數據集擴增。

2.3.2 最佳迭代次數優選

為驗證迭代次數對檢測結果的影響,設置更加合理的迭代次數,本研究采用Tensorboard(即tensorflow內置的一個可視化工具,可清晰展示深度神經網絡組織、結構及其訓練過程)對模型訓練進行監測,如圖6所示,橫坐標表示Faster R-CNN訓練的迭代次數,縱坐標表示損失值(loss),該模型的初始損失值為2.348 9,經過4 000次訓練后損失值開始收斂,經過20 000次訓練后損失值穩定在0.15。由此可見,在一定實驗條件下,設置過少的迭代次數會使損失值較大,降低檢測精度,而過多的迭代次數對損失值降低效果不顯著,且耗費大量訓練時間。綜上,對于電廠冷卻塔工作狀態的檢測,本研究最終確定的最優模型訓練迭代次數為20 000次。

圖6 訓練損失值變化Fig.6 Training loss value change

2.3.3 不同特征提取網絡精度對比

不同的特征提取網絡對模型的檢測效果也會不同,ResNet101網絡通過添加自身映射層,保證網絡在層數很深時仍可以得到有效訓練,從而防止了準確率下降的問題,VGG16使用較小的卷積核,在有相同感知野的條件下,增加了網絡深度,減少了權重參數的數量,在一定程度上提升了網絡的訓練效果,同時,網絡之深,參數之大,可以預期它具有很高的擬合能力。由圖7可見,VGG16網絡相較于ResNet101網絡,兩種狀態(powerstation_w為工作狀態,powerstation_nw為非工作狀態)下的AP值都有所增加,檢測的mAP(經計算,ResNet101 mAP為90.16%;VGG16 mAP為94.88%)提高了4.72%,圖8展示了部分檢測結果圖。場景一,非工作狀態下的冷卻塔檢測召回率相等,但工作狀態下,VGG16網絡對于冷卻塔檢測的召回率要高于ResNet101網絡;場景二,兩種狀態下,VGG16網絡對于冷卻塔檢測的召回率都高于ResNet101網絡,因此,VGG16網絡對冷卻塔及其排氣特征提取效果更好。

(a)ResNet101 (b)VGG16

(a)場景一,ResNet101 (b)場景一,VGG16

2.3.4 不同算法性能對比分析

圖9為3種不同算法檢測結果圖,SSD算法工作狀態下的冷卻塔漏檢1個,誤檢1個;YOLOv3算法非工作狀態下的冷卻塔誤檢1個;Faster R-CNN算法全部檢測正確。因此,采用Faster R-CNN算法對發電廠冷卻塔進行工作狀態判定。為保證實驗結果的準確性,本實驗采用的3種不同算法分別在相同硬件條件和數據集上進行實驗,測試結果如表2所示。根據前面實驗結論,Faster R-CNN采用VGG16作為特征提取網絡。SSD與YOLO都屬于單階段(One-stage)檢測算法,其主要思路是采用不同比例與長寬比在圖像上均勻密集抽樣,然后再通過CNN直接進行分類與回歸,整個過程只需要一步,而R-CNN系列算法則是通過CNN網絡產生一系列候選框,然后對候選框進行回歸,所以準確度較高。從表中實驗結果也可以看出,Faster R-CNN的精確度比SSD和YOLOv3分別提高14.24%和1.09%。

(a)SSD (b)YOLOv3 (c)FasterR-CNN

表2 3種不同算法對比分析Tab.2 Comparative analysis of three different algorithms (%)

2.3.5 多區域驗證

本文選取國內8家大型火力發電廠進行區域驗證,共包含52個冷卻塔,其中處于工作狀態下的冷卻塔31個,非工作狀態下的冷卻塔21個。特征提取網絡采用VGG16,其檢測結果如圖10所示,藍色和黃色的方框表示檢測到的冷卻塔目標。在8家發電廠中,冷卻塔目標被準確檢測,并有效判別其所處的工作狀態。綜上所述,本研究提出的檢測方法對于火力發電廠冷卻塔檢測及其工作狀態判定有效可行。

(a)河北省邢臺電廠 (b)河南省沁北電廠 (c)山東省德州電廠 (d)山西省鄒城電廠

3 結論

隨著“智能電網戰略”的提出,以火力發電廠為主要發電設備的檢測研究尤為重要,而目前相關研究較少,且缺乏對電廠工作狀態的自動判定方法。因此,本文提出通過檢測冷卻塔來間接識別發電廠,根據冷卻塔在工作狀態下的排氣特征,提出了一種基于深度學習網絡的火電廠冷卻塔工作狀態判定方法。實驗結果表明:該模型在目標工作狀態檢測中,mAP為94.88%,選取8家發電廠驗證均取得理想效果。因此,本研究證明Faster R-CNN方法可以有效地應用于城市重要地物目標的工作狀態檢測,并拓寬了深度學習的應用和研究方向。該方法也可遷移至城市內具有排氣現象的其他大型工業地物目標檢測中,同時獲取工業活動的工作狀態,研究成果可有效服務于城建部門對周邊環境的監管,具有較大的應用潛力。今后將繼續深入開展相關研究,結合遙感大數據與深度學習網絡的新技術,進一步提升目標檢測精度,為相關部門決策提供技術支撐。

猜你喜歡
冷卻塔電廠卷積
冷卻塔若干設計問題總結
基于3D-Winograd的快速卷積算法設計及FPGA實現
從濾波器理解卷積
世界上最大海上風電廠開放
智慧電廠來襲
智慧電廠來襲,你準備好了嗎?
用Citect構造電廠輔網
基于傅里葉域卷積表示的目標跟蹤算法
空氣冷卻塔除沫器改造與管理
西門子S7-200PLC在火電廠冷卻塔風機控制中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合