?

基于改進YOLOv5模型的智能立體車庫結構裂縫識別算法研究

2024-04-09 15:05趙怡豪劉勇岳仁峰孔令鑫
信息系統工程 2024年3期
關鍵詞:目標識別深度學習

趙怡豪?劉勇?岳仁峰?孔令鑫

摘要:針對立體車庫中明暗變化顯著、目標尺寸差異大等現象導致的裂縫識別準確度不高的問題,提出了一種基于改進YOLOv5網絡的識別算法模型。該模型通過優化特征提取層和增加注意力機制,提高了對不同尺寸目標的識別能力,通過改進的特征融合層結構和檢測層輸出框尺寸,提升了識別精度。在立體車庫結構裂縫數據集上的試驗驗證表明,該網絡收斂速度快,在目標識別率和圖像識別準確率方面都有所提升,識別精度高達95.4%,實現了立體車庫結構裂縫的精準檢測和定位,為高速、高精度的結構裂縫檢測提供了理論基礎,具有工程應用價值。

關鍵詞:裂縫檢測;YOLOv5;深度學習;目標識別

一、前言

裂縫作為結構損傷的表觀呈現,既是耐久性不足的預警,也是結構被破壞的先兆。在立體車庫中,結構裂縫反映了立體車庫地基等支撐結構的受力狀態、耐久性及安全性。在現場檢測時,裂縫的檢測需要人為判斷,存在很大的主觀因素,加之復雜惡劣的檢測環境,導致裂縫檢測存在效率低、測不準、檢不全等缺點,無法滿足立體車庫裂縫檢測高精度的需求。因此,急需研究高效、高精度的結構裂縫自動化檢測技術。

近年來,隨著計算機技術的飛速發展,使得開發性能令人滿意的網絡模型成為可能。根據應用目的的不同,結構裂縫自動檢測技術大致可分為兩類:一是圖像像素級裂縫檢測,在分析結構表面紋理狀況的基礎上,分析裂縫分布等特征,為結構健康狀況評估提供精確參數。二是塊級路面裂縫檢測,類似于給定圖像中的目標檢測,如Faster R-CNN[1]和YOLO系列[2]等方法,識別速度較快,能夠滿足實時檢測要求,得到廣泛的應用。此外,通過深度學習實現結構表面裂縫識別的方法,具有更好的遷移性和魯棒性,結果更加客觀、可靠,在減少了人工成本的同時,大大提高檢測效率,具有廣闊的應用前景。

在現階段的研究中,徐國整等[3]提出HU-RseNet卷積神經網絡模型識別混凝土表面裂縫。李良福[4]基于改進PSPNet,實現像素級的裂縫區域識別。顧書豪等[5]設計了一種將注意力機制和語義增強相結合的特征模塊,有效地融合了語義信息和裂縫特征??梢园l現,現有的深度學習檢測算法雖然解決了傳統算法識別精度低、漏檢率高的問題,在識別精度上有所提升,但仍然存在對暗環境下,小目標識別困難的問題。

YOLOv5[6]采用了更輕量的網絡結構,在靈活性上遠強于YOLOv4,在模型的快速部署上具有極強優勢。YOLOv5包括四個版本,分別為YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x,在結構上復雜度依次提升,可以根據識別目標的復雜度選擇不同版本。檢測目標為裂縫,其目標結構簡單,背景單一,因此選擇在網絡結構相對簡單的YOLOv5s進行改進。針對立體車庫結構裂縫圖像中明暗變化明顯、目標尺寸差異大等問題,增加了YOLOv5網絡注意力機制,改變了特征融合層結構,并利用訓練好的模型,進行了對比分析。結果表明此方法具有較高的魯棒性,對不同環境、不同形狀的裂縫均能較好識別,在確保高檢測精度的基礎上兼顧檢測速度。

二、基于改進YOLOv5的多尺度檢測算法

立體車庫背景復雜,結構性裂縫往往存在光暗變化明顯、裂縫尺寸差異大的問題,原YOLOv5模型無法滿足該背景下的裂縫檢測需求,存在框取不全、重復識別、誤檢、漏檢等情況。針對原YOLOv5模型存在的不足,提出了改進的YOLOv5網絡模型,通過引入注意力機制模塊,提高網絡的細節特征提取能力,減弱光暗變化對目標檢測的影響。根據立體車庫結構裂縫大小不一的特點,改進了特征融合層結構,增加了多尺度檢測層的檢測尺度,使模型能夠準確地檢測不同大小的裂縫目標,增加了算法的健壯性。網絡的主體結構包含特征提取層、特征融合層、多尺度檢測層,如圖1所示。

(一)特征提取層

在兼顧網絡檢測速度的前提下,針對立體車庫環境復雜、采集的圖像清晰度低的問題,改進了YOLOv5網絡的特征提取層,在Bottleneck CSP模塊中引入了注意力機制,提出CBAM_ Bottleneck CSP模塊,通過對通道信息的充分利用,增強網絡的特征提取能力。CBAM_Bottleneck CSP由CBAM_ Bottleneck和CSP兩部分組成,其結構如圖2所示。

CBAM_Bottleneck基于殘差結構特征提取模塊,能夠充分利用特征映射的信息冗余特點,提高特征提取能力。CSP是一種基于殘差結構的局部、全局特征融合模塊,可以增加卷積層特征提取的效率,減少計算量,提高模型的學習能力。

(二)特征融合層

特征融合層作為網絡的路徑聚合模塊,負責將特征提取層輸出的特征信息與上采樣的信息進行融合。YOLOv5使用FPN(Feature Pyramid Networks)與PAN(Perceptual Adversarial Network)相結合增強網絡特征提取能力,自上而下進行特征融合,在實現強語義特征傳遞的同時,準確保留空間信息,并傳遞到預測層,實現強定位特征傳遞,對像素進行適當定位以形成掩模,提高小目標檢測能力。

針對立體車庫裂縫目標尺寸差異大的問題,通過增加FPN特征金字塔結構,在PAN中增加上采樣操作,提高特征信息的融合量,并增加160×160融合層,最終為檢測層輸出160×160、80×80、40×40和20×20四個尺度的特征圖。具體結構如圖1中特征融合層所示。

(三)多尺度檢測層

采用多尺度檢測層對圖像特征進行預測,將輸出的四個尺度特征圖,用于檢測不同尺寸的物體,生成預測框并預測類別。網絡輸出4個預測框信息,包含預測框的位置信息和置信度,由于輸出的預測框存在較多的重復冗余,使用非極大值抑制NMS(Non-Maximum Suppression)算法[7],保留置信度最高的預測框位置信息,精確完成目標檢測。

三、實驗與分析

(一)數據采集及預處理

數據源自某立體車庫路面裂縫,共1000張圖片,每張圖片至少有一處裂縫,背景復雜、明暗變化且噪聲較大。實驗采用Mosaic數據增強方法對圖片進行增強,確保不同的圖片都能得到充分的訓練,使模型學習到更深層的特征信息,增強模型泛化能力。通過對圖像角度、對比度等屬性進行不同程度的調整將數據擴充到8000張,增加算法的魯棒性,提高檢測精度。采用labelimg工具對數據進行框選標注,最終整理出6400張標注的圖片作為訓練集、800張標注的圖片作為驗證集和800張標注的圖片作為測試集。

(二)實驗環境及參數設置

實驗環境搭建的計算機配置為:Intel(R) Core(TM) i5-7400 CPU @ 3.00GHz、NVIDIA GeForce GTX1050顯卡、3 GB內存,并配置使用 CUDA10.1版本和CUDNN7.6版本。深度學習框架平臺為Pytorch1.8.0版本。模型訓練時的超參數為:初始學習率0.001、動量0.98。模型輸入3通道的720×720像素圖像,受GPU顯存的限制batchsize設為6,優化器采用隨機梯度下降法SGD,總共設置迭代1000個epoch。損失函數采用交叉熵損失函數,評價指標為預測精度、召回率、mAP。

(三)實驗結果及分析

在對模型進行評估時,首先需選取適當的評價指標。選取召回率Recall、平均精度均值mAP和精確率Precision作為模型算法的評價指標,召回率能夠反映檢測器漏檢目標的問題,平均精度均值能夠反映識別網絡預測框精準度的情況,精確率能夠反映出網絡模型檢測器誤檢的情況。改進前后網絡各評價指標的對比見表1,改進后的網絡預測精度提高了8%,召回率提高了4%,mAP提高了1.87%。

在訓練過程中記錄觀察模型的損失函數曲線如圖3所示。原模型損失函數曲線見圖3(a),損失函數波動較大,下降緩慢,說明原網絡對簡單背景下小目標的特征提取能力較弱。改進后模型損失曲線見圖3(b),損失函數曲線下降較原模型更快,波動較少,在訓練到第500個epoch時損失值達到了0.01,預測邊框的平均精度均值mAP更高,收斂速度更快。

測試集中部分圖片的識別結果如圖4所示,其中方框為預測框,左上角的標簽代表這張圖片識別的種類和置信度。改進后的模型對于橫向裂縫、縱向裂縫、斜向裂縫以及光暗變化明顯處的裂縫都比原網絡識別得更精準,具有更好的魯棒性。

四、結論

針對立體車庫結構裂縫檢測,提出了一種改進的 YOLOv5 網絡模型,主要的改進有利用CBAM_Bottleneck模塊改進了骨干網絡,增強模型特征提取能力,以及針對裂縫大小差異大的問題,改進了特征融合層結構,增加了多尺度檢測層的檢測尺度,選擇20×20、40×40、80×80、160×160尺度檢測層,增加了網絡對不同尺寸目標框取的精度。實驗結果表明,改進后的YOLOv5模型在召回率、平均精度、檢測精確度上均得到了不同程度的提升。

參考文獻

[1]Shaoqing Ren, Kaiming He, Girshick Ross, et al. Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(6): 1137-1149.

[2]Joseph Redmon, Ali Farhadi. YOLO9000: Better, Faster, Stronger[C]. 30TH IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR 2017), 2017: 6517-6525.

[3]徐國整,廖晨聰,陳錦劍,等.基于HU-Res Net的混凝土表觀裂縫信息提取[J].計算機工程,2020,46(11):279-285.

[4]李良福,王楠,武彪,等.基于改進PSPNet的橋梁裂縫圖像分割算法[J].激光與光電子學進展,2021,58(22):101-109.

[5]顧書豪,李小霞,王學淵,等.增強語義信息與多通道特征融合的裂縫檢測[J].計算機工程與應用,2021,57(10):204-210.

[6]Dihua Wu, Shuaichao Lv, Mei Jiang, et al. Using channel pruning-based YOLO v4 deep learning algorithm for the real-time and accurate detection of apple flowers in natural environments[J]. Computers & Electronics in Agriculture, 2020, 178: 105742.

[7]Han H, Gu J, Zheng Z, et al. Relation Networks for Object Detection[C]. 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition, IEEE, 2018: 3588-3597.

基金項目:濟南市科技計劃(后補助)項目社會民生專項(項目編號:202131009)

責任編輯:張津平、尚丹

猜你喜歡
目標識別深度學習
渡口水域安全監管技術研究
全自動模擬目標搜救系統的設計與實現
有體驗的學習才是有意義的學習
動態場景中的視覺目標識別方法分析
基于PC的視覺解決方案在 Delta機器人抓放中的應用
電子商務中基于深度學習的虛假交易識別研究
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
深度學習算法應用于巖石圖像處理的可行性研究
基于深度卷積網絡的人臉年齡分析算法與實現
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合