?

一種基于CBAM-RCNN 輔助校內人員軌跡預測以及外來人員風險等級評估的數學模型

2023-11-29 11:26長安大學信息與網絡管理處荀偉
數字技術與應用 2023年11期
關鍵詞:準確率卷積樣本

長安大學信息與網絡管理處 荀偉

近年來,大數據與人工智能技術的迅速發展,為安防監控系統的升級和改進提供了新的思路和可能性。本研究將探討基于CBAM[1]算法搭建一個CBAM-RCNN模型:即C-R-M,借助人臉和人體識別技術的支持,智能安防監控系統具備實時報警功能,還能有效監測和管理非法入侵事件。模型可協助生成巡邏路徑,管理人員能夠實時監測巡邏人員的路徑,也可以事后檢索并還原巡邏人員的行程,提高了巡檢監管的效率和準確性[2,3]。

1 可行性分析

CBAM-RCNN 是一個基于深度學習的算法,需要使用大量的數據和計算資源進行訓練和推理,可以實現人員檢測、人員識別和軌跡跟蹤等多種功能。在人員檢測方面,CBAM-RCNN 可以識別圖像中的物體并標出其位置和類別,從而實現對視頻監控中物體的實時區分。應用CBAM 模塊可增強特征的表征效能和差異性,從而提升人員檢測的速度和精確性。

1.1 人員檢測

CBAM-RCNN 可以檢測圖像中的物體,并標出它們的位置和類別。在模型訓練過程中,模型會學習從圖像中提取特征,然后利用這些特征來生成邊界框和類別預測,基于這樣的特性,可以用CBAM-RCNN 實時區分視頻監控里的物體類型,是人還是物。

1.2 人員識別

由于CBAM-RCNN 不僅可以檢測物體,還可以將物體分為不同的類別。在訓練過程中,模型會學習從圖像中提取特征,在輸入基礎數據集后(即包含全校教職工以及學生的頭像信息),就可以利用模型區分人員是教職工、學生還是臨時人員,進而可進行校內人員風險等級分類和預測[4]。使用CBAM 模塊可以提高特征的表征能力和可區分性,從而提高分類的準確性。

1.3 軌跡跟蹤

結合CBAM-RCNN 分類的準確性以及快速處理的特性,本研究創新地將CBAM-RCNN 用于物體跟蹤。通過在連續的幀之間跟蹤物體的運動,CBAM-RCNN可以生成準確的人員軌跡圖。在校園監控和安全管理等方面具有較強的可行性以及廣泛的應用前景。

2 數據預處理

如圖1 所示是本研究數據預處理步驟,由此可提高視頻和圖片數據質量。

通過圖1 中的數據預處理,可以使視頻和圖片數據更好地適應后續數據處理的需求,進而提高目標檢測模型的性能和精度,最終獲得更好的預測與分類結果。

3 數據處理

3.1 模型搭建

3.1.1 CBAM

(1)CBAM 是由Woo 于2018 年提出的一種多重關注機制,能夠同時聚焦通道和空間,從而實現更卓越的性能表現。(2)通道注意力機制:對輸出的特征依次進行求和操作,通過應用Sigmoid 函數進行激活,得到通道注意力特征的權重。接下來,將這些特征權重與輸入的特征進行逐元素相乘操作,從而生成空間注意力模塊所需的特征。(3)空間注意力機制:對輸入的特征圖進行基于通道的全局最大池化和全局平均池化運算,然后將獲得的特征圖進行通道級別的合并。這樣的設計有助于模型更好地關注重要的空間區域,從而提高模型性能。

3.1.2 殘差網絡

經過第一層線性變換和激活函數后的輸出為F(x),第二層是在這個輸出和輸入x之間進行的。在進行第二層的線性變換和激活函數之前,將輸入x添加到了路徑中,創建了一個shortcut。最終的輸出是在應用激活函數后獲得的σ(F(x)+x)。

3.1.3 卷積神經網絡

將圖片或信號作為初始輸入傳遞給卷積神經網絡。網絡使用卷積核對輸入數據進行掃描和卷積運算,以計算數據的權重和偏差。接下來,通過激活函數引入非線性變換,以擬合相關的映射關系,從而建立故障數據與故障狀態之間的連接,如式(1)所示:

式(1)中:xl+1為當前層的輸出,xl為當前層的輸入,kl為卷積核,bl為偏置,f(*)為激活函數。

在本研究中,選擇用如式(2)所示的ReLU 函數:

ReLU 函數在輸入值小于0 時梯度為0,這可以避免出現函數值過小導致梯度消失的問題,從而加快訓練過程。在卷積層中,輸出數據會進行批量歸一化(即BN,Batch Normalization)。本研究中使用的BN 公式如式(3)、式(4)所示:

式(3)中:μB為數據的均值,σB2為方差,為歸一化后的值;式(4)中:γ,β為BN重構參數。

經過多次卷積和批量歸一化處理后,特征數據將被全局平均池化,再將池化層的輸出通過Softmax 分類器進行分類,最終輸出結果。

3.1.4 CBAM-RCNN 模型結構

本研究提出了一種基于CBAM-RCNN 算法的模型,該模型主要由卷積網絡、CBAM 和殘差塊組成。CBAM和殘差塊被融合進卷積網絡中,以實現最佳的故障診斷效果,如式(5)所示:

式(5)中:xl+1為當前輸出,xl為上層輸出、當前輸入,kl為核,bl為偏置,f(*)為激活函數,BN 為函數BatchNorm。

3.1.5 CBAM-RCNN 模型訓練與驗證

為評估CBAM-RCNN 模型的特征提取和分類預測性能,我們采用了交叉熵損失函數作為評價指標,度量實際值與模型輸出值之間的誤差。鑒于視頻幀或圖像中人體部位像素分布不均,為更準確評估模型分類預測,我們采用分層k 折交叉驗證方法驗證模型。

將所有樣本隨機分成k 個相等子樣本集,同時保持各類別比例。然后,使用k-1 個子樣本集進行模型訓練,剩余1 個子樣本集用于驗證。這有效評估模型在不同數據子集上的性能,全面了解其表現。我們重復這個過程k 次,每次選擇不同的子樣本集作為驗證集,然后將k 次得到的結果取平均值作為最終的驗證結果。

3.2 代碼實現

用CBAM-RCNN 算法實現檢測、識別和追蹤需要實現以下幾個步驟:(1)數據預處理:根據已經準備好的人員頭像數據集,使用OpenCV 庫中的函數對圖片進行裁剪、縮放和歸一化操作。使用cv2.resize()函數將圖片調整到指定大小,再使用cv2.cvtColor()函數將圖片轉換為灰度圖像。(2)模型構建:使用CBAM-RCNN 算法構建目標檢測模型,本研究中用PyTorch、TensorFlow等深度學習框架搭建CBAM-RCNN 模型。(3)模型訓練:使用準備好的頭像數據集,通過反向傳播算法對模型進行訓練和優化,以提高模型的準確率和魯棒性。(4)模型測試:使用測試數據集對模型進行測試,評估模型的準確率和性能。(5)應用部署:將訓練好的模型部署到監控系統中,實現人員檢測、人員識別和軌跡跟蹤功能。

4 實驗驗證與結果分析

4.1 模型參數

為了構建模型,本研究選擇了基于Python 語言的Pytorch 框架。計算機使用的是Windows 10 操作系統,硬件配置為8GB 內存。優化算法選擇了Adam,并采用了學習率的一種衰減策略:OneCycleLR,當中,學習率最大值設置為:0.001。模型的具體參數設置如表1、表2 所示。

表1 模型訓練參數設置Tab.1 Model training parameter settings

表2 模型網絡參數設置Tab.2 Model network parameter settings

4.2 處理結果與對比分析

為了保證本研究的可靠性,采用分層4 折交叉驗證策略。隨機選擇所有樣本的3/4(共75 個樣本)作為訓練集,并使用剩余1/4 的樣本(共25 個)作為驗證樣本,將整個過程重復進行4 次,并將4 次驗證結果的均值作為模型最終預測的準確率,每折訓練200 次。

為驗證本文所構建的模型在軌跡預測與風險等級分析方面的性能,我們創建了卷積神經網絡(CNN)和基于CBAM 的卷積網絡,其參數設置與該模型相同。具體而言,我們將CNN 網絡的層數設置為4 層,卷積核數分別設置為8、16、32、64。CBAM-CNN 模型的卷積層有5 層,相對于以上CBAM-RCNN 模型,只缺失了殘差塊的部分。我們使用相同的樣本進行訓練,包括41個正常樣本、23 個人體數目較少的樣本和49 個人體數目較多的樣本。此外,我們還使用相同的驗證方法對這些模型進行驗證,如表3 所示。

表3 模型驗證結果對比Tab.3 Comparison of model verification results

針對每個狀態的樣本,CBAM-RCNN 模型的準確率比CNN 模型更高。與CBAM-CNN 模型相比,CBAMRCNN 模型在正常、人數較少和人數較多的樣本中表現更好。CBAM-RCNN 模型的總準確率為88.33%,CBAMRCNN 模型表現出了比CNN 和CBAM-CNN 模型更高的準確率,分別超過了它們22%和15%。這些驗證結果充分驗證了CBAM-RCNN 模型的有效性。

5 結論

為了改進卷積網絡的性能,本文引入了CBAM 和殘差塊,構建了CBAM-RCNN 模型,將其應用于智慧安防領域,并對其進行了測試對比。以下是本文的研究工作和結論:(1)數據預處理階段,通過對基礎視頻和圖片數據進行圖片增強,包括縮放、標準化和去噪等操作,將處理后的數據作為模型的輸入。這種預處理方法能夠有效提高視頻和圖像中人體人臉特征的有效性,并增強模型的魯棒性。(2)在CBAM-RCNN 模型中,引入了多注意力機制,使用CBAM 來優化網絡參數設置,實現任務關鍵信息聚焦。同時,采用殘差塊以防止模型梯度爆炸和梯度消失問題,從而提升網絡訓練的穩定性。根據實驗驗證結果,相對于單獨使用CNN 模型或CBAM-CNN模型,CBAM-RCNN 模型的準確率有明顯提高。(3)為了避免模型的過擬合,本文采用全局平均池化層替代卷積神經網絡中的全連接層,這一策略有效減輕了模型的過擬合問題,同時減少了模型的參數數量,提高了模型的運行速度。

綜上所述,CBAM-RCNN 模型由于能有效提升監控中人體識別的性能、具有較高的準確率和穩定性且能避免過擬合的問題,所以在輔助實現校內人員軌跡預測和外來人員風險等級評估方面有顯著效果,進而為實現校內智慧安防提供了一種新的思路。通過實時對校內人員的軌跡和外來人員的行為進行分析和評估,提高了安防監控系統的準確性和實時性,為當前安防監控系統的升級和改進提供了參考。

猜你喜歡
準確率卷積樣本
基于3D-Winograd的快速卷積算法設計及FPGA實現
乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
2015—2017 年寧夏各天氣預報參考產品質量檢驗分析
用樣本估計總體復習點撥
從濾波器理解卷積
推動醫改的“直銷樣本”
高速公路車牌識別標識站準確率驗證法
基于傅里葉域卷積表示的目標跟蹤算法
隨機微分方程的樣本Lyapunov二次型估計
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合