?

基于圖像處理技術的智能化人體行為識別模型研究

2022-11-09 08:23冉憲宇
微型電腦應用 2022年10期
關鍵詞:差分圖像處理聚類

冉憲宇

(陜西國防工業職業技術學院, 計算機與軟件學院, 陜西, 西安 710300)

0 引言

隨著科技水平以及信息化技術的發展,人體行為識別在諸多領域擁有廣泛的應用前景。其中圖像視頻是重要的信息載體,如何實現識別智能化是解放生產力、提升工作效率的關鍵。通過圖像處理技術提取有效信息,采用精密的算法準確識別出人體各類行為無論是對科技發展還是對民生的便利性都具備很大的現實意義,因此本文從運動目標檢測、特征提取、行為識別幾個方面逐層推進、深入研究。

1 圖像處理技術

1.1 技術簡介

數字圖像主要是利用數值像素表示及存儲各類設備獲取的二維圖像信號,圖像處理技術主要是對數字圖像進行分析與轉換,最終實現各類目標計算。數字圖像在形式上主要包括由特定色彩模型組成的彩色圖像、采用數值矩陣表示的灰度圖像、特殊的只有0和1取值的二值圖像等[1]。

1.2 降噪處理

實際生活中,由于成像設備得到的原始圖像受各類因素影響會存在噪聲,影響圖像質量,也影響特征提取,為了提升識別準確性,需要進行降噪處理。首先,分析噪聲的來源,主要包括受傳感器等設備影響、由于環境因素干擾以及傳輸過程信道干擾產生的噪聲幾大類;其次,利用濾波器進行過濾,常用辦法包括中值濾波法、均值濾波法、高斯低通濾波、小波濾波等。

1.3 圖像增強

由于設備或環境影響導致最終效果不佳,通過圖像增強可以進行改善,將關鍵部分突出,其余部分弱化或剔除。目前比較常用的方法包括:將灰度值重新分配的直方圖均衡化法、利用隸屬度函數實現變換的模糊增強法等。

1.4 形態學處理

形態學主要用于描述圖像的區域形狀,達到提升處理性能的效果。因為數字圖像的形態學處理是在集合論的邏輯運算基礎之上的,所以在圖像的分割以及后處理時經常使用形態學處理的相關技術。主要包括將原始圖像通過結構運算變長或者變粗的膨脹運算、縮小或細化的腐蝕運算以及梯度運算等。

2 運動目標檢測

在圖像序列中識別行為的過程中,最核心也是最基礎的是先定位到運動目標,之后才能進一步分析其行為,因此本節首先對運動目標的檢測進行分析與研究。

2.1 檢測步驟

在人體行為識別過程中對于運動目標的檢測屬于核心環節,將運動目標提取出來作為后續識別分析的基礎。檢測方法大體分為兩類:一類是通過輪廓檢測,一類是通過速度及加速度的變化以及不同幀之間背景差異檢測。輪廓特征容易變化,不利于實時檢測。因此本文采用第二類速度檢測法,檢測步驟主要包括圖像預處理、提取顏色紋理等特征、運算轉換、聚類分析。

2.2 背景提取模型

讀取N幀圖像處理為灰度圖像序列fi(i=1,2,3,…,N),將坐標像素值作為高斯分布均值ui,l(x,y),初始化處理之后建立混合高斯背景模型

(1)

2.3 改進的幀間差分算法

幀間差分法的核心思想是利用不同時段的圖像進行差分,最終得到差分圖像,利用相鄰時刻之間像素的差異變化檢測運動目標,剔除未改變的像素之后根據閾值進行判斷。根據差分方式的不同主要包括兩幀、三幀、加權累積等。由于兩幀差分法對加速、減速明顯的目標容易出現重影,三幀差分法雖然可以克服這一缺點,但在目標存在空洞時也容易產生誤判,為了提高判斷準確度,本文基于三幀法構建一種改進幀差法,步驟如下。

(1) 選定四幀連續的圖像fk(x,y),fk+1(x,y),fk+2(x,y),fk+3(x,y)進行去噪增強預處理后得到dk(x,y),dk+1(x,y),dk+2(x,y),dk+3(x,y)。

(2) 將一與三、二與四進行隔幀差分計算,得到二值化圖像

(2)

(3)

(4)

(5)

其中,g1k、g12k為差分后圖像,i×j為每幀圖像大小,M為預設閾值,λ為抑制系數取為2,Δm1、Δm2為動態閾值。

(3) 對二值化圖像進行目標顏色標記。

(4) 對上一步驟進行邏輯與運算

M(x,y)=g1(x,y)g2(x,y)

(6)

2.4 構建運動目標檢測模型

基于上文模型及算法,融合背景提取模型與改進幀差法實現目標檢測,首先分別采用2種算法獲取圖像,然后進行與運算,利用形態學處理消除少量空洞之后得到運動目標。構建過程如圖1所示。

圖1 運動目標檢測模型構建流程

3 圖像特征提取

判斷出運動目標之后,針對圖像的特征提取也至關重要,簡而言之,人體行為識別過程就是特征聚類分析的過程。因此本節著重研究提取算法。

3.1 選取原則

物體的特征屬于區別與其他物體的標志性特點,在圖像處理過程中,亮度、尺寸、角度變化等都是其影響因素。選取特征時應注意:

(1) 選用的特征互相之間要具有獨立性,避免冗余導致計算復雜;

(2) 特征之間差異越大越好,如此才更利于識別;

(3) 特征維度不應過大,避免算法復雜度增加。

3.2 特征指標

根據特征選取原則,圖像特征指標選擇如下。

(1) 顏色:顏色特征具備良好的穩定性,不隨目標大小或方向改變,清晰、直觀。描述方式包括直方圖、聚合向量、相關圖等[3]。

(2) 紋理:表面特征,屬于灰度等級變化的表征方法,提取方面包括統計法、結構法、信號類法等。

(3) 形狀:本質特征,通常包括輪廓與區域兩種,可分解為點、線、面。

(4) Sift:Sift特征用于描述局部特點,具有良好的適應性,不受亮度、尺寸、旋轉等影響,可理解為尋求包括位置、尺度、方向的特征點。

3.3 改進k-均值聚類算法

k-均值算法是應用較多的聚類算法,核心思想是不斷更新聚類中心進行迭代收斂。算法將含有n個對象的數據集X劃分為k個簇Cj,利用聚類準則函數判斷是否終止。但該算法易陷入局部最優解且過于依賴初始值且初始值比較隨機。因此本文提出優化改進:

(1) 針對局部最優問題引入遺傳算法來解決;

(2) 針對初始值隨機問題采用類內以及類間距離方法。

整體算法流程如圖2所示。

圖2 改進k-均值聚類流程

int(Xi,Xj)=2*d(Xi,mj)-D(mi,mj)

(7)

接下來根據公式

ave≤σ*int(Xi,Xj),σ∈[1.5,2.5]

(8)

判斷是否成立,如果滿足式(8)說明屬于同一聚類,不滿足式(8)則不屬于同一聚類,由此獲得最佳聚類數Kopt,以其作為聚類中心進行遺傳編碼。

4 行為識別建模

基于上文的目標檢測與特征提取,以獲取識別所屬的各類初始數據,重點構建針對這些初始數據的識別模型構建。

4.1 改進的HSMM模型

隱馬爾科夫模型(HMM)基于馬爾科夫假設、狀態與時間無關的不動性假設以及輸出只和當前狀態有關的獨立性假設,這些假設條件雖然簡化了復雜度,但在某種程度上漏掉了前一時刻的有用信息。因此本文對其進行改進,以HMM模型為基礎,增加時間組成成分,構建隱半馬爾科夫模型(HSMM),引入狀態停留的時間概率函數,將下一時刻的狀態與當前狀態及停留時間進行關聯。采用左右連續型HSMM模型,步驟如下。

(1) 設隱狀態數量N,數據集S=[S1,S2,…,SN],t時刻隱狀態

qt∈[S1,S2,…,SN]

(2) 設狀態對應的觀測值總量M,數據集V=[v1,v2,…,vN],t時刻觀測ot∈[v1,v2,…,vM]。

(5) 設觀測概率矩陣B={bj(k)}N×M,其中bj(k)=p(ot=vk,qt=Sj),1≤j≤N,1≤k≤M。

(6) 設狀態停留時間概率D,取結合t-1時刻狀態i的概率與t時刻轉移到狀態j的概率,記作高斯分布p(j,d)=n(d|uj,σj)。

(7) 得到HSMM模型

λ=(N,M,π,A,B,D)

(9)

4.2 基于HSMM模型識別人體行為

在人體行為識別過程中應用HSMM模型進行處理的流程如圖3所示。

圖3 HSMM模型識別流程

(1) 利用前向—后向算法,輸入觀察序列O和模型λ,求解輸出概率P(O|λ)的大小。

(2) 利用Viterbi算法,輸入觀察序列和模型,求解最佳隱狀態序列Q。

(3) 利用BW算法實現參數估計,求解使P(O|λ|)最大的模型[5]。

5 實證結果分析

為驗證本文構建的模型的準確性,從KTH人體行為數據庫中選擇了6種不同運動形態的行為視頻,每種姿態選取10條記錄,以此作為訓練樣本集獲得HSMM模型,迭代次數設置為1 000,取另外一組各10條視頻作為測試樣本集,進行10次測試后以算術平均值進行統計作為識別率,識別結果如表1所示。

表1 利用HSMM模型識別人體行為結果表

由此可以得出,平均識別率達到97.5%,具有良好的識別效果。

6 總結

本文引入圖像處理技術,通過改進的幀差分算法實現運動目標檢測,通過改進的k-均值算法進行聚類分析提取特征,通過改進的HMM模型實現人體行為識別,實測準確率較高。但場景相對簡單,選取的驗證行為也較少,并且在算法的抗干擾性、計算速度等方面還需要進一步研究與探索。

猜你喜歡
差分圖像處理聚類
RLW-KdV方程的緊致有限差分格式
一種傅里葉域海量數據高速譜聚類方法
符合差分隱私的流數據統計直方圖發布
海戰場偵察圖像處理技術圖譜及應用展望
人工智能輔助冠狀動脈CTA圖像處理和診斷的研究進展
基于ARM嵌入式的關于圖像處理的交通信號燈識別
基于圖像處理的廢有色金屬自動分選算法研究
面向WSN的聚類頭選舉與維護協議的研究綜述
改進K均值聚類算法
基于Spark平臺的K-means聚類算法改進及并行化實現
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合