?

基于圖像處理的對勾識別算法研究

2022-09-07 04:05李雪梅車愛靜
信息記錄材料 2022年7期
關鍵詞:角點感興趣灰度

李雪梅,車愛靜

(衡水學院電子信息工程學院 河北 衡水 053000)

0 引言

近年來人才的競爭愈加激烈,為了更好地了解每個員工的工作情況,會定期對工作人員進行考核,考核的標準一般為德、能、勤、績、廉5個方面。傳統的方式先將考核表分發給員工,大家根據標準在對應表格位置處打對勾,再統一收集起來,有專人進行統計,最后得出大家總的得分情況,這種方式費時費力,還容易出現統計錯誤,因此提出來一種基于圖像處理的對勾識別算法,只需將收集好的考核表掃描為圖像,即可通過對圖像識別對考核表中的對勾位置進行識別,從而統計出得分,節約了時間和人力、物力。

1 圖像預處理

首先對收集好的考核表進行掃描處理,得到考核表的數字圖像,為了后續識別的準確性,需要對圖像進行預處理,包括圖像的灰度化、二值化、去噪、傾斜校正、圖像歸一化等。

1.1 灰度化

一般考核表為黑白圖像,只需進行二值化即可,如果考核表是彩色表格,則需先對其進行灰度化?;叶葓D像信息量較少,又要保留圖像有用的特征信息,由科學研究數據得知,人的眼睛對綠色最敏感,而對藍色最遲鈍,因此,對RGB的各個分量分別乘以不同權值,這樣使RGB不同分量的重要性能體現出來,處理后的灰度圖也更符合實際生活的需要,因此本文選用這種方法。加權平均值算法見式(1):

1.2 去噪處理

紙質考核表轉化為電子圖像和進行灰度化的過程中由于各種因素的影響會存在噪聲,為了后續更好地進行圖像的識別,需要對其進行去噪,提高清晰度。常用的濾波方法有:中值濾波、均值濾波和高斯濾波等方法。中值濾波是對一個窗口內的像素點的灰度值重新進行大小排序后,而噪聲點處的灰度值用重排后像素的中間值來代替。這樣可保存邊緣和細節,但由于考核表中有大量的表格線,會被誤認為噪聲,識別不出表格線,因此不適合中值濾波。高斯模糊處理方法的原理是用周圍像素的灰度平均值作為中間像素的值,結果會使得圖片中間的一些像素變得模糊。而考核表中有大量的表格線且相隔距離短,結果會造成表格模糊,不易識別表格的內容。雙邊濾波處理方法將一個高斯方差加在高斯模糊的處理中,可以在去噪的同時保存了邊緣的信息,表格線不受影響,既去除了噪聲,圖像也不會模糊。

1.3 二值化

為了進一步降低計算量,需要對圖像進行二值化。圖像二值化即設定閾值,將灰度圖像進行分類,將[0~255]的灰度級歸類為0或1。只要選取的閾值合適,轉換之后的圖像數據量減少,但并不會影響圖像局部和整體的特征。圖像二值化最重要的是閾值的選取,根據閾值選取方法的不同可劃分為固定閾值法與自適應閾值法。固定閾值法是自己對圖片進行實驗,確定一個固定的閾值,對于考核表這種灰度級比較簡單的圖像適合于用固定閾值法進行二值化,考核表版面結構明了清晰,灰度級差別明顯,灰度值相對固定,采用固定閾值(200,255)處理原圖像得到的二值化圖像效果比較好。二值化的圖像見圖1。

1.4 傾斜校正

用掃描儀掃描的考核表圖片有時是傾斜的,為了識別的效果好,要對其進行校正。而考核表中直線較多,比較適合用霍夫(Hough)變換來進行校正[1],本文利用Hough變換原理來檢測直線。然后利用得出的直線斜率k0計算圖像傾斜角θ=arctan(k0),然后根據求得的傾斜角對圖像進行修正,將圖像中心作為原點進行旋轉。旋轉矩陣R如式(2):

得到旋轉后的坐標如式(3):

1.5 圖像歸一化

由于圖像采集可能會受到很多因素的影響,造成采集到的圖像和原圖像的大小不同,影響識別的準確率,所以要進行圖像歸一化。圖像歸一化操作是指在不改變原圖像信息的情況,將圖像轉化成規格一致、相對位置不變的圖像。由于考核測評表本身是一張A4紙張的大小,所以將尺寸大小統一調整為A4紙張的大小,即可實現圖像歸一化。

2 感興趣區域定位

考核測評表的構成比較簡單,由3部分組成,即表的標題、主體和備注,主要識別的是主體部分[2]。從考核測評表的幾何結構和邏輯結構來看,它的版面規格大小統一,姓名區域和表格區域位置固定,而定位的任務分別在姓名區域和表格區域,識別的主體為表格區域,適合采用感興趣區域表格檢測法來進行表格的定位。所謂感興趣區域即是一幅圖片里需要檢測識別的區域,而考核測評表需要識別的部分就是姓名區域和打對勾的表格區域,基于交互式的感興趣區域簡單方便高效,但對要處理的圖片有要求,不能過于復雜,目標和背景簡單明確。而考核測評表的版面清晰簡單,對比明顯,正好適合用交互式的感興趣區域檢測方法[3]。

將二值化后的圖像的寬和高分別設置為width、high,圖像中需要定位的單元格起始點像素的坐標位置為(x,y)。整張考核測評表自需要定位的考核人員姓名開始一共有16行單元格,因此需要進行16次行檢測才可將考核表整頁的考核人員檢測出來。設置行計數器來記錄行檢測的次數,直到檢測16次結束。同樣地對于列的檢測也是如此,考核表自左側考核人員姓名開始一共有20列,以左側像素起始坐標x開始,沿著水平方向從左向右每隔一定的像素點作為一個感興趣區域,區域在x軸上的起始點,循環執行到圖像的最大寬度,如果x的值小于圖像的寬度,則繼續搜索,直到搜索到最大寬度為止。設置一個列計數器,一旦確定了一個感興趣區域,計數器則加一次并作為當前感興趣區域的標記符,計數器從1開始一直記錄到20(每行有20個單元格),一行搜索完畢后接著搜索下一行?;诮换ナ降母信d趣區域檢測方法根據預先設定的感興趣區域大小劃分出每一個單元格,并同時用計數器記錄當前感興趣區域作為單元格的位置標記。流程見圖2。

3 對勾檢測原理

檢測出考核測評表的每個感興趣區域以后,再對表格內的對勾進行識別,而需要識別的對勾都處在一個固定的單元格中,每一個單元格對應著不同考核標準的考核等級,所以只要確定了哪個位置的單元打有對勾,就能獲得考核情況。鑒于考核表的版面結構,對于對勾的檢測可應用以下兩種方法:一是根據像素統計法,二是角點檢測法。

像素統計法簡單易行,圖像經過二值化處理后只有0和1兩種灰度級,而沒有打對勾的表格里是1灰度級,而打有對勾的表格內在對勾部分是0灰度級,所以只需要檢測表格內灰度級為0的像素的多少即可,但是由于手寫打勾有時會超出表格到另一個格子里去,所以檢測的不是很準確。

而角點檢測是檢測表格內是否有角點。Harris角點檢測算法是一種簡單的、基于信號處理的,每個像素點周圍小窗口的二階導數圖像的自相關矩陣特征提取算子[4-5],比較適合檢測對勾,其檢測原理為圖像中的一個窗口沿著不同的運動方向在圖像不同區域中移動:(1)窗口在圖像中的平滑區域里移動時,窗口沿著任何一個方向一直運動下去,其運功軌跡并沒有改變,見圖3a。(2)窗口在圖像中的邊緣區域中移動時,窗口一直沿著邊緣的方向運動,其運動軌跡也不會發生變化,見圖3b。(3)窗口在圖像中的交點區域里移動時,窗口的運動軌跡向不同的方向延展發生改變,見圖3c。

通過觀察Harris角點檢測原理圖可以發現運動軌跡在圖像中不同區域里沿著各個方向發生了不同程度的變化,可根據這一特征確定圖像中某一點是否為角點,Harris角點檢測是通過平移圖像中的窗口,造成圖像中灰度發生變化,從而判斷出角點的位置。Harris角點檢測圖像局部灰度變化自相關函數為:

自相關函數E(m,n)代表窗口經過平移[m,n]后得到的圖像灰度變化結果,I代表圖像中不同像素點的灰度,w(x,y)代表圖像的窗口。不同點的灰度變化是不同的,灰度變化最明顯的是角點區域。

圖像中某一點的微小移動量[m,n]后灰度變化結果,可以進一步化簡表示成:

上式中矩陣Q是一個二階矩陣,類似于自相關函數E(m,n)的Hessian 矩陣可以通過對圖像的像素點求導得到:

對圖像中任意一像素點進行兩次求導,當存在一階導數并且是極大值,二階導數為零時,即矩陣Q存在兩個較大的特征值,此時認為圖像中灰度自相關函數E(m,n)在該點的曲率最大,說明此點是一個角點。一般情況下,沒打對勾的單元格內是不存在任何角點的,當有對勾時單元格內會有至少3個強角點存在,見圖4。輸出有角點表格的位置坐標,即可完成對勾位置的確定。

4 對勾識別實驗

采集100張考核測評表的圖像,經過預處理后,分別用像素統計法和角點檢測法進行對勾識別實驗,實驗結果見表1。

表1 考核表實驗測試

由實驗結果可以看出,用角點檢測法來識別表格中對勾的識別率高達98%,而像素統計法的識別率略低一些,因此采用角點檢測法來檢測表格中的對勾比較合適。

5 結語

傳統的人工統計考核測評表的結果費時費力,本文運用數字圖像處理技術將收集好的考核測評表用掃描儀轉換為數字圖像,先對其進行預處理,處理完成后確定圖像的感興趣區域,對感興趣區域進行定位,最后采用角點檢測法識別出對勾所在的位置,從而確定被考核人員的考核結果。經過試驗測試,此算法用于自動提取識別考核測評表的對勾具有可行性和實用性。

猜你喜歡
角點感興趣灰度
一種改進的自適應FAST 角點檢測算法
采用改進導重法的拓撲結構灰度單元過濾技術
多支撐區域模式化融合角點檢測算法仿真
對自己感興趣
基于點云聚類的垛型角點檢測方法
天津港智慧工作平臺灰度發布系統和流程設計
Bp-MRI灰度直方圖在鑒別移行帶前列腺癌與良性前列腺增生中的應用價值
Arduino小車巡線程序的灰度閾值優化方案
角點檢測技術綜述①
編讀往來
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合