李顏瑞
(山西機電職業技術學院信息工程系 山西 長治 046011)
隨著信息技術的發展和互聯網的廣泛應用,利用人的生物特征作為識別依據,在信息安全領域已經成為一個非常重要的研究課題。目前已經研究的生物識別有指紋[1]、虹膜[2]、掌紋[3]、人臉[4]和眉毛[5]等識別技術。主成分分析方法即PCA已經用在了眉毛識別研究當中,與獨立分量分析方法即ICA相比較發現,二者有很多相似的地方。但是獨立分量分析方法更具優越性。因為獨立分量分析方法不僅考慮了圖像或者音頻信息的二階統計信息,而且也考慮了圖像或者音頻信息的高階統計信息,生成的特征信息具有獨立性。所以,ICA方法同時考慮了二階和高階信息,并且特征相互獨立,這樣提取特征比用PCA提取特征更有利于進行識別。所以,本文使用獨立分量分析方法即ICA方法進行眉毛識別的研究。
ICA也稱為獨立分量分析方法[6],是一種基于統計信息的特征提取方法,發源于盲源分離技術,屬于線性變換的一種,它是將音頻或者圖像等信息,通過自己設置的特定函數,生成相應獨立分量并且由這些獨立分量組成線性組合,這樣更有利于提取特征并且能夠保持更好的特征向量。
預處理是生物特征驗證和生物特征識別過程中的一個非常重要的步驟,對下面特征提取的好壞有直接的影響。因此,為了提高眉毛的識別率,減小眉毛圖像的尺寸等外在因素的影響,應該在特征提取之前進行眉毛圖像的預處理。本文決定采用李玉鑑教授提供的原始眉毛庫,作為本文的原始眉毛庫(圖1),并且采用左眉毛作為研究對象,同時圈取出眉毛部分并進行保存(圖2)。利用公式
進行灰度化處理(圖3),用零階插值算法對圖像進行歸一化處理,大小為40*200(圖4)。
圖1
圖2
圖3
圖4
用于特征提取的圖像必須是經過預處理后的圖像,否則將會很大程度上影響特征提取的結果,所以必須在預處理的基礎上再進行特征提取。
近鄰法[8]則是一種根據樣本提供的信息,繞開概率的估計而直接決策的技術,所以它也屬于非參數判別方法的一種。在特征提取的基礎上,研究采用K-近鄰方法進行識別。
(1)將訓練集眉毛圖像的特征向量,都存儲起來共同構成訓練集眉毛圖像的特征庫。
(2)計算訓練集眉毛圖像特征庫中特征間的最大歐式距離的一半,即眉毛間的最大許可距離記:dmax。
(3)計算測試眉毛特征與訓練集中的眉毛特征之間的距離,記為為眉毛庫中特征個數。
實驗是建立在50人的眉毛庫上,每人提供6張眉毛組成眉毛庫,則眉毛庫共有300張眉毛圖片。實驗中,每人選取三張作為訓練眉毛,剩下三張作為測試眉毛,則訓練眉毛有150張,測試眉毛有150張。共進行了三次實驗,實驗結果如下。
見表1所示。
表1 不同的訓練庫
見表2所示。
表2 近鄰與k近鄰
本次研究采用基于ICA的眉毛識別方法在50人的眉毛庫上取得了較好的識別效果,再一次證明了使用眉毛這一生物特征用于識別是完全可行的。但是本次研究仍有一些不足之處和需要加強改進的地方。例如預處理階段仍然采用人工的方式進行提取眉毛區域,沒能實現自動化,在眉毛識別的研究推廣應用上,就存在一定的障礙和阻力;眉毛庫的數量還是比較有限,而目前僅僅是在實驗室中完成的,如果是在現實應用中,估計還有其他問題出現;所以今后的研究重點應該是眉毛區域的自動提取方法和建立大規模且合格的眉毛數據庫。