?

一種基于形狀矩陣的傅里葉描述子

2012-08-10 07:48張瑜慧
電視技術 2012年23期
關鍵詞:查準率傅里葉質心

張瑜慧

(宿遷學院三系,江蘇 宿遷 223800)

責任編輯:魏雨博

圖像檢索是多媒體技術與數字圖像處理領域的一個研究熱點。描述圖像內容的視覺特征一般有顏色、紋理、形狀和空間關系等。形狀是人們對圖像理解的重要內容之一,現有的形狀描述算法一般分為基于目標輪廓的形狀描述子和基于區域的形狀描述子兩大類[1-2]。

一個好的形狀描述子應具備對平移、縮放和旋轉的不變性,同時應具有緊致性和計算的簡單性,當然還應具有較強的形狀區分能力[3]。利用傅里葉變換將圖像從空間域轉換到頻域,提取圖像形狀在頻域中的表示是一種有效的方法。但這類方法的檢索性能緊密依賴于目標邊界的提取結果,如果邊界提取不準確,將會導致最終的檢索準確率低,而且這種方法易受噪聲等外部干擾的影響。

一般數字圖像是通過正方形網格采樣得到的,圖像的坐標默認是笛卡爾直角坐標,且坐標原點在圖像的左上角。直接對其進行傅里葉變換,雖然也能得到頻譜描述,但是無法得到不變的形狀描述子,即若對圖像進行平移、縮放和旋轉變換,將會得到不同的特征描述。

1 坐標系轉換

給定一個二值圖像I={f(x,y);0≤x<M,0≤y<N},I的質心坐標(xc,yc)定義為

式中:A是圖像面積,定義為

極坐標表示法以質心(xc,yc)為中心,由像素離質心的距離r和θ=0°所夾角度來表示像素的坐標(r,θ)。由笛卡爾直角坐標系轉換為極坐標系的公式為

相比于直角坐標,極坐標表示圖像的優點是不受圖形平移和縮放的影響。

2 形狀矩陣

形狀矩陣是表示區域形狀信息的一個有效工具。具體操作為:以質心為圓心,以最大質心距離為半徑形成目標區域的最小外接圓。將圓半徑等距離劃分成M份,形成M個同心圓。之后將極軸從0°~360°逆時針旋轉,記錄極角為(K×360/N)°(K為0~N-1之間的整數)時極軸與同心圓交點處的像素信息。即使用極坐標光柵系統對圖像進行重新采樣,形成一個記錄圖像形狀信息的、大小為M×N的形狀矩陣。矩陣的行對應同心圓,列對應半徑[4]。利用形狀矩陣表示圖像,大大減少了參與后續計算的數據量。由于極坐標的極點位于區域質心,且是對最大質心距離進行等距離劃分,所以形狀矩陣滿足對圖像的平移和縮放不變性[5]。

文獻[5]提到,當圖像發生旋轉時,其對應形狀矩陣的行向量將發生相應的循環移位。但分析形狀矩陣的具體產生過程可以發現,若圖像旋轉某個角度,對其進行極坐標光柵系統采樣后得到的形狀矩陣也會發生變化,且這種變化并不是循環移位。圖1通過仿真驗證了本文的分析,其中圖1c是對圖1a順時針旋轉90°后得到的圖形,圖1b、圖1d分別是圖1a和圖1c的形狀矩陣。由圖1可以清楚地看到,這兩個矩陣的行向量之間并不存在循環移位關系。因此,文獻[5]對形狀矩陣進行相位修正,并不能保證描述子的旋轉不變性,同時在進行相位修正后還會引入誤差,這將直接導致檢索的準確率降低。

圖1 圖形及旋轉后圖形的形狀矩陣

3 二維離散傅里葉變換

圖像I={f(x,y);0≤x<M,0≤y<N}的二維DFT定義為

其幅度和相位分別為

式中:R(u,v)是復數F(u,v)的實部;I(u,v)是虛部。

由DFT變換的性質可知,圖像I平移后,幅度不發生變化,僅相位發生變化。因此一般情況下,可直接使用幅度信息描述形狀。

4 實驗結果和討論

用于評估形狀描述子性能的植物葉片圖像主要從野外采集而來。典型的葉片形狀如圖2所示,其中包括三葉草、牽?;?、楓葉等8種植物葉子。每類圖像采集30幅圖片,其中20幅是同類不同個體的圖像,另外10幅由從20幅圖像中隨機挑選的某幾幅進行旋轉、縮放、平移等幾何變換得到。再加上一些不同形狀的干擾葉片圖像(如圖2第2行所示),組成一個300幅圖像的小型形狀數據庫。其中,有些形狀類似,如圖1中第1行的形狀5與第2行形狀7相似,第1行形狀3與第2行形狀4相似,第1行形狀6與第2行形狀3相似,等等。

圖2 典型的植物葉片形狀

提取傅里葉描述子的具體步驟如下:

1)對彩色圖像進行二值化。首先將圖像庫中的彩色圖像轉換為灰度圖像,動態設定閾值,再將像素的取值二值化,獲取二值圖像f(x,y)。

2)求取圖像的質心(xc,yc)。

3)坐標系轉換。以質心為極坐標的極點,將圖像的坐標系由直角坐標轉變為極坐標系。

4)提取圖像的形狀矩陣。以質心為圓心,以最大極徑為半徑形成一個最小外接圓。將圓半徑等距離劃分成M份,極角分成N等分,形成大小為M×N的形狀矩陣。

5)二維離散傅里葉變換。對形狀矩陣進行二維離散傅里葉變換,得到形狀矩陣在頻域中的表示F(u,v)。

6)獲取傅里葉描述子。獲得幅度譜|F(u,v)|,將低頻系數作為形狀描述子。

在具體操作時,形狀矩陣的大小M×N,以及低頻系數的個數是根據檢索性能進行確定的。實驗取M=N=30,即形狀矩陣的行數和列數都是30。由于圖像的高頻反映圖像的細節內容,而低頻部分反映圖像的概貌,因此可以用傅里葉變換的低頻系數作為表示圖像形狀的描述子。由于系數個數的多少也會對檢索性能產生影響,因此實驗分別取4,9,16,25,36,49 和64 個系數作為形狀特征,并分別在測試集上進行檢索。對6種不同形狀各隨機抽取4幅圖像作為查詢圖像,分別在測試集上檢索相似圖像計算其查準率,求取平均值,得出每種形狀的平均查準率,最后求取6種形狀檢索準確率的平均值。結果如圖3所示,當特征數從4上升到16時,查準率上升了16個百分點,效果明顯。而當特征數從16增加到64,準確率只上升了6個百分點,檢索準確率增長緩慢。在對檢索準確率和特征維數進行權衡后,本文將特征維數即系數個數確定為49。

圖3 不同特征數下的平均查準率

為了測試本文算法的性能,實驗將幾種不同算法與之進行比較,包括Hu不變矩[6]、最小外接矩形(目標與最小外接矩形的面積比作為形狀特征)[7]、最小外接圓(同心圓等面積劃分N等份,再對每一區域求取信息熵作為形狀特征)[8]、對圖像邊界的極坐標信息進行傅里葉變換得到的傅里葉描述子,以及PFD[5]這5種算法。

利用上述6種形狀特征,分別對圖2中的前6種形狀進行檢索,每類隨機選取4幅圖像作為查詢圖像,在剩余的圖像中檢索相似圖像,計算平均查準率,繪制不同形狀特征對不同葉子形狀的平均檢索查準率圖(如圖4所示)。圖中行標識1~6分別代表6種不同形狀,列代表查詢準確率。從圖4可以看出,除了形狀5之外,本文算法對其余形狀的檢索準確率相較其他算法更加優越,尤其是形狀1,3和4,但第6種形狀的優勢不明顯。實驗表明算法對于復雜形狀的檢索具有明顯優勢,原因在于形狀矩陣中包含了圖像形狀較多的細節信息。6種形狀特征的平均檢索準確率分別為:71.25%,48.33%,55.00%,64.38%,77.5%,91.04%。由結果可以看出本文算法比查準率次高算法PFD的平均準確率高出13%以上。

最后為了測試噪聲對算法性能的影響程度,實驗分別對測試集中的圖像添加高斯噪聲和椒鹽噪聲,再統計6種葉片形狀的平均檢索準確率。具體數據如圖5所示。從圖中可以看出,具有噪聲的圖像的檢索準確度大約下降10個百分點。分析原因在于噪聲導致圖像質心,尤其是最大極徑發生改變,從而導致對應的形狀矩陣發生改變,最終傅里葉描述子也發生相應變化。但是檢索結果還是比較令人滿意,原因在于算法利用傅里葉變換的低頻系數作為描述子,而噪聲對低頻系數影響較小,因此,本文的算法對噪聲具有一定的穩健性。

圖4 不同形狀特征對不同形狀的平均檢索查準率(%)

圖5 噪聲對檢索性能的影響

5 結論

本文提出一種利用形狀矩陣表示圖像的空間域信息,之后進行二維離散傅里葉變換將形狀信息從空域變換到頻域,最后提取低頻系數作為形狀描述子的方法。用野外采集的植物葉子圖像庫進行測試實驗結果顯示,該算法要明顯優于Hu不變矩等其他5種算法。但是如何增強本文算法對噪聲的穩健性,以及使其對圖像旋轉具有不變性還有待進一步研究。

[1]閆雅楠,夏定元.結合邊緣檢測和區域分割的形狀特征提?。跩].電視技術,2007,31(3):12-15.

[2]魏怡,何一偉,倪海峰,等.形狀描述法在圖像檢索中的應用綜述[J].系統工程與電子技術,2009,31(7):1755-1761.

[3] LU G J,SAJJANHAR A.Region-based shape representation and simlilarity measure suitable for content-based image retrieval[J].Multimedia Systems,1999,7(2):165-174.

[4]GOSHTASB A.Description and discrimination of planar shape using shape matrices[J].IEEE Trans.Pattern Anal.Mach.Intell.,1985,7(6):738-743.

[5]王斌.一種不變的基于傅立葉變換的區域形狀描述子[J].電子學報,2012,40(1):84-88.

[6] HU M K.Visual pattern recognition by moment invariants[J].IRE Trans.Information Theory,1962,11(2):179-187.

[7]盧蓉,范勇,陳念年.一種提取目標圖像最小外接矩形的快速算法[J].計算機工程,2010,36(23):178-180.

[8]孫強強.基于內容的二值商標圖像檢索研究[D].揚州:揚州大學,2008.

猜你喜歡
查準率傅里葉質心
重型半掛汽車質量與質心位置估計
基于GNSS測量的天宮二號質心確定
雙線性傅里葉乘子算子的量化加權估計
基于小波降噪的稀疏傅里葉變換時延估計
基于數據挖掘技術的網絡信息過濾系統設計
大數據環境下的文本信息挖掘方法
基于深度特征分析的雙線性圖像相似度匹配算法
基于傅里葉變換的快速TAMVDR算法
快速離散傅里葉變換算法研究與FPGA實現
一種海洋測高衛星質心在軌估計算法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合