?

基于內容檢索的硅藻細胞自動分類

2014-05-25 00:35琦,周
關鍵詞:外接圓硅藻圓環

牟 琦,周 平

(浙江理工大學信息學院,杭州310018)

基于內容檢索的硅藻細胞自動分類

牟 琦,周 平

(浙江理工大學信息學院,杭州310018)

對硅藻細胞分類提出了一種基于內容的分類方法。該方法首先獲取帶外接圓的目標;然后,對其應用紋理主特征直方圖,紋理變化度,紋理角特征3種方法提取出目標的特征向量;最后使用歐氏距離進行相似性度量。實驗結果表明,該方法具有較好的分類準確率及召回率。

硅藻細胞分類;基于內容的圖像檢索;圖像特征提取

0 引 言

硅藻是一種大型的,對環境十分重要的單細胞藻類群體,它基本被發現于所有的水生棲息地中。位于海洋生物鏈的底層,是其他海洋生物的重要食物來源,所以對整個海洋生物鏈起著地基的作用。同時,也對海洋的生態平衡起著至關重要的作用。此外,硅藻有著廣泛的應用[1-2],包括水質量評價、天氣估測、考古和醫學制藥等各個領域。但是,硅藻的每個種類的作用又各不相同,有的可以用來檢測水體質量,但其本身卻不具有藥用價值。所以對硅藻的鑒定和識別變得尤為重要。

大多數分類使用分類關鍵點或者通過電腦和書本上的樣本圖片進行對比[3]。這不是一件簡單的工作,因為考慮到生物學家可能要評估20萬個不同種類的硅藻,而且許多基于形態非常難以區別。所以通過算法和軟件對硅藻進行自動識別鑒定成為了一種必要的,同時也是一種非常方便、高效的檢測手段。

大多數藻類細胞的分類思路是先分割再通過提取顏色、形狀、紋理等特征得到特征向量[4-10],最后通過分類器得到結果。但是,如果分類的種類過多時,工程量非常巨大,最后所要使用的判斷標準和判斷數據也會極其復雜。所以,本文通過基于內容的圖像檢索找到與待檢索圖像最像的種類,以達到快速分類的目的。

1 獲取外接圓

1.1 圖片預處理

首先對圖像進行灰度化和Sobel邊緣檢測,得到灰度邊緣檢測圖像,再對結果圖像進行Otsu分割。Otsu法是一種使類間方差最大的閾值確定方法,所以也稱為最大類間方差法。該方法具有簡單、處理速度快等特點,是一種常用的閾值選擇方法。其基本思想是把圖像中的像素按灰度值用閾值T分為兩類C1和C2,C1由灰度值在[0,T]之間的像素組成,C2由灰度值在[T+1,L-1]之間的像素組成,按照下式計算兩類之間的類間方差:

式(1)中ω1(t)為C1中所包含的像素數,ω2(t)為C2中所包含的像素數,μ1(t)為C1中所有像素數的平均值,μ2(t)為C2中所有像素數的平均值。讓T在[0,L-1]范圍依次取值,使σ(t)2最大的T值即為Otsu法的最佳閾值。

之后為所得圖像進行膨脹和去除小面積。去除小面積使用輪廓跟蹤、孔洞填充和面積過濾的方法。先使用輪廓跟蹤找到圖像各個連通域的輪廓并儲存,之后對輪廓進行孔洞填充,并將小于總輪廓面積5%的小面積過濾掉。這樣做不僅可以將圖片的雜點去除,還可以將置于圖片上的比例尺去除,方便后續的操作。

1.2 外接圓算法

通常使用的外接圓算法是將圖像二值化后,通過求取形心和半徑求取外接圓。但是這種方法易受到目標外干擾點及比例尺的影響導致外接圓提取過大。針對這種情況,本文提出一種外接矩收縮法獲得外接圓。圖1為本文所用外接圓算法和重心半徑法的效果比較圖,圖2列出了外接圓的整個獲取過程。其中外接矩收縮法的詳細步驟如下:

圖1 外接圓算法比較

圖2 外接圓的獲取過程

步驟1:求得左上方最小橫縱坐標x1、y1,右下方最大橫縱坐標x2、y2;

步驟2:按此二點(x1,y1)、(x2,y2)畫出目標外接矩;

步驟3:初始化四個坐標為矩形中心的點,檢測外接矩四條邊上與目標的交點,若有交點則更新四點中對應點,四點從上邊以順時針方向命名為p1,p2,p3,p4;

步驟4:移動矩形右下角坐標,每次往八鄰域中的左上角移動一個像素;移動后檢測p2,p3是否與目標相交,若相交則停止;

步驟5:移動矩形左上角,每次往八鄰域中的右下角移動一個像素;移動后檢測p1,p4是否與目標相交,若相交則停止;

步驟6:外接圓半徑,圓心以最終的矩形左上角和右下角點連線為直徑計算。

2 特征提取

2.1 紋理主特征直方圖

本文對灰度圖像采用5位位屏蔽用于簡化數據計算量,屏蔽后圖像的紋理特征并未有根本性的變化,但是亮度值從256縮減到了8種。將屏蔽后的圖像的外接圓從內到外按距離均分10等份,從而得到10個圓環。之后統計每個圓環上8種亮度的數目,就此得到一個8×10的特征向量,向量的從低到高排列順序為按照圓環由內而外,亮度由低到高排列。實驗劃分圖和數據直方圖分別如圖3和圖4所示。由圖4(a)和(c)、(e)和(g)比較可知,相似的圖片通過上述方法可以獲得相似的直方圖數據,同時對目標具有旋轉和綻放不變性。

計算相似度時,按照同色、同環對比,每個圓環所取得的數據都要乘以各自圓環的加權值,加權值由內而外為0.02、0.06、0.1、0.11、0.12、0.15、0.2、0.15、0.1、0.04。加權后,按照同色、同環的方式使用歐氏距離計算相似度。在歐式平面上,任意兩點(i1,j1)和(i2,j2)的距離表示為

圖3 實驗同心圓劃分示意

圖4 同突眼紋藻、交替盒型藻紋理主特征直方圖示例

2.2 紋理變化度

不同的紋理必然存在的不同的亮度變化,此處,本文正是利用這一點采用除去最外環后的其他9個圓環上的亮度變化次數,從而得到9維的目標特征向量。計算相似度時,按照同色、同環對比,每個圓環所取得的數據都要乘以各自圓環的加權值,加權值由內而外為0.04、0.09、0.12、0.13、0.13、0.13、0.13、0.12、0.1。加權后,按照同色、同環的方式使用歐氏距離計算相似度。表1為圖4(a)、圖4(e)的紋理變化度數據。

2.3 紋理角特征

目標紋理是由許多小結構組成的,而這些結構在圖像上亮度相似,由于之前已經過5位位屏蔽處理使得亮度相近的歸為了一類,所以在此處,本文采用統計圓環上同亮度點的夾角角度作為數據依據。通過實驗觀察(將角度1~180°劃分為180份,每份1°),統計每個圓環上同亮°間角°數據時,角度越大圓環上存在的這種角度數目越少,3°以下的統計值過高且各個種類3°以下數值相差不大,這是由于噪聲干擾和亮度不均造成的,故此處將角度區間以2為基的倍增方式劃分,具體劃分為(3°,10°]、(10°,20°]、(20°,40°]、(40°,80°]、(80°,160°]、(160°,180°]。由此可以得到一個8×6的特征向量(由于只有8個內圓環可以保證位于目標內)。計算相似度時,按照同色、同環對比,每個圓環所取得的數據都要乘以各自圓環的加權值,加權值由內而外為0.01、0.09、0.15、0.15、0.15、0.15、0.15、0.15。加權后,按照同色、同環的方式使用歐氏距離計算相似度。圖5(a)、圖5(b)分別為圖4(a)、圖4(e)的紋理角特征數據。

圖5 同突眼紋藻及交替盒型的藻紋理角特征數據

3 實驗結果

基于內容的圖像檢索的檢索效果評價有多種方法,比較常用的方法有準確率與召回率、準確率-召回率曲線以及排序評價方法等[11-12]。本文采用準確率和召回率對基于內容的硅藻自動鑒別系統-DRS(diatom retrieval system)的檢索性能進行評價,并對實驗結果進行了分析。圖6為準確率、召回率示意圖,其中A表示檢索到的相關文件,B表示檢索到的不相關文件,C表示未檢索到的相關文件,D表示未檢索到的不相關文件。測試圖像數據庫含有396幅硅藻圖像。隨機抽取圖像數據庫中的20幅圖像作為測試圖像,分別按照紋理主特征直方圖,紋理變化度,紋理角特征3種方法進行單特征和綜合特征檢索,構成20次檢索。

召回率(recall rate):是檢索出的相關文檔數A和文檔庫中所有的相關文件數A+C的比率,衡量的是檢索系統的查全比例。即R=A/(A+C)。

準確率(precision rate):是檢索出的相關文檔數A與檢索出的文件總數A+B的比率,衡量的是檢索系統的精度。即P=A/(A+B),本實驗中A最大為3,A+B為40,所以理論最高值為7.5%。

圖6 準確率、召回率示意圖

對于每次的檢索結果,通過準確率和召回率計算當前的檢索數據結果。綜合10次檢索數據結果,得到了相應的平均準確率和召回率(表2),其中精確率滿值為7.5%,召回率滿值為100%。由實驗結果可知,綜合特征比單一特征的檢索效果要好,本文方法的檢索性能明顯優于SEH[13],SHE表示結構元素直方圖(structure elements'histogram),結構元素的具體定義詳見參考文獻[13]。

表2 不同方法的P-R比較

4 結 論

本文通過基于內容的圖像檢索技術,實施硅藻的自動鑒定識別,并研發了硅藻圖像檢索系統-DRS。DRS以硅藻為搜索對象,使用紋理主特征直方圖,紋理變化度,紋理角特征3種方法提取目標的特征向量,最后通過相似性對比得到最有可能的分類類別,降低了因疲勞和主觀知識范圍的束縛所造成的分類失誤以及因失誤而引起的后續試驗和生產的誤差和錯誤。同時為快速準確地鑒定硅藻種類提供了技術支持。根據對系統進行的測試和分析可知,基于綜合特征的內容檢索相較單一特征準確率和召回率更高,SEH對目標和背景顏色差異較大的檢索會有較好的效果,同時SEH方法較為依賴顏色特征所以對于有著復雜紋理特征和一些顏色不一樣但是紋理相似的圖片有著較差的準確率和召回率,但是本文所提出的3個特征對于旋轉不變性、復雜紋理都有著較好的效果。

[1]Stoermer E F,Kreis Jr R G,Andresen N A.Checklist of diatoms from the Laurentian Great lakes.II[J].Journal of Great Lakes Research,1999,25(3):515-566.

[2]Jones V.Diatom Introduction[M].Elias S A.Encyclopedia of Quaternary Science.Amsterdam:Elsevier Inc,2007:476-484.

[3]Smol JP,Stoermer E F.The Diatoms:Applications for the Environmental and Earth Sciences[M].Cambridge:Cambridge University Press,2004:21-25.

[4]Songn Q,Wang G,Wang C.Automatic recommendation of classification algorithms based on dataset characteristics[J]. Pattern Recognition,2012(45):2672-2689.

[5]Dimitrovski I,Kocev D,Loskovska S,et al.Hierarchical classification of diatom images using ensembles of predictive clustering trees[J].Ecological Informatics,2012,7(1):19-29.

[6]Peng B,Zhang L,Zhang D.A survey of graph theoretical approaches to image segmentation[J].Pattern Recognition,2013(46):1020-1038.

[7]Xie F,Bovik A C.Automatic segmentation of dermoscopy images using self-generating neural networks seeded by genetic algorithm[J].Pattern Recognition,2013(46):1012-1019.

[8]Zhao F,Lin F,Seah H S.Binary SIPPER plankton image classification using random subspace[J].Neurocomputing,2010(73):1853-1860.

[9]Chang L,Duarte M M,Sucar L E,et al.A Bayesian approach for object classification based on clusters of SIFT local features[J].Expert Systems with Applications,2012,39(2):1679-1686.

[10]Ranzato M,Taylor P E,House J M,et al.Automatic recognition of biological particles in microscopic images[J].Pattern Recognition Letters,2007,28(1):31-39.

[11]韋 娜,耿國華,周明全.基于內容的圖像檢索系統性能評價[J].中國圖象圖形學報,2004,9(11):1271-1275.

[12]茹立云,彭 瀟,蘇 中,等.基于內容圖像檢索中的特征性能評價[J].計算機研究與發展,2003,40(11):1566-1570.

[13]Wang X,Wang Z.A novel method for image retrieval based on structure elements'descriptor[J].Journal of Visual Communication and Image Representation,2013,24(1):63-74.

Automatic CIassification of Diatom CeIIs Based on Content RetrievaI

MU Qi,ZHOU Ping
(The School of Information Science and Technology,Zhejiang Sci-Tech University,Hangzhou 310018,China)

A content-based classification method is proposed for sorting diatom cells.This method first gets the goal with a circumscribed circle and then extracts the feature vector of the target by applying the histogram of main features of the texture,texture change degree,texture angle characteristics.Finally,Euclidean distance is used for similarity measure.Experimental results show that the method has good classification precision rate and recall rate.

diatom cell classification;content-based image retrieval;image feature extraction

TP391.4

A

(責任編輯:陳和榜)

1673-3851(2014)02-0211-05

2013-09-06

牟 琦(1987-),男,山東青島人,碩士研究生,主要從事圖像處理方面的研究。

周 平,E-mail:zp@zstu.edu.cn

猜你喜歡
外接圓硅藻圓環
硅藻定量分析在溺死診斷中的應用
基于掃描電子顯微鏡硅藻人工智能搜索系統檢驗效能評估
小硅藻找親戚
豬圓環病毒病的發生、診斷和防治
硅藻指數在水環境監測與評價中的應用分析
五環填數
將相等線段轉化為外接圓半徑解題
僅與邊有關的Euler不等式的加強
巧剪圓環
轉動戒指
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合