?

復雜背景下的宮頸細胞核分割方法

2019-07-31 05:05趙晶梁隆愷何勇軍謝怡寧
哈爾濱理工大學學報 2019年3期

趙晶 梁隆愷 何勇軍 謝怡寧

摘 要:自動閱片技術采用圖像處理方法,在細胞核識別的基礎上實現對細胞核DNA含量的準確測量,能夠為醫生診斷提供輔助。圖像分割作為自動閱片系統關鍵直接影響系統性能。然而,顯微鏡下細胞核圖片存在光照不均、背景陰影等情況。并且不可避免地存在一些血細胞、淋巴細胞、垃圾雜質、成團細胞,這嚴重降低了分割算法的性能。為解決上述問題,提出了復雜背景下的宮頸細胞核分割方法。該方法首先利用參數自適應的局部閾值法來分割圖片,并利用自適應的分割參數調節來處理圖片中的復雜情況。即利用局部閾值窗口大小和二值化后輪廓數量的函數關系來自動調節窗口大小。然后根據得到的二值圖確定分水嶺算法的標記圖像,最后利用分水嶺算法完成整張圖片的分割。實驗表明,此方法能適應復雜圖像環境,并可以從成團細胞中分割出重疊程度較低的細胞,提高分類器識別細胞核的概率。

關鍵詞:細胞核分割;參數自適應;分水嶺算法;局部閾值法

DOI:10.15938/j.jhust.2019.03.004

中圖分類號: TP315.69

文獻標志碼: A

文章編號: 1007-2683(2019)03-0022-07

Abstract:Automatic screening technology developed in recent years. It applies image processing, and first recognizes nucleus and then measures the DNA contents accurately, so it can provide auxiliary for a doctor′s diagnosis. Image segmentation is the key technique of automatic screening system which directly determines the performance of the systems. However, the imaging environments under the microscope are complex. One the one hand, uneven illumination, background shading and uneven dyed nucleus exist. On the other hand, there are inevitably blood cells, lymphocytes, garbage, impurities and conglobation cells in cell images. These conditions degrade the performance of image segmentation. In order to solve these problems, we put forward a method to segment cervical nuclei in complex background. This method first employs the local threshold method to segment images. In this procedure we propose a parameter adapting method which adjusts its parameters automatically

according to the function of local threshold window size and the binarized outline number. The local threshold method transforms an image into a binary image which is then passed to image corrosion operator to generate a marking image. With the binary image, the watershed algorithm was finally performed to segment the image. The experiment shows that the method can adapt to the complex image environment and separate the cells with lower overlapping nuclei images.

Keywords:nucleus segmentation; parameter adaptive; watershed algorithm; local threshold method

0 引 言

近年來宮頸癌高發,已經成為威脅女性生命的社會問題。2012年世界衛生組織發布的調查報告表明,在欠發達地區宮頸癌是婦女的第二大殺手,僅在2012年新增病例44.5萬例。2012年大約有27萬婦女死于宮頸癌,且超過85%的發生在低收入或中等收入國家。早發現早治療是應對這一問題的有效方法。在宮頸癌診斷方面,目前有效的方法是宮頸涂片病理檢查。該方法需要經驗豐富的病理醫生通過鏡下觀察發現病變細胞后做出診斷。然而,隨著癌癥的頻發,該技術已無法適應現實需求。一方面,該診斷需要醫生經過長期的專門訓練,對醫生要求較高;另一方面醫生在鏡下觀察完全根據經驗,具有主觀性,容易因視覺疲勞而導致誤診率上升。近年來發展起來的自動閱片技術能有效解決這些問題。典型的有計算機輔助閱片的DNA倍體分析技術。該技術只對細胞核染色,顯微鏡在軟件的控制下自動聚焦掃描,拍攝鏡下圖片,并在識別的基礎上準確測量細胞核核內DNA的相對含量,最后將異常的細胞核羅列出來,輔助醫生診斷。通過該技術,醫生只需接受短時間的培訓,僅需復核系統挑選出的病變細胞核即可做出診斷,診斷準確率更高。

細胞核圖像分割是決定DNA倍體分析系統性能好壞的首要環節。研究者們提出的典型解決方法有閾值分割法[1]、分水嶺分割法[2]等等。

閾值法通過設定不同的特征閾值,將圖像的像素點分為若干類,具有實現簡單、計算量小、性能較穩定等有點,已成為圖像分割中應用最廣泛的分割技術。以固定閾值分割為基礎,出現了一系列閾值分割的新方法[1]。按照閾值的作用范圍可分為全局閾值和局部閾值法兩大類。全局閾值法中閾值的選取至關重要,是這類方法研究的重點。申鉉京等提出了基于多閾值Otsu準則的閾值分割快速計算。該算法減少閾值的搜索范圍,并利用查找表計算均值、方差,優化了底層運算,提高了算法的分割速度[3]。全局閾值只能分割對比度較高的背景和較清晰的圖片,不能克服圖像光照不均勻、背景有雜質或陰影的影響[4]。局部閾值法能有效緩解這個問題。劉占提出了局部期望閾值分割方法,首先把圖像轉換成梯度矩陣,然后將矩陣分割成眾多子區域并計算其數學期望,最后以該值來對其子區域進行邊緣提取。這種方法提高了圖像邊緣特征的可辨識性,使邊緣信息的提取準確性提高[5]。Petter Ranefall等通過橢圓擬合和局部區域的大小來優化局部區域的閾值,提出了適用于橢圓或細長物體的分割方法[6]。閾值的性能受較多參數的影響,而這些參數大多憑經驗設置,難以達到理想效果。

分水嶺分割方法[2]是一種基于數學形態學分割方法。其基本原理是把圖像類比為測地學中的拓撲地貌,圖像中每點像素的灰度值代表該點的海拔高度,每個局部極小值及其影響的區域稱為集水盆,而集水盆的邊界則形成分水嶺。傳統的分水嶺算法容易造成過分割,為了解決這一問題,一些研究者提出了基于標記點的分水嶺算法。Ji X等提出了一種基于距離變換的分水嶺算法來分離粘連細胞核,通過增強細胞核邊緣后利用Otsu閾值粗分割細胞核,利用優化的種子點來進行分水嶺操作,最終達到分離粘連細胞核的目的[7]。Geetha等提出了一種基于標記點控制的分水嶺算法,可以精確地計算細胞核的核漿比[8]。另一些研究者則通過改進分水嶺算法的實現原理來解決這一問題。Husain等提出一種利用徑向基函數(radial basis function,RBF)神經網絡對圖像的目標對象進行分割。在形成的水域地形中創建圖像直方圖,RBF初始參數如中心和寬度分別自動設置在直方圖的峰值和最小值上[9]。還有一些研究者嘗試對分水嶺算法的處理結果進行再分割或合并相似區域。Zhanpeng H等采用基于分水嶺分割和區域合并提取肝臟區域圖像,將分水嶺分割后的結果作為區域合并的標記圖像,然后基于相似性的標準對圖像的標記區域進行合并[10]。

目前的方法大多針對某一類情況,難以適應DNA倍體分析這樣復雜的應用環境。如圖1所示,首先,復雜的背景條件,即光照不均、背景陰影、染色深淺不一致等問題。其次,脫落宮頸細胞采集不可避免地存在微生物、細胞碎片、血液、污染物等雜質,使標本中存在大量的碎片、黑斑、絲狀絮狀垃圾和一些聚集成團的腺細胞核等垃圾雜質。這些問題對細胞核分割方法提出了新的挑戰。為此,本文結合局部閾值法和分水嶺算法,提出了基于復雜背景下的宮頸細胞核分割方法。該方法利用自適應參數的局部閾值法來得到分水嶺算法的標記點。首先利用自適應的參數調節來排除細胞核圖像上的光照不均、背景陰影、雜質和染色深淺不一致等問題對分割的影響,將細胞核分割出來。然后再利用重復腐蝕法腐蝕二值圖像,獲得分水嶺算法的標記圖像。最后利用分水嶺算法分割整張圖片。實驗表明,所提出的方法能準確分割各種類別和重疊程度較小的細胞核,能有力地支撐了自動閱片系統。

1 本文算法實現

分水嶺算法是分割圖像的有效方法,但是由于顯微鏡下的圖片存在背景光照不均、陰影、雜質等復雜情況。傳統的分水嶺算法分割時會導致過分割或欠分割現象,本文通過自適應參數的局部閾值法的方法分割圖片中的細胞核,并通過標記選取算法選取細胞核心為分水嶺算法提供較為準確的標記圖像。

1.1 傳統分水嶺原理

分水嶺的計算過程是一個迭代標注過程。首先對每個像素的灰度級進行從低到高排序,然后在從低到高實現淹沒過程中,對每一個局部極小值在h階高度的影響域內采用先進先出(FIFO)結構進行判斷及標注。通常把梯度圖像作為輸入圖像。分水嶺算法對微弱邊緣具有良好的響應,圖像中的噪聲、物體表面細微的灰度變化,都會產生過度分割的現象。為了解決分水嶺的過分割問題,眾多研究者提出了很多解決辦法[2],其中以標記法為主,標記法就是將注水的極小值區域換成自定義的標記點,這樣可以有效的避免過分割現象,那么標記點的選取就顯得至關重要。本文提出了一種標記點選取方法。

1.2 圖像預處理

為了消除圖片復雜背景對分水嶺分割的影響。本節采用局部閾值法分割圖片,并利用參數自適應的方法去除陰影、雜質、光照對閾值的影響。最后得到只有細胞的二值圖,即初步的標記圖像。

1.2.1 局部閾值原理

局部閾值法首先將圖片分割成若干個w×w大小的區域,并利用背景和對象的灰度值均值和標準差的差異確定每個區域的閾值計算公式:

T(x,y)= M(x,y)+kD(x,y)(1)

其中(x,y)是在窗w×w內的一點,T(x,y)是窗內的閾值,M(x,y)和D(x,y)分別是窗內的灰度值的均值和標準差,k是一個固定的偏差。窗的寬度w對算法的效果有很大的影響。如果窗寬太小容易造成細胞核過分割,窗寬太大又不能排除復雜背景情況對算法的影響。實際圖片情況都互不相同,故自適應地調節w的大小并找到一個合適的w值至關重要。

1.2.2 自適應參數調節

過度分割表現在分割出的輪廓數量遠大于實際輪廓數。因此,本文利用窗長度大小和分割后的區域數量的關系來確定最佳w值。即當w取較小值,細胞核內部會出現孔洞或零散的點,這時輪廓的數量相對較多。隨著w的增大孔洞和散點變少,輪廓的數量會逐步減少,直到減小到一個相對穩定值,此時w值為最佳窗口大小。 而當w繼續增大到一定值時,背景中的一些雜質和陰影就會出現,輪廓數目又開始增加。由此可知改變化趨勢符合三次曲線的圖像,故為了不受噪聲點的影響本文采用曲線擬合的方法來獲得符合圖2中散點的函數公式,并利用該公式來求得最佳w值。

本文采用了最小二乘法法擬合如圖2的散點,其任務為求一個函數y=f (x),使得圖中所有散點在最小二乘準則下到曲線f (x)的距離平方和最小。其中f (x)如下所示的三次曲線:

f(x)=ax3+bx2+cx+d(2)

擬合的目的是要解如下優化問題

1.3 標記點的選取

局部閾值分割可以很好地避免復雜背景的影響,但是對于細胞聚集較密集的圖片的處理效果不是很明顯。而一些病變細胞就恰好容易出現到成團細胞中,所以分割成團細胞可以提高癌細胞的檢出率。針對這一情況,本節通過重復腐蝕得到的二值圖,盡可能的將重疊的細胞分割開,并將得到的結果作為分水嶺算法的標記圖像。最后利用分水嶺有效地分割重疊程度不高的細胞,并抑制過分割現象,得到整張圖片的分割圖。

1.3.1 輪廓分割

本節主要分割腐蝕難度較大的重疊輪廓。首先利用凹點檢測算法[11]檢測到每一個輪廓的凹點,然后利用如下的歐式距離公式計算距離最小的兩個凹點,試驗發現這兩個點的連線可以將輪廓分成兩個部分,并且不會錯將單細胞分割。用此方法可以有效分割重疊程度較高的細胞。

1.3.2 重復腐蝕

本節主要采取基于面積限制的重復腐蝕操作,首先提取輪廓,并判斷每個輪廓的面積,如果面積大于定值A,就腐蝕該輪廓,否則就保持不變,重復該腐蝕過程直到所有輪廓的面積均不大于A。最后將面積小于B的輪廓刪掉,至此得到分水嶺算法的標記圖。其中A為圖片中最小細胞核的面積,B要大于一些細小雜質的面積并遠小于A值。該方法可以有效保留較小的細胞核,并更好地分割較大的重疊細胞,從而減小分水嶺的過分割或欠分割現象。

1.4 分割算法實現步驟

步驟一:利用局部閾值法循環分割圖片200次,w每次增加2,并記錄每一次的輪廓數量C。

步驟二:用最小二乘法擬合w和C的函數關系式f(x),并利用f(x)求取最佳窗口大小x。

步驟三:利用最佳閾值x對圖片做局部閾值化。

步驟四:提取輪廓并檢測每一個輪廓的凹點,確定歐式距離最近的兩點切割輪廓。

步驟五:提取輪廓,判斷每個輪廓的面積。如果面積大于A就腐蝕輪廓,否則保持不變。

步驟六:重復執行步驟五直到所有輪廓面積都不大于A。

步驟七:刪除面積小于B的輪廓,得到標記圖像。

步驟八:以標記圖像為輸入執行分水嶺算法。

2 實驗和結果分析

2.1 參數自適應的對比實驗

該實驗主要實現參數自適應的局部閾值法,針對不同種情況給出示意圖,并展示不同的窗口大小分割圖片時的效果不同。說明了自適應參數調節的必要性

2.1.1 實驗數據

從大量的細胞圖片中選取了如圖2所示的四張圖片。他們分別代表背景存在雜質、背景有陰影、細胞成團出現和背景光照不均勻等4種復雜的背景情況的圖片4張。

2.1.2 實驗過程

首先利用OTSU算法分割圖片,并保存結果留作對比圖。然后以w=15為初始值每次增加2,對圖片進行局部閾值化,并記錄此時的輪廓數量,重復實驗200次。再將得到的數據繪制散點圖并擬合曲線。最后對比分析最佳閾值的分割結果和其他閾值的結果。

2.1.3 實驗結果分析

如圖2所示的曲線擬合圖,橫坐標為窗長度w,縱坐標為閾值分割后輪廓的數量。該圖中展示的曲線很好的擬合圖中的散點,并得到了一個最佳閾值x,即圖中曲線的極小值點。由圖2可以看出不同圖像的最佳閾值點相差較多,式2中的參數也各不相同,若不使用參數自適應則不能得到準確的分割圖。圖3中展示了不同圖片在不同w值時的不同分割效果,本文選取了3種不同閾值來對比分析。從圖中可以看出在w=x時閾值分割的效果最佳,當w=25時細胞內部出現了孔洞和離散的點,當w=175時圖片中的雜質和陰影出現并影響了分割效果。而OTSU算法不能避免復雜背景條件對細胞分割的影響。實驗表明該方法可以自動選擇局部閾值的參數,并避免復雜背景對圖像分割的影響。

2.2 分水嶺算法的對比實驗

2.2.1 實驗數據與過程

如圖5(a)所示的成團細胞為該實驗的數據。首先利用傳統的分水嶺算法分割圖片,結果圖像留作對比分析。然后利用標記合成算法合成標記圖像。最后利用基于標記點控制的分水嶺算法分割圖片。該實驗將對比分析傳統分水嶺算法和本文改進的分水嶺算法在重疊細胞核分析中的效果。

標記圖像的生成過程如圖4所示,首先利用參數自適應的局部閾值法分割圖片,然后對輪廓做簡單的重疊輪廓分割,最后利用基于面積限制的重復腐蝕法處理二值圖像,獲得分水嶺算法的標記圖。從圖4中可知,當重復腐蝕次數N>2時輪廓大小基本不發生改變。

2.2.2 結果分析

如圖5所示,5(b)是傳統分水嶺的效果圖,圖中有很多過分割的地方。5(c)是本文分水嶺算法結果,效果較好且過分割的部分較少。該實驗表明本文的標記點選取算法可以得到大部分細胞核,并可以從重疊細胞中分割出單細胞,使分水嶺算法達到了最佳的使用效果。而傳統的分水嶺算法由于標記點不準確從而出現了過分割現象。

2.3 算法效果評價與分析

2.3.1 實驗數據

實際采集到的圖片中不會同時出現本文算法中考慮到的所有復雜情況,對處理結果難以統計。所以本節合成存在多種復雜情況和細胞核重疊情況的圖片用于方法評價。首先選取多種復雜情況的圖片1 000張,然后隨機組合成圖片100張,并確保每張圖片中均存在光照不均勻、背景有陰影、雜質和成團細胞等多種情況。

2.3.2 實驗過程

首先利用參數自適應的局部閾值法來閾值化圖片,然后利用標記點選取算法將得到的結果圖腐蝕成分水嶺算法的標記圖像,最后利用分水嶺算法分割100張圖片,保存實驗過程圖和結果圖。為了對實驗結果做定量的分析,從中選取兩張圖片將圖中內容標記為單個細胞核、重疊細胞核、雜質等三類。然后分別利用本文算法、局部閾值法、全局閾值法來分割圖片。最后統計分割結果,并計算分割準確度。分割準確度為分割出單細胞核的準確度,所以計算公式為:

Aaccuracy=(TP+FP)/N(5)

式中TP如表1、2、3所示,代表實際是單細胞并被分割成單細胞的數量。FP代表實際是重疊細胞但是被分割成單細胞的數量。N代表圖片中實際內容的數量。

2.3.3 實驗結果與分析

圖6為算法定性分析效果圖。圖6(a)圖中出現了細胞核多種重疊形式和復雜的背景情況。從6(b)圖中可以看出,本文算法成功地將復雜的背景情況排除。圖6(c)中可以看出本文的標記點選取算法成功分割重疊程度低的細胞,并保留了大部分細胞的核心。而圖6(d)中展示了分水嶺后的效果,本算法有效地分割了重疊程度不高的細胞。

如表1、2、3所示為3種算法分割后數據統計。其中T、F分別代表圖片中標記的單細胞、重疊細胞;P、N分別代表圖片被分割后得到的單細胞、重疊細胞。如圖7所示,本文用不同顏色的標記點標記了不同算法分割后的不同情況,表中所示數據為本次實驗的統計結果。利用這些數據,通過式(5)計算可得分割準確度。如圖8所示結果,展示了利用三種不同算法分割圖片得到的分割準確度,其中本文算法的分割準確度遠大于另外兩種算法。實驗表明本文算法優于一些經典的算法,并可以一定程度上地分割重疊細胞,為細胞識別打下堅實的基礎。

3 結 語

針對DNA倍體分析系統在實際應用時面臨的細胞核分割問題,本文提出了復雜背景下的宮頸細胞核分割方法,實現整張圖片的分割。實驗表明,本文的算法可以解決細胞核DNA倍體分析系統在實際應用時的細胞核準確分割問題,確保DNA倍體分析系統對細胞核的精準測量。

參 考 文 獻:

[1] 吳一全,孟天亮,吳詩婳. 圖像閾值分割方法研究進展20年(1994—2014)[J]. 數據采集與處理, 2015, 30(1):1.

[2] XING F, LIN Y. Robust Nucleus/Cell Detection and Segmentation in Digital Pathology and Microscopy Images: A Comprehensive Review[J]. IEEE Reviews in Biomedical Engineering, 2016,9.

[3] 申鉉京,劉翔,陳海鵬.基于多閾值Otsu準則的閾值分割快速計算[J].電子與信息學報,2017,v.39(01):144.

[4] ZENG Z, CHEN S, TANG S, et al. Unsupervised Segmentation of Cell Nuclei in Cervical Smear Images Using Active Contour with Adaptive Local Region Fitting Energy Modelling[C]//International Conference on Biomedical Engineering and Informatics. 2015:250.

[5] 劉占. 基于局部期望閾值分割的圖像邊緣檢測算法[J]. 計算機與現代化, 2016(8):52.

[6] RANEFALL P, SADANANDAN S K, WHLBY C. Fast Adaptive Local Thresholding Based on Ellipse Fit[C]// The IEEE International Symposium on Biomedical Imaging. IEEE, 2016.

[7] JI X, LI Y, CHENG J, et al. Cell Image Segmentation Based on an Improved Watershed Algorithm[C]//Image and Signal Processing (CISP), 2015 8th International Congress on. IEEE, 2015: 433.

[8] GEETHA P K, NIDHYA R, DINESH Kumar A, et al. Cell Segmentation and NC Ratio Analysis for Biopsy Images Using Marker Controlled Watershed Algorithm[C]// International Conference on Green Computing Communication and Electrical Engineering. IEEE, 2014:1.

[9] HUSAIN R A,ZAYED A S, AHMED W M, et al. Image Segmentation with Improved Watershed Algorithm Using Radial Bases Function Neural Networks[C]//Sciences and Techniques of Automatic Control and Computer Engineering (STA), 2015 16th International Conference on. IEEE, 2015: 121.

[10]ZHANPENG H, QI Z, SHIZHONG J, et al. Medical Image Segmentation Based on the Watersheds and Regions Merging[C]//Information Science and Control Engineering (ICISCE), 2016 3rd International Conference on. IEEE, 2016: 1011.

[11]楊輝華,趙玲玲,潘細朋,等.基于水平集和凹點區域檢測的粘連細胞分割方法[J].北京郵電大學學報,2016,39(6):11.

(編輯:關 毅)

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合