郭雨瑩,許建樓,尚婉清,尤少培,王海軍
(河南科技大學 數學與統計學院,河南 洛陽 471023)
圖像分割是計算機視覺和圖像處理中一個基本但仍然具有挑戰性的問題。一般來說,圖像分割是基于相似的屬性(如強度、顏色和紋理)將圖像分成一定數量的互不相交有不同特點的區域的過程,它在生物醫學[1]和深度學習[2]等領域有著廣泛的應用。通常,自然圖像中的顏色和紋理特征非常復雜,因此從背景中完全分割對象非常困難。到目前為止,人們已經提出了很多圖像分割模型。大體上,求解分割模型的方法分為基于模型[3-9]和基于學習[10-12]2大類。然而,由于圖像的多樣性和復雜性,使得統一的網絡架構不能令大量圖像產生一致最優分割效果。在訓練網絡過程中表現就是雖然所有訓練樣本的總的損失函數很好地達到極小值,但對于單個圖像,損耗可能會隨著訓練的繼續而增加。由于這種不穩定性以及深度學習的方法涉及大量數據,本文選擇用基于模型的方式進行圖像分割。
在已經提出的各種基于模型的圖像分割方法中,最有效的方法是基于變分的分割方法。它利用原始圖像定義一個體現分割區域的內部特點及邊界的能量泛函,然后最小化該能量泛函實現圖像分割。Mumford-Shah[3]模型是在每個區域內使用平滑函數進行近似,相當于將圖像分割成不同的同質區域,但其非凸的能量泛函使得極小化問題難以用數值方法分析和求解。文獻[4]提出了用每個區域內的常值函數來近似圖像的活動輪廓模型。文獻[5]將圖像分割和圖像去噪任務統一到一個全局最小化框架中,避免了水平集方法中初始化距離函數中的活動輪廓以及在進化過程中周期性地重新初始化距離函數中的活動輪廓。文獻[6]為了能夠處理分割中的灰度不均勻性,提出了一種新的圖像分割的水平集方法。文獻[7]在隸屬函數上引入了一個非凸正則化,提出了一種新的用于軟多相圖像分割的變分模型。文獻[8]采用一個多層水平集函數的N層水平集隱式曲面,將圖像劃分為N個區域,通過對一個水平集函數求極值,實現三維多相分段常值圖像的快速分割與重建。與圖像分割不同,圖像分解技術是通過設計模型和算法,提取圖像中的主要特征或者有用的信息,其主要目標是把一個給定的原始圖像分解為卡通部分和紋理部分?,F有的部分圖像分解變分模型中使用了OSV模型中的H-1泛函[13-15]。由于在測量振蕩分量時使用了H-1(Ω)中的弱范數,這些模型可以有效地從輸入圖像中提取紋理(詳細介紹參見文獻[16]第3節)。雖然這些方法在視覺上都取得了很好的分解效果,但是這些模型在求解過程時都忽略了Hodge分解得到的向量函數q。從數學的意義上來說,若忽略向量函數q包含的向量信息,則模型的能量泛函出現偏差,影響結構紋理分解。因此,文獻[17]保留了向量函數q,同時讓紋理對應的向量場屬于L1空間,提出了加權曲率驅動的卡通紋理圖像分解。
由于自然圖像不符合分片常數的假設,文獻[18]將圖像分解技術引入圖像分割模型中,使用結構部分代替分割模型中的原始圖像。文獻[15]遵循織物圖像可以分解為卡通和紋理成分的假設,在圖像分割階段結合了圖像分解過程。文獻[19]將圖像分割和卡通紋理分解相結合提出了一種新的模糊分割模型??紤]到OSV分解變分模型中零散度向量函數被忽略的問題,本文保留了OSV模型中的零散度向量函數,將改進后的圖像分解項加入分割模型,給出了一種更合理、更有效的圖像分割模型和分割算法。由于新模型保留了圖像分解變分模型中的零散度向量函數,使得本文方法能夠正確分割較復雜的自然圖像。
給定原始圖像f(x):Ω→R+∪{0},假定圖像分割區域數為N已知,文獻[20]提出以下的基于模糊區域的多相圖像分割模型:
(1)
文獻[21]提出了一個在圖像分解中廣泛應用的變分模型,簡稱OSV模型:
(2)
由于自然圖像通常有結構和紋理2種成分,文獻[18]將分解模型(2)加入分割模型,提出了基于圖像分解的稀疏正則化多區域圖像分割方法:
(3)
式中:第1項是正則項;第2項是保真項;第3、4項為圖像分解項;(Ii)γ表示隸屬度函數Ii(x)的多尺度小波分解系數;λ、α、β是正的平衡參數。該模型將分解模型與分割模型相結合,在圖像分解的同時進行圖像分割,從而得到較好的分割結果。
在式(2)第2項的推導過程中,作者在文獻[21]中假設圖像的紋理v=f-u=divg,然后利用g的Hodge分解g=?p+q,忽略q并令g屬于L2空間而得到,其中div是散度算子,p是標量函數,q是零散度向量函數。然而忽略q,則g的向量信息被改變,進而改變了紋理的特性[17]。
自然圖像一般有結構和紋理2種成分,使用分塊常值函數并不能很好地逼近原始圖像??紤]到現有的使用H-1泛函的模型在求解過程中都忽略了Hodge分解得到的零散度向量函數,本文提出了保留零散度向量場約束的多區域圖像分割模型:
(4)
注意到,與模型(3)不同,新模型(4)中圖像分解項保留了無散度向量場q,這是本文的主要貢獻。首先,新模型(4)中第四項是g屬于L2空間,不同于文獻[17]讓g屬于L1空間。其次,新模型(4)和模型(3)雖然從表達式v=divg的形式上看是一樣的,但是在式(3)中g是與結構部分u直接相關的。事實上,由于忽略無散度向量函數q使得g=?(Δ-1(f-u))不準確,則由模型(3)所得的結構部分u不準確,而本文提出的模型(4)保留了零散度向量場q,保證了向量場g的準確性,從而得到更準確的結構部分u,因此得到的分割結果更好。
對模型(4),采用增廣拉格朗日乘子法和交替方向法。首先引入2個輔助變量hi、z,令hi(x)=Ii(x),z=Δ-1(f-u),則模型(4)變成以下最小化問題:
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
(13)
(14)
(15)
(16)
對u子問題,用直接變分法得到它的Euler-Lagrange方程,再利用梯度擴散流得:
(17)
對mi子問題,這是一個關于mi的可微優化問題,可得到解的顯示表達式:
(18)
對Ii-子問題,這是一個關于Ii的可微優化問題,可得到解的顯示表達式:
(19)
對q子問題,利用直接變分法的下面方程并用快速傅里葉變換求解:
(20)
對z子問題,用直接變分法的如下方程并用快速傅里葉變換求解:
(2βΔ-μ3Δ2)z=-2βdivqk+1-
(21)
(22)
(a) 自然圖像 (b) Fish圖像 (c) 織物圖像 (d) Plaid圖像
為了說明本文模型的可行性和有效性,對以上測試圖像進行仿真實驗。參與實驗的其他模型主要有文獻[6]、[22],基于圖像分解使用了H-1泛函的分割模型文獻[15]以及[18]。每個模型均通過人工調整參數達到最好的分割效果。在數值實驗中,直觀地給出紋理所對應的向量場g以及向量場q,同時進行定量分析來說明本文模型的創新。
圖2為自然圖像在文獻[15]、[18]以及本文模型上的分割實驗結果。其中,Ii,i=1,2指示圖像的分割子區域。
(a) 文獻[15] (b)文獻 [18] (c) 本文模型
從圖2可以看出,其他對比模型的分割子區域I2包含一些不需要的紋理信息。這是因為盡管文獻[15]和[18]引入OSV分解項得到了相對較好的圖像分割結果,但OSV分解項忽略了零散度向量場,使得分解不準確,進而導致分割結果I2中仍包含部分紋理信息。而本文模型保留了被忽略的零散度向量函數q,使得紋理對應的向量場更準確,從而通過求解模型得到了更加準確的結構和紋理圖像,因此分割結果I2較為理想。另外,由于零散度向量場還包含很多向量信息(如圖4),與其他忽略q的模型相比,本文模型的向量場g更加清晰準確,包含更完整的紋理信息,故本文模型的分解結果較為理想。
同樣地,為了進一步驗證本文模型的有效性,文獻[6]、[22]、[18]以及本文模型在Fish圖像上進行對比分割實驗,得到的結果見OSID“開放科學數據與內容”中“補充材料.docx”的圖1。
圖3選擇織物圖像作為測試圖像對文獻[15]、[18]的模型和本文模型進行實驗,展示了相應的分割結果、分解結果及其對應的向量場g。其中,Ii,i=1,2,3指示圖像的分割子區域。由于文獻[6]、[22]直接對織物圖像進行分割,且實驗結果相對較差,具體分割結果見OSID“開放科學數據與內容”中“補充材料.docx”的圖2。
(a)文獻 [15] (b) 文獻[18] (c) 本文模型
從圖3可以看出,相較于其他對比模型,本文模型的分割結果更準確。由于織物圖像含有大量紋理成分不利于分割,文獻[15]和[18]在分解的同時也進行了分割從而得到了較為準確的分割結果,但其分解過程忽略了零散度向量函數q,導致紋理所對應的g向量場不正確,使得通過求解模型得到的結構成分和紋理成分不準確,因此得到的分割子區域L1包含一些屬于子區域L3的線條。而本文模型的向量場g保留了零散度向量場q(如圖4),?z向量方向與q向量方向相互抵消合并,使得紋理部分提取得比較徹底,卡通部分更加符合分段常數的假設,進而得到了更好的分割結果。
類似地,文獻[15]、[18]、[6]以及本文模型在Plaid圖像上進行分割實驗,得到的結果見OSID碼“開放科學數據與內容”中“補充材料.docx”的圖3。
(a) 自然圖像 (b) Fish圖像 (c) 織物圖 (d) Plaid圖
從圖4可以看出,q向量場包含了很多向量信息。如果q被忽略,那么得到的g向量場就不正確,從而影響通過模型求解得到的結構部分和紋理部分的準確性,進而影響圖像分割的結果,因此保留q是有必要的。
為了進一步說明新模型的優勢,采用精確率[23]、召回率[24]以及Jaccard相似系數[25]來評估分割結果,如表1所示。
表 1 客觀評價結果
表1中的指標越接近1,說明分割越準確。從表1可以看出,文獻[6]、[22]的3種評價指標數值上表現較差,由于OSV分解項的加入,文獻[15]、[18]的3種評價指標數值上表現較好,而本文模型保留了OSV分解項忽略的q,在數值上表現更好。與其他模型相比,本文模型在測試圖像上精確率、召回率以及Jaccard相似系數的平均值至少分別提高了3.42%、0.77%、4.89%。這與本文模型的理論分析和直觀視覺結果一致。
為了得到更好的分割結果,本文通過分析無散度向量場理論,提出了一個新的帶有零散度向量場約束的基于圖像分解的多區域分割模型并采用交替方向法求解新模型。實驗結果表明,對于紋理圖像,由于耦合圖像分割與圖像分解使得分割不易受紋理影響,從而新模型的分割結果在精確率、召回率、Jaccard相似系數上有明顯提升,由于保留了使用H-1泛函度量振蕩成分時忽略的無散度向量場q,無論從理論還是數值實驗,向量信息都更加完整。