?

基于多策略改進麻雀搜索算法優化SVM的古建筑彩畫分割①

2023-07-15 02:33鄢敏夏永華顧進立許曦王沖
關鍵詞:彩畫適應度種群

鄢敏, 夏永華,, 顧進立, 許曦, 王沖

1.昆明理工大學 國土資源工程學院,昆明 650093;2.昆明理工大學城市學院,昆明 650051;3.中國電建集團 昆明勘測設計研究院有限公司,昆明 650200

中國古建筑彩畫歷史悠久, 形成了以官式彩畫為主體的大量區域性彩畫樣式, 是我國古代建筑裝飾藝術的主要表現形式之一.但因建筑木制結構常年暴露于外部環境中, 建筑彩畫極易出現褪色、破甲、開裂等病害, 現存的大量歷史彩畫保存現狀堪憂.為保護古建筑彩畫遺產, 各地學者通過數字攝影方式, 以大量像片為載體記錄彩畫的現狀信息.但受限于圖幅大小, 像片難以兼顧彩畫的清晰度與全局性, 且對存儲空間消耗極大, 亟需一種準確且高效的彩畫數據采集與數字化解決方案.

近年來, 以數字攝影測量為基礎并結合圖像分割、矢量化等圖像處理手段的貼近攝影測量方法, 以其優異的模型完整度和建模精細度在文物保護領域成效斐然[1].目前的圖像分割方法種類繁多[2-10], 其中SVM算法在解決小樣本、高維度問題上具有獨特優勢, 是目前最受歡迎的分類算法之一, 本文也將采用SVM作為分類算法, 以供后續實驗對比與分析.

高斯徑向基函數(RBF)的SVM模型的分類性能主要受損失參數c與核函數參數g的影響.為尋找最優訓練參數, 大量學者通過群智能優化算法來搜索模型最佳訓練參數, 以實現更高的分類精度)[11-14].麻雀搜索算法(sparrow search algorithm, SSA)[14]是一種新型的群智能優化算法.相比于傳統群體優化算法, SSA算法的控制參數少、局部開發能力較強.但類似其它群優化算法, SSA算法同樣存在早熟收斂、易陷入局部最優與邊界計算等問題.針對SSA算法存在的部分局限性, 本文提出了一種多策略改進麻雀搜索算法(multi-strategy improved sparrow search algorithm, MISSA), 用于優化SVM的參數選擇過程、提高分類精度.

1 多策略改進麻雀搜索算法優化SVM的分割方法

本文使用SLIC算法提取超像素, 通過主成分分析(PCA)對融合多個色彩空間的顏色矩特征進行降維, 利用MISSA算法優化SVM的初始訓練參數, 獲取更加精確的分類結果.算法的主要步驟如下:

1)輸入彩畫圖像, 通過形態學重構處理, 在保留邊界信息的同時, 濾除圖像明暗噪聲.

2)通過網絡搜索確定最佳分割步長與緊湊度, 對去噪圖像使用SLIC算法獲取超像素分割結果.

3)融合超像素區域內多色彩空間的顏色矩特征, 并采用PCA算法進行特征降維.

4)通過MISSA算法尋找最優訓練參數, 使用SVM獲取精確分類結果.

5)利用ArcGIS軟件對分類結果進行矢量化.

1.1 圖像預處理

1.1.1 圖像去噪

形態學重構[4]通常用來突出圖像中與掩膜圖像相一致的部分, 同時忽略圖像中其它對象.因此, 通過與腐蝕、求補運算相結合, 可對圖像進行雙邊濾波, 去除圖像明暗噪聲, 并保留重要的區域輪廓信息.其計算公式如下:

I1=reconstruct(I,IΘg)

(1)

I2=reconstruct(R1,R1Θg)

(2)

其中:I為圖像某一波段的灰度圖像,g為結構元素,R1為圖I1的補像.式(1)實現了對圖像亮部噪聲的剔除, 式(2)則通過補像實現了圖像暗部噪聲的剔除.最后, 對I2進行求補, 即可得到去噪圖像.

1.1.2 超像素分割

超像素分割算法利用相鄰像素間的特征相似性將像素組合成具有一定視覺意義的不規則像素塊, 用少量的超像素來代替像素表達圖片特征, 極大地降低了圖像后處理的復雜度, 是目前常用的圖像分割預處理方法.常用的超像素分割方法主要有分水嶺算法[5]、均值漂移算法[6](Mean Shift)與簡單線性迭代聚類算法[7](simple linear iterative clustering, SLIC)等, 其中, SLIC算法因結構簡單、結果緊湊且貼合邊緣, 是目前最常用的超像素分割算法之一.本文通過網絡搜索確定SLIC算法分割步長與緊湊度參數, 以小塊樣本區域的邊界重疊度作為適應度指標, 采用過分割策略獲取超像素結果, 以保證分割的準確性.

1.2 特征提取與降維

1.2.1 多色彩空間的區域顏色矩

彩畫圖像超像素區域分類主要依靠色彩特征的差異.不同漆料色彩的RGB值差異明顯, 但光照變化等因素造成的漆面反光與邊緣模糊問題會嚴重影響分類效果.為降低光照等因素的影響, 本文引入了顏色屬性與光照強度獨立的CIE-Lab和YCbCr色彩空間, 共選取R,G,B,L,a,b,Y,Cb,Cr,Gray(0.2989R+0.587G+0.114B)共10個顏色分量用于后續的區域色彩統計.

由于圖像顏色信息主要分布于低階矩中, 所以一般采用一階矩(均值,Mean)、二階矩(方差,Variance)、三階矩(偏斜度,Skewness)便足以表達圖像的顏色分布[15].因此, 本文選擇以上3種顏色矩統計超像素區域的色彩特征.計算公式如下:

(3)

(4)

(5)

其中:N為一超像素區域內像素總數,Colori為超像素區域內第i個像素的某顏色分量值.

1.2.2 特征降維

當特征維數增加, 后續分類計算的復雜程度也會相應增加, 對SVM分類的效率與精度影響極大.因此, 對特征進行適當的降維十分必要.本文采用目前常用的主成分分析(PCA)方法, 通過線性投影將高維特征映射至低維空間, 并保證同一維度上特征的方差最大, 以使用較少的特征維度, 保留盡可能多的特征信息.

1.3 多策略改進麻雀搜索算法

本文針對麻雀搜索算法存在種群缺乏多樣性、易陷入邊界計算、早熟收斂與收斂速度慢等問題做出了改進.

1.3.1 Tent混沌映射改進種群初始化

假設種群中存在n只麻雀, 變量搜索空間為d維, 則初始化種群與適應度可表示為:

原SSA算法通過偽隨機數生成器初始化種群位置, 但偽隨機函數生成器的不確定性會嚴重降低種群的多樣性.混沌映射由于具有非線性、遍歷性與長期不可預測性等特點, 常被用于替代偽隨機數生成器來優化搜索.本文采用了其中性能較好的Tent混沌映射模型, 通過建立映射關系將混沌序列轉換至變量空間以替代原始種群.其計算公式如下:

xi,j=bu-(bu-bl)*ri

(6)

(7)

其中:r0為[0, 1]范圍內的隨機數,ri為第i個初始參數取值,a為(0, 1)范圍內的常數,xi,j為第i個個體在第j維的位置,bu為變量上界,bl為變量下界.

1.3.2 引入冪數級遞減慣性權重的發現者位置更新公式

麻雀種群中, 發現者具有高適應度, 搜索范圍更廣, 負責引導種群的覓食行為.為了平衡算法的全局搜索與局部開發能力, 本文在發現者位置更新公式中引入了冪數級遞減的慣性權重.改進后位置更新公式為:

(8)

(9)

1.3.3 加入者位置更新公式

加入者的適應度相對較低, 會跟隨發現者與其競爭食物, 或飛往其它區域進行覓食.其位置更新公式如下:

(10)

1.3.4 引入警戒解除機制的警戒者位置更新公式

警戒者負責擴散警戒信號, 一般選取種群中10%~20%的個體負責預警, 其位置更新公式如下:

(11)

其中:β為控制步長, 服從均值為0, 方差為1的正態分布;k為[-1, 1]范圍內的隨機數;ε設置為一極小常數, 以避免除零錯誤;fi為當前個體的適應值,fb與fw則分別表示目前最優與最差適應值.當fi≠fb時, 個體位于種群外圍, 需飛往種群中心; 當fi=fb時, 個體位于種群中心, 它將向臨近個體靠近, 遠離捕食者.

警戒者的存在是為了提升種群的全局搜索能力, 但原SSA算法中警戒者的數量固定, 會使算法后期的收斂速度變慢.本文采用線性遞減策略調節警戒者比例, 其計算公式如下:

(12)

其中:Smax與Smin為警戒者的數量范圍.

1.3.5 線性遞減的最優個體T分布變異

本研究引入以迭代次數t為自由度的T分布隨機算子對最優麻雀個體的位置進行擾動, 以防止種群陷入局部最優解.計算公式如下:

(13)

(14)

當fi≥fb時, 執行以上變異運算, 其中:r為(0, 1)范圍內的隨機數,T(t)為以迭代次數t為自由度的T分布隨機數,pmax與pmin為變異概率的取值范圍.

1.3.6 隨機回歸的越界處理

在SSA中, 由于麻雀運動的隨機性, 常出現位置越界導致邊界計算, 缺乏對邊界鄰域的搜索.本文使用一種隨機回歸的越界處理改善該問題, 公式如下:

(15)

其中:bu與bl分別為變量x在數值的上界與下界,r為(0, 1)范圍內的均勻分布隨機數.這一處理方法會使越界回歸具有一定的彈性, 而不是單一的賦值變量的上下界, 提高了種群的多樣性.

1.3.7 MISSA算法實現步驟

多策略改進麻雀搜索算法(MISSA)的運算步驟如下.

Step1: 根據公式(6)初始化種群與MISSA參數: 種群數量popsize、最大迭代次數TMax、搜索參數的上下界bu與bl、慣性權重范圍wmax與wmin、發現者比例Pd等參數.

Step2: 計算初始種群適應度并排序, 記錄最優、最差適應度個體位置與適應度值:Xbest,fbest,Xworst,fworst.

Step3: 根據公式(9)與公式(12)計算慣性權重與警戒者數量:w,S.

Step4: 根據公式(8)更新發現者位置.

Step5: 根據公式(10)更新加入者位置.

Step6: 根據公式(11)更新警戒者位置.

Step7: 根據公式(14)計算變異概率, 根據公式(13)計算最優個體擾動后位置.

Step8: 根據公式(15)進行越界后的邊界計算.

Step9: 更新適應度值并排序, 更新最優、最差適應度個體位置與適應度值:Xbest,fbest,Xworst,fworst.

Step10: 循環Step3-Step4, 判斷是否滿足條件, 滿足則跳出循環.

Step11: 算法結束, 返回最優參數與適應度.

2 實驗與分析

2.1 實驗數據

本研究中使用的彩畫圖像屬典型的昆明別子彩畫樣式[16], 像片通過貼近攝影測量方式采集于昆明市龍泉觀道教古建筑群.實驗采集設備為DJI Mini, 其相機焦距24 mm, 傳感器尺寸1/2.3英寸, 拍攝中心距物面約5米, 采集了6個梁枋彩畫對象共522張圖像.采用Context Capture軟件對影像進行三維建模并生成正射影像, 再利用Photoshop軟件裁剪彩畫主體.影像三維建模結果示例如圖1所示.

圖1 影像三維建模示例圖

本文的實驗環境為: AMD Ryzen-5六核CPU、16G內存、Windows10操作系統、MATLAB 2018b、libsvm 3.25、Context Capture 10.17、ArcGIS 10.5.

2.2 顏色矩特征組合分類結果對比

為驗證多色彩空間顏色矩特征不同組合方式對于分割精度的影響, 本文對各單一色彩空間的色彩及其組合方式、降維處理進行精度對比.通過人工篩選得到損失參數c為1, 高斯核函數參數g為0.1, PCA取貢獻率大于0.1%的主成分特征向量進行降維.單一方法與不同組合方法的分類性能對比如表1所示.

表1 不同特征組合分類精度對比

從表1中可以發現, 利用單一色彩空間的均值進行分類, 分類精度平均可達到94.7%.通過結合不同色彩空間特征, 分類精度較單一RGB提升約1.9%.而整合全部顏色矩特征后, 特征維數達到30維, 此時分類精度最高, 達97.996%, 但分類效率明顯下降.通過主成分分析進行特征降維后, 特征維數下降至5維, 分類精度幾無損失, 且分類用時明顯降低.實驗表明, 通過融合多色彩空間特征, 改善了單一色彩空間因光照等因素造成的局限性, 并且在使用低階顏色矩統計特征并進行PCA降維后, 分類精度與效率有明顯提高.

2.3 改進麻雀優化SVM分析

本文通過多種改進策略來平衡與進一步挖掘SSA算法的全局搜索與局部開發能力, 豐富種群多樣性, 提升算法收斂效率.為驗證改進算法的優化性能, 將本文改進算法與PSO算法、WOA算法、SOA算法及原SSA算法進行對比.通過3折交叉驗證的驗證精度作為適應度值, 對一尺寸為831*217像素, 共3687個超像素的小尺寸彩畫圖像分別進行10次實驗, 取最優與平均精度及平均用時進行對比.為降低優化算法的時間成本, 引入了精度停滯退出機制, 當精度停滯增長num次后即跳出迭代.實驗圖像共有8個色彩類別, 各類別均勻采樣15個樣本.算法公共參數設置為num=20,TMax=100,Popsize=20,c∈[0.1, 100],g∈[0.01, 10]; PSO算法參數設置為c1=2,c2=2; WOA算法參數設置為b=0.8; SOA算法參數設置為fc=2,u=1,v=1; SSA算法參數設置為ST=0.6,Pd=0.7,S=0.2; 本文算法算法參數設置為a=0.7,n=2,r1, 0=0.8,r2.0=0.1,w∈[0.4, 0.9],p∈[0.2, 0.5],ST=0.6,Pd=0.7,S∈[0.05, 0.2].各算法優化性能對比如表2所示.

表2 各優化算法性能對比

通過分析可得, SSA算法在分類精度上明顯優于PSO經典算法, 在平均耗時、精度均值與方差上優于WOA等新型最優化算法, 體現出SSA算法在運算速度與輸出穩定性上的優勢.此外, 本文算法在精度上相較于原SSA算法提升約0.03%, 精度方差提升約0.14%, 且用時上節省0.17 s.實驗表明本文算法較原SSA算法進一步改善了算法優化性能與穩定性, 加快了算法的迭代收斂速度, 相較于原算法在穩定性與收斂速度上表現出明顯優勢.

2.4 彩畫圖像分割結果對比

本文從數據集中選取了兩幅不同規模的彩畫圖像進行實驗, 圖像信息如表3所示.將本文算法與PSO-SVM[11]、GA-PSO-SVM[17]、原SSA-SVM[14]以及PSO-RF進行對比實驗.其中基于SVM的算法訓練參數依舊采用2.3小節的設置, PSO-RF算法的PSO參數與PSO-SVM一致, RF的超參數取值為決策樹棵數范圍[5, 50], 屬性特征集大小范圍[5, 20].圖像分類結果的精度評價采用總體分類精度與Kappa系數進行評價, 各算法分類結果對比如圖2與表4、表5所示.

表3 實驗圖信息

表4 圖1各算法分類性能對比

表5 圖2各算法分類性能對比

圖2 各算法分類結果

分析表中數據可發現, PSO-RF實驗精度僅次于本文算法, 但由于決策樹規模對分類效率的影響, 導致其處理效率極其低下.綜合實驗數據來看, 本文算法分割精度最高, 分類效率也優于其它對比算法, 總體分類精度分別高于原SSA算法3.13%與5.87%, Kappa系數優于原算法0.073 8與0.065 8, 迭代次數與原算法相近的情況下, 分類用時節省了2.08 s與1.41 s, 效率提升約27%.

2.5 分割結果矢量化

將彩畫分割結果進行矢量化后, 可對彩畫的圖案、輪廓與色彩信息更加便捷地保存與分析.本文將修正后的分割結果輸出為類別掩膜, 利用ArcGIS軟件將其轉換為矢量面要素, 并進行坐標校正與適當平滑, 可將分割后的柵格信息轉換為以*.shp與*.dwg格式保存的矢量數據文件.轉換結果如圖3所示.

圖3 圖像矢量化結果

2.6 結果分析

通過分析上述實驗結果, 大致可發現以下問題:

1)本文基于邊界重疊度網絡搜索超像素分割最優參數的方法極為有效, 可直接做到以樣本最小目標尺度進行圖像過分割.但由于未加入任何融合策略, 還無法實現多尺度分割, 須在今后的研究中加以改善.

2)融合多個色彩空間低階矩特征的分類結果有明顯改善, 通過利用分離亮度與色相的lab與YCbCr色彩空間信息, 降低了過曝等圖像噪聲影響.再通過適當的特征降維, 可有效提高分類的精度與效率.

3)整體來看, 本文提出的算法在原SSA算法基礎上, 通過改善種群多樣性與平衡全局與局部搜索能力等措施, 在算法穩定性與效率上改進效果明顯, 在彩畫分類實驗中表現優異.SSA算法屬新型智能優化算法, 在具體應用上存在大量改進空間, 本文部分改進思路同樣適用于其它群體智能算法應用方向, 并值得深入探究.

4)彩畫圖像分割結果鋸齒化嚴重, 需利用合適的平滑方法, 才能得到輪廓平滑且準確的矢量化結果, 但本文通過軟件人工設定平滑參數的方法較為繁瑣, 難以平衡結果精度與線條精簡間的目的沖突, 這是目前研究中需加以改進的地方.

3 結語

本文通過融合多色彩空間顏色矩統計特征, 改進圖像分割與分類算法, 有效地提升了圖像的分割效率與精度, 為古建筑彩畫等古代藝術的傳承與保護提供了一種新思路, 為建筑彩畫藝術研究提供了新工具, 具有一定的研究與應用價值.

猜你喜歡
彩畫適應度種群
改進的自適應復制、交叉和突變遺傳算法
山西省發現刺五加種群分布
中華蜂種群急劇萎縮的生態人類學探討
清早期 午門西番草三寶珠彩畫
趙丹娜作 巖彩畫《忘卻》
清 碧云寺菩薩殿天花彩畫
中國巖彩畫的開拓者
基于空調導風板成型工藝的Kriging模型適應度研究
崗更湖鯉魚的種群特征
少數民族大學生文化適應度調查
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合