?

基于字典學習的機織物圖像重構

2016-04-20 06:45毛兆華萬賢福1b卜佳仙
關鍵詞:信息熵

毛兆華, 萬賢福, 汪 軍, 1b, 周 建, 卜佳仙,

陳 霞1a, 1b, 李立輕1a, 1b

(1. 東華大學 a. 紡織學院; b. 紡織面料技術教育部重點實驗室, 上海 201620;

2. 江南大學 紡織服裝學院, 江蘇 無錫 214122)

?

基于字典學習的機織物圖像重構

毛兆華1a, 萬賢福1a, 汪軍1a, 1b, 周建2, 卜佳仙1a,

陳霞1a, 1b, 李立輕1a, 1b

(1. 東華大學 a. 紡織學院; b. 紡織面料技術教育部重點實驗室, 上海 201620;

2. 江南大學 紡織服裝學院, 江蘇 無錫 214122)

摘要:首先對機織物圖像進行窗口分割,將每個窗口展開成列向量,所有列向量聯合組成一個矩陣;然后對該矩陣進行字典學習,得到個數最佳的字典,即基向量;最后應用該字典對待檢測樣本進行近似,并設計了基于信息熵的指標對原圖像與近似圖像之間的近似程度進行量化.重點探討了字典模型類型和字典個數對圖像重構效果的影響.結果表明,所提出的字典學習方法能夠對機織物很好地近似,此外,有約束求解字典的模型對圖像重構的效果優于無約束模型.

關鍵詞:機織物; 圖像重構; 字典學習; 紋理表征; 字典個數; 信息熵

自然界中事物的紋理多種多樣,紋理分析一直是計算機視覺的核心研究內容之一.對機織物圖像進行重構的實質是尋找機織物的紋理信息.由于圖像紋理的多樣性與復雜性,目前對圖像紋理的定義還不是特別精確,因此,所用的紋理分析方法也是建立在對紋理的不同理解的基礎上,其大體分為4大類[1]:基于結構[2-3]、基于統計[4-5]、基于模型[6-7]和基于信號處理[8-10],前3類都是基于空間域,最后1類是基于頻率域.基于統計的方法通過定義一些統計量來對紋理結構在空間分布上的統計特征進行描述,該類方法包括灰度共生矩陣法、灰度直方圖統計法,以及直接從像素灰度值中計算圖像的一些直觀統計量,如均值、標準差、熵等.基于結構的方法將紋理視為由許多結構基元在空間上的重復排列所形成,以結構基元為基礎進行紋理描述.基于模型的方法以數學模型對產生紋理的隨機過程進行建模描述,主要方法有隨機場模型法、分形模型法等.基于信號處理方法則直接將紋理圖像視為一維或二維的信號,以數學變換為主將紋理信息從空間域變換到頻率域對紋理進行描述,主要有傅里葉變換方法、小波變換方法等.

傅里葉變換和小波變換等頻域分析方法的出現為機織物圖像的重構提供了有效的工具.前者采用正弦或余弦函數作為基函數對信號進行表達;后者采用滿足一定條件下的小波基對信號進行表達.然而,由于傅里葉變換和小波變換皆采用固定的字典(基向量),在對特征各異的信號進行表達時,對信號內容的適應性并不總是很理想,尤其是對高維信號的表達.近年來,使用字典學習進行信號的表達受到了廣泛的關注,特別是在計算機視覺領域,與傳統上使用固定的或預先定義的字典表達方法相比,通過學習所得的字典能夠更好地適應信號特征,允許字典學習對輸入信號進行更有效的表達.此外,目前字典學習方法主要應用于數字圖像去噪[11]和人臉識別[12]等方面,很少有研究者將其用于機織物圖像重構方面,因此,本文提出一種基于字典學習的機織物圖像重構的方法.

1基于字典學習的圖像重構原理

在信號處理領域中,信號通??梢苑纸鉃橐恍┗驹鼗蚝瘮档木€性組合來進行表達.對機織物紋理信號線性表達的基本思路是去尋找一些基元素(稱為字典),這些基元素的線性組合可以在一定的約束下對原信號進行最優的近似(重構).

1.1字典學習

設m×n型的數據矩陣X= [x1, x2, …, xn], xi∈Rm,i=1, 2, …,n,其中,n為樣本個數,m為向量維數.在l2范數近似條件下,所要尋找的字典可以寫成如下優化問題:

(1)

式中:D=[d1, d2, …, dk], dj∈Rm為所要學習的字典;k為字典個數;αi∈Rk為X中元素xi的系數向量.對d1, d2, …, dk約束主要是為了限制D中元素值.

顯然,對式(1)進行最小化,也就意味著去尋找這樣一個字典,該字典元素的線性組合能夠對所有樣本xi進行最小平方誤差下的近似.

由于式(1)中D和α皆未知,如何構造D通常被稱為字典學習問題,所得的字典稱為學習字典.

1.2算法原理

將織物圖像分割為一定大小的子窗口,每個子窗口代表一個樣本.在l2范數近似條件下,通過樣本對式(1)進行優化求解,能對所有樣本在最小平方差條件下進行最優近似表達.為了得到預期更好的學習字典,可以對式(1)施加額外的約束或構造新的目標函數,從而獲得很好的表征效果.

1.2.1無約束模型

無約束即是對字典和系數矩陣沒有任何限制條件,在l2范數近似條件下,其構造模型如式(1)所示.

對式(1)進行最小化,所得的學習字典能夠在最小平方誤差下對所有樣本進行最優近似.求解時可以將其中一個變量D或α固定,這樣每一部分都可以看作一個最小二乘問題,使用交替最小化方法進行求解.

若令A= [α1, α2, …, αn]為系數矩陣,則迭代規則為

一直循環,直到‖Di+1Ai+1-DiAi‖F2<ε時停止運算,此時也就得到了學習字典D.

1.2.2非負約束模型

基于重構誤差最小建立數學模型,即

本文采用有效集(activeset)改進的非負矩陣分解算法[13],即基于有效集方法的交替非負最小二乘算法.有效集方法是一個可行點方法,即每個迭代點都要求是可行點,每次迭代求解一個不等式約束的二次規劃.該算法具有優異的收斂性能,故選取該算法來優化學習字典.

在學習階段,本文先把機織物圖像切割成一定大小的子窗口,并視每個子窗口為一個樣本.接著將子窗口樣本按列展成為列向量,并將所有的樣本向量并列組合成為一個矩陣,并記為X.然后,對所得的矩陣實施字典學習并提取最佳個數為k的字典列作為最佳字典元素,D=[d1, d2, …, dk].

(3)

顯然,若要使近似效果最佳,則有必要對所用的學習字典個數進行優選.

2學習字典個數的優選

機織物由相互垂直的經紗和緯紗系統按一定規律交織而成,所形成的織物圖像表面呈現出很強的周期性,即織物像素點間存在大量的相關性.當采用上述優化模型的算法所得的學習字典D進行表達時,通常很小的字典(字典個數k<20)就可以對機織物紋理的主體結構信息進行有效的表征,從而可以很好地近似機織物圖像.

在得到機織物的學習字典之前,首先要確定字典的個數.從式(1)可以直觀看出,學習字典的個數直接決定了重構誤差的大小,即字典個數越多,重構誤差會越小,但字典個數過多時,又會增加計算的復雜性,故本文需要選取一個適中的字典個數.

為了將學習字典對樣本的近似程度進行量化,本文設計了一個稱為近似指數(簡記為E)的量化指標,其定義為

(4)

E所在的區間為0%~100%,當近似樣本與原樣本完全一致時,則E=100%.對于表征而言,E越大表示字典對該種織物的表征能力越強.

為了能清楚說明式(4)中所定義的量化指標的有效性,以平紋織物的樣本為例,近似效果如圖1所示.當k=3時,近似效果幾乎達到90%,此后隨著字典個數的增大,近似效果沒有顯著增加,故可以選定平紋織物最佳字典個數k=3.

圖1 平紋織物的近似指數隨字典個數變化的曲線Fig.1 Approximate index curve of plain fabric with  different dictionary number

3試驗結果與討論

本文試驗中所有測試圖像都來自生產一線,為了方便起見,子窗口大小取32像素×32像素.按織物紋理,將織物圖像分成平紋數據集和斜紋數據集,并采用式(4)提出的量化指標評價近似效果.為了驗證算法的重構效果,本文選用27種不同背景紋理的織物樣本進行統計,共包括平紋樣本數據集60個和斜紋樣本數據集48個,其中每種織物取4個樣本圖像進行測試,共測試平紋樣本240次和斜紋樣本192次.平紋織物和斜紋織物圖像重構的近似指數統計如表1所示.

表1 平紋織物和斜紋織物圖像重構的近似指數統計

由表1可以看出,當k=3時就能對平紋織物圖像進行很好的近似重構,其后隨字典個數的增大,近似指數并未有顯著提高.如圖2所示為平紋織物圖像所得的3個字典元素,這3個字典很明顯地包含了平紋結構的信息,故利用這些字典就可以對相應的平紋織物進行圖像近似.

圖2 平紋織物的學習字典(k=3)Fig.2 Learned dictionary for plain fabric (k=3)

斜紋織物的最優字典個數需要不斷地嘗試來選取.例如對于一些規則度很高的斜紋織物樣本而言,僅需要2個字典元素就可以對機織物圖像近似表達(如圖3所示),所得斜紋織物的學習字典很清晰地展示了斜紋的紋理結構.

圖3 斜紋織物的學習字典(k=2)Fig.3 Learned dictionary for twill fabric (k=2)

由近似指數能明顯得出基于非負約束模型的學習字典的近似效果優于無約束模型.這是因為非負約束使得字典元素都是非負,這就使得一些冗余的無用信息被剔除了,在相同的字典個數情況下,非負約束模型得到的學習字典的有用信息更多,近似效果也較好.

此外,從表1可以觀察到, 有時當k較大時,相應機織物的近似指數反而會較小,即近似效果會稍微變差.這種情況大都出現在無約束模型中,其主要原因是在無約束模型中,字典個數越多時,相應得到的冗余信息也會越多,這樣會使得樣本與原圖像之間的信息熵值比變小.非負約束模型中也會出現這種情況,但是差異很小,這可能是試驗誤差引起的.

為了更直觀地了解機織物圖像的重構效果,在不同字典個數的情況下,平紋樣本和斜紋樣本圖像(圖4所示)的重構效果,如圖5所示.

(a) 平紋織物

(b) 斜紋織物

由圖5可以看出,字典個數越大,織物圖像的近似效果越好,不過當k=5, 7, 9, 11時近似圖像相差不大,這與表1的結果趨勢基本一樣,故沒有必要選取太大的字典個數.因為選取的字典元素過多,不僅重構效果改善不明顯,而且計算量會增加,使得計算時間相應增加,從而影響織物圖像重構的效率.此外,從圖5還可以看出,斜紋織物圖像的重構效果優于平紋織物,與表1中相應的統計結果相吻合,這是因為斜紋織物的紋理比平紋織物規整清晰.

 

 

 

 

4結語

本文在字典學習的基礎上,提出了一種機織物圖像重構的研究方法,著重探討了字典個數對機織物圖像重構效果的影響,并通過構造量化指標——近似指數來進一步確定最佳的字典元素.

試驗結果表明,當k=3時,平紋織物就能得到近似效果比較好的重構圖像,而斜紋織物則需各自探討最佳字典個數.此外,在相同的學習字典個數下,非負約束模型的算法比無約束模型的近似效果好,因為非負約束只存在加法運算,所得字典的有用信息比較多,故近似效果比較好.

當然,本文利用字典學習方法對平紋樣本和斜紋樣本分別重構了240次和192次,考慮到樣本容量和試驗次數對重構結果的影響,下一步可以采集更多的樣本織物來研究相應的圖像重構效果,此外可將本文的近似結果進一步應用于機織物瑕疵檢測的研究.

參考文獻

[1] TUCERYAN M, JAIN A K. The handbook of pattern recognition and computer vision [M].Singapore: World Scientific Publishing Co, 1998:207-248.

[2] 王鋒,焦國太,杜燁.基于數學形態學的織物疵點檢測方法 [J].測試技術學報,2007,21(6):515-518.

[3] 祝雙武,郝重陽,李鵬陽,等.基于紋理結構分析的織物瑕疵檢測方法 [J].計算機應用,2008,28(3):647-649.

[4] 韓立偉,徐德,王麟琨.基于統計信息的織物瑕疵自適應檢測 [J].電子器件,2008,31(3):979-983.

[5] 高曉丁,汪成龍,左賀,等.基于直方圖統計的織物疵點識別算法 [J].紡織學報,2005,26(2):121-123.

[6] CAMPBELL J G,FRALEY C, MURTAGH F, et al. Linear flaw detection in woven textiles using model-based clustering [J]. Pattern Recognition Letters, 1997,18(14):1539-1548.

[7] 步紅剛,黃秀寶,汪軍.基于多分形特征參數的織物瑕疵檢測 [J].計算機工程與應用,2007,43(36):233-237.

[8] 阮秋琦.數字圖像處理學 [M].北京:電子工業出版社,2013:75.

[9] KUMAR A, PANG G K H. Defect detection in textured materials using Gabor filters [J]. IEEE Transactions on Industry Applications, 2002,38(2):425-440.

[10] DUNN D, HIGGINS W E. Optimal Gabor filters for texture segmentation [J]. IEEE Transactions on Image Processing, 1995,4(7):947-964.

[11] 解凱,張峰.基于雙正交基字典學習的圖像去噪方法[J].計算機應用,2012,32(4):1119-1121.

[12] 朱杰,楊萬扣,唐振民.基于字典學習的核稀疏表示人臉識別方法[J].模式識別與人工智能,2012, 25(5):859-864.

[13] KIM H, PARK H. Nonnegative matrix factorization based on alternating nonnegativity constrained least squares and active set method [J].Society for Industrial and Applied Mathematics, 2008,30(2):713-730.

Woven Fabric Image Reconstruction Based on Dictionary Learning

MAOZhao-hua1a,WANXian-fu1a,WANGJun1a, 1b,ZHOUJian2,BUJia-xian1a,CHENXia1a, 1b,LILi-qing1a, 1b

(a. College of Textiles; b.Key Laboratory of Textile Science & Technology, Ministry of Education, 1. Donghua University, Shanghai 201620, China; 2. College of Textiles and Clothing, Jiangnan University, Wuxi 214122,China)

Abstract:Firstly, normal woven fabric image is partitioned into small sub-windows and vectorized into a column vector, then all the column vectors are combined into a matrix. Secondly, the matrix composed of column vectors is solved by dictionary learning, and the optimal dictionary(basis vectors)is extracted. Finally the dictionary is applied to reconstruct testing samples and the entropy-based index is calculated to qualify the proximity between original and reconstruction image. Effects of the model types and number of dictionary on image reconstruction are also investigated deeply. Experiments show that the proposed method of dictionary learning can achieve good approximation performance. In addition, learning dictionary with constraint performs better than unconstraint.

Key words:woven fabric; image reconstruction;dictionary learning; texture characterization; number of dictionary elements size; information entropy

中圖分類號:TS 101.9

文獻標志碼:A

作者簡介:毛兆華(1989—),女,江蘇南通人,碩士研究生,研究方向為機織物瑕疵自動檢測.E-mail:h15006180077@163.com汪軍(聯系人),男,教授,E-mail:junwang@dhu.edu.cn

基金項目:國家自然科學基金資助項目(61379011)

收稿日期:2014 -12-05

文章編號:1671-0444(2016)01-0035-05

猜你喜歡
信息熵
基于信息熵可信度的測試點選擇方法研究
基于信息熵理論研究弩藥對膝骨性關節炎大鼠影響
基于信息熵模糊物元的公路邊坡支護方案優選研究
近似邊界精度信息熵的屬性約簡
基于信息熵賦權法優化哮喘方醇提工藝
一種基于信息熵的雷達動態自適應選擇跟蹤方法
基于RBS故障樹和改進粗糙集信息熵的綠色建筑項目施工進度風險評估
基于信息熵和未確知測度理論的供應鏈風險系數定量測度模型研究
基于信息熵的循環譜分析方法及其在滾動軸承故障診斷中的應用
基于信息熵與變權綜合的城市快速路節點規劃
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合