?

主成分分析的圖像壓縮與重構

2012-09-27 01:42姜虹
電子設計工程 2012年5期
關鍵詞:維數特征向量特征值

姜虹

(西安工業大學 計算機科學與工程學院,陜西 西安 710032)

主成分分析的圖像壓縮與重構

姜虹

(西安工業大學 計算機科學與工程學院,陜西 西安 710032)

針對圖像占用空間大,特征表示時維數較高等的缺點,系統介紹了主成分分析(PCA)的基本原理。提出了利用PCA進行圖像數據壓縮與重建的基本模型。實驗結果表明,利用PCA能有效的減少數據的維數,進行特征提取,實現圖像壓縮,同時并根據實際需要重建圖像。

圖像壓縮;PCA;圖像重建;特征提取

目前數字圖像的數據量呈爆炸型增長,占用大量的存儲和傳輸等資源,主要是由于圖像數據中的相鄰像素的相關性高,圖像數據表示中存在著大量的冗余;與此同時在圖像的特征表示的過程中,維數很高,使人難以理解數據之間的關系,使得存儲、傳輸、處理變得更加困難,在處理、計算過程中必須分配很大的存儲空間以及消耗大量的計算時間,高維數據處理成了問題的瓶頸。壓縮后的圖像傳輸到目的地后,要經過解壓縮恢復到原圖像才可以使用,因此有必要對壓縮的圖像和數據進行重構。目前壓縮算法有很多,比如JPEG[1-2],JPEG2000[3-4],基于小波的相關壓縮方法[5-7]。

文中采用的主成分分析(PCA)方法能夠除去圖像數據的相關性,將圖像信息濃縮到幾個主要成分的特征圖像中,有效地實現了圖像的壓縮;同時可以根據主成分多少恢復不同的數據圖像,滿足不同層次對圖像壓縮與重建的需要。

1 PCA的基本原理

主成分分析(Principal Components Analysis,PCA)是用幾個較少的綜合指標來代替原來較多的指標,而這些較少的綜合指標既能盡多地反映原來較多指標的有用信息,且相互之間又是無關的。PCA的中心目的是將數據空間降維以排除眾多信息共存時互相重疊的冗余信息,是將原變量進行坐標變換,使少數幾個新變量是原有諸變量的線性組合。同時,這些新變量要能有效地表示原變量表達的數據結構而不丟失或盡量少丟失信息,且新變量互不相關。通過PCA處理的圖像信息往往能夠保留住更多的數據的最重要方面。

主成分分析的基本原理是選擇樣本點分布方差大的坐標軸進行投影,使維數降低而信息量損失最小。給定數據矩陣Xm×n(通常m>n),它由一些中心化的樣本數據{xi}mi=1構成,其 中xi∈Rn且 :

原圖像數據A如果沒有經過中心化,即式(1)不成立,則應對數據A進行標準化處理。即對每一個指標分量作標準化處理,即:

其中樣本均值和樣本標準差:

得到X=(xij)m×n。

PCA通過式(2)將輸入數據矢量xi變換為新的矢量

其中:U是一個n×n正交矩陣,它的第i列Ui是樣本協方差矩陣的第i個本征矢量。

換句話說,PCA求解如下的本征問題:

其中λ是C的一個本征值,ui是相應的本征矢量。當僅利用前面的P個本征矢量時 (對應本征值按降序排列),PCA變換可以表示為:

其中S稱為主分量,最大特征值λ對應的最大特征向量μ就是第一個主成分,這個特征向量就是數據有最大方差分布的方向。第二主成分也就是第二大特征值對應的特征向量,數據點沿著這個方向方差有第二大變化,且這個特征向量與第一個是正交的。

PCA變換矩陣U是按特征值λ大小排列的相應特征向量u組成的變換核矩陣,由于能量主要集中于特征值λ大的系數中,如果只用特征值較大的前 k(k<(n×n))個主分量來近似表示S,即丟掉對應于特征值λ較小的系數,則對圖像質量不會有大的影響。即用前k個最大的特征值對應的k個特征向量構成新的變換矩陣Uk做一新的變換。

可由k維向量Sk(稱為主分量)代替原來的n×n維向量S。式(8)就稱為圖像的主分量表示。這就是標準的PCA,這種標準化方法有效地減少了數據量綱對數據提取的影響,它廣泛應用于圖像特征選擇和表示、圖像數據壓縮等方面。

2 主成分分析的圖像重建

主成分分析中主分量Sk相對于S其維數減少了n×n-k維,作反變換得到原圖像A的降維重建值A:

上式表明,如果k=n×n(即所有的特征向量都用于變換),則誤差為零。而如果選用k個具有最大特征值得特征向量組成變換矩陣Uk,則從圖像的降維重建和均方差誤差降至最小來說,PCA變換是最佳的。

主成分變換的運算是求輸入矢量構成的協方差矩陣的特征值與特征矢量。將所獲得的n個指標(每一指標有m個樣品)的一批數據表示成m×n維數據矩陣:

對矩陣A作標準化處理,即對每一個指標分量進行標準化處理,利用公式(2),從而得到矩陣 X=(xij)m×n。

運用Jacobi迭代方法計算R的特征值λ1,…,λn,即對應的特征向量v1,…,vn,特征值按降序排序(通過選擇排序)得≥…≥并對特征向量進行相應調整得,…,。通過施密特正交化方法單位正交化特征向量,得到α1,…,αn。計算特征值的累積貢獻率 B1,…,Bn,根據給定的提取效率 p,如果 Bt≥p,則提取t個主成分α1,…,αt。計算已標準化的樣本數據X在提取出的特征向量上的投影 Y=X·α,其中 α=(α1,…,αt)。 所得的Y即為進行特征提取后的數據也就是數據降維后的數據。

由式(12)可得重建圖像X,反變換公式如下:

由式(10)計算樣本矩陣的相關系數矩陣:

3 實驗結果

PCA并非針對單一樣本,對于一副圖像而言,可以將圖像分割成很多塊(image patches),將這些小圖像塊作為樣本,并且假設這些樣本有著共同的成分。將一副圖像分割成許多小圖,并假設這些圖有著相關性,且這些假設在大部分情況下都成立,圖3使用圖flower.jpg圖,大小為576×576。分割成12×12的塊,共有576個樣本,經PCA運算后,取前48個主分量畫出其特征分布圖,如圖1所示;并由得出的主成分特征矩陣求出不同特征數下特征累計貢獻率的變化趨勢圖,如圖2所示;由此看出,伴隨著特征數的增加其累積貢獻率也隨著增加,當特征數增加到一定數量后,特征數量的增加對累計貢獻率和圖像重建效果的影響不是很大。

圖1 前48個主分量的分布圖Fig.1 The distribution of the prior 48 principal components

圖2 特征累計貢獻率圖Fig.2 The cumulative contribution rate chart of these features

根據運算特出的主分量,分別取前k個不同的主分量得到不同的重建圖像,如圖3所示。

圖3 不同主成分條件下圖像的重建Fig.3 Image reconstruction of different principal components

4 結 論

PCA能有效地減少數據的維數,并能使提取成分與原始數據的誤差達到均方最小,可用于用于數據的壓縮和模式識別的特征提取。特別是隨著多媒體圖像數據信息技術的發展,豐富的圖像媒體蘊藏著大量的信息,為了有效地存儲和傳輸這些圖像數據,圖像壓縮技術越來越受到重視。文中提出的基于PCA的圖像壓縮與重建,經試驗結果表明,實現方法簡單,能有效地實現圖像的壓縮;同時可以根據主成分多少恢復不同的數據圖像,滿足不同層次對圖像壓縮與重建的需要。

[1]張元偉,劉彥隆.基于JPEG標準的靜態圖像壓縮算法研究[J].電子設計工程,2010,18(2):78-80.

ZHANG Yuan-wei,LIU Yan-long.Research of static image compression algorithm based on JPEG standard[J].Electronic Design Engineering,2010,18(2):78-80.

[2]鄭崴,苗青林.圖像壓縮技術JPEG的分析[J].河南科技學院學報,2010,38(3):123-126.

ZHENG Wei,MIAO Qing-lin.Analysis of JPEG of image compression technology[J].Journal of Henan Institute of Science and Technology,2010,38(3):123-126.

[3]吳濤,畢篤彥.JPEG2000圖像壓縮算法研究[J].計算機應用與軟件,2007,24(9):155-156.

WU Tao,BI Du-yan.Study of wavelet based JPEG2000 image compression algorithm[J].Computer Applications and Software,2007,24(9):155-156.

[4]Christopoulos C,Skodr as A,Ebrahimi T.The JPEG2000 still image coding system:an over view[J].IEEE Transactions on Consumer Electronics,2000,46(4):1103-1127.

[5]尚曉清,宋國鄉,徐發國.基于小波變換的簡單變長編碼圖像壓縮方法 [J].西安電子科技大學學報,2002,29(1):96-99.

SHANG Xiao-qing,SONG Guo-xiang,XU Fa-guo.A new SVLC scheme for image compressing based on wavelet transform[J].Journal of Xidian University,2002,29(1):96-99.

[6]Eslami R,Radha H.Wavelet-based contourlet transform and its application to image coding[C]//Proceeding of IEEE International Conference on Image Processing,Singapore:IEEE,2004:3189-3192.

[7]Eslami R,Radha H.New image transform using hybrid wavelets and directional filter banks:analysis and design[C]//Proceeding of IEEE Inter national Conference on Image Processing.[s.l.]:IEEE,2005:733-736.

Image compression and reconstruction of PCA

JIANG Hong
(School of Computer Science and Engineering,Xi’an Technological University,Xi’an710032,China)

Point to the weakness of space-consuming and higher dimension when featuring the images of the traditional method, the article introduced the basic principles of principal component analysis (PCA), established a basic model of a image data compression in use of PCA.Experimental results show that PCA can effectively reduce the data dimension,

implement feature extraction,realize the image compression,and reconstruct image to meet the actual needs.

image compression; Principal Components Analysis; image reconstruction; feature extraction

TP391.41

A

1674-6236(2012)05-0126-03

2011-12-29稿件編號:201112158

西安工業大學校長基金(XGYXJJ0529)

姜 虹(1977—),女,陜西西安人,碩士,講師。研究方向:軟件工程、智能信息處理。

猜你喜歡
維數特征向量特征值
二年制職教本科線性代數課程的幾何化教學設計——以特征值和特征向量為例
β-變換中一致丟番圖逼近問題的維數理論
克羅內克積的特征向量
一類內部具有不連續性的不定Strum-Liouville算子的非實特征值問題
一類帶強制位勢的p-Laplace特征值問題
單圈圖關聯矩陣的特征值
一類齊次Moran集的上盒維數
一類特殊矩陣特征向量的求法
EXCEL表格計算判斷矩陣近似特征向量在AHP法檢驗上的應用
基于商奇異值分解的一類二次特征值反問題
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合