?

多媒體壓縮編碼技術研究

2009-09-29 08:58劉玲媛
新媒體研究 2009年14期

劉玲媛

[摘 要]多媒體技術的發展使圖像信息逐漸成為交互的主要內容之一。解決圖像存儲與傳輸問題的壓縮編碼技術一直以來是國內外研究的熱點,從數據各種編碼方法的發展方向反映圖像壓縮編碼技術的飛速發展。主要介紹各種壓縮編碼技術的必要性、可能性、壓縮的過程,分類及各自的優缺點。

[關鍵詞]數據壓縮 圖像壓縮 編碼方法

中圖分類號:TP3 文獻標識碼:A 文章編號:1671-7597(2009)0720041-02

一、多媒體數據壓縮的必要性

進入信息時代,人們將越來越依靠計算機獲取和利用信息。多媒體計算機系統是現代計算機發展一個主流方向。數字化后的視頻和音頻等媒體信息具有數據海量性,與當前硬件技術所能提供的計算機存儲資源和網絡帶寬之間有很大差距。這樣,就對多媒體信息的存儲和輿造成了很大的困難,成為阻礙人們有效獲取和利用信息的一個瓶頸。以一個陸地衛星的為例:其水平、垂直分辨率分別為2340和3240,四波段、采樣精度7位,它的一幅圖像的數據量為2340*3240*7*4=212Mbit,按每天30幅計,每天數據量為212*30=6.6Gbit,每年的數據量高達2300Gbit。

二、多媒體數據壓縮的可能性

圖像壓縮的目的是為了減少需要保存或傳輸的數據量,但這應以不破壞原有圖像的信息為根本原則,否則,這種壓縮就失去了數據壓縮的意義。研究發現,圖像數據表示中存在著大量的冗余。通過去除這些冗余數據可以使原始圖像數據極大地減少,而不會對圖像品質產生很大影響,從而解決圖像數據量巨大的問題。而圖像數據冗余情況常見的有以下幾種:空間冗余、時間冗余、結構冗余、知識冗余、視覺冗余、圖像區域的相同性冗余、紋理的統計冗余。圖像數據壓縮技術就是采取一定的策略從原始信息中找出并去掉這些冗余中的一種或幾種,以達到壓縮的目的。

三、圖像壓縮的一般過程

圖像壓縮處理一般是由兩個過程組成的:一是編碼過程,即將原始數據經過編碼進行壓縮,以便于存儲與傳輸;二是解碼過程,此過程對編碼數據進行解碼,還原為可用的數據。

四、壓縮的分類

多媒體數據壓縮方法根據不同的依據可產生不同的分類。第一種,根據質量有無損失可分為有損編碼和無損編碼。第二種,按照其作用域在空間域或頻率域上分為:空間方法、變換方法和混合方法。第三種:根據是否自適應分為自適應性編碼和非適應性編碼。

五、多媒體數據編碼分類

六、常用的圖像壓縮技術編碼方法簡介

(一)脈沖代碼調制(PCM)

它實際上是連續模擬信號的數字采樣表示。PCM編碼器和解碼器位于一個圖像編碼系統的起點和終點。它們實際上分別是A/D轉換器和D/A轉換器。其它的編碼方法都是在多媒體數據模擬信號經過PCM編碼后再進行的壓縮編碼方法。

(二)預測編碼

編碼器記錄與傳輸的不是樣本的真實值,而是它與預測值的差。這一方法稱為DPCM方法。預測編碼方法原理,是從相鄰像素之間有強的相關性特點考慮的。比如當前像素的灰度或顏色信號,數值上與其相鄰像素總是比較接近,除非處于邊界狀態。那么,當前像素的灰度或顏色信號的數值,可用前面已出現的像素的值,進行預測(估計),得到一切預測值I估計值)將實際值與預測值求差,對這個差值信號進行編碼、傳送。預測編碼主要是減少了數據在時間和空間上的相關性,因而對于時間序列數據有著廣泛的應用價值。在數字通信系統中,例如語音的分析與合成,圖像的編碼與解碼,預測編碼已得到了廣泛的實際應用。

預測編碼方法分線性預測和非線性預測編碼方法。線性預測是預測器中預測系數是固定不變的常數?;陬A測技術的幀間預測編碼技術處理的對象是序列圖像(運動圖像)。利用幀間的時間相關性進一步消除圖像信號的冗余度,提高壓縮比。它也有兩種編碼方法是:條件補充法和運動補償技術。

(三)變換編碼

變換編碼不是直接對空域圖像信號編碼,而是首先將空域圖像信號映射變換到另一個正交矢量空間,產生一批變換系數,然后對這些變換系數,進行編碼處理。變換編、解碼過程示意圖:

變換編碼技術已有近30年的歷史,廣泛應用于各種圖像數據壓縮,諸如單色圖像、彩色圖像、靜止圖像、運動圖像,以及多媒體計算機技術中的電視幀內圖像壓縮和幀間圖像壓縮等。

正交變換的種類很多,如傅里葉變換、沃爾什變換、哈爾變換、斜變換、余弦變換、正弦變換、K-L變換等。最佳的正交變換是K-L變換。次最優的正交變換是DCT變換。變換編碼方案把N*N像素的圖像分割成n*n像素的子圖像,然后對每個子圖像的進行單位變換。單位變換是一種可逆的線性變換。變換的目的是去除原始信號中像素間的相關性。這種去除相關的操作一般會亂信號能量僅在一小組傳輸系數上重新分布,利用這種方法,許多數可以在量化之后,可以借助于對比度敏感函數達到視覺上的無損壓縮。

在圖像壓縮中應用變換,應有如下的特性:

1.減少圖像相關:理想的變換是將完全消除圖像塊中數據的相關。

2.基本函數與圖像無關:由于圖像間的統計特征變化大,最佳的變換通常依賴于圖像本身,所以一般用于圖像無關的基本變換函數來替換最有性能變換。

3.快速實現:n點的變換所需的操作一般是O(n2)。一些變換有快速實現的算法,其操作次數可以減少為O(nlogn)。

(四)統計編碼

如果要求在編碼過程中不丟失信息量,即要求保存信息熵,這種信息保持編碼又叫做熵保存編碼,或者叫熵編碼。熵編碼是無失真數據壓縮,用這種編碼結果經解碼后可無失真地恢復原圖像。

信息量和信息熵。信息是不確定性的量度定義的。一個消息的可能性越小,其信息量越多;而消息的可能性越大,則其信息量越少。所謂信息量是指從N個相等可能事件中選出一個事件所需要的信息度量或含量,也就是在辨識N個事件中特定的一個事件的過程中所需要提問“是或否”的最少次數。例如:要從64個數中選定某一個數,可以先提問“是否大于32”,不論回答是或否都消去了半數的可能事件,這樣繼續問下去,只要提問6次這類問題,就能從64個數中選定某一個數。這是因為每提問一次都會得到1bit的信息量。因此在64個數中選定某一個數所需要的信息量是:log264=6(bit)。如果將信源所有可能事件的信息量進行平均,就得到信息的“熵”,熵就是平均信息量。

香農信息論認為,信源所含有的平均信息量(熵)就是進行無失真編碼的理論極限。低于此極限的無失真編碼方法是找不到的,而只要不低于此極限,那就總能找到某種適宜的編碼任意地逼近熵。信源中或多或少的含有自然冗余度,這咱冗余既來自于信源本身的相關性,又來自于信源概率分布的不均勻性中。只要找到去除相關或改變概率分布不均勻的方法和手段,也就找到信息熵編碼的方法。因此,如何利用信息熵理論減少數據在傳輸和存儲時的冗余度,就是信息熵編碼所要解決的問題。

利用信息熵進行編碼的方法有多種,有:哈夫曼編碼(利用概率分布特性);行程編碼方法(利用相關特性);算術編碼(利用概率分布)。前兩種方法廣泛用于數據編碼壓縮系統中,并被JPEG列入推薦算法的一部分。

哈夫曼編碼的理論依據是變字長編碼理論。在變字長編碼中,編碼器的編碼輸出漢字是字長不等的碼字,按編碼輸入信息符號出現的統計概率,給輸出碼字分配以不同的字長。對于編碼輸入中,出現大概率的信息符號,賦以短字長的輸出碼字;對于編碼輸入中,出現小概率的信息符號,賦以長字長的輸出碼字。

行程編碼是相對簡單的編碼技術,主要思路是將一個相同值的邊疆串用一個代表值和串長。在進行圖像編碼時,可以定義特定方向上具有相同灰度值的相鄰元為一輪,其延續長度稱之為延續的行程,簡稱“游程”。游程的終點位置由前一游程的綹位置確定,這樣就可以由串來表示圖像數據。

算術編碼比哈夫曼編碼、行程長度等熵編碼方法都復雜,但是它不需要傳送像哈夫曼編碼的哈夫曼碼表,同時算術編碼還有自適應能力的優點,所以算術編碼是實現高效壓縮數據中很有前途的編碼方法。它是將被編碼的信息表示成實數0和1之間的一個間隔。這種編碼方法的實現要比哈夫曼編碼能提高5%左右的效率。

七、結束語

壓縮技術的發展同社會的需求息息相關,壓縮標準也是越來越多,基于知識的編碼和語義編碼將是壓縮編碼的發展方向,隨著數學理論、信息論以及計算機視覺理論等的發展,必然會有一些更新的、功能更全面的,效率更的高的壓縮編碼方法出現。

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合