?

兩描述分布式視頻壓縮傳感

2013-09-17 10:25韓予皖
電視技術 2013年3期
關鍵詞:關鍵幀解碼器解碼

韓予皖,師 衛

(太原理工大學信息工程學院,山西太原 030024)

兩描述分布式視頻壓縮傳感

韓予皖,師 衛

(太原理工大學信息工程學院,山西太原 030024)

為了滿足低功耗視頻設備的低復雜度編碼及無線網絡傳輸的穩定性,提出了兩描述分布式視頻壓縮傳感(2D-DCVS)方案。在編碼端,首先把視頻序列分成兩個子序列,即兩個描述;然后將兩個描述通過分布式視頻壓縮傳感(DCVS)壓縮。由于將運動估計、變換編碼等復雜度較高的運算轉移到解碼端進行,DCVS具有低復雜度編碼的特性。在解碼端包括兩種解碼器,分別是中心解碼器和邊解碼器。當兩個描述都被收到時,中心解碼器能夠恢復出最好質量的視頻;即使僅當一個描述被收到時,那也能夠保證得到一個尚可接受的重建視頻。實驗結果表明,特別當測量率低時,2D-DCVS顯示出了優越性。

2D-DCVS;DCVS;低復雜度編碼

【本文獻信息】韓予皖,師衛.兩描述分布式視頻壓縮傳感[J].電視技術,2013,37(3).

隨著無線網絡和多媒體技術的快速發展,低功耗的無線視頻設備逐漸流行。由于有限的電池能量和內存,以及不穩定的無線網絡,這些設備需要低復雜度的編碼算法和穩定的傳輸。

傳統的視頻編碼算法,例如H.26x,MPEG系列標準,由于這些算法在編碼端采用了運動估計、正交變換、運動補償等,造成了較高的計算復雜度,所以不符合上述要求。然而分布式視頻編碼(DVC)[1],也稱Wyner-Ziv(WZ)視頻編碼,其主要采用了獨立編碼和聯合解碼的編碼框架,具有一定的信道傳輸的魯棒性和低復雜度編碼的特點,近幾年來在圖像/視頻編碼的研究方面,一直是人們研究的熱點課題。DVC把復雜的計算從編碼端轉移到解碼端,因此表現出低復雜度編碼特性。同時,壓縮傳感(CS)[2]理論也激起人們的興趣,能同時進行數據采集和壓縮,其采樣數量遠小于奈奎斯特采樣,通過隨機測量方法,提供一個簡單的編碼和高精確的重構。所以根據DVC和CS各自的特性綜合生成一個新的框架叫做分布式視頻壓縮傳感(DCVS)[3],這不僅減少了視頻壓縮的數據量,而且降低了編碼的復雜度。

近幾年,多描述編碼(MDC)引起了人們的關注,其特點是延時小、無需重傳、易于實時視頻傳輸,適用于互聯網、無線通信網這些不穩定的網絡的實時視頻傳輸,是一種新的面向不可靠信道傳輸的編碼方法。視頻信號被分成多個描述,每個描述通過單獨的信道傳輸。當一些描述丟失時,可以通過收到的描述來估計丟失描述,恢復出質量可接受的視頻;當收到的描述增多時,恢復出的視頻質量變得更好。

為了滿足低耗視頻設備的低復雜度編碼和穩定的傳輸,筆者利用DCVS和MDC各自的特性,綜合生成一種多描述分布式視頻壓縮傳感(MD-DCVS)新的方案。在MDDCVS框架里,為了提高系統的性能,應用了塊壓縮傳感(BCS)、自適應稀疏基和雙邊運動估計補償。

1 壓縮傳感(CS)理論

Donoho[4]和 Candes[5]等人在 2004 年提出了 CS 理論,CS理論是一種全新的信號描述與處理的理論框架,其主要內容在某一變換域內具有稀疏表示的信號,或者是此信號是可壓縮的,就可以基于與變換基不相關的少量線性觀測將變換所得的高維信號投影到一個低維空間上,最后通過求解一個最優化問題,可以從這些少量的觀測值中高概率地恢復出原始信號。

假設信號x為1個RN空間的M×1維列向量,則其可用1組基向量(稀疏基)ΨN×N的線性組合來表示,其數學表達式為[4]

式中:θ表示稀疏系數;信號x具有可壓縮性或稀疏性,信號是可壓縮的是指在允許較少的損失情況下,具有較少的大系數和許多小系數,小系數都是極小或接近于零的數。信號是稀疏的,是指只有K個非零系數,K遠小于N,其余所有系數都為零,這樣還可稱作K-稀疏信號。信號的稀疏基選擇,由信號本身的特點決定,如離散傅里葉變換(DFT)基、離散余弦變換(DCT)基、離散小波變換(DWT)基,都可作為信號的稀疏基。

信號的采樣與壓縮是通過觀測矩陣線性投影實現的,設Φ為M×N(M?N)的觀測矩陣,則長度為N的信號x的觀測值y可由線性測量直接獲得式中:y是M×1的觀測值向量;A=Φ·Ψ為M×N的矩陣;Φ滿足以下的條件:1)受限等距特性準則(RIP)[5];2)非相干性。測量矩陣Φ的列與稀疏基矩陣Ψ的行不能相互表示。x可以憑借這些觀測值,通過貪婪追蹤算法或者轉化為凸優化問題求解,從而精確重建原信號。

2 分布式視頻壓縮傳感(DCVS)

DCVS框架[3]如圖1所示。在編碼端,一個視頻序列由幾組圖像組成,每組圖像包括一個關鍵幀和一些CS幀,關鍵幀可以作為相鄰CS幀的參考幀。在編碼端,每一幀(關鍵幀或者CS幀)都單獨被CS壓縮,而關鍵幀CS測量率比CS幀高。

圖1 DCVS框架

在解碼端,每一關鍵幀可以通過梯度投影稀疏重建(GPSR)[6]算法來恢復,GPSR算法的初始值和迭代終止條件,可以通過視頻序列之間相關性進一步改進。對于CS幀,首先根據已解碼的關鍵幀,運動補償內插出其邊信息,然后通過聯合稀疏模型(JSM)和邊信息進行重建。

3 多描述編碼(MDC)

一個簡單的兩描述編解碼框架如圖2所示,編碼端首先將一個視頻信號用多描述視頻編碼器分成兩個子序列,即描述S1和S2,然后分別單獨通過信道1和信道2傳輸;解碼端包括一個中心解碼器和兩個邊解碼器,當兩個描述S1和S2都可以收到時,中心解碼器起作用;當描述S2完全丟失時,邊解碼器1起作用;當描述S1完全丟失時,邊解碼器2起作用。由圖2可知,當所有的描述被收到時,中心解碼器將恢復出最好的質量視頻序列;假設一個描述丟失,相應的解碼邊將從收到的描述來估計丟失的描述,恢復出可接收的視頻序列。因為這兩個描述之間相關,所以丟失的描述能夠用收到的描述來估計。一般來說,描述間的相關性越高,更高質量的描述能夠被估計出來。然而,隨著相關性增加,冗余也增加,編碼的效率也隨之降低。所以,在MDC中,在編碼效率和恢復出的視頻質量之間的權衡很重要。

圖2 兩描述編解碼框架

4 兩描述分布式視頻壓縮傳感(2DDCVS)

為了實現低功耗視頻設備的低復雜度編碼及無線網絡傳輸的穩定性,本文根據MDC和DCVS各自特性,綜合產生一種2D-DCVS新的方案,該方案框架如圖3所示。

圖3 2D-DCVS框架

4.1 編解碼的描述

在編碼端,一個視頻序列通過奇偶分離法,將視頻分成兩個描述,即奇數幀子序列和偶數幀子序列。每一個描述被分成幾組圖像,每組圖像又包括一個關鍵幀和一些CS幀。每一關鍵幀按照CS方法編碼;對于每一CS幀,為了降低編碼復雜度,先把每一幀圖像分成塊,然后用塊壓縮傳感 (BCS)[7]方法進行幀觀測,對一個圖像塊xB,其觀測值為

式中:yB表示觀測值向量;ΦB表示觀測矩陣,是由結構化隨機矩陣(SRMS)[8]方法構造的。SRM的優點是計算速度快、結構簡單。SRM建立在可靠數學模型的基礎上,能有效測量廣泛種類的稀疏信號,在精確恢復所需的觀測值個數的矩陣中,幾乎達到最佳效果,是一種性能優異的觀測矩陣。

在解碼端,每一關鍵幀可以通過GPSR算法來重建;而每個圖像塊也通過GPSR算法進行重構,這是一個無限制凸優化問題,表示為

式中:yB是從式(3)獲得的觀測值;A=ΦB·ΨB,ΨB是xB的稀疏基,即:xB=ΨB·θB,θB是xB在ΨB基下的系數;‖·‖2表示l2范數;‖·‖1表示l1范數;τ是一個非平衡參數。稀疏變換矩陣在很多CS算法中,通常都選擇固定且正交的變換基向量,例如DFT,DCT,DWT等。因為相鄰的兩個視頻序列之間,存在著緊密聯系,具有很大相似性,所以自適應稀疏基是由當前塊的前/后已重構的關鍵幀中相應位置的一些相鄰的塊組成。兩個相鄰幀中的一些塊,可以線性組合起來近似表示當前塊,在此稀疏基下,圖像塊表現出更好的稀疏性,因此可以得到較好的CS恢復質量。

4.2 邊解碼器和中心解碼器

假設只僅收到一個描述(以描述1為例),描述1的所有關鍵幀即K幀(1,5,9,…),首先通過GPRS算法重建;然后CS幀由通過已恢復出相鄰關鍵幀運動補償內插產生的邊信息,并利用自適應稀疏基對CS幀中的每個圖像塊的恢復進行聯合重建;最后由重構的所有的奇數幀內插描述2的偶數幀,以便獲得人們可接受的完整視頻序列。具體細節描述如圖4所示。

圖4 邊解碼器

假設所有描述都收到,所有的 K 幀(1,2,5,6,…)通過 GPRS 算法重建;所有 CS 幀(3,4,7,8,…)通過 BCS 恢復。如上文所述,利用雙邊運動估計補償,能夠恢復出更好質量的CS幀,最后能夠獲得最好質量的視頻序列。具體細節描述如圖5所示。

圖5 中心解碼器

5 實驗結果

本文選取2個視頻測試序列Foreman和Hall,新方案2D-DCVS和文獻[9]DCVS作比較。觀測率(Measurement Rate)是兩個描述之和,包括關鍵幀和CS幀;PSNR為在解碼端視頻恢復的平均值;視頻圖像組GoP大小為2;塊的大小為16×16。

從圖6可知,對于Hall,邊解碼器和中心解碼器恢復出的視頻質量,在相同測量率下,2D-DCVS明顯優于DCVS;2D-DCVS得到大約0.7~1.4 dB的中心質量的提高,0~1.3 dB左右的邊質量提高。而對于Foreman,中心質量提高了0.2~0.8 dB,邊質量在測量率為0.33時降低,但恢復出的視頻質量可以接受。從實驗結果看到,在低觀測率時,2D-DCVS比DCVS更好,因為對幀和塊平均分配觀測值是不合理的。圖7表明2D-DCVS與DCVS恢復出的連續的幀質量幾乎相當。另外,隨著GoP增加,2DDCVS的性能下降,因為MDC破壞了幀之間的相關性。然而,MDC的優點是當一個描述丟失,恢復出的視頻質量可以接受,而且對于不可靠的信道,傳輸具有一定的魯棒性。

6 結束語

本文提出一種新的2D-DCVS框架,考慮到低功耗視頻設備編碼端復雜度和實時性要求,應用了塊壓縮傳感;為了進一步利用視頻序列之間的相關性,應用自適應稀疏基對圖像塊解碼,圖像塊在此稀疏基下具有更強的稀疏性;最后,應用雙邊運動估計補償來優化重建的結果。實驗結果展示本方案滿足無線網絡的需求。未來的研究是將兩描述分布式視頻壓縮傳感擴展成為多描述分布式視頻壓縮傳感,以及在實際的互聯網和無線傳輸網絡中如何應用,從而更好地提高其實用價值。

:

[1]GIROD B,AARON A,RANE S,et al.Distributed video coding[J].Proceedings of the IEEE,2005,9(1):71-83.

[2]CANDES E,WAKIN M.An introduction to compressive sampling[J].IEEE Signal Processing Magazine,2008,25(2):21-30.

[3]KANG L W,LU C S.Distributed compressive video sensing[C]//Proc.ICASP 2009.[S.l.]:IEEE Press,2009:1169-1172.

[4]DONOHO D.Compressed sensing[J].IEEE Trans.Inform.Theory,2006,52(4):1289-1306.

[5]CANDES E,ROMBERG J,TAO T.Robust uncertainty principles:exact signal recon-struction from highly incomplete frequency information[J].IEEE Trans.Inform.Theory,2006,52(2):489-509.

[6]FIGUEIREDO M,NOWAK R,WRIGHT S.Gradient projection for sparse reconstruction:application to compressed sensing and other inverse problems[J].IEEE Journal of Selected Topics in Signal Processing,2007,1(4):586-597.

[7]GAN L.Block compressed sensing of natural images[C]//Proc.Int.Conf.on Digital Signal Processing.Liverpool:IEEE Press,2007:403-406.

[8]DO T T,TRAN T,GAN L.Fast compressive sampling with structurally random matrices[C]//Proc.IEEE Int.Conf.Acoustics,Speech and Signal Processing.Las Vegas:IEEE Press,2008:3369-3372.

[9]DO T T,CHEN Y,NGUYEN D T,et al.Distributed compressed video sensing[C]//Proc.International Conference on Image Processing.Cairo:IEEE Press,2009:1393-1396.

Two Description Distributed Compressed Video Sensing

HAN Yuwan,SHI Wei

(College of Information Engineering,Taiyuan University of Technology,Taiyuan 030024,China)

To meet low-complexity encoding of low-power video devices and the robust transmission of the wireless network,a two description distributed compressed video sensing(2D-DCVS)is proposed.At the encoder side,the encoder firstly divides the video sequence into two sub-sequences(two descriptions).Then,both descriptions are compressed by the distributed compressed video sensing(DVCS).Some computation-consuming algorithms,such as motion estimation and transform coding,are moved to the decoder,so DVCS has low-complexity encoding property.At the decoder side,two kinds of decoder,respectively is central decoder and side decoder.When two descriptions are received,the central decoder provides the best quality reconstruction of the video sequence.Video with acceptable quality can be achieved even when only one description is received.The experiment results show the superiority of the 2D-DCVS,especially when the measurement rate is low.

2D-DCVS;DCVS;low-complexity encoding

TN919.8

A

韓予皖(1985— ),碩士生,主研嵌入式視頻編碼;

師 衛(1956— ),碩士生導師,主研嵌入式系統。

責任編輯:時 雯

2012-09-15

猜你喜歡
關鍵幀解碼器解碼
《解碼萬噸站》
科學解碼器(一)
科學解碼器(二)
科學解碼器(三)
自適應無監督聚類算法的運動圖像關鍵幀跟蹤
線圣AudioQuest 發布第三代Dragonfly Cobalt藍蜻蜓解碼器
解碼eUCP2.0
NAD C368解碼/放大器一體機
Quad(國都)Vena解碼/放大器一體機
基于改進關鍵幀選擇的RGB-D SLAM算法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合