?

特定場景大視角視頻拼接技術研究與實現

2017-05-19 03:30林財明衛志敏
電腦與電信 2017年4期
關鍵詞:角點矩陣特征

林財明 衛志敏

(華僑大學,福建 廈門 361021)

特定場景大視角視頻拼接技術研究與實現

林財明 衛志敏

(華僑大學,福建 廈門 361021)

本文對視頻拼接設計了一個簡單的框架,主要是采用三路固定攝像進行實時拼接,在U u n t u 16.04系統安裝O p e n C V開源庫和C U D A 8.0軟件包,并使用該系統搭建視頻拼接框架系統。利用G PU編程技術,對視頻拼接技術中最耗時的特征匹配算法、細縫估計、多波段融合和扭曲映射算法進行加速。在計算資源足夠的情況下,利用C U D A進行在線實時視頻流拼接。

實時拼接;多波段融合;加速

1 引言

由于互聯網、云計算、大數據的快速發展,VR(Virtual Reality,即虛擬現實)直播是目前繼體驗店最容易商業化的領域。華人文化(CMC,華人文化基金、華人文化控股的并稱)宣布,旗下體奧動力與微鯨科技進入體育賽事VR內容制作領域,將嘗試在中國國家隊、中超聯賽、足協杯賽、業余足球聯賽等足球賽事中提供VR直播信號。VR技術是一項目前來說前景不錯的技術,在體育賽事領域已有一定應用。

視頻拼接技術是屬于較新的研究領域,存在很大的研究空間。國內外對于視頻拼接都朝著各種方向進行研究,并且取得一些成果。該技術在視頻會議、軍事監控、交通導航等領域得到了廣泛的應用。視頻拼接技術也在VR中是一項非常重要的技術,在此背景下,本文對特定場景大視角視頻拼接技術進行了研究。

2 設計方案分析

目前,常用的拼接技術是以AutoStitch軟件的拼接框架為主,該拼接框架已經非常成熟,是影像拼接的一個里程碑。AutoStitch必須滿足兩個條件:第一,影像疊區域要近似一個平面;第二,每個攝像機拍攝的光心要在同一點上。如果這兩個條件不滿足的話,那么因為視差問題帶來的鬼影和模糊現象將會非常嚴重。

本文采用的是基于足球場三路攝像頭+算法+CUDA編程的大視角拼接方案,覆蓋整個足球場。讓三路攝像頭光心盡量重合在一起,三路攝像頭擺放在一個圓盤上,這樣就可以減少因為物理問題帶來的重疊區域的鬼影和模糊現象。

圖1 設計框架圖

設計方案如圖1所示,首先輸入三路視頻流,然后對三路視頻流的第一幀影像進行特征點計算、匹配,并由特征點計算出相機參數,最終配準出正確的數據,并計算出相應的單應性矩陣;根據變形的模型和單應性矩陣把最終三幅影像映射為一幅影像的關系式計算出來,然后進行縫隙估計和曝光補償,使得拼接后的視頻更加自然,最后用多波段融合技術對每三幀進行融合處理,最終得出視頻拼接的大視角全景圖。

下面分四點闡述拼接的主要技術:

(1)找特征點

本文采用ORB算法,ORB特征是將FAST特征點的檢測方法與BRIEF特征描述子結合起來,并在它們原來的基礎上做了改進與優化。首先,它利用FAST特征點檢測的方法來檢測特征點,然后利用Harris角點的度量方法,從FAST特征點中挑選出Harris角點響應值最大的N個特征點。其中Harris角點的響應函數定義為:

R=detM-α(traceM)2(1)

我們知道FAST特征點是沒有尺度不變性的,所以我們可以通過構建高斯金字塔,然后在每一層金字塔圖像上檢測角點,來實現尺度不變性。那么,對于局部不變性,我們還差一個問題沒有解決,就是FAST特征點不具有方向,ORB[1]的論文中提出了利用灰度質心法來解決這個問題?;叶荣|心法假設角點的灰度與質心之間存在一個偏移,這個向量可以用于表示一個方向。對于任意一個特征點p來說,我們定義p的鄰域像素的矩為:

其中I(x,y)為點(x,y)處的灰度值。那么可以計算出圖像的質心為:

那么特征點與質心的夾角定義為FAST特征點的方向:

要保證該算法具有旋轉不變性,需要確保x和y在半徑為r的圓形區域內,即x,y∈[-r,r],r等于鄰域半徑。

ORB選擇BRIEF作為特征描述方法,但是特征不具有旋轉不變性,所以給BRIEF加上旋轉不變性。對于任意的特征點,該描述子是一個長度為n的二值碼串,該二值串是由特征點周圍的n個點對(2n個點)組成的,我們把這2n個點組成一個矩陣S:

使用鄰域方向θ和對應旋轉矩陣Rθ,構建S的一個校正版本Sθ=RθS其中

而θ就是公式(4)所求,把360o分為12份,然后對每一份求得Sθ,這樣一個查找表就創建成功,對于每一個θ,我們只需查找表即可快速得到它的點對集合Sθ。本文將ORB算法編寫成CUDA程序,使其效率更加高效,并用RANSAC算法篩選特征點。

(2)找縫隙

縫合線(Seam Line)是圖像拼接后在重疊區域內形成的一條把兩幅拼接在一起的圖像明顯可區分開的分界線(又稱“拼接線”)。不消除它,對拼接圖像的視覺效果將產生不良影響,消除它可采用某種圖像融合策略。消除“拼接線”之前,需先找到“拼接線”在全景圖中的準確位置,即找到縫合線。目前用于縫合線搜索的主要技術有基于動態規劃法,該種方法依據一定的相似性準則找出符合最優條件的縫合線。

(3)融合圖像

簡單的線性融合會使得影像的高頻部分被模糊,而多波段融合可以很好地解決這個問題,本文對于每一幅影像融合掩模公式(7)如下:

如果坐標(x,y)的值有最大權重,那么相應映射的位置設為1,否則設為0。最大權重映射通過和連續的高斯函數進行卷積產生融合映射:

在這個公式中,wiσ(x,y)是0到σ寬度的融合權重。新的波段頻率由公式(10)產生,相應的權重由公式(11)產生。

本文利用GPU對高斯金字塔和拉普拉斯金字塔算法進行編程,提高算法的執行速度,以實現視頻實時拼接。

(4)Warps image部分

可以采用很多模型來進行圖像扭曲,因為對于不同的場景,全局單應性矩陣的對齊能力并不是十分完美,所以需要用更厲害的矩陣或者更多的單應性矩陣來解決。J Gao提出將場景劃分為背景平面和前景平面,用兩個單應性矩陣分別對齊背景和前景,這種方法可以無縫拼接大部分現實場景,但是需要拼接影像具有可以劃分為前景和背景的約束[2]。林溫燕提出用多個仿射變換,六參數的homography矩陣,經過仿射變換的平行線依舊保持平行,能把正方形變成四邊形,局部變形和對齊能力很好,在某種程度上可以處理由視差帶來的重影問題[3]。J Zaragoza提出一種新的homography,主要將圖像劃分為密集網格,每個網格都用一個單應性矩陣對齊,并給出一套高效的計算方法Moving DLT。但是計算如此多單應性矩陣,計算量極大,所以此處必須用GPU編程實現,否則實時拼接是不可能的。2014年張帆提出的拼接方案是在整個重疊區域所有的輸入圖像并不需要精確對齊。采用混合對齊模型,開發一種隨機算法來尋找最佳的單應性矩陣,將單應性矩陣和content-preserving warping進行結合,最后將對齊的影像用標準的seam-cuting算法和多波段融合算法組合起來,可以有效處理視差和局部畸變問題[4]。張哲瀚提出的變形方法則是采用分三大塊處理,借鑒圖像縮放形狀保持的方法,非重疊區域逐漸過渡到全局相似變換,能把正方形變成矩形,并對整個圖像增加相似變換約束,矯正拼接圖像的形狀,減小由于投影帶來的畸變問題[5]。林宗慶提出的變形方法是用對單應性矩陣進行約束,不過它采用兩種線性單應性矩陣和全局相似變換相結合來進行影像的拼接[6]。

以上的變形方案都是對單應性矩陣做文章,但不同方案相應的計算量都很大,對于不同場景,如果想利用比較好的單應性矩陣,就得優先考慮GPU編程。

三路視頻拼接最重要的問題就是實時性,還有本文采用的大視角拼接系統,三路攝像頭擺放位置都是固定的,所以針對影像拼接框架中,利用特征點計算單應性矩陣,本文只計算一次,然后利用它進行后續的處理。

3 實驗結果分析

圖2 輸入影像

圖3 輸出影像

由于本文的實現目標是想達到實時性,但是由于細縫估計和多波段融合方面的耗時比較大,所以將這兩部分算法用GPU編程實現,目前所能達到的效果是720p三路視頻每秒20幀左右,實現平臺i7-7700hq,系統ubuntu16.04,GPU為TITAN BLACK。本文采用扭曲方式是圓柱映射,這部分算法代碼也需要用GPU編程來實現。

4 結論

本文采用三路視頻對足球場進行拼接,首先計算速度慢,因為針對單應性矩陣的優化方法,很多文章都有提及,但是想擴展到視頻拼接上,最直接的思路是利用GPU的并行來加速單應性矩陣的計算。對拉普拉斯金字塔融合算法進行優化,并移植在GPU上運行,可以消除小部分的重影問題。對視頻進行實時拼接,利用CUDA進行加速,是一個目前來說最完美的方案。

[1]Rublee E,Rabaud V,Konolige K,et al. ORB: an efficient alternative to SIFT or SURF. Proceedings of the IEEE International Conference on Computer Vision,Barcelona,Spain,2011: 2564—2571.

[2]Gao, J., Kim, S.J., Brown, M.S.: Constructing image panoramas using dual-homography warping. In: Proceedings of the 2011 IEEE Conference on Computer Vision and Pattern Recognition. pp. 49{56. CVPR '11 (2011).

[3]W.-Y. Lin, S. Liu, Y. Matsushita, T.-T. Ng, and L.-F. Cheong. Smoothly varying affine stitching. In Computer Vision and Pattern Recognition (CVPR), 2011 IEEE Conference on, pages 345–352. IEEE, 2011.

[4]F. Zhang and F. Liu. Parallax-tolerant image stitching. In Computer Vision and Pattern Recognition (CVPR), 2014 IEEE Conference on. IEEE,2014.

[5]Chang, C.H., Sato, Y., Chuang, Y.Y.: Shape-preserving half-projective warps for image stitching. In: Proceedings of the 2014 IEEE Conference on Computer Vision and Pattern Recognition. pp. 3254{3261. CVPR ' 14 (2014).

[6]C.-C. Lin, S. U. Pankanti, K. N. Ramamurthy, and A. Y. Aravkin, “Adaptive as- natural- as- possible image stitching,”in Proc. IEEE Conf.Comput. Vis. Pattern Recog., Jun. 2015, pp. 1155–1163.

[7]Brown, M., Lowe, D.G.: Recognizing panoramas. In: Proceedings of the Ninth IEEE International Conference on Computer Vision - Volume 2. pp. 1218{. ICCV'03 (2003).

[8]Brown, M., Lowe, D.G.: Automatic panoramic image stitching using invariant features. Int. J. Comput. Vision 74(1), 59{73 (Aug 2007).

[9]Carroll, R., Agrawal, M., Agarwala, A.: Optimizing content- preserving projections for wide- angle images. ACM Transactions on Graphics 28(3), 43 (2009).

Research and Realization of Large-angle Video Stitching Technology in Specific Scene

Lin Caiming Wei Zhimin
(Huaqiao University,Xiamen 361021,Fujian)

tract】 This paper designs a simple framework for video stitching,mainly using three fixed camera for real-time stitching;installs OpenCV base and CUDA8.0 software package in the Uuntu16.04 system;and uses the system to build video stitching frame system.It uses GPU programming technology to accelerate the most time-consuming algorithms of video stitching technology,such as feature matching,slit estimation,multi-band fusion and twist mapping.With sufficient calculation resources,CUDA is used for the online real-time video stream stitching.

words】 real-time stitching;multi-band fusion;accelerate

TP391.41

A

1008-6609(2017)04-0025-03

林財明(1991-),男,福建泉州人,碩士研究生,研究方向為圖像處理、機器學習、深度學習。

華僑大學研究生科研創新能力培育計劃資助項目,項目編號:1511401021。

猜你喜歡
角點矩陣特征
如何表達“特征”
不忠誠的四個特征
基于FAST角點檢測算法上對Y型與X型角點的檢測
抓住特征巧觀察
基于邊緣的角點分類和描述算法
基于圓環模板的改進Harris角點檢測算法
初等行變換與初等列變換并用求逆矩陣
矩陣
矩陣
矩陣
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合