?

3D 沉浸式音樂錄音傳聲器陣列技術發展綜述

2022-09-23 09:19
電聲技術 2022年7期
關鍵詞:中間層聲源心形

高 杰

(南京藝術學院 傳媒學院,江蘇 南京 210000)

0 引言

“沉浸”一詞最早應用于視覺藝術,指利用人的感官體驗和認知體驗,營造氛圍讓參與者身臨其境的體驗狀態。在利用互聯媒體進行娛樂的背景下,3D 沉浸式音頻通常是指為聽者提供除寬度和深度外還具有高度信息的三維(3D)音頻體驗,聽者依靠雙耳可以分辨出前、后、左、右、上等方位的音頻技術,克服了傳統立體聲和環繞系統平面化的局限性。近年來,國內外已經開發出多種用于3D 音頻的音頻格式和錄制方式,如Dolby Atmos,Auro-3D,DTS:X,NHK 22.2 以及中國多維聲等等[1]。3D 音頻從最初應用于影視作品,逐步拓展到音樂、游戲及互聯網視頻等新領域,應用的領域和數量逐漸增加。2018 年,國際電信聯盟發布ITU-R BS.2051-2 標準,推薦了用于音響系統的3D 揚聲器配置。在揚聲器設置方面,這些3D 音頻系統通常在原有水平環繞的基礎上增加了頂部揚聲器。目前3D 音頻的實現方式主要有以下幾類:基于通道的音頻(Channel Based Audio,CBA),基于對象的音頻(Object Based Audio,OBA),基于場景的音頻(Scene Based Audio,SBA)或這些方式的組合。

CBA 是基于聲道的概念來實現3D 沉浸式音頻系統,需要對系統中的每一只揚聲器進行固化,才能實現聲音的定位和移動效果,傳統的5.1,7.1,NHK22.2,Auro-3D 以及中國多維聲都是采用此種方式。OBA 則拋開的聲道的概念,基于聲音對象概念,系統會根據聲音的運動軌跡、位置等數據,結合揚聲器的數量進行即時的運算,然后把音頻流分配到系統中的每一只揚聲器中。OBA 不再受揚聲器的數量限制,但揚聲器的數量越多,運動和位置將會更準確。Dolby Atmos 與DTS:X 就是采用了這兩種方式的組合。

隨著嶄新的3D 沉浸式音頻格式的出現,音頻內容制作技術也在更新。在傳統聲學空間錄制音樂的背景下,麥克風陣列技術對于呈現錄音師和制作人所需的聽覺場景的空間特征至關重要。雖然OBA 可以在后期制作中靈活混合音頻信號,但是在聲學環境中使用麥克風陣列進行CBA 記錄需要考慮各種因素,如傳聲器的間距角度、指向性以及擺放的位置等等。

21 世紀以來,國內外音頻工程師和錄音工程師已經提出了許多用于CBA 的不同3D 傳聲器陣列錄制系統。其中一些系統是根據聽覺感知的科學原理設計的,而另一些系統則是錄音師從錄音實踐中衍生出來的,例如著名的2L 唱片公司提出的“2L-Cube”,中國著名錄音師李大康老師提出的“LDK-Cube”等。由于一種技術不太可能同時滿足各種不同的錄制場景需求,因此對于錄音師和制作人而言,了解不同技術的設計原則,以便能夠選擇最適合的技術來實現藝術目標至關重要。

本文旨在對常見的3D 傳聲器陣列進行全面的綜述,并討論它們在物理和感知上的差異。傳聲器陣列的范圍僅限于室內聲學環境以及室外環境聲錄制,與ITU-R BS.2051-2 標準中推薦的3D 揚聲器配置兼容的陣列。

1 3D 沉浸式錄音制式的簡述與分類

目前,3D 沉浸式錄音傳聲器陣列大致分為水平和垂直間隔(HVS)、水平間隔和垂直重合(HSVC)以及水平和垂直重合(HVC)陣列三種。HVS 陣列將水平和垂直的傳聲器間隔一定的距離,通過垂直和水平方向上產生的時間差進行聲音的空間營造。如果水平傳聲器間隔較寬,通道間電平和相位的差異性會更大,具有更強的空間信息。然而,國內外研究表明,在3D 聲音再現時,垂直和水平傳聲器之間的間距對感知空間信息的影響甚小。在此理論的基礎上,研究人員采用HSVC 概念設計了一些麥克風陣列,高度傳聲器和水平傳聲器處在一個水平面,而水平布置的麥克風間隔以增強空間信息。這一概念要求在中層和上層使用定向傳聲器(心形或超心形),以實現足夠的通道之間的隔離度。HVC 陣列在所有傳聲器之間沒有間距或間距很小,主要依賴通道間電平差進行定向信號源成像。通常被以四面體布局排列的四個心形振膜組成(First Order Ambisonics,FOA),或者在一個小球體的表面安裝多個振膜,提供比FOA 更高的空間解析度。

傳聲器陣列也分為“主傳聲器”陣列和“環境”陣列。主傳聲器陣列傳統上指的是一組傳聲器,以一定的間距和角度布置,用于定向源成像和從記錄空間中特定位置的角度產生空間信息。在古典音樂錄制中,根據樂隊的大小以及所需的空間和音調特性,主陣列通常放置在地面上方約2~4 m,通常布置在指揮后方。在3D 主陣列傳聲器中,陣列的中間層負責前面的聲源成像和后面的環境成像。上層通常旨在捕捉環境以及增強感知的空間信息,除非聲源在物理上升高(如舞臺上方的合唱團)或垂直較大(如管風琴),在這種情況下需要垂直聲源成像。有些錄音師傾向于依托一個主陣列,也有一些人傾向于增加多個傳聲器來補充主陣列。

環境陣列僅用于錄制漫射聲音(反射和混響),而不是直達聲,因此通常建議放置在錄制場所的混響半徑之外[2]。環境陣列可以與主陣列的正面中間層傳聲器配合使用。此方法的優勢在于,由于環境陣列信號幾乎不包含直達聲,因此可能有更大空間來提升環境聲音而不影響主聲源的定位。

1.1 HVC 陣列

1.1.1 OCT-3D

OCT-3D 是由THEILE 和WITTEK 提出的4+5+0 陣列,使用OCT-SURROUND(優化的心形三角形環繞)五聲道主傳聲器陣列作為中間層,并在其正上方1 m 處增加4 個朝上的超心形傳聲器,如圖1 所示。OCT 前方3 支傳聲器中兩側采用超心形傳聲器,抑制了前方3 支傳聲器的相關性,主要設計目標是通過最小化通道間串擾來實現穩定的正面成像,后方環繞和中間C 通道使用心形指向傳聲器。研究表明,環繞傳聲器陣列的相關性可能有助于增加感知到的聲源寬度,實際效果取決于聲源的類型。

圖1 OCT-3D 傳聲器陣列

OCT-3D 陣列共需要9 支傳聲器,其中心形指向3 支,超心形6 支。選擇上層超心形傳聲器是為了減少傳聲器之間的相關性。THEILE 和WITTEK認為,由于使用ICTD或ICLD進行垂直平移的限制,不可能在中上層之間實現穩定的垂直方向的成像。所以THEILE 和WITTEK 建議,中上層揚聲器拾取的應該是反射和混響,而不是直達聲。對上層使用朝上的超心形傳聲器可以充分抑制直達聲,從而拾取的主要是彌散的反射聲和混響聲。

1.1.2 LDK-Cube

LDK-Cube 是李大康教授基于多年的環繞聲錄音實踐總結的一種由大間距主傳聲器和環境傳聲器組合而成的3D 傳聲器陣列[3]。該陣列使用八支傳聲器組成一個立方體,下層為4 支全指向傳聲器,上層為4 支心形指向傳聲器指向天花板,如圖2 所示。各傳聲器之間的間距建議在5 m 以上,對于傳聲器的選擇和擺放位置更加靈活。傳聲器之間的間距越大,彼此的相關性就越小,拾取到的空間信息也就越多[4]。

圖2 DK-Cube 傳聲器陣列

1.1.3 2L-Cube

2L-Cube 是LINDBERG 開發的一種采用9 支全指向傳聲器排列在一個正方體上,可實現4+5+0的雙層傳聲器陣列,如圖3 所示。正方形的寬度和深度可以根據樂隊的大小從0.4 m 到1.2 m 變化,而高度維度保持1 m 不變。中置傳聲器放置在左右傳聲器之間的中間位置稍前方。將樂隊呈圓形布局,并將2L-Cube 放置在圓形的中心位置,以實現360°成像。LINDBERG 還傾向于調整個別樂手與傳聲器陣列的距離,以便為不同的音樂作品實現最佳水平平衡。2L 唱片公司使用此種陣列錄制并發行大量作品,效果非常不錯。

圖3 2L-Cube 傳聲器陣列

2L-Cube 陣列使用9 支全指向形傳聲器。與單向或雙向傳聲器相比,全指向傳聲器通常會提供更好的低頻響應。此外,上層麥克風的精確垂直方向取決于所需的音調特性。該陣列經常使用均衡器配件(圓球形狀)來增加高頻的指向性,在垂直方向產生一些ICLD,有助于避免聲像位置在垂直平面上向上移動。

1.1.4 Hamasaki Cube

HAMASAKI 和VAN BAELEN 在Hamasaki Square(HS)錄音制式的基礎上,通過添加4 個向上的超心形傳聲器來捕捉上層的環境聲音,如圖4所示。HS 是一種成熟的技術,用于錄制常規0+5+0再現的四聲道環境聲音。其由4 個側面的8 字形傳聲器組成,呈正方形排列。研究發現,同時使用前后通道進行環境聲記錄和再現,與只使用后通道相比,可以產生更大的空間感。由于麥克風朝向側面,零點朝向前方,HS 可以充分抑制來自舞臺的直達聲,同時拾取來自橫向的早期反射和混響聲。

圖4 Hamasaki Cube 傳聲器陣列

根據主觀評估結果和基于聲像定位估計,建議HS 的大小為2~3 m,這表明在傳聲器間距為2 m的情況下,在100 Hz 以上可以實現完全的信道分離度。建議在增加的上層以及中層和上層之間使用相同的2~3 m 間距的超心形傳聲器。此外,還可以在上方正方形的中心額外放置一個朝上的超心形傳聲器。結果顯示,Hamasaki Cube 總體上比Hamasaki Square(HS)更好。

1.2 HSVC 陣列

1.2.1 PCMA-3D

PCMA-3D 是HYUNKOOK L 提出的PCMA 設計概念[5]的4+5(7)+0 陣列,如圖5 所示。最初的PCMA 為五聲道環繞記錄中靈活呈現感知距離和水平而設計的。陣列中的每個點都采用以一致方式排列的前向和后向心形傳聲器。通過將兩個不同比例的傳聲器信號混合,可以創建不同方向和指向性的虛擬麥克風,從而可以靈活地控制每個通道信號的大小與混合比。

圖5 PCMA-3D 傳聲器陣列

國內外研究結果表明,兩層傳聲器之間的間距將不會對3D聲音再現中的感知空間產生顯著影響,垂直通道間時間差對于垂直成像來說是一個不穩定的因素。這些發現也成為所有其他HSVC 陣列上層配置的理論基礎。也就是說,上層和下層傳聲器之間的間距并不會影響3D 聲音的成像。

布局圖表明,上層的4 個超心形傳聲器與其對應的中間層傳聲器排列在同一水平面上。垂直方向放置的傳聲器比中間層傳聲器的電平至少低9.5 dB 左右,防止聲像定位向上移動。中間層和上層的心形傳聲器也可以“背靠背”的方式布置,使得上層的心形傳聲器背離聲源,以獲得最大的聲道分離度。上層主要捕捉來自天花板的反射聲,而中間層捕捉來自前方的直達聲和來自后方的反射聲。這將在平衡高度通道中的環境級別方面提供靈活性,而不會影響主要在中層的聲像定位。這種重合布置的另一個好處是在后期制作中,3D 下混到立體聲時幾乎不會出現染色的現象。也就是說,當高度傳聲器信號與其對應的中層傳聲器信號混合時,將不會產生相互抵消與相位失真。

1.2.2 ORTF-3D

ORTF-3D 是 由WITTEK 和THEILE 提出的4+4+0 陣列。ORTF 是一種成熟的雙通道錄音技術,使用兩支間距為17 cm、角度為110°的心形傳聲器。SCHOEP 的ORTF-3D 就是使用了窄間距定向傳聲器的概念。在基于ORTF 的基礎上以垂直重合的方式排列的中層和上層各采用四支超心形傳聲器。麥克風之間的排列緊湊。中上層傳聲器之間的夾角為90°,由于傳聲器都為強指向性,提供了足夠的通道分離度。另外,ORTF-3D 有室外布置和室內布置兩個版本。室內采用方形布局,每對垂直傳聲器之間的間距為18 cm,夾角為90°,如圖6 所示。而戶外為矩形布局,寬20 cm,深10 cm,如圖7所示。

圖6 ORTF-3D 傳聲器陣列室內布置

圖7 ORTF-3D 傳聲器陣列室外布置

1.2.3 Au3Dio

Au3Dio是由VAIDA提出的4+6+0傳聲器陣列。中間層由6 支心形傳聲器組成,呈六邊形布局。根據SENGPIEL 的心理聲學模型的計算,建議每個相鄰傳聲器之間的間距為62 cm,以便為每個立體聲段產生60°的SRA。如圖8 所示,前面和后面的傳聲器都增加了向上的8 字形傳聲器,以垂直重合的方式排列。8 字形傳聲器可以直接分配到上層揚聲器,在這種情況下,正面心形傳聲器應該直接指向聲源,以最大限度地抑制上層信號中的直達聲。

圖8 Au3Dio 傳聲器陣列

心形和8 字形傳聲器可以配對成MS 制式,從而可以靈活地為中間層和上層分配信號。在這種情況下,需要將傳聲器陣列布置到聲源高度以上。

1.3 HVC 陣列

目前,市面上已有多種HVC 陣列的3D 傳聲器,大體呈四面體和球形陣列,如RODE NT-SF1(如圖9 所示),Sennheiser Ambeo VR(如圖10 所示)以及zoom-VR(如圖11 所示)。這些傳聲器可以理解為M/S 制式立體聲拾音的三維擴展,采用一定的方式組合多個音頭形成的陣列來記錄具有高度、深度、寬度信息的多通道信號,稱之為A-Format 信號格式,并通過這些通道信息配合Ambisonic Plugin插件去運算并形成一個3D音頻,轉換成5.1.4,7.1.4,B-Format 或其他3D 環繞聲格式的信號。由于振膜間距較小,在高頻時會導致所謂的“空間混疊”,導致聲音質量以及再現中的聲像定位精度和水平方面的顯著差異。

圖9 RODE NT-SF1 傳聲器

圖10 Sennheiser Ambeo VR

圖11 ZOOM-VR 傳聲器

2 HSV、HSVC 和HVC 陣列一般性結論

由于聲源類型、記錄環境以及回放系統差異很大,因此不可能為所有陣列之間的差異得出一般性結論。然而,通過對現有國內外研究的回顧,可以總結出HSV、HSVC 及HVC 這三種不同類型的物理配置的明顯差異。

在HVS 陣列中使用中上層之間的垂直間距的主要動機是漫反射聲音的垂直成像,隔離兩層之間傳聲器的相關性。眾所周知,隔離度對于水平圖像擴展和增強層次是有效的。大多數HVS 陣列似乎都使用了垂直傳聲器間距的理論[6]。而HSVC 陣列在物理上更緊湊,從而在戶外音景或現場音樂會錄制情況下使用更加方便。另外一個最大的優勢就是3D 到2D 的下混音。當上層信號與其在中間層中的相應傳聲器直接混合,便于2D 再現時由于重合的性質產生梳狀濾波。與HVS 陣列相比,失真度較小,特別是使用全指向傳聲器。

在靈活性方面,HVS 陣列比HSVC 陣列更具優勢,特別是對于大型再現系統。由于間距的原因,可以更靈活地選擇麥克風的指向性和擺放位置。較大的間距更有助于控制音色特征。例如,在音樂廳錄制大型管風琴時,頂部麥克風信號可能會根據麥克風的垂直位置而有很多變化。上層高度可以用作創造性工具,以產生所需的音色特征。

盡管兩種陣列都是在盡可能逼真地錄制和再現聲場,但HVS 和HSVC 陣列配置和放置背后的動機往往介于真實感和藝術性之間?,F實主義和藝術性都是錄音的重要因素,與創造身臨其境的聽覺體驗相輔相成。從聽眾的角度來看,可以為上層設計出各種創造性的聲音。例如,在音樂廳錄音中,面向觀眾區域的心形麥克風,往往比相對未經處理的天花板吸收更多的高頻,可能會錄制到比直接向上的超心形麥克風更柔和的反射聲。

3 結語

總體而言,目前三種類型的3D 沉浸式錄音傳聲器陣列都存在各自的優勢與局限性。在實際應用中,還需要更主觀和客觀的研究來探索3D 沉浸式錄音傳聲器陣列的客觀參數,完善沉浸式聲音質量評估標準。

猜你喜歡
中間層聲源心形
管道有源噪聲控制中壁面分布次級聲源的空間分布優化
虛擬聲源定位的等效源近場聲全息算法
一種基于麥克風陣列用于分離單極子和偶極子聲源的方法
Zn-15Al-xLa中間層對鎂/鋼接觸反應釬焊接頭性能影響
Heart心形浪漫
室內聲音導航系統
制作心形賀卡
如何利用合作教學激發“中間層”的活躍
淺談通信綜合營帳數據中間層設計原則與處理流程
盤點八大奇葩的心形結構
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合