從兩聲道立體聲、多聲道環(huán)繞聲再到三維沉浸式音效,接近真實(shí)世界和創(chuàng)作者意圖的觀影體驗(yàn)逐漸呈現(xiàn)在觀眾的面前。當(dāng)我們談?wù)撊S音效時(shí),我們往往驚嘆于音箱數(shù)量之多,聚焦于精確的音箱擺位,熱衷于探究杜比全景聲、DTS:X和AURO-3D等主流沉浸式音頻格式的同與異。但你是否想過,作為三維音效的核心,高度聲道究竟從何而來?高度揚(yáng)聲器的數(shù)量和布局如何演變?這當(dāng)中,又涉及哪些有趣的建筑聲學(xué)和心理聲學(xué)知識(shí)呢?
從建筑聲學(xué)開始說起
在新近出版的《沉浸式聲音:雙耳聲和多聲道音頻的藝術(shù)與科學(xué)》一書中,作者Paul Geluso嘗試從建筑聲學(xué)的角度,來探究高度聲像/聲場的起源。他提到,即使史前時(shí)期的音樂家和神職人員也知道,洞穴中輻射的聲音會(huì)增加感知響度,從而提升人們對(duì)于神明的敬畏感。在音樂的發(fā)展歷程中,音樂家和觀眾逐漸意識(shí)到聲學(xué)環(huán)境能夠顯著改變?nèi)藗冃蕾p音樂表演的體驗(yàn),甚至“一個(gè)特定的聲學(xué)環(huán)境可以被視作樂器來處理”。
位于馬薩諸塞州的 Koussevitzky Music Shed 音樂廳
很多建筑設(shè)計(jì)師們也早將目光緊緊投注在房頂樣式和空間高度上。Paul Geluso舉了兩個(gè)例子,一個(gè)是位于馬薩諸塞州的Koussevitzky Music Shed音樂廳,另一個(gè)是日本的Yamaha Ginza音樂廳。前者為了解決音樂聽感渾濁的情況,在樂隊(duì)和前排觀眾的頭頂上搭了一個(gè)類似“天棚”的結(jié)構(gòu)。這個(gè)天棚由一系列大尺寸的三角形構(gòu)成,其中有50%的表面積是開孔的,看上去像許多巨大的蝙蝠翅膀連接在一起(見圖1)。書中提到,這樣設(shè)計(jì)的目的在于“一半聲音從開孔的位置穿過,到達(dá)上方空間,保證混響時(shí)間不變,另一半聲音通過反射回到觀眾區(qū),增加聲音的清晰度和親切感。”
Yamaha Ginza 音樂廳位于東京,特點(diǎn)是內(nèi)部空間寬度較窄,但是房頂很高
Yamaha Ginza音樂廳位于東京,特點(diǎn)是內(nèi)部空間寬度較窄,但是房頂很高。設(shè)計(jì)師為了塑造更強(qiáng)烈的空間感,在音樂廳的頂部增設(shè)了一個(gè)拱形表面和若干可移動(dòng)的反射體(見圖2)?蓜e小看這幾塊反射體,它們一方面可以增強(qiáng)樂器的直達(dá)聲,另一方面能調(diào)整正面和側(cè)方的聲學(xué)能量,塑造更適宜的空間感。通過控制反射體的高度,甚至可以調(diào)整聲像的感知尺寸(或范圍)。
ITU-R BS.2051-0 標(biāo)準(zhǔn)建議書提議以“X/Y/Z.LFE”格式進(jìn)一步明確了各層前/側(cè)/后(加LFE)揚(yáng)聲器的數(shù)量
高度聲道的感知和方向性頻段
上期,我們已經(jīng)在《神秘的“幻象聲像/聲場”從何而來?》中為各位簡單介紹了基于雙耳時(shí)間差(ITD,intramural time difference)和雙耳電平差(ILD,interaural level difference)的定位機(jī)制。需要注意的是,這些雙耳間的信息差異對(duì)于感知高度聲源的方向和空間信息并沒有那么重要,相反,肩膀、頭部和耳廓反射塑造出的頻率變化影響更大,尤其是聲源位于正中平面的時(shí)候。阿強(qiáng)家庭影院
1996年,Jens Blauert在對(duì)相關(guān)現(xiàn)象進(jìn)行深入研究之后,發(fā)現(xiàn)了聲源位置與特定頻段的增減之間有特別的關(guān)系,并將這些頻段命名為“方向性頻段”,比如8kHz為中心的頻段就與頭頂位置相關(guān)。在他之后,相關(guān)研究也沒有停止。雖然得出的數(shù)據(jù)和結(jié)果略顯不同,但無一不證明“方向性頻段”的存在。“以8kHz為中心頻率的1/3倍頻程頻段與正中平面上的頭頂位置聽覺密切相關(guān)。”
簡單來說,當(dāng)高度信號(hào)被輻射時(shí),方向性頻段會(huì)影響感知高度。舉個(gè)例子,如果將Hi-Hat踩镲聲(主要集中在8kHz)定位在前上方揚(yáng)聲器中,由于高度方向性頻段在信號(hào)頻譜中占據(jù)主導(dǎo),實(shí)際聽感方位可能比預(yù)期更高。因此在實(shí)際應(yīng)用中,一方面要考慮頻率內(nèi)容對(duì)聲音信號(hào)的合理分布產(chǎn)生的影響;另一方面,可以通過調(diào)整方向性頻段的頻率,在不使用高度揚(yáng)聲器的情況下提高感知聲像的位置。
虛擬的高度聲像
這就相當(dāng)于,獲得一個(gè)虛擬的高度聲像 。Tomlinson Holman在《多聲道環(huán)繞聲技術(shù)(第二版)》 書中談到幻象聲場/聲像的來源時(shí),說道“當(dāng)反射聲電平增高到某一水平時(shí),‘綜合定位效應(yīng)’開始起作用,使兩個(gè)聲源之間的方位被聽音者判斷為聲源的方位,從而產(chǎn)生了幻象聲源,在揚(yáng)聲器之間形成幻象聲像。”發(fā)燒友們對(duì)這一概念最真切的體會(huì)應(yīng)該是在聆聽兩聲道Hi-Fi音樂時(shí),感覺歌手就站在自己的面前唱歌。很多時(shí)候,我們對(duì)虛擬聲像的討論也多是集中在水平方向的揚(yáng)聲器之間,那么,水平揚(yáng)聲器和高度揚(yáng)聲器之間也能獲得一個(gè)穩(wěn)定的虛擬聲像嗎?針對(duì)這個(gè)問題,研究人員進(jìn)行了多項(xiàng)心理聲學(xué)實(shí)驗(yàn),并得出以下結(jié)論:
當(dāng)ICTD(Inter-Channel Time Difference通道間時(shí)間差)小于10ms時(shí),小于6-7dB的ICLD(Inter-Channel Level Difference通道間強(qiáng)度差/電平差)僅對(duì)高度聲道的信號(hào)產(chǎn)生水平方向的定位。而當(dāng)高度揚(yáng)聲器相較水平揚(yáng)聲器的ICLD高于7dB時(shí),就會(huì)提升虛擬聲像的高度。
10dB的ICLD可以將聲像從一個(gè)水平面提升到另一個(gè)水平面。
值得注意的是,多個(gè)研究結(jié)果都表明,雖然兩只揚(yáng)聲器可以對(duì)高度聲像的定位進(jìn)行渲染,但高度聲像定位無法像水平的前置聲像定位那么準(zhǔn)確。
AuroMax 格式最高支持 26.1 聲道系統(tǒng)
高度揚(yáng)聲器的數(shù)量演變
基于此,多家機(jī)構(gòu)開始陸續(xù)提出了包含高度聲道在內(nèi)的三維揚(yáng)聲器布局。ITU-R BS.2051-0標(biāo)準(zhǔn)建議書(ITU,2014)中對(duì)此有著非常詳細(xì)的闡述,并建議用用“上方揚(yáng)聲器數(shù)量+中部揚(yáng)聲器數(shù)量+下方揚(yáng)聲器數(shù)量”的形式來表示三維揚(yáng)聲器布局。其中上方指的是高度平面,中部表示的是靠近人耳的水平平面,下方指的是地平面。按照這個(gè)說法,傳統(tǒng)的5.1聲道系統(tǒng)可以被標(biāo)記為0+5+0布局。在此基礎(chǔ)上,建議書甚至提議以“X/Y/Z.LFE”格式進(jìn)一步明確了各層前/側(cè)/后(加LFE)揚(yáng)聲器的數(shù)量,如圖3所示。
Tomlinson Holman 曾提出在 2+8+0 的布局基礎(chǔ)上增加兩只低音炮,從而得到我們熟悉的 THX10.2 系統(tǒng)
THX10.2
按照中層揚(yáng)聲器成雙成對(duì)的邏輯,高度揚(yáng)聲器的布局演變從兩只上層揚(yáng)聲器開始。它們的位置通常是在左前和右前揚(yáng)聲器的上方,與中層的揚(yáng)聲器配合使用,讓聽眾能獲得自然的縱深感。Tomlinson Holman曾提出在2+8+0的布局基礎(chǔ)上增加兩只低音炮,從而得到我們熟悉的THX10.2系統(tǒng)。
2010年,Kim、Lee和Pulkki為確定所需高度揚(yáng)聲器的數(shù)量做了一項(xiàng)研究,讓聽音者們對(duì)0、2、3、4和9只上層揚(yáng)聲器布局的定位和空間感進(jìn)行評(píng)價(jià)。就整體效果而言,聽音者們均認(rèn)為9只揚(yáng)聲器的布局更加出色,而3-4只揚(yáng)聲器能提供可信的方向性特征。
AURO-3D
AURO Technologies也對(duì)揚(yáng)聲器的數(shù)量和位置進(jìn)行了許多探索,包括使用4只或更多數(shù)量的高度揚(yáng)聲器、將上層揚(yáng)聲器直接放置在中層揚(yáng)聲器的正上方、增加一個(gè)頭頂正上方的揚(yáng)聲器(也被稱為VOG:Voice-of-the-God上帝之聲)。
2006年,AURO -3D的概念被正式提出。專利的AURO -MATIC技術(shù)甚至能將傳統(tǒng)立體聲或環(huán)繞聲音源渲染出適用于AURO -3D揚(yáng)聲器布局的AURO -3D聲場。2015年,AURO Technologies宣布推出新一代的三維沉浸式音效格式——AuroMax,最高支持26.1聲道系統(tǒng)。
NHK22.2
可能很多人不知道的是,早在2003年,日本廣播公司NHK就提出了一套22.2(9+10+3)的多聲道系統(tǒng)。在屏幕范圍內(nèi)使用了5只中層揚(yáng)聲器、3只上層揚(yáng)聲器和3只下層揚(yáng)聲器。除此之外,還有11只揚(yáng)聲器對(duì)屏幕外的沉浸式體驗(yàn)進(jìn)行擴(kuò)展。
后來,Hamasaki等人進(jìn)行了兩聲道、5.1聲道和22.2聲道系統(tǒng)主觀特點(diǎn)的比較研究。參加實(shí)驗(yàn)的聽音者們都認(rèn)為22.2聲道在所有測試項(xiàng)目(響度除外)上均超過兩聲道系統(tǒng),并且在以下六個(gè)方面超過5.1聲道系統(tǒng):前/后區(qū)分度、上/下區(qū)分度、運(yùn)動(dòng)、方向、混響和包圍感。
《沉浸式聲音:雙耳聲和多聲道音頻的藝術(shù)與科學(xué)》一書中對(duì)這個(gè)實(shí)驗(yàn)進(jìn)行了詳細(xì)的描述,并特別指出“22.2系統(tǒng)能夠?yàn)楦嗦犚粽咛峁┫嗨频穆犚趔w驗(yàn)”,即“擴(kuò)展了有效聽音區(qū)”。
2011年,Hamasaki在后續(xù)論文中進(jìn)一步總結(jié)了9+10+3揚(yáng)聲器布局需要做到的五個(gè)特征:
完整性:能夠在屏幕上的任何位置對(duì)聲像進(jìn)行定位;
全向性:以聽音者為中心,能重播任何方向上的聲音;
臨場感:能夠呈現(xiàn)自然、高品質(zhì)的三維空間;
兼容性:能夠與現(xiàn)有多聲道格式兼容;
可用性:能夠支持實(shí)況錄音和實(shí)況播出。
DTS:X 誕生之初還僅支持 7.1.4 聲道
杜比全景聲是目前應(yīng)用最廣泛的三維音頻格式之一
借助杜比反射式音箱模塊來增強(qiáng)上方聲場的表現(xiàn)力
最新的 DTS:X Pro 格式已經(jīng)能在 7.1.6、13.2.9 及更多聲道的布局中配置多達(dá)32只揚(yáng)聲器,實(shí)現(xiàn) 5 層架構(gòu)
杜比全景聲和DTS:X
時(shí)間來到2012年前后,杜比全景聲(Dolby Atmos)和DTS:X格式相繼登場。這兩個(gè)基于對(duì)象的音頻格式在商用和家用領(lǐng)域都發(fā)展迅猛,以后來者居上的姿態(tài),成為與AURO-3D并駕齊驅(qū)的主流三維音頻格式。目前杜比全景聲格式最高支持24.1.10揚(yáng)聲器布局。
DTS:X也不遑多讓,誕生之初還僅支持7.1.4聲道,最新的DTS:X Pro格式已經(jīng)能在7.1.6、13.2.9及更多聲道的布局中配置多達(dá)32只揚(yáng)聲器,實(shí)現(xiàn)5層架構(gòu)。阿強(qiáng)家庭影院
高度揚(yáng)聲器的布局影響
數(shù)量是最直觀的,但高度揚(yáng)聲器的布局和擺位也不容忽視。2015年,Kim、King和Kamekawa對(duì)4+5+0揚(yáng)聲器布局中的高度揚(yáng)聲器布局進(jìn)行了比較。研究人員將12只高度揚(yáng)聲器放置在水平方位角不同,而高度角相同(+30°)的位置,每次選擇4只揚(yáng)聲器來重播高度聲道的信息,共有8種不同的組合方式。
結(jié)果顯示,高度揚(yáng)聲器的位置比信號(hào)內(nèi)容(如混響類型/音樂選擇)所帶來的影響更大。聽音者在進(jìn)行布局選擇時(shí),會(huì)更傾向于選擇那些“前額的”“狹窄的”聲像,能提供強(qiáng)烈的臨場感而非更好的整體空間感。另外,揚(yáng)聲器布局也會(huì)影響聽眾對(duì)聲場的感知,從而影響對(duì)整體音質(zhì)的評(píng)判。
參考資料
1《沉浸式聲音:雙耳聲和多聲道音頻的藝術(shù)與科學(xué)》Paul Geluso著,翼翔譯,人民郵電出版社,2021年
2《多聲道環(huán)繞聲技術(shù)(第二版)》 Tomlinson Holman著,王玨譯,人民郵電出版社,2011年
3《ITU-R BS.2051-0建議書(02/2014)》,國際電信聯(lián)盟發(fā)布,2014