?

視差梯度對da Vinci立體視的影響

2020-12-23 05:28謝鶯和鈺吳詩怡李睿洪賢哲周信宏
關鍵詞:視差構型探針

謝鶯,和鈺,吳詩怡,李睿,洪賢哲,周信宏

( 1 中南民族大學 生物醫學工程學院,認知科學國家民委重點實驗室,武漢 430074;2中南民族大學 生物醫學工程學院,武漢 430074)

長期以來,立體視覺研究主要關注雙眼性視差在深度知覺中的作用[1,2];而將那些在對側眼中所謂沒有對應的非配對區視為噪聲[3-5],認為它們是視覺算法的障礙.近年來,越來越多的研究者開始認識到,觀察場景中的單眼性區域(半遮擋區)在深度知覺中也發揮著重要作用[6,7].人們發現,單眼性特征可以揭示深度的不連續性,并能對深度進行定位[6, 8-10].1990年,NAKAYAMA和SHIMOJO首次將對單眼性區域產生立體深度的現象命名為da Vinci立體視[11],將術語da Vinci立體視用于泛指深度在單眼性遮擋基礎上知覺而不涉及視差的任何現象.

與講求雙眼中相對應特征匹配的視差理論相對立,da Vinci遮擋理論認為,單眼性特征在對側眼中沒有匹配,當然也就沒有視差,它們的深度是根據遮擋幾何學重構出來的[11-13].基于不透明物體的遮擋幾何學原理,NAKAYAMA等人提出了深度約束區以及最小深度約束等概念,并將da Vinci構型劃分為有效(單眼性特征位于雙眼性表面顳側)和無效(單眼性特征位于雙眼性表面鼻側)兩類[11].采用條棒作為單眼性元素,NAKAYAMA和SHIMOJO發現,在一定的范圍內,放置在有效遮擋側的條棒,隨著它與雙眼性矩形表面的距離增加,條棒的感知深度也定量地增加;而放置在無效遮擋側的條棒,無論它離雙眼性矩形表面的距離如何變化,卻始終處于與雙眼性表面相同的深度.這些結果符合遮擋理論的預期,也與NAKAYAMA和SHIMOJO關于生態學有效和無效遮擋的劃分相一致,支持了遮擋理論.

然而,這一論斷及結果的普遍性,隨后受到了挑戰.譬如,HAKKINEN和NYMAN發現,在非常類似于NAKAYAMA和SHIMOJO的“有效”和“無效”構型之間,并未發現深度知覺方面的差異[14].此外,GILLAM、COOK和BLACKBURN質疑,在NAKAYAMA和SHIMOJO采用的da Vinci構型中的單眼性條棒具有與雙眼性矩形類似的垂直輪廓,因此其刺激構型中的定量深度可能起自于類似Panum極限情況的雙重融合而不是遮擋[15].為了證明該觀點,GILLAM等設計采用了兩種單眼性元素——一種是能夠與矩形邊緣融合的直線,另一種是不能融合的圓盤.如果單眼性元素的深度確實是基于遮擋幾何學恢復的,則只要位于有效側,直線和圓盤應該都能夠觀察到定量深度(從生態學分析,被遮擋物的形狀應該是無關緊要的);相反,如果深度是基于融合產生的,則具有不同融合特性的直線和圓盤的知覺深度可能會存在差異.GILLAM等發現,直線不論位于有效還是無效側,均產生了定量深度;相反,圓盤不論位于有效還是無效側,卻均未能產生定量深度.因此他們得出結論,在NAKAYAMA和SHIMOJO采用的條棒da Vinci刺激構型中的定量深度簡單地是類似Panum極限情況的雙重匹配的一個實例,而非起源于遮擋.

然而,盡管GILLAM等認為NAKAYAMA和SHIMOJO的條棒刺激構型中的定量深度不是起源于遮擋,但他們并不否認da Vinci立體視的存在.COOK和GILLAM設計了一種背景侵入型刺激構型,該構型中的雙眼性表面是一個“8”形狀的圖形,具有彎曲的邊界,而背景侵入部分的邊界是垂直的.COOK和GILLAM之所以設計這樣一種構型,一個重要的考慮是使得侵入的垂直邊緣與圖形的被刪除部分的邊界不一樣.這樣的話,如果兩眼中相應邊界融合,應該產生一個可清楚識別的復雜的3D形狀.然而COOK和GILLAM發現,雖然侵入面相對于雙眼性表面產生了定量深度,但并沒有觀察到雙眼性融合所預期的3-D曲面效應.因此COOK和GILLAM認為,該構型下的深度知覺依賴于遮擋幾何學,是一種真正起源于da Vinci立體視加工的深度[16].

眾所周知,除了視差,立體融合還受到視差梯度的限制[17-19].早期的研究發現[20-22],在先前有關Wheatstone-Panum極限情況融合方式的研究中,正是由于忽略視差梯度的影響,導致不同的研究者根據相同的研究思路卻得出了截然相反的結論[23-26].分析COOK和GILLAM的侵入型da Vinci刺激構型可以發現,其雙眼面其實是由兩個圓盤疊加組合而成.從COOK和GILLAM前面的研究已知[15],具有較大視差梯度的圓盤是難以與垂直輪廓發生融合的.這無疑是導致COOK和GILLAM的觀察者沒有觀察到3-D曲面的原因.

本研究打算對COOK和GILLAM的刺激構型進行拉伸,減少構型的視差梯度,調研在這種情形下,能否觀察到深度曲面效應.如果該構型的知覺深度真的是起源于遮擋,則在垂直方向上拉伸構型對實驗結果應該不會有影響;相反,如果該構型的知覺深度是來自于融合,則減少視差梯度應該會導致更容易觀察到深度曲面效應.

1 實驗

1.1 實驗刺激

本實驗采用的刺激構型在COOK和GILLAM等采用的侵入構型基礎上進行構建和擴展(如圖1所示).在類似于他們的原始侵入構型(見圖1(a))中,一個實心的封閉圖形呈現給兩只眼;在一只眼中,背景從右邊侵入到圖形內部刪除部分圖形.通過改變看見侵入的眼,分別構建鼻側和顳側侵入構型.侵入角度有4種,分別對應于9、12、15、18像素的侵入寬度.通過將原始侵入構型(其視差梯度記為G1)進行垂直拉伸,使其高度變為原來的2倍和3倍,從而構建視差梯度依次減小的G2(圖1(b))和G3構型(圖1(c)).對構型進行垂直方向的拉伸不會改變構型中的遮擋關系.如果該構型中的深度是在遮擋幾何學的基礎上產生的,觀察者應該觀察到同樣的深度知覺結果.

圖1 實驗采用的侵入構型示例Fig.1 Examples of the intrusion configuration used in the experiment

1.2 參與者

共6名,均為中南民族大學本科生,視力或矯正視力正常.在實驗前,均通過觀察顏少明數字化立體視覺檢查圖確定立體視正常.

1.3 實驗裝置和程序

實驗刺激圖形由Window NT 圖形工作站產生,呈現在三維液晶顯示器上(SD2320MW,美制).顯示器分辨率為1920×1200,刷新率為75 Hz.實驗時參與者需戴上正交偏振濾光鏡獲取相應的分視信號,即左眼只看到下顯示器、右眼只看到上顯示器的圖像.觀察距離為50 cm.參與者在參加實驗前進行少量深度觀察練習,以確定他們明白指導語.與COOK和GILLAM一樣,要求參與者通過雙眼性探針對目標的上、中、下3個部位進行深度測量.其中,上和下部探針的位置位于侵入面的頂部和底部的水平,中部探針的位置位于圖形的中部.參與者可通過鍵盤左右鍵和上下鍵改變探針的位置,使其與知覺到的目標邊緣的相應位置處于相同的深度.在每次設置之前,探針會向前或向后移動任意數量的深度.向前和向后的調整進行了平衡.探針設置比圖形更遠的記為負,比圖形更近的記為正.對于每一侵入角,每個參與者需進行3次深度測量.

2 實驗結果

在前期的調研中發現,對于視差梯度最大的G1構型,觀察者最初報告的往往是一個平坦的矩形目標,但對于視差梯度較小的G3或G2構型,觀察者報告的目標往往卻是明顯的3-D曲面.有意思的是,在觀察了梯度較小的構型后再去觀察梯度較大的構型時,觀察者往往也能觀察到3-D曲面.故本文對6名參與者的3次深度測量結果沒有籠統地進行總平均,而是分別依次顯示在圖2(A、B、C)中.

從圖2的實驗結果可以看出,所有參與者對鼻部和顳部侵入的反應均表現出明顯差異.對于顳側侵入,所有參與者知覺到目標出現在圖像的前面,這在深度設置上體現為上、下探針的設置結果都是正的;并且隨著侵入角度增大,知覺到的深度是增加的.他們將顯示描述為一個前景目標,部分遮擋了一個8字形的背景圖形.對于鼻側侵入,6名參與者中有4人(CP、WX、HY、YX)知覺到目標出現在圖像的后面,這在深度設置上體現為上、下探針的設置結果是負的.同樣,隨著侵入角度增大,知覺到的深度是增加的.他們將顯示描述為透過一個數字8形狀的孔看到位于后面的一個目標.另有2名參與者(XZ、MY)在第1次進行深度測量時對鼻側侵入沒有觀察到深度.他們報告侵入物看起來似乎與圖形8在同一個平面上,反映為他們的上、下探針深度設置接近于零.但經過提示,在后來的第2次和第3次實驗中,參與者XZ在鼻側侵入條件下也觀察到了定量深度,表現為隨著侵入角度增大,上、下探針指示的深度也是增加的(第2次不太準確,第3次變得比較精確). 參與者MY對鼻側侵入始終沒有觀察到深度(深度探針為零).

本研究最關心的是參與者所觀察到的目標表面的形狀,這可以從中部探針的設置得到反映.如果中部探針的深度與上、下探針的深度基本一致,表明參與者觀察到的目標是一個平坦矩形;相反,如果中部探針的深度與上、下部探針的深度不一致,則表明參與者觀察到的是一個3-D曲面.

從圖2可以看到,在進行第1次深度測量時,對于視差梯度最大的G1構型,確實有較多的參與者(譬如WX、HY、MY、YX)觀察到目標是平坦矩形,但不同參與者的效應并不完全一致(見圖2A):參與者CP對鼻側侵入觀察到的是一個中間向外凸出的3-D曲面(中部探針的深度大于上、下探針的深度),對顳側侵入觀察到的是一個中間向內凹陷的3-D曲面(中部探針的深度小于上、下探針的深度);參與者WX對鼻側和顳側侵入觀察到的均是平坦矩形;參與者HY只對顳側侵入觀察到平坦矩形,對鼻側侵入觀察到的是中間向外凸出的3-D曲面;而參與者YX對顳側侵入觀察到的是中間向內凹陷的3-D曲面,對鼻側侵入大部分觀察到的是平坦矩形,但對具有最小侵入角的鼻側侵入構型觀察到的卻是明顯的3-D曲面.雖然參與者XZ和MY對鼻側侵入在進行第1次深度測量時均沒有觀察到深度,但對顳側侵入XZ觀察到的是3-D曲面,而MY觀察到的是平坦矩形.對于視差梯度較小的G2構型,除了XZ和MY對鼻側侵入觀察不到深度,MY對顳側侵入、YX對兩個較大鼻側侵入觀察到平坦矩形外,其他參與者無論對顳側侵入還是鼻側侵入觀察到的都是明顯的3-D曲面;而對于視差梯度最小的G3構型,除了XZ和MY對鼻側侵入沒有觀察到深度,所有參與者,包括MY對顳側侵入,都觀察到了曲面效應.

圖2 6名觀察者(CP、WX、HY、YX、XZ、MY)3次深度測量的實驗結果Fig.2 Experimental results of depth measurements of six participants(CP、WX、HY、YX、XZ、MY)

在第2次深度測量中,越來越多的參與者觀察到了深度曲面效應(見圖2B).從實驗結果可以看到,除了MY對鼻側侵入沒有觀察到深度,所有參與者,包括MY對部分顳側侵入,都觀察到了曲面效應.即使是對于視差梯度最大的G1構型,那些起初對兩側或一側侵入觀察到平坦矩形的觀察者(WX、HY、YX),也轉而觀察到了3D曲面,表現出了非常明顯的知覺遷移效應.這與前期的調研結果相吻合.參與者HY和YX反映平坦矩形和3D曲面兩種情形都可以知覺到. 在第3次深度測量中(結果見圖2C),除了MY(她對鼻側侵入依然沒有觀察到深度),其他參與者對具有不同視差梯度的侵入構型,不管是鼻側還是顳側,均觀察到了明顯的深度曲面效應,且表現為深度設置越來越精確.

3 分析和討論

根據COOK和GILLAM的設計,在侵入構型中,一只眼睛看到的侵入體的垂直邊緣與另一只眼睛看到的圖形8的邊緣的融合應該產生一個容易識別的復雜三維表面.然而他們的實驗參與者觀察到的全部都是平坦的矩形,而沒有人觀察到3-D曲面.因此他們認為,這一構型下的深度不可能用融合性立體視來解釋,而是起源于NAKAYAMA和SHIMOJO提出的da Vinci立體視.

本研究通過改變侵入構型的視差梯度,發現隨著視差梯度減小,參與者觀察到的確實是具有空間深度效應的曲面,提示侵入構型的深度還是由融合性立體視產生.如果該構型中的深度是在遮擋幾何學的基礎上產生的,對構型進行垂直方向的拉伸不應該對觀察到的知覺結果產生影響.

值得注意的是,即使對于視差梯度最大的G1構型,本研究的部分觀察者一開始知覺到的就是有復雜3D形狀的曲面,而不像COOK和GILLAM的觀察者一樣全部知覺到的都是平坦的矩形.該結果的差異,一方面是由于觀察者之間本身存在差異,另一方面應歸因于兩項研究中采用的刺激構型的差異.在COOK和GILLAM的研究中,采用的是視差梯度最大的G1侵入構型.從本研究的實驗結果可以看出,對于G1構型在最初觀察到平坦矩形的概率確實是比較大的.而本研究采用了3種具有不同視差梯度大小的侵入構型.從研究結果可以發現,對于視差梯度最小的G3侵入構型,觀察者毫無例外觀察到的都是具有深度差異的復雜3-D曲面.由于在本研究中,不同梯度大小的侵入構型隨機混合出現,并且被試的作業之間存在明顯的知覺遷移效應,因此即使是對G1構型,也有很多觀察者觀察到了3-D曲面.這進一步證明,侵入構型的深度是基于融合性立體視產生的.

與COOK和GILLAM的研究結果類似,本研究中最初也有兩名參與者在鼻側侵入條件下不能觀察到深度.但經過提示,參與者XZ克服了這一困難,在隨后的兩次深度測量中都觀察到了定量深度.但另一名參與者MY與COOK和GILLAM的研究中的觀察者一樣,雖經多種努力卻始終無法在鼻側侵入條件下觀察到深度.鼻部侵入條件的知覺結果涉及到將8字形黑色區域視為一個孔,透過這個數字8形狀的孔看到位于后面的目標.這些不能觀察到深度的參與者的困難提示了知覺經驗的強大影響,但參與者XZ從最初不能到后來可以看到深度的成功經驗也表明這一困難并非無法克服.

猜你喜歡
視差構型探針
場景高程對任意構型雙基SAR成像的影響
基于自適應窗的立體相機視差圖優化方法研究
Xpert MTB/RIF對結核菌利福平耐藥的診斷價值及rpoB基因突變特點的分析
分子和離子立體構型的判定
視差邊緣優化的SGM 密集深度估計算法?
Kobe—one of the greatest basketball players
一種單發直升機直流供電系統構型
氣液鼓泡床反應器中氣泡行為光纖探針測量方法
航天器受迫繞飛構型設計與控制
基于分割樹的視差圖修復算法研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合