?

基于殘差注意力網絡的波前畸變復原方法

2022-02-15 11:51曹陽張祖鵬彭小峰
光子學報 2022年12期
關鍵詞:光束湍流殘差

曹陽,張祖鵬,彭小峰

(重慶理工大學 電氣與電子工程學院 重慶 400054)

0 引言

攜帶軌道角動量(Orbital Angular Momentum,OAM)的光束可提高系統信道容量和頻譜利用率,成了眾多學者的研究對象[1]。目前,在實驗室條件下通過對OAM 光束復用,已經實現了Tbit/s 級別的數據傳輸[2]。然而在自由空間光通信(Free Space Optical Communications,FSO)系統中,大氣湍流引起的大氣折射率變化,使得大氣傳輸的激光束出現振幅隨機起伏以及相位扭曲,導致無線光通信系統的性能下降[3]。自適應光學(Adaptive Optics,AO)是可通過校正光束動態波前畸變來提升通信系統性能的技術,已成為無線光通信系統的研究熱點[4]。AO 系統一般包括波前傳感器、波前控制器和波前校正器,而根據AO 系統是否使用波前傳感器可將其分為常規AO 和無波前探測AO 兩類[5]。常規AO 系統在天文觀測、生物醫學領域取得了廣泛應用,但是受到系統結構復雜性和工作原理本身的制約,其應用范圍具有局限性[6]。無波前探測AO系統可直接利用探測到的光強信息設計控制算法,產生波前校正器所需要的控制信號,即根據畸變光強圖像進行波前重構[7]。

經典無波前探測的波前重構方法包括Gerchberg-Saxton 相位恢復算法[8]、隨機并行梯度下降算法[9]、模擬退火算法以及遺傳算法[10]等,這些算法多需要通過迭代計算求解,難以實現實時的波前重構?;谏疃葘W習(Deep Learning,DL)的無波前探測是將CCD 相機捕捉到的光強圖像作為神經網絡輸入,將波前像差或Zernike 系數作為輸出,然后再將輸出轉化為控制信號,最終控制變形鏡實現波前校正。文獻[11]中應用點擴展函數的深度學習方式實現波前重構,獲得了比隨機重構更低的誤差,但對于較大尺寸圖像的復原實時性較差。文獻[12]針對現有搜索算法迭代次數過多的問題,提出基于深度神經網絡的模型,從而獲取Zernike 系數進行波前校正,并減少了時間開銷。上述研究表明了DL 技術在AO 中可有效應用,但通常存在計算成本高的問題。為降低計算復雜度,文獻[13]使用卷積神經網絡模型,直接從單個光強圖像估計波前Zernike 系數,通過實驗驗證了過曝光、離焦和散射等預處理方式的有效性。文獻[14]同樣使用卷積神經網絡模型,使其學習畸變渦旋光強分布與前20 項Zernike 系數之間的映射關系,縮短了計算時間。這些研究表明DL 具有巨大的潛力,另有相關文獻從幾何光學方面提升系統性能,如文獻[15]中用相位差異思想,提出將焦平面和離焦平面的光強圖作為神經網絡輸入,并將其對應的Zernike 系數作為標簽,輸出波前Zernike 系數。文獻[16]探討了訓練數據的一致性對波前復原性能的影響,仿真結果表明,使用單一訓練數據集的模型魯棒性不強。文獻[17]同樣根據相位差的思想,采集空間光調制器生成的真實相位,使用卷積神經網絡建立了真實圖像與其Zernike 系數的映射,并由于模型參數少,顯著提升了模型的實時性。文獻[18]把殘差網絡應用于波前重構,將遠場光強圖作為輸入,波前Zernike 系數作為輸出,驗證了神經網絡魯棒性強的特性。與傳統波前探測算法相比,深度卷積神經網絡已經在無波前探測AO 系統上表現出了優越性,但仍然存在對光斑特征感知和表達不足的問題。隨著網絡不斷加深,易出現梯度消失、爆炸甚至過擬合的現象,難以完成實時精確的重構任務,過多的池化操作也會導致小目標信息丟失,重構誤差過大。

針對上述問題,本文引入殘差網絡作為主干網絡,利用其跳層連接的特點,使網絡學習更深層次的特征表示,并在網絡中嵌入帶有多尺度特征提取的混合注意力結構,利用空洞卷積來提取光斑的不同感受野信息,在擴大特征尺度的同時避免網格偽影現象;應用通道注意力加權融合不同尺度的特征,并向后傳播,通過空間注意力對特征圖像素間的依賴性進行聚合,得到更具分辨率的特征圖;定義網絡損失函數為多個指標的加權和,從而增加重構Zernike 系數的真實性。

1 渦旋光束大氣傳輸模型

基于深度學習的無波前探測AO 系統中通常用神經網絡模型代替傳統校正算法,從畸變光強圖像中反演出波前像差或是其Zernike 系數,結合神經網絡模型的無波前探測AO 系統框架如圖1 所示??臻g光調制器法是常見的渦旋光束生成法之一,激光器發射的光束經過擴束準直后,入射到搭載了叉形光柵的空間光調制器上,即可生成預校正的渦旋光束。在大氣傳輸時,光波發生波前畸變,其相位面不是平面,此時的畸變波前被分光鏡分為兩部分,一部分聚焦到波前校正系統,另一部分用于信息傳輸。波前控制器接收到波前畸變信息之后,將進行波前重構,得到波前系數,并據此生成控制電壓系數,由變形鏡(Deformable mirror)產生共軛波前,補償接收到的光束,校正完后再將光束送到信息接收端。

圖1 無波前探測AO 系統原理Fig.1 Schematic diagram of AO system without wavefront detection

在自由空間光通信中,渦旋光束與普通光束相比,具有連續螺旋形波前,在光束傳播的方向上相位具有不確定性,該處即為相位奇點。渦旋光束中拉蓋爾-高斯(Laguerre-Gauss,LG)光束是一種具有代表性的光束,在自由空間下其光場分布為

式中,l為渦旋光束的拓撲荷數,可以取為任意整數;p表示LG 光束的徑向指數;r為空間點到傳輸軸的徑向距離;φ為方位角;,w0為光束束腰半徑,z0=kw0/λ為瑞利距離,k=2π/λ為波數,λ為光波長;為拉蓋爾多項式。假設光束發射點位于z=0 處,且為了在研究方便的情況下不影響結果,令p=0,則發射光束光場分布表示為

根據式(2)可以模擬出LG 光束在大氣湍流中的傳輸過程,考慮光束傳輸中存在衍射效應,因此經過衍射光闌后的光場分布為

式中,x-y為入射平面坐標,x1-y1為接收平面坐標,T(x,y)為圓孔光闌透過率函數,u(x,y,0)為z=0 時的光場分布,設置圓孔半徑rc=w0。

當光波通過多個相位屏時,只有相位變化而振幅不變,在Rytov 近似下,可以得到傳輸距離為Δz時的光場分布為

式中,F-1和F 分別表示傅里葉逆變換和傅里葉變換;?(r,zi)表示大氣湍流相位屏函數;kx和ky分別表示x和y方向上的空間波數,且。因此,只需模擬出大氣湍流的相位屏模型就可以計算出接收端處光場的大小,選用Noll 定義的Zernike 多項式來模擬湍流相位屏?(r),可表示為

式中,Zi為第i項多項式對應不同相差,Zeveni為第偶數項,Zoddi為第奇數項,為徑向函數表達式,r和θ為極坐標,n和m分別為徑向和角向級次,始終是整數并且滿足m≤n,n-|m|=even,even 為偶數。Zernike 多項式的第一項表示平移,對圖像成像質量沒有影響,更高階的多項式可以表示更高的頻率成分,因此本文不考慮第一項式,并選取36 階的多項式生成符合實際情況的大氣湍流相位屏。

2 殘差注意力網絡模型

2.1 殘差網絡模型

由于捕獲到的光強圖中包含波前像差信息,因此基于深度卷積神經網絡的模型能夠從畸變光強圖中提取出波前Zernike 系數,甚至直接提取大氣湍流相位,其權重共享的特性,可在減少學習參數量的同時實現實時波前重構。然而一味地增加網絡深度,不僅容易過擬合,還極容易陷入局部最優,且卷積操作會由于感受野大小的不同,導致本具有聯系的像素間提取出的特征存在差異,這些差異會導致重構的像差較大。針對上述問題,用殘差網絡的思想構建特征圖的恒等映射,使得后面的層能學習到網絡的殘差,減少過擬合風險,并結合全局上下文信息,加入注意力機制,在特征之間建立聯系,增加網絡的波前重構能力?;跉埐罹W絡的波前重構系統如圖2 所示。

圖2 網絡整體結構Fig.2 Overall network structure

骨干網絡為ResNet50 模型,首先通過7×7 的下采樣卷積操作將輸入的光強圖轉變為特征圖像,大尺度卷積核在盡可能保留特征信息的情況下減小計算量。之后采用過濾器大小為3×3 的最大池化操作減少特征映射的參數,將其降維至初始圖像的1/4 大小。然后將混合注意力模塊嵌入到ResNet 模型中,充分捕獲特征信息,每個混合注意力模塊包含兩次卷積操作和一次混合注意力計算操作,每次卷積操作的通道數如圖2 所示。最后經過全連接層將特征從三維空間映射到一維空間中,并加入Dropout 防止過擬合,最終的輸出為輸入光強圖中波前像差對應的Zernike 系數。

2.2 混合注意力結構

為了彌補深度ResNet 感受野有限,跨通道交互缺乏,小目標信息易丟失的問題,在網絡中添加空間注意力(Spatial Attention,SA)機制與動態選擇機制網絡(Selective Kernel Neural Networks,SKNet)[19]相結合的混合注意力結構,主要采用卷積操作提取特征映射的相關信息,加入殘差跳連結構根據輸入的特征的重要程度來為模型合理地分配計算資源。提出的混合注意力結構包括帶有通道注意力機制(Channel Attention,CA)的SKNet 與空間注意力機制,其結構如圖3 所示。

圖3 混合注意力結構Fig.3 Structure diagram of mixed attention

對于光強圖像中不同大小的光斑,其特征的尺度同樣變化,如果采用大小相同的卷積核,小光斑特征信息的表達能力逐漸變弱,導致重構像差誤差增加。針對此,用多尺度特征提取網絡SKNet,使模型增強淺層特征的表達,有利于網絡中較小目標的回歸,讓模型把注意力更加聚焦在目標本身。

SKNet 可以分為分解、融合和選擇三個部分。在分解部分,選取不同大小的卷積核進行特征映射操作,雖然多分支結構能夠挖掘更豐富的語義信息,增強網絡的表達能力,但同時也加大了網絡訓練的難度。因此選用3×3 和5×5 大小的雙流網絡結構,表示為

式中,X∈Rh×w×C為輸入的特征圖,f代表卷積操作,這樣不僅可以通過多分支結構獲取光強圖像中高低頻部分的特征表示,而且可以避免過多的網絡分支造成訓練難以收斂。其中5×5 的卷積采用空洞卷積操作。

在融合部分,通過求和操作控制特征圖相加,然后由全局平均池化統計卷積層每個通道攜帶的信息得到s,最后進行特征降維得到z。整體過程表示為

式中,Fgp是全局池化操作,Ffc是全連接操作,δ為線性整流函數(Rectified linear unit,relu),B 為Batch normalization 層,Ws∈Rd×C,d=max(C/τ,L)表示全連接之后的特征維度,C為通道維度大小,τ為壓縮因子,L表示d的最小值。全局注意力模塊用于整合深層和淺層特征,以緩解深層特征分辨率低而引起的較小光斑信息丟失的問題。

選擇部分,使用softmax 函數計算各個通道的權重分布。計算方式為

式中,a和b分別為和的軟注意力權重矩陣,ac為a的第c行元素,bc同理。A和B同為注意力權重矩陣,Ac為A的第c行元素,Bc同理。由于池化層的存在,高頻信息量會進一步減少,導致深層特征對小目標的表達能力較弱。引入空間注意力機制對目標區域的特征加以權重,尋找網絡中特征間的聯系,使特征提取網絡有選擇性地關注包含重要信息的目標區域。最后的輸出矩陣計算公式為

式中,c表示拼接操作,σ為sigmoid 激活函數,Favg與Fmax分別表示沿著通道軸執行的平均池化操作和最大池化操作。與通道注意力不同的是,空間注意力可以將高低頻信息區分開來,這與通道注意力是互補的[20],經過優化空間信息的特征圖可以有效表達像素點間的特征相似度,空間注意力可以很好地獲得上下文語義信息。

2.3 損失函數

為了讓波前像差的Zernike 系數重建更合理,結合常用的波前評價指標來改進網絡的損失函數。常用的AO 系統評價指標有波前峰谷值(Peak to Valley,PV)和波前均方根值(Root Mean Square,RMS)等,PV 用來表示波前最高點與最低點的差值,RMS 表征被測光束波前相較于理想波前的偏離程度[21],其公式分別為

式中,Δ?為波前像差,為其均值,ρ和θ為光瞳面的極坐標??梢钥闯?,PV 值反映的波前信息不夠全面,RMS 值則更注重波前的整體信息,結合兩者能更準確地表現波前情況。因此結合均方誤差(Mean Squared Error,MSE)的損失函數為

式中,zact和zpre分別為實際與估計的Zernike 系數,長度為N,γ為各損失的權重,L 為各個損失函數的加權和,損失函數的縮小代表著重構精度的提高。

3 基于深度學習的波前復原模擬

3.1 仿真驗證

為驗證提出的殘差注意力網絡的可行性,模擬渦旋光束在不同湍流強度下的傳輸,展開波前復原仿真。根據Taylor 凍結湍流假設理論,大氣湍流在短時間內其空間結構保持不變,因此假設湍流凍結時間為10~20 ms。渦旋光束在經過大氣湍流之后發生了相位失真,其大小與D/r0比值相關,其中D是系統孔徑直徑,r0是大氣相干長度。采用大氣相干長度r0表述湍流強度的影響,r0越大表示湍流強度越小。對于光束束腰半徑為3 cm 的系統,D/r0=2 可以表示弱湍流,D/r0=10 可以表示中湍流,D/r0=20 可以表示強湍流。其余參數設置如表1 所示。

表1 仿真參數Table 1 Parameter of simulation

同時為使仿真更加合理,設置比值范圍為D/r0=2~20,間隔為2,每個比值生成5 000 組隨機Zernike 系數和對應的光強圖作為訓練數據,其中訓練集、驗證集與測試集的比值為8∶1∶1,訓練圖像的大小調整為224×224 像素,網絡的輸出為36 位Zernike 系數。為使實驗對比更清晰,將從輸出的Zernike 系數中生成對應的波前相位進行對比,并從預測相位與真實相位之間的殘差來測試網絡準確性。由式(3)、(5)和表1 中參數可生成如圖4 所示的湍流相位屏和光強分布。圖4(a)為弱湍流強度下Zernike 系數模擬的湍流相位屏,單位為度(°),以及拓撲荷數為3 的LG 光束經過圓孔光闌后的光強分布,圖中PV 值和RMS 值的單位為rad,其值較小,代表大氣環境良好。圖4(b)~(c)為中湍流和強湍流下的相位屏圖和光強圖,隨著PV 值和RMS 值變大,相位屏的起伏變大,表示大氣信道環境變差,光強分布發生畸變。

圖4 湍流相位分布和光強分布Fig.4 Turbulent phase distribution and light intensity distribution

仿真環境采用python 語言的keras 深度學習庫,離線訓練迭代次數epoch 設為100,每個批次大小Batchsize 設為50。采用自適應學習率Adam 算法,設置初始學習率為0.001,當網絡精確度在10 個批次內未增加時學習率下降為0.000 1,在全連接層中使用Dropout 層來防止網絡過擬合,并使用tanh 函數作為網絡激活函數。綜合評估后損失函數各個部分的權重設置為γMSE=1,γPV=0.8,γRMS=0.5。訓練過程中的損失函數值與準確率大小如圖5 所示,圖5(a)中損失函數隨著迭代次數增加而減小,圖5(b)中準確率逐漸增加,最終整體準確率能達到97%左右。

圖5 模型的損失函數與精確度Fig.5 Loss function and accuracy of the model

為驗證殘差注意力網絡模型的有效性和魯棒性,仿真中在不同湍流強度下隨機生成了5 組Zernike 系數,并生成對應的相位屏如圖6(a)所示。通過提出的混合注意力網絡模型預測Zernike 系數,估計的結果和其殘差相位如圖6(b)~(c)所示,文獻[12]的結果如圖6(d)所示??梢钥闯鎏岢龅臍埐钭⒁饬W絡模型預測的殘差最小,僅使用卷積神經網絡的模型預測的結果不夠準確,其殘差相位的PV、RMS 值如表2 所示,本文方法預測的畸變相位殘差值較小,相較于之前的工作能得到更符合實際的相位屏。因此從圖6 和表2 可知,在不同湍流強度下混合注意力網絡均有很好的重構效果,且復原的相位屏與實際相位屏相似度高。圖7 為5 種不同湍流強度下預測的Zernike 系數與實際系數的對比,可以看出本文方法的預測結果與實際系數較為接近。

圖6 預測的湍流相位與實際對比Fig.6 Comparison of the predicted turbulence phase with the actual phase

表2 不同湍流強度下殘差相位的PV 值和RMS 值Table 2 PV and RMS values of the residual phase at different turbulence intensities

圖7 預測的Zernike 系數與實際對比Fig.7 Comparison of the predicted Zernike coefficient with the actual coefficient

根據預測的Zernike 系數重構波前之后,向畸變光束加載反相波前,即可實現湍流相位的校正。為驗證殘差注意力網絡模型的魯棒性,在不同信噪比下進行仿真。不同信噪比下的光強如圖8 所示,隨著湍流強度增加,LG 光束的輪廓逐漸變形,噪點分布也隨著信噪比減小而增加。預測的結果如圖9 所示,在高信噪比條件下預測效果與無噪聲相近,在低信噪比,如5 dB 的情況下,殘差相位的起伏仍比較平緩,具體結果如表3所示。通過表3 和圖9 的結果可知,提出的混合注意力網絡能重建準確的波前相位,并具有較高的魯棒性。

表3 不同信噪比下殘差相位的PV 值和RMS 值Table 3 PV and RMS values of the residual phase at different SNR

圖8 不同信噪比下的光強Fig.8 Light intensity map at different SNR

圖9 不同信噪比下的殘差相位Fig.9 Residual phase at different SNR

3.2 消融仿真

為驗證提出的混合注意力結構的有效性,仿真中訓練了幾種不同模型,包括基礎骨干網絡ResNet50、添加CA 的網絡、添加SA 的網絡以及添加混合注意力結構的網絡,得到了如表4 所示的準確率結果。

表4 不同模型的準確率與計算時間對比Table 4 Comparison of accuracy and calculation time of different models

表4 表明,添加了注意力機制的網絡在重構Zernike 系數上的精度最高,且與單一注意力結構相比,混合注意力結構的準確率更高,達到了97.1%。在運行時間上,測試了1 000 次后取其平均值,從表中可知,添加注意力網絡的計算時間均在10 ms 以下,可以滿足實時波前校正的要求,隨著硬件性能的增加,運行時間可以繼續降低?;旌献⒁饬Y構的運行時間比ResNet50 稍長,但綜合準確率來評估后,本文提出的殘差注意力網絡性能最好。

為驗證注意力機制在網絡中的作用,在原數據集的基礎上,設計以下消融仿真,將提出的混合注意力機制作為基礎訓練模型,然后分別移除CA 和SA 訓練得到2 個不同模型,訓練中所有參數設置均相同。在相同湍流條件下隨機生成一個相位屏,其結果如圖10(a)所示,不同模型測試的結果如圖10(b)所示。圖10(c)左圖為完整模型復原的波前殘差,相較于單一注意力機制得到的結果,其重構相似度最高。從圖10(c)中可知,移除CA 會導致特征之間的關聯性下降,重構波前的相似度變低,移除SA 導致特征提取能力下降,特征表達的能力變弱。該消融實驗得到的評價指標對比如表5 所示,完整模型的殘差PV 值為0.145 1 rad,RMS值為0.052 7 rad,相比其他兩種模型更小。綜上,混合注意力機制具有實際有效性。

圖10 去除部分注意力機制與完整模型的預測結果對比Fig.10 Comparison of prediction results between the model with partial attention mechanism removed and the complete model

表5 去除部分注意力機制的評價指數對比Table 5 Comparison of evaluation indexes of removing partial attention mechanism

為驗證各種損失函數在模型中的作用,在原數據集上進行消融仿真。完整模型為聯合3 種損失函數的網絡,分別移除其中一種損失函數訓練不同模型進行測試,訓練中所有參數的設置均相同。在相同湍流條件下隨機生成一個相位屏,結果如圖11(a)~(c)所示,不同模型測試的結果如圖11(b)所示。完整模型復原的波前殘差如圖11(c)左圖所示,可以看出,移除PV 時,得到的波前殘差畸變幅度較大;移除RMS 時,波前殘差結果在內容上發生了失真,導致整體相似度較低。各個模型生成的評價指標對比如表6 所示,完整模型的殘差PV 值為0.164 9 rad,RMS 值為0.039 5 rad,因此結合實際評價指標的損失函數是合理有效的。

表6 去除部分損失函數的評價指數對比Table 6 Comparison of evaluation indexes of partial loss function

圖11 去除部分損失函數的模型與完整模型的預測結果對比Fig.11 Comparison of partial loss function with complete model

4 結論

本文針對大氣湍流引起渦旋光束畸變,導致FSO 通信質量降低的問題,提出了結合殘差注意力網絡的AO 系統反演波前相位,從而實現有效的波前校正。訓練后的模型建立了前36 階Zernike 系數與畸變光強分布之間的準確映射關系。在不同湍流條件下進行仿真,得到的波前殘差PV 值和RMS 值優于現有研究,表明網絡具有強魯棒性。在D/r0=2 的情況下PV=0.045 rad,RMS=0.011 rad;在D/r0=10 的情況下PV=0.226 rad,RMS=0.046 rad;在D/r0=20 的情況下PV=0.275 rad,RMS=0.071 rad。預測的Zernike 系數與實際系數相近,通過系數重構的相位與實際相位相似度高。驗證了混合注意力網絡在重構波前相位任務中的有效性,在較少增加時間復雜度的情況下準確率達到最高。殘差注意力網絡精確度高、實時性好和靈活性強的特點,可為深度學習在AO 系統中的實際應用提供保障。

猜你喜歡
光束湍流殘差
氣球上的五星期(九) 光束與金礦
基于雙向GRU與殘差擬合的車輛跟馳建模
詭異的UFO光束
“湍流結構研究”專欄簡介
基于殘差學習的自適應無人機目標跟蹤算法
基于遞歸殘差網絡的圖像超分辨率重建
重氣瞬時泄漏擴散的湍流模型驗證
綜合電離層殘差和超寬巷探測和修復北斗周跳
激光探索
淺談汽車前照燈近光光束垂直偏移的檢測及調整
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合