?

結合梯度指導和局部增強Transformer的圖像去模糊網絡

2024-02-28 08:18周冬明
小型微型計算機系統 2024年1期
關鍵詞:集上分支梯度

楊 浩,周冬明,趙 倩

(云南大學 信息學院,昆明 650504)

0 引 言

相機獲取圖像需要其感光傳感器暴露在光線下一定時間,以收集足夠的光子.如果在這個時間間隔內相機自身發生移動或拍攝場景中存在快速運動的物體,會導致采集到的圖像在相對運動的方向上出現模糊.模糊圖像不僅在視覺上令人不快,而且還會顯著降低視覺系統(包括監控系統和自動駕駛系統)進行目標檢測[1,2]和圖像分割[3,4]的性能.圖像去模糊的目的是從模糊圖像中恢復潛在的清晰圖像,然而這是一個高度不適定的逆問題,因為可能有多張清晰圖像同時對應一張模糊圖像.為了解決這個不適定問題,早期的去模糊方法通過研究圖像先驗[5-8]來估計模糊核從而求解潛在清晰圖像.然而,手動設計的先驗是主觀的,很難準確地表征現實世界中自然圖像和模糊核的內在分布,從而限制了去模糊算法的性能.

近五年來,隨著深度學習在其他視覺任務上的成功,許多基于深度卷積神經網絡的圖像去模糊算法[9-13]逐漸被提出.早期基于深度卷積神經網絡的算法[9-11]主要利用卷積神經網絡替換傳統框架中的一些模塊或步驟(例如,估計模糊核),以利用豐富的數據.Schuler等人[9]使用CNN構建模糊輸入和預測內核之間的映射,可以自動學習盲反卷積來去除模糊.Gong 等[10]通過CNN估計出模糊圖像的運動流圖,并據該圖恢復出清晰圖像.

最近的方法使用卷積神經網絡(CNN)來提取特征并直接學習模糊圖像和清晰圖像對之間的映射.這些方法針對圖像去模糊對卷積神經網絡進行改進并提升了去模糊性能,例如多尺度(MS)[12,13]、多補丁(MP)[14,15]和多時間(MT)[16]循環架構等.Nah等人[12]提出了一種端到端的多尺度網絡,該網絡以由粗到細的方式逐步恢復出清晰圖像.Zhang等人[14]提出一種多補丁分層去模糊網絡,該方法通過空間金字塔匹配提高去模糊的質量.Park等人[16]提出一種多時間網絡,該模型把重度模糊分解成多個輕度模糊,并在每次迭代中逐步地對輕度模糊進行去模糊.受生成對抗網絡(GAN)啟發,一些方法[17-19]嘗試使用GAN來將模糊圖像直接生成清晰圖像.由于不再需要手動設計先驗,這些基于CNN的方法具有更強的泛化性,能夠更容易地處理復雜場景模糊,并獲得了不錯的效果.然而,卷積是內容無關的,因為相同參數的卷積核被整個圖像共享,基于卷積神經網絡的去模糊方法忽略了不同圖像區域之間的不同性質.另一方面,由于局部性等歸納偏差,卷積無法有效地學習遠程依賴信息.由于動態場景的模糊通常是不均勻的,這限制了CNN去模糊性能的進一步提升.

Transformer[20]最初是自然語言處理(NLP)領域的一個模型,用于并行處理詞向量以加速模型推理,Transformer的全局計算特性使得它能夠很好地對遠程上下文信息進行建模.作為一個開創性的工作,Dosovitskiy 等人[21]首先將Transformer用于計算機視覺領域.該模型通過將圖像分割成 16×16 的圖像塊,將不同的圖像塊視為不同的詞向量輸入到 Transformer 中建立遠程依賴關系,提高了圖像分類的準確率.之后許多研究者將Transformer應用到目標檢測、圖像分割、姿態估計等高層次計算機視覺任務中,并且這些方法的性能大幅超過了許多基于CNN的方法.然而,Transformer中自注意力機制的復雜度隨圖像大小的二次增加阻礙了其在需要高分辨率特征圖的去模糊任務中的應用.此外,局部信息能更好的幫助恢復模糊圖像的細節,而視覺Transformer不具備局部性[22].

在本文中,提出了一種具有梯度引導的雙分支Transformer用于圖像去模糊,Transformer的全局計算特性使得網絡能更好的處理復雜模糊.具體地說,受Swin Transformer啟發,本文使用了一個基于窗口的Transformer并且在多頭自注意力輸入特征圖周圍使用反射填充來增強對邊緣信息的利用.同時,通過在Transformer塊的自注意力機制和前饋網絡中引入卷積來解決傳統Transformer局部建模不足的問題.此外,由于梯度圖揭示了圖像中每個局部區域的清晰度,為了進一步使提出的模型能更好的恢復圖像細節,本文引入梯度圖來引導模糊圖像的復原并提出了一個特征融合模塊來有效融合去模糊分支和梯度分支的特征信息.

1 相關理論

1.1 圖像的模糊模型

圖像傳感器通過在相機曝光時間段內測量光子來捕獲圖像.在明亮的照明下,曝光時間足夠短,圖像可以捕捉清晰的瞬間.但是,如果光線較弱,較長的曝光時間可能會導致運動模糊.模糊圖像可表示為:

Ib=f(Is,θ)

(1)

其中f(·)是圖像模糊函數,θ是參數向量.Is和Ib分別表示清晰圖像和模糊圖像.圖像去模糊的目標是從模糊圖像中恢復清晰的圖像,即找到模糊函數的反函數,如:

Is=f-1(Ib,θi)

(2)

其中f-1(·)為去模糊模型,θi表示其參數.對于基于深度學習的去模糊方法,f-1(·)和θi可以分別視為網絡及其參數.

更進一步來說,運動模糊圖像的退化過程可被建模為卷積過程:

Ib=k?Is+N

(3)

其中k是模糊核,N表示加性高斯噪聲.在這樣的圖像中,任何相對于相機移動的物體都會沿著相對運動的方向看起來很模糊.比如相機抖動通常會使得靜態背景出現模糊,而在沒有相機抖動的情況下,快速移動的物體會導致這些物體模糊,而背景仍然清晰.模糊的圖像自然會包含由這兩個因素引起的模糊.早期的方法使用移位不變內核對模糊進行建模[5,8],而最近的研究解決了非均勻模糊的情況[12,14,19].

1.2 Transformer介紹

Transformer[20]首次被用于自然語言處理(NLP)領域的機器翻譯任務.如圖1示,它由一個編碼器和一個解碼器以及幾個相同體系結構的轉換器塊組成.編碼器生成輸入的編碼,而解碼器獲取所有編碼并使用它們合并的上下文信息來生成輸出序列.每個Transformer塊由多頭關注層、前饋神經網絡、跳躍連接和層歸一化組成.多頭自注意力層的作用是建立序列之間的遠程依賴關系,前饋網絡的作用是將序列映射到更大的空間維度.

圖1 標準Transformer模型結構Fig.1 Standard Transformer model structure

如圖2(a)所示,在自注意力層中,首先將輸入向量轉換為3個不同的向量:查詢向量q、關鍵字向量k和值向量v.然后,來自不同輸入的矢量被投影成3個不同的矩陣,即Q、K和V.隨后,不同輸入矢量之間的注意函數計算如下:

(4)

圖2Fig.2

公式(4)的解釋為:首先計算每對不同向量之間的分數,這些分數決定了自注意力在對當前位置的序列進行編碼時給予其他序列的關注程度.其次將分數歸一化以增強改進訓練的梯度穩定性,然后將分數轉換為概率.最后,將每個值向量乘以概率之和.概率較大的矢量將從以下各層獲得額外的關注.

為了提高提高自注意力層的性能,多頭注意力被引入自注意力層,其結構如圖2(b)所示.對于自然語言處理中給定的參考詞,通常希望在閱讀句子時關注其他幾個詞.單頭自注意力層限制了模型專注于一個或多個特定位置的能力,而多頭自注意力解決了這個問題,這是通過給予注意力層不同的表示子空間來實現的.具體來說,不同的“頭”使用不同的向量q、關鍵字向量k和值向量v矩陣,這些矩陣由于隨機初始化,可以將訓練后的輸入向量投影到不同的表示子空間中.

1.3 梯度信息

圖像的梯度表示圖像中像素周圍的變化劇烈程度,這反映了圖像的邊緣信息[23].如果在模型中引入梯度信息,模型可能會從梯度空間中學到更多,從而可以很好地保留幾何結構恢復清晰銳利的邊緣.計算相鄰像素之間的差值可以獲得圖像I的梯度圖,其計算過程如下所示:

Ix(x)=I(x+1,y)-I(x-1,y)

(5)

Ix(x)=I(x+1,y)-I(x-1,y)

(6)

I(x)=(Ix(x),Iy(x))

(7)

(8)

其中G(·)表示提取梯度圖的操作,x和y表示圖像不同像素的坐標.獲得梯度的操作可以很容易地通過具有固定核的卷積層來實現.不考慮梯度方向信息,因為梯度強度足以揭示恢復圖像中局部區域的清晰度.因此,本文采用梯度的強度圖作為梯度圖,這種梯度圖可以被視為另一種圖像,可以利用圖像到圖像轉換的技術來學習兩種模態之間的映射.

2 本文方法

2.1 整體網絡結構

如圖3所示,提出的去模糊網絡由兩個分支組成,即內容分支和梯度分支.內容分支通過Transformer強大的遠程上下文建模能力去除模糊,而梯度分支使用Transformer學習模糊圖像的梯度圖到清晰圖像的梯度圖的轉換.模型中的梯度分支包含了來自內容分支的幾個層的信息,這是因為內容分支能夠攜帶豐富的結構信息從而利用這些特征作為先驗來提升梯度分支的性能.由于梯度圖的大部分區域都接近于零,因此梯度圖可以強調輪廓的空間關系,并通過這些信息引導圖像生成更清晰的邊緣.

圖3 網絡總體架構Fig.3 Overall network architecture

對于內容分支,本文使用了Transformer塊構成的U形網絡并且在編碼器和解碼器之間建立跳躍連接.對于輸入的退化的圖像U∈h×W×3,內容分支首先通過卷積來獲得淺層特征.緊接著,這些淺層特征被輸入到一個4層對稱編碼器-解碼器并轉化為深層特征,其中每個編碼器和解碼器具有16個Transformer塊,編碼器從高分辨率輸入分層減小特征圖大小,同時擴大通道容量.解碼器將低分辨率多通道數的特征圖作為輸入,并逐步恢復高分辨率表示.在編解碼器中,采用用像素混洗和像素逆混洗分別作為上下采樣操作操作,這能最大程度減少信息丟失.最后應用3×3卷積層獲得殘差圖像R∈h×W×3并通過I0=I+R獲得恢復的圖像.

梯度分支的網絡結構與內容分支相同,但每個編碼器和解碼器的Transformer塊減少到4.此外每個內容分支的編解碼器的輸出通過通道拼接操作融合到梯度分支相對應的編解碼器輸入.最后使用交互式特征融合模塊將梯度分支的特征和內容分支的特征進行融合,并通過損失函數監督生成梯度圖.

2.2 Transformer塊

如圖3所示,每個Transformer塊由多頭關注層、前饋神經網絡、跳躍連接和層歸一化組成.多頭自注意力層的作用是建立序列之間的遠程依賴關系,前饋網絡的作用是將序列映射到更大的空間維度.

2.2.1 多頭自注意力

受Swin Transformer啟發,本文使用帶有掩碼的移位窗口方案對遠程依賴進行建模.由于移位窗口帶有掩碼,使得圖像邊緣的窗口尺寸小于設置的窗口尺寸.對于高級視覺任務,圖像的對象通常位于圖像的中心,使得圖像的邊緣像素對結果的貢獻很小.而對于圖像去模糊,圖像邊緣與圖像中心一樣重要.因此,本文在多頭自注意力輸入特征圖周圍使用反射填充來增強對邊緣信息的利用.給定大小為H×W×C的輸入,首先通過將反射填充后的輸入劃分為不重疊的M×M個局部窗口,并將輸入重塑為HW/M2×M2×C特征,其中HW/M2是窗口的總數.然后,它為每個窗口分別計算標準自注意力(公式(1)).

此外,為了進一步增強Transformer對局部信息的建模能力,加入了一個與多頭自注意力并行的卷積分支.相比起其他在Transformer中加入卷積的架構,本文使用卷積來補充局部信息,而不是充當位置嵌入.即仍然使用注意力機制來聚合窗口內的信息,但也使用卷積來聚合鄰域內的信息,而不考慮窗口分區.

2.2.2 局部增強前饋網絡

標準Transformer中的前饋網絡(FFN)在利用本地上下文的能力方面受到限制.相比高級計算機視覺任務,局部信息對于圖像去模糊更為重要,因為恢復模糊區域需要利用周圍像素的信息.為了克服這個問題,受最近工作的啟發[24],本文在基于Transformer的結構中向FFN添加了深度卷積塊.如圖3所示,局部增強前饋網絡首先對每個輸入向量應用一個線性投影層以增加其特征維度,然后將標記重塑為2D特征圖,并使用1×1卷積核3×3深度卷積來捕獲局部信息.然后將特征展平為標記,并通過另一個線性層縮小通道以匹配輸入通道的尺寸.本文使用GELU作為每個線性層或卷積層之后的激活函數.

2.3 交互式特征融合模塊

雖然頻域引入梯度信息可以強調圖像的結構邊緣,但充分利用圖像內容信息和和圖像梯度信息來重建圖像仍然很困難.最簡單的方法是將兩個分支的特征相加或連接.然而,這并不能有效地利用這些特征進行圖像重建,并且可能導致特征干擾.因此,本文提出一個交互式特征融合模塊(interactive fusion module,IFM)來逐漸融合梯度信息和內容信息.

如圖3所示,兩個卷積核大小為3×3的卷積將內容特征FC和梯度特征FG映射到FbC和FbG.接下來,通過使用通道拼接來融合FbC和FbG生成的特征并通過Sigmoid函數生成特征圖.最后,將激活的特征與原始特征相加以增強被模糊區域破壞的圖像的背景信息.最后將相加后的特征拼接起來即可得到IFM的輸出.IFM將兩個特征交互式的融合到一起,從而更有效的利用內容特征和梯度特征.

2.4 損失函數

對于圖像恢復任務,MSE是最常用的損失函數.然而MSE中平方項的過度懲罰而會產生過度平滑的視覺效果.本文使用Charbonnier損失函數[25],該函數對小錯誤的容忍度更高,并且在訓練期間具有更好的收斂性,以指導網絡的輸出結果對清晰圖像的執行逐次逼近.Charbonnier損失函數表示如下:

(9)

由于上文已經提到梯度圖是反映圖像結構信息的理想工具,它也可以用作二階約束來為模型提供監督.本文通過減小從去模糊圖像中提取的梯度圖與從相應清晰圖像中提取的梯度圖之間的距離來制定梯度損失.其表示如下:

(10)

其中G(·)表表示公式(4)中的梯度算子.圖像重建總損失如下:

Lchar=Lchar+λ×Ledge

(11)

在圖像和梯度域的監督下,Transformer不僅可以學習精細的外觀,還可以避免幾何失真.對于梯度圖重建,使用Charbonnier損失函數來進行監督(圖3梯度分支).值得注意的是,提出的模型不僅使用梯度圖來引導模型重建高質量的圖像,還通過縮小模糊圖像梯度圖和清晰圖像梯度圖之間的差異來進一步提升圖像細節.

3 實驗結果與分析

3.1 數據集

本文總共使用了兩個合成數據集GoPro[12]和HIDE[26]以及一個真實數據集RealBlur-J[27].GoPro數據集[12]使用GoPro Hero 4相機捕獲每秒240幀(Fps)的視頻序列,并通過對連續的短曝光幀進行平均來生成模糊圖像,它是圖像運動模糊的常用基準,包含3214個模糊/清晰圖像對.在實驗中遵循相同的分割[12],使用2103對用于訓練,其余1111對用于評估.HIDE數據集[26]合成方式與GoPro類似,只是相機響應函數的選擇不同,其測試集包含2,025幅圖像.對于真實圖像,本文還在RealBlur-J數據集[27]上評估了不同的去模糊的方法,該數據集有3758對模糊和清晰對用于訓練,980對用于測試.為了進一步驗證提出的去模糊算法的泛化性以及在工程上的應用價值,本文還在遙感數據集上對去模糊性能進行了測試.根據Fang等人[28]的方法,本文使用ISPRS Potsdam[29]數據集來獲得200張具有各種復雜模糊的遙感圖像,該數據集無需訓練即可直接測試.

3.2 實驗設置

本文所有實驗在一臺裝有一個NVIDIA RTX 3090 GPU的工作站上完成,CPU型號為Intel(R)Core(TM)i7-10700K @ 5.0GHz,使用64位 Windows 10操作系統,CUDA11.1.本文模型基于PyTorch 1.9.1深度學習框架實現,在訓練階段,使用AdamW優化器來訓練模型,并將輸入大小設置為256×256,批大小設置為4.初始學習率為4×10-4,使用余弦退火策略來穩定地降低學習率.對于數據增強,使用了隨機旋轉、隨機翻轉.本文使用GoPro數據集上進行400000次迭代訓練.

3.3 對比實驗

本文將提出模型與近年來幾種先進的傳統去模糊方法和基于深度學習的去模糊算法模型進行比較,包括DCP[7]、Whyte[5]、DeepDeblur[12]、DeblurGANv1[17]、DeblurGANv2[18]、DMPHN[14]、DBCP[19]、MT-RNN[16]、MSCAN[30]、BANet[31].其中DCP和Whyte是傳統去模糊算法,其余是基于深度學習的去模糊算法.所有去模糊結果都通過作者公開發布的源代碼獲得,并使用常用的峰值信噪比(PSNR)和結構相似性指數(SSIM)作為評價指標來評估不同去模糊方法的性能.PSNR值越高,從模糊圖像中恢復清晰圖像的效果越好.SSIM的值越接近1,去模糊圖像越接近參考清晰圖像.

3.3.1 在合成數據集上的結果

定量結果如表1所示,可以看出在合成數據集(GoPro和HIDE)上本文算法獲得了最高的PSNR和SSIM數值.這表明與其他去模糊方法相比,提出的方法可以實現更好的性能.與第二好的方法BA相比,本文算法的的PSNR提升了0.16dB,SSIM提升了0.001.值得注意的是,提出的方法不僅在GoPro數據集上取得了最佳性能,而且在HIDE數據集上也獲得了最高的PSNR和SSIM值.

表1 在3個數據集上PSNR和SSIM指標的定量結果Table 1 Quantitative results of PSNR and SSIM metrics on the three datasets

提出的算法對圖像去模糊效果的定性分析如圖4所示.從圖中4可以看到,傳統算法幾乎無法去除模糊.這是因為傳統算法使用固定的手動設計的先驗,很難處理不同場景下的模糊.同時,基于深度學習的方法能一定程度去除模糊,但它們難以處理大面積的模糊以及去模糊的同時無法恢復清晰的邊緣.得益于Transfomer強大的遠程上下文建模能力,本文算法能夠更好的處理大面積的模糊,同時本文引入的梯度信息能幫助網絡恢復銳利的邊緣.以圖4中的最后一行圖像為例,傳統算法(DCP)幾乎無法恢復模糊圖像.最近的基于CNN的方法(DeepDeblur、DMPHN、MT-RNN、BANet)處理的圖像無法徹底的去除模糊,并且無法獲得銳利的邊緣.相比之下,本文算法能夠更好的恢復圖像細節信息.

圖4 在合成數據集(GoPro和HIDE)上的視覺效果Fig.4 Visual results on the synthetic dataset

3.3.2 在真實數據集上的結果

為了進一步驗證本文算法在真實場景中的去模糊性能,本文還在真實模糊數據集上將提出的算法與其他算法進行比較.表1展示的在RealBlur-J數據集上不同算法的量化指標.可以看出,本文算法依然在所有評價指標上達到了最高,這說明提出的算法不僅在合成數據集上獲得了高性能,還能更好的應用于真實場景.

圖5是在真實數據集上的定性分析.傳統算法的去模糊結果幾乎和輸入模糊圖像沒有差異,基于CNN的方法也很難徹底去除模糊.例如圖5中的文字區域,許多方法都無法準確的恢復出清晰的文字,并存在很多偽影.相比之下,只有本文算法能夠準確的恢復出清晰的文字.顯然,本文算法的去模糊結果獲得了最好的視覺效果,這與在合成數據中得到的結論相同.

圖5 在真實數據集上的視覺效果Fig.5 Visual results on the real dataset

3.3.3 在遙感數據集上的結果

在遙感圖像數據集上的去模糊定量結果如表2所示.可以觀察到,提出的去模糊模型再次獲得了最高的PSNR和SSIM數值.相比傳統算法DCP,提出的模型去模糊后圖片的PSNR大幅提升了8.24dB.相比第二好的深度學習去模糊算法BANet,PSNR和SSIM分別提升了1.88dB和0.072.

表2 在遙感數據集上的定量結果Table 2 Quantitative results on remote sensing datasets

圖6是在遙感數據集上的定性分析.從圖中可以看出,提出的去模糊算法獲得了最清晰紋理和邊緣.例如,圖中房屋和車的清晰度恢復得更好,輸出結果更接近標簽圖像(Ground Truth).所有這些結果進一步表明,提出的模型在不同場景下具有更好的泛化能力.

圖6 在遙感數據集上的視覺效果Fig.6 Visual results on the remote sensing dataset

3.4 消融實驗

本文通過全面的消融研究來驗證網絡各個模塊組成的有效性以及超參數的設置.所有的消融實驗都在GoPro數據集上進行.

3.4.1 超參數設置

本文對Charbonnier損失和梯度損失進行了權衡實驗,如圖7所示.在實驗中通過調整超參數λ的值來找到最優的超參數λ(公式(11)),從而優化網絡性能.本文將超參數λ分別設置為0、0.2、0.5、1和2.從圖中注意到,當超參數λ=0.2時獲得了最佳性能,因此本文將λ設置為0.2.

圖7 不同超參數設置的結果Fig.7 Results of different hyperparameter settings

3.4.2 網絡組成

如表3所示,當網絡去除梯度分支(w/o Gradient branch)時,PSNR和SSIM分別下降了0.39dB和0.04.這表明梯度分支的信息能夠更好的幫助網絡去除模糊.當去除Transformer塊中的并行卷積分支(w/o parallel convolution)時,PSNR和SSIM分別下降了2.21dB和0.053.這驗證了與多頭自注意力并行的卷積能夠進一步提升模型性能.當使用逐元素相加或者通道拼接的方式來替換IFM來融合特征,PSNR分別下降了0.36dB和0.21dB,這說明提出的特征融合模塊能更好的融合梯度信息和圖像內容信息.

表3 網絡不同模塊組成的消融實驗Table 3 Ablation studies with different module compositions of the network

3.4.3 Transformer的有效性

殘差塊(Res Block)[32]是卷積神經網絡中廣泛使用的特征提取模塊.本文通過用殘差網絡[30]替換所有Transformer塊來證明提出的方法的有效性,這兩個模型保持相同的參數量(26MB).如表3的序號3所示,提出的方法獲得了最高的PSNR和SSIM.因此,與傳統的卷積神經網絡相比,所提出的Transformer具有非常明顯的性能提升.

3.5 在后續視覺任務上的應用

圖像恢復技術的最終目標是服務于高級計算機視覺任務,例如對模糊圖像的物體檢測和圖像分割.本文使用圖像去模糊模型作為目標檢測和圖像分割的預處理步驟來驗證不同算法的性能.在實驗中,分別使用被廣泛使用的YOLOv4[1]和PSPNet[33]作為目標檢測器和圖像分割器.如圖8所示,使用模糊圖像目標檢測無法檢測到對象,并且圖像分割也產生了誤分割.其他去模糊方法能一定程度提升性能,但依然存在誤檢現象.相比之下,提出的的方法可以顯著提高目標檢測和圖像分割算法的性能,減少誤檢.因此,提出的模型可以有效地提高后續高級計算機視覺任務的魯棒性并且更適合作為后續高級計算機視覺任務的預處理步驟.

圖8 在高級計算機視覺任務上的評估Fig.8 Evaluation on high-level computer vision tasks

4 結 論

本文提出一種基于梯度引導的局部增強Transformer模型用于圖像去模糊.主要方法包括以下幾點:1)本文引入了一種具有窗口機制的Transformer用于圖像去模糊,Transformer的全局計算特性使得網絡能更好的處理復雜模糊.同時,本文通過在傳統Transformer的自注意力機制和前饋網絡中引入卷積來解決Transformer對局部信息建模不足的問題;2)本文使用梯度信息來指導模糊圖像的復原,從而能夠獲得更清晰的物體結構與邊緣;3)本文提出了一種交互式特征融合模塊,從而能夠充分利用圖像的梯度信息和內容信息.在定量和定性的實驗中證明了本文算法的有效性和魯棒性.在未來的工作中,將進一步研究所提出的Transformer模型應用到圖像恢復任務(如圖像去霧[34]和低照度圖像增強[35]).

猜你喜歡
集上分支梯度
一個改進的WYL型三項共軛梯度法
Cookie-Cutter集上的Gibbs測度
一種自適應Dai-Liao共軛梯度法
鏈完備偏序集上廣義向量均衡問題解映射的保序性
巧分支與枝
一類扭積形式的梯度近Ricci孤立子
一類擬齊次多項式中心的極限環分支
復扇形指標集上的分布混沌
地溫梯度判定地熱異常的探討
生成分支q-矩陣的零流出性
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合