?

基于雙分支點流語義先驗的路面病害分割模型

2024-04-09 01:41龐榮楊燕冷雄進張朋劉言
智能系統學報 2024年1期
關鍵詞:張量先驗注意力

龐榮,楊燕,冷雄進,張朋,劉言

(1.西南交通大學 計算機與人工智能學院, 四川 成都 611756; 2.可持續城市交通智能化教育部工程研究中心,四川 成都 611756; 3.招商局重慶公路工程檢測中心有限公司, 重慶 400067; 4.國家山區公路工程技術研究中心,重慶 400067)

我國公路投資固定資產累計10萬億元,公路總里程接近520萬公里[1]。完善的公路路網和交通體系為推動國家經濟快速發展和加快城市化進程提供堅實的保障[2]。但是目前車多路多的嚴峻形勢,對公路養護提出了更高的要求,其中裂隙和坑槽等道路病害嚴重威脅到行車安全和人民生命健康,及時發現道路病害能避免非人為因素,保障車輛駕駛安全[3]。傳統人工路面病害識別檢測方法效率低下并且極具主觀性,急需引入路面病害智能化高效檢測,來加快智慧交通養護的發展,提高識別準確率的同時實現降本增效[4]。

基于數字圖像處理方法的路面病害識別算法需要先使用直方圖均衡、灰度變換等技術進行預處理,再使用投影法或者邊緣檢測對圖像進行分割,使用人工設計的卷積核進行特征提取,最后通過反向傳播訓練神經網絡實現路面病害識別?;跈C器學習的路面病害識別算法的特征提取需要依賴人工經驗,通過機器學習圖像特征提取算法自行挖掘特征表示,常見的算法有尺度不變特征變換算法和 方向梯度直方圖算法。但是傳統機器學習算法是基于大量假設條件通過詳細數學推導而設計出來的,不具有通用性。而基于深度學習的路面病害識別通過車載攝像頭采集RGB路面圖像,利用車載邊緣端設備的數據傳輸服務將圖片傳輸到云計算平臺并利用深度學習圖像算法進行識別,具有較強的魯棒性。

雖然深度學習方法相對更加魯棒,但是目前此類算法仍然存在許多難點:1) 采集圖像的質量和清晰度較低,路面病害與道路的幾何結構特征對比不明顯,影響算法識別率。2) 路面病害尺度不一致且相對復雜的真實路面背景普遍較小,類別不平衡問題極其嚴重。3) 目前大部分巡查設備的車載攝像頭安裝在車底并垂直地面進行病害采集,利用此方法采集的圖像識別效果好,具有背景簡單、病害相對背景占比大、清晰度高等特點,但是存在道路病害不完整,重復識別等問題。

針對上述問題,本文提出了一種基于雙分支點流語義先驗的裂隙、坑槽路面病害分割模型,可以對前置攝像頭采集的低質量路面圖像進行裂隙、坑槽病害分割。該網絡模型由雙重自注意力的語義先驗模塊、語義局部增強模塊和稀疏主體采樣點流模塊組成,并采用雙分支結構同步進行訓練。其中,雙重自注意力的語義先驗模塊運用高效自注意力機制和互協方差自注意力機制分別對圖像的二維空間和特征通道進行語義特征的提取。語義局部增強模塊利用深度可分離卷積對語義先驗特征進行局部聚合,并利用全連接層進行升維和降維操作,切換特征空間維度進行特征聚合。稀疏主體采樣點流模塊可以融合跨層和本層語義特征并利用稀疏采樣的方式對病害前景進行特征提取和傳播,以緩解類別不平衡問題。

本文的主要貢獻如下:1)提出一種基于雙分支語義先驗網絡,并運用高效自注意力機制和XCiT自注意力機制分別對二維空間和特征通道進行語義特征提取,以提高低質量復雜背景的病害識別率。2) 引入語義局部增強SLeff模塊提高局部特征聚合能力。3) 提出了一種新的稀疏主體點流模塊,并與傳統特征金字塔網絡相結合,進一步緩解路面病害的類別不平衡問題。4) 構建了一個真實場景的道路病害分割數據集,并在該數據集和公開數據集上與多個基線模型進行對比實驗,驗證了模型的有效性。

1 路面病害識別相關工作

傳統路面病害分割檢測主要依賴數字圖像處理技術,其過程一般包括以下步驟:1) 定義每個圖像像素的各種梯度特征;2) 使用二值分類器判斷像素點所屬類別。路面病害分割檢測算法總體可以分成基于閾值化,顯著性和圖像邊緣3大類[5-7]。Sheng 等[8]提出一種基于梯度提升決策樹的路面裂縫檢測方法,該方法通過結合多層次特征來描述裂縫,并充分利用了裂縫的結構化信息,使用梯度提升決策樹算法訓練模型。Sun等[9]使用領域加權對病害附近像素進行加權計算,然后使用局部閾值化對加權結果進行精細化分割,最后為了解決病害連接問題將膨脹法運用在病害特征上,取得良好結果。曹建農等[10]提出將均值漂移與直方圖模式判別方法對已分塊圖像進行平滑處理,根據圖像直方圖模式特征判斷有無病害,結合多方向搜索進行分割。然而上述方法都是基于人工設計特定特征提取模塊,無法自適應不同病害環境,不具有通用性。

隨著深度神經網絡在計算機視覺領域的不斷發展,高效智能化路面病害識別成為可能?;谏疃葘W習的路面病害檢測主要分為深度病害目標檢測[11-13]和深度病害語義分割[14-16]兩大類。這兩大類檢測方法根據特征提取網絡的不同又可以分為基于卷積神經網絡和基于視覺Transformer的病害識別算法。實際項目中對路面病害識別采用目標檢測的方法占主流,而基于語義分割的病害識別方法相對較少,因此具有較大的研究空間。

Zhang等[17]提出一種基于深度卷積神經網絡的路面裂縫檢測方法,將切割獨立的小塊圖像輸入神經網絡進行分類,并將分類結果組合成一整張概率圖,其中高亮部分作為病害區域。韓靜園等[18]將全卷積神經網絡用于路面裂縫分割,分析通道特征的關系,在特征金字塔網絡的池化層加入擠壓和激勵模塊,利用權重對原始特征在通道上進行重標定,自適應地為裂縫邊緣、圖案和形狀等特征分配權重。Yang等[19]提出一種用于路面裂縫檢測的特征金字塔和層次增強深度卷積網絡,該網絡以特征金字塔的方式將上下文信息集成到低層特征中進行裂紋檢測。

由于Transformer所具備的長距離上下文建模能力和并行計算能力使其在自然語言處理領域取得巨大成功,因此相關學者開始嘗試將其應用在計算機視覺領域[20]。Xie等[21]提出一種簡單高效且魯棒性強的語義自注意力分割模型(segmentation transformer, SegFormer),該模型由層次化自注意力編碼器層和僅由幾個全連接層構成的解碼器2部分組成。Strudel等[22]提出的Segmenters是基于最新的視覺自注意力模型的研究成果,將圖像分割成塊并將它們映射為一個線性嵌入序列,用編碼器進行編碼,再由Mask Transformer將編碼器和類嵌入的輸出進行解碼,解碼器可以通過用對象嵌入代替類嵌入來直接進行全景分割。Carion等[23]提出的基于自注意力的目標檢測算法通過在解碼器上附加一個掩碼頭并擴展到全景分割任務,并獲得有競爭力的結果。

2 基于雙分支點流語義先驗的復雜路面病害模型

模型整體框架如圖1所示,主要由自注意力層、語義先驗層與稀疏主體采樣點流模塊組成。模型整體流程如下:輸入圖像通過圖像塊劃分層變成統一大小的圖像塊,利用通過線性投射層和分層窗口自注意力模塊對前置攝像頭采集的真實路面病害圖進行特征提??;然后通過基于語義先驗模塊指導后續模塊的特征更新方向;通過稀疏主體點流模塊對病害前景特征點進行采樣,并利用采樣點進行訓練。最后利用雙分支訓練結構同步完成自注意力層和語義先驗層的更新優化。另外,本文利用語義局部增強模塊對語義先驗層輸出的語義特征張量在更高維度的特征空間進行局部語義聚合。

2.1 基于雙重注意力機制的語義先驗模塊

大部分語義分割任務都是對已經預訓練好的骨干網絡進行微調,以適配當前任務。但是直接對預訓練好的骨干網絡進行微調缺乏語義指導,忽略了整體網絡在編碼階段提供的語義上下文信息?;诖?,本模型引入Semask模型[24]的思想,在特征提取骨干網絡中添加圖像語義信息,每個先驗語義模塊都為后續特征提取模塊的微調提供指導意義,使得整體網絡的語義優化朝著更加合理的方向。具體來說,本模型設計了一個新的語義解碼器對中間語義先驗信息提供監督,使用基于雙重自注意力的語義先驗模塊,用來捕獲全局整體圖像特征在空間和通道2個維度的關系。對于圖像空間級別的特征語義提取,本文采用高效自注意力機制[25];對于特征通道維度級別的語義特征提??;本文采用XCiT自注意力機制[26]。相較于傳統的注意力計算方式,同時對這2個維度分別建??梢垣@得更多的上下文信息和關系?;陔p重自注意力的語義先驗模塊整體結構圖2所示。

圖2 基于雙重注意力的語義先驗模塊整體結構Fig.2 The overall structure diagram of semantic prior modules based on dual attention

雙重自注意力模塊中的高效注意力機制的運算方式為

式中:張量Q∈Rn×dq,張量K∈Rn×dk,張量V∈Rn×dv,ρq、ρk分別表示張量Q和張量K沿矩陣每一行和每一列應用Softmax歸一化函數。高效注意力改變傳統注意力機制中間特征矩陣的乘法順序,將歸一化的張量K與張量V相乘,再將生成的全局上下文向量與歸一化的張量Q相乘生成新的語義特征。其具有線性的時間和空間復雜度,同時與傳統的自注意力機制有相同的表達能力,使用矩陣乘法的結合律來交換2個矩陣乘法的順序,大大減小注意力機制運算次數,從n×n減小到dk×dv。

由于格拉姆矩陣(Gram)和協方差矩陣的特征譜非零部分等價,因此Gram矩陣和協方差矩陣能夠互相用對方的特征向量表示,而原始自注意力計算過程可以看成類似Gram矩陣的計算過程。因此對于特征通道維度的語義信息提取,本文拋棄了傳統沿圖像塊維度進行自注意力矩陣乘法的計算方式,改用基于互協方差自注意力機制來重新對特征維度進行建模,進一步提高運算效率,減少運算次數?;f方差自注意力機利用特征通道之間的注意力操作替代圖像塊維度之間顯示完全成對交互計算,將圖像塊維度投影的鍵標準化張量K與圖像塊維度投影的查詢標準化張量Q做乘法操作,得到關于特征通道的互協方差矩陣,并將該矩陣與值張量Q相乘得到特征通道的注意力張量。最后使用分組自注意力機制,對輸入特征在通道維度進行分組,只對位于對角線的通道分組應用互協方差注意機制,避免對所有通道進行計算降低運算復雜度。值得注意的是,為了使得互協方差矩陣權重分布更加合理,互協方差自注意力機引入了可學習的溫度參數τ?;谕ǖ捞卣鞯幕f方差自注意力公式為

綜上所述,整個語義先驗模塊的完整流程為

式中:EA為二維圖像高效注意力操作,XA為通道XCiT注意力操作,EAres和XAres分別為注意力計算中間結果,LN為層標準化。

2.2 融合局部增強信息的語義先驗模塊

雖然Transformer網絡架構能夠克服卷積的歸納偏置所帶來的局限性,但是其訓練需要大量數據集[27],其模型無法通過簡單幾層網絡輕易捕捉本文所構建的小樣本路面病害圖像的幾何低維拓撲結構信息。受到CeiT模型的啟發[28],本文在語義先驗模塊中引入語義局部增強SLeff結構對語義信息進行局部聚合操作,該模塊的詳細設計如圖3所示。

圖3 語義局部增強模塊結構Fig.3 The structure diagram of semantic local enhancement module

假設輸入圖像通過第i層特征提取網絡和雙注意力語義先驗模塊得到語義特征向量hi∈Rn×c,該向量首先經過線性投影層將維度擴展到n×e,然后根據圖像原始Token的排列順序將二維語義向量hei∈Rn×(c×e)重組為三維張量為了聚合局部特征,SLeff模塊利用深度可分離卷積將新重組的特征矩陣進行卷積運算,最后將特征向量展平,并經過一個線性投影層恢復成與輸入大小相同的語義特征向向量∈Rn×(c×e),其中n表示中間特征語義向量的行數,c表示特征向量通道的維度。語義局部增強模塊SLeff流程為

式中:GELU為GELU激活函數,BN表示層歸一化函數,Linear1和Linear2表示線性投影層,SpatialReStore表示像素重排函數,DWConv表示深度可分離卷積函數,Flatten表示特征矩陣展平函數。

2.3 稀疏主體點流采樣模塊

基于自注意力的語義分割模型需要圖像中的每個像素點與全局像素點進行交互計算,但對于復雜背景占比較大的路面病害圖,如果直接進行全局關系的建模就會造成大量計算的冗余,無法充分挖掘小面積前景的特征表示。此外,對于目前主流的特征提取網絡,隨著網絡層數的增加語義特征包含的信息逐漸抽象和高級,但是語義特征分辨率卻在逐漸減小,該特性會導致小面積的前景特征隨著網絡層數的增加而逐漸消失,不利于病害的識別。本文提出的稀疏主體點流模塊通過在當前FPN層采樣部分病害前景特征像素點作為重點關注對象,只將該部分像素點與全局像素點進行建模。同時該模型將相鄰層特征進行下采樣融合,利用下層高分辨率特征的具象語義信息補充本層低分辨率的抽象語義信息。針對傳統點流方法沒有考慮融合本層特征,本模塊又對采樣點所在層進行采樣點自注意力聚合,并將其與跨層特征相結合,真正意義上完成了不同階段的特征融合。稀疏主體點流采樣模塊通過稀疏注意力機制將相鄰特征層的信息相關聯,避免大量背景噪聲點參與全局建模,減少運算次數,提高運算效率,緩解類別嚴重不平衡問題。同時跨層特征融合將不同層的分辨率信息與語義信息進行互補,兼顧高分辨率信息和高語義信息的相互統一,提高對復雜背景下小面積病害的識別能力[29],具體原理和操作如圖4所示。

圖4 考慮本層節點聚合信息的稀疏主體點流優化Fig.4 Sparse subject point flow optimization graph considering aggregation information of local nodes

假設圖片經過編碼骨干網絡得到4組不同的中間特征張量ti。首先將本層語義特征張量ti與相鄰層特征張量ti-1相疊加,疊加后的特征通過卷積操作得到融合低層具象特征和高層抽象特征的主體特征選擇信息流張量ci。然后對原始特征圖的主體特征選擇信息流張量的非0特征值點與對應二維坐標相映射,并根據該映射完成對特征張量ti的更新。為了達到稀疏特征點的目的,選擇更新后語義特征張量ti中特征值大小前top-n的點作為興趣點,并根據興趣點的坐標信息進行采樣,最終得到稀疏語義特征向量。根據FPN結構的相鄰特征大小倍率關系,可以計算出語義特征張量ti-1中對應主體特征選擇信息流張量的非0特征值點集合的二維坐標。為了關聯相鄰FPN網絡的特征,進一步提高其表達能力,還將本層稀疏采樣點之間進行自注意力操作,通過2次矩陣乘法操作計算不同層之間語義特征的注意力矩陣,并將該矩陣與當前層稀疏語義特征向量相乘后求和,得到最終更新完成的全局稀疏語義特征張量。最后根據語義特征向量ti-1的采樣坐標將對應位置的值插入到ti-1中(對應圖5擴散操作),進而完成語義特征向量ti-1的更新操作,最終得到i-1層融合了i層語義信息的特征語義向量。稀疏主體點流結構如圖5所示。

圖5 稀疏主體點流結構Fig.5 Sparse subject point flow structure diagram

稀疏主體點流模塊具體操作流程為

式中:Interpolation表示插值操作,AdaptiveMax-Pool2d表示自適應最大池化操作,Update表示根據采樣點進行更新操作,Bmm表示矩陣乘法操作,Scatter表示擴散操作。

3 基于雙分支點流語義先驗的路面病害分割模型實驗分析

3.1 數據集和指標

實驗使用公開數據集Crack500和采集自自研車載自動化巡查項目的路面病害語義分割兩種數據集。其中,Crack500數據集包含訓練集1 896張、驗證集348張、測試集1 124張圖像。而自研巡查車路面病害數據集通過前置攝像頭錄制路面視頻并傳輸到邊緣服務器上,并隔固定時間間隔進行幀采樣。該數據集收集了從2022年3月-9月重慶部分路面病害數據,每張圖片的分辨率規整為1 080×720的PNG格式圖像,一共包含1 000張路面病害圖,訓練集驗證集的比例為3∶1,包含3個語義類別,分別為橫向裂縫、縱向裂縫和坑槽。本實驗采用的語義分割評價指標包括平均交并比(mIoU)、平均準確率(mPrecision)、召回率(recall)、F1得分和參數量(param)。各項指標表示如下:

式中:k表示種類數(不包含背景),pii、pjj、pij和pji分別表示預測正確屬于該病害、預測正確不屬于該病害、預測該類病害不屬于該類的假類和預測不屬于該類的病害屬于類(如果第i類為正類)。本實驗如果在mIoU相差不大的情況下,即使出現mIoU偏低的情況,也著重觀察平均準確率、召回率及F1得分,原因如圖6所示,由于人工對低質量路面病害圖僅僅靠肉眼觀察后打標不可能做到像素級別,而所提供數據集的Ground Truth相較于預測結果而言反而有漏打少打的情況,因此僅僅依靠計算mIoU會出現效果好的模型反而mIoU較低的情況,無法說明模型的準確性,因此著重考慮后面3個指標。

圖6 人工路面病害打標Ground Truth與模型預測結果對比可視化Fig.6 Visualization of comparison between Ground Truth and model prediction results for artificial pavement disease marking

所有實驗均在Pytorch-GPU-1.8.1和Python-3.7上實現,并在單張NVIDIA GeForce RTX 3 090(顯存24 G)上運行。為了實驗的公平,所有實驗模型均采用基準學習率為γ0=0.001的AdamW優化器,并采用poly學習率衰減,設置訓練迭代次數為80 000,批處理大小為4。

3.2 實驗結果對比

本文在上述2個數據集上將所提出模型與其他語義分割模型進行比較,如表1和表2所示。比較方法分為2類,基于CNN的語義分割算法和基于視覺Transformer的語義分割算法,基于卷積網絡包括以ResNet為骨干網絡的Ccnet[30]、Deeplabv3[31]、Deeplabv3+[32]及Hrnet系列[33]和Cgnet[34];基于視覺Transformer的分割模型包括以VIT為骨干網絡的Setr[35]、Segmenter[22]和Segformer[21]。

表1 不同語義分割模型在自研路面病害數據集上的結果對比Table 1 Comparison of results of different semantic segmentation models on self-developed road surface disease datasets

表2 不同語義分割模型在Crack500公開數據集上的結果對比Table 2 Comparison of results of different semantic segmentation models on Crack500 public dataset

在2個數據集上,基于Transformer的語義分割模型的效果要遠差于CNN,是因為自注意力網絡訓練需要大規模數據集才能充分挖掘全局關系,而2個數據集中訓練集數量遠遠不足。但是,本模型使用Transformer骨干特征網絡卻在2個少量樣本的數據集上比所有卷積方法在Flops、mPrecision、Recall和F1-score4個重點指標上都高,說明了該算法在訓練少樣本的路面病害樣本上具有巨大潛力。同時可以觀察到在自研數據集上,本文方法的mPrecision指標與Deeplabv3+接近;但是Flops遠低于該方法,說明本文方法在相同精準度的情況下具有更快的運算速度;同理,本文方法與基于ResNet101的Ccnet模型在Recall指標接近,但是Flops減少了接近2倍,進一步說明本文模型的有效性(注:雖然Hrnet18網絡的參數量僅9.64 M,但是本文不將其作為最佳參數量結果的原因是該網絡表現其他指標極差,沒有參考意義。同理認為所有模型中浮點運算次數最低的為本文的模型,而不是Segformer)。而在公開數據集上,由于數據集質量大幅度提高,所有方法的指標相較于自研數據集都有大幅度提升,但是本文所提模型表現大幅優于基于所有對比方法,進一步驗證了本模型在高質量語義分割數據集上更具魯棒性和有效性。

表3給出不同大小的 Swin-Transformer 骨干網絡細節參數。在表4中本文對Swin Transformer 3種不同編碼器變體進行實驗,其中Swin-T-FPN表示利用Swin-Tiny作為編碼器,FPN作為解碼器展示使用不同骨干相同網絡效果對比。變體具體參數如表3所示,基于Swin-Transformer的tiny版本的骨干網絡在所有指標表現最好;相反,使用更大版本的Swin-Transformer特征骨干網絡反而會影響模型的精度,在各項指標中都有大幅度的下滑。原因是更大的模型雖然擬合效果更好,但是由于實驗使用的數據集質量較低,數量較少,針對小數據集,大模型更容易出現欠擬合的現象。也就是說,相同訓練參數配置的下,大模型可能會一直陷入一個局部次優解,無法對模型全局參數有個更好的更新。

表3 不同大小的Swin-Transformer骨干網絡細節參數表Table 3 Detailed parameter table of Swin-Transformer backbone network of different sizes

表4 Dual-SePointFlow模型使用不同大小Swin-Transformer骨干網絡效果對比Table 4 Comparison table of effects of Dual-SePointFlow model using Swin-Transformer backbone networks of different sizes

3.3 消融實驗

在本節實驗中,將對雙分支訓練結構、語義先驗模塊和稀疏點流主體模塊進行消融實驗,分析本文設計的模塊對于真實復雜路面病害識別的有效性。表5展示了3種結構的消融結果,最簡單的Swin-Transformer+FPN模型出人意料的召回率最高,表明該方法查全率高,但是查準率非常低,綜合兩者的F1得分非常低;原始的semask模型相較于第1個模型添加了最簡單的語義先驗模塊,其模型犧牲較多的查全率去提高查準率,但是效果甚微,F1得分非常低,效果不理想。在原始semask基礎上添加稀疏點流模塊,查準率小步上升,但是召回率進一步下降。而采用新設計的雙重語義先驗模塊犧牲較少查準率的同時大幅度提高查全率,F1得分也得到顯著提高,證明了雙重語義先驗模塊的有效性。最后結合局部增強模塊得到最好的結果,驗證該模塊的有效性。

表5 Dual-SePointFlow不同模塊消融驗證實驗效果對比Table 5 Comparison of ablation validation experiments on different modules of Dual-SePointFlow

3.4 可視化結果分析

本節主要展示在自研車載自動化巡查項目的路面病害語義分割數據集上的可視化結果分析。圖7給出了不同經典語義分割模型的實驗結果對照?;诰矸e的分割模型中Cgnet預測的細小細節最多,Ccnet和Hrnet基本上無法預測細小裂縫細節。而對于較大的裂縫,所有卷積模型表現良好?;赥ransformer的分割模型對于細小裂縫識別總體表現很差,但是對于較大裂縫的識別效果比卷積更好,預測結果更加完整??傮w而言,在小數據集上基于卷積的分割模型效果更勝一籌。而本文方法效果最好,基本上準確預測了大坑槽和細小的裂縫細節,證明了本文模型的有效性。

圖7 不同語義分割模型實驗結果對照可視化Fig.7 Comparison visualization of experimental results of different semantic segmentation models

圖8給出了本文模型在自研路面病害數據集上的消融實驗結果對照。純Swin骨干加FPN網絡結構預測結果最差,無法提取病害整體關系,因此出現一條裂縫被識別成好幾種病害。而添加最原始的語義先驗模塊,緩解數據集不夠導致無法提取病害全局特征。進一步添加稀疏主體點流模型,只關注病害特征點,預測病害的完整度更加好,最后使用本文的語義先驗模塊,預測結果光滑平整,基本上不會出現病害不連續的情況,驗證了本文所設計模塊的有效性。

圖8 Dual-SePointFlow模型消融實驗結果對照可視化Fig.8 Comparison visualization of ablation experimental results of Dual-SePointFlow model

4 結束語

本文提出了一種基于雙分支點流語義先驗的真實路面病害識別模型。針對路面病害數據集小、圖像質量差等問題,提出了雙分支語義先驗模塊來指導骨干特征提取網絡更好地優化;針對前置攝像頭采集圖像病害占比小的問題, 提出了稀疏主體點流模塊,只對部分病害前景采樣點進行計算,同時融合不同層與自身層的特征信息進行更新,進一步提高識別精度的同時緩解了病害類別嚴重不平衡問題。為了訓練和驗證模型,本文構建了一個真實路面病害分割數據集,通過大量實驗驗證本文方法不僅能在真實環境下有效地識別路面病害,而且針對小樣本和類比不平衡的情況也具有好的效果。由于類似的全景路面病害數據集很少,本文只在本數據集上表現良好,并驗證本模型的有效性。但是想要模型做到強泛化能力和強魯棒性,具有一定的挑戰性和研究價值。未來如果有更多全景路面數據集公開,還可以進一步探究如何更好挖掘復雜背景與前景的關系,提高其檢測和分割的識別率。

猜你喜歡
張量先驗注意力
讓注意力“飛”回來
偶數階張量core逆的性質和應用
四元數張量方程A*NX=B 的通解
基于無噪圖像塊先驗的MRI低秩分解去噪算法研究
“揚眼”APP:讓注意力“變現”
基于自適應塊組割先驗的噪聲圖像超分辨率重建
擴散張量成像MRI 在CO中毒后遲發腦病中的應用
A Beautiful Way Of Looking At Things
基于平滑先驗法的被動聲信號趨勢項消除
先驗的廢話與功能的進路
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合