基于零樣本學習的集裝箱箱號識別系統研究

2023-12-29 03:56劉東輝沈毅煒趙中華

港口裝卸 2023年6期

劉東輝劉奇沈毅煒趙中華

1 青島海西重機有限責任公司 2 中國石油大學(華東)經濟管理學院 3 山東科技大學自動化學院

1 引言

集裝箱編號用于跟蹤和管理集裝箱,其準確性直接影響到物流效率和客戶滿意度。傳統的集裝箱號碼識別方法主要基于監督學習,對于新出現的沒有標簽的集裝箱號碼無法進行準確識別。為此,提出一種基于語義自編碼器的零樣本學習方法,旨在通過學習圖像特征與語義的映射,實現對陌生集裝箱號碼的準確識別。

2 零樣本學習與語義自編碼器

2.1 零樣本學習

零樣本學習是一種機器學習任務,旨在實現對未見過類別的準確分類[1]。傳統的機器學習方法通常需要大量已標注的數據進行訓練,但在現實中,獲取大規模標注數據的成本較高。零樣本學習通過利用已知類別和屬性之間的關系,以及通過學習類別的特征表示,實現對未知類別的分類。這種方法可以通過將樣本映射到一個共享的語義空間來實現,使得類別間的關系更加明確。

特征提取算法是零樣本學習算法中的重要組成部分。在集裝箱箱號識別中,需要選擇一種合適的特征提取算法來提取集裝箱箱號中的關鍵信息。常用的特征提取算法包括卷積神經網絡、循環神經網絡等。GAN(Generative Adversarial Network,生成對抗網絡)是一種用于生成新數據的深度學習模型。在基于零樣本學習的集裝箱箱號識別系統中,可以利用GAN生成新型號的集裝箱樣本,從而實現對新型號集裝箱的零樣本學習。模型訓練算法是實現集裝箱箱號識別的關鍵技術之一。在集裝箱箱號識別系統中,需要構建一個合適的模型來訓練數據。常用的模型訓練算法包括支持向量機、隨機森林等,這些技術相互協作,共同實現對新型號集裝箱的準確識別。

2.2 語義自編碼器

SAE(Semantic Auto Encoder,語義自編碼器)能夠學習到數據的低維表示,并將數據映射到一個語義空間中[2],由編碼器和解碼器組成。編碼器將輸入數據轉換為語義空間中的表示,解碼器將語義表示重新映射到原始數據空間,以重構輸入數據。

語義自編碼器的訓練過程包括2個關鍵步驟:編碼和解碼。在編碼階段,輸入數據經過一系列的隱藏層,每一層都將數據表示壓縮成更低維度的表示。在解碼階段,低維度的表示經過一系列的隱藏層逐步解碼,最終重構成與原始輸入數據盡可能相似的輸出。在訓練過程中,通過最小化重構誤差來優化自編碼器的參數,使得其能夠學習到數據的有效表示。

語義自編碼器的關鍵優勢在于能夠將不同類別的樣本映射到語義空間中的不同區域,不同類別之間的語義距離可以被有效地量化。在零樣本學習任務中,語義自編碼器能夠訓練已知類別和語義空間之間對應的關系,對未見過的類別進行準確分類。

3 系統設計

岸邊集裝箱起重機(以下簡稱岸橋)箱號識別系統由3個子系統組成,分別是前端岸橋智能視覺識別子系統、后端集中管控子系統、web前端子系統。

3.1 智能視覺識別系統

視覺識別子系統部署在岸橋上,由高清攝像機、電氣柜、PLC系統組成。系統采集PLC信號進行轉換解析,通過識別集裝箱裝卸過程中小車及吊具的動作自動觸發攝像機對集裝箱、集卡車進行全方位的抓拍。通過基于零樣本學習的識別模型識別集裝箱箱號、箱型代碼、集卡車號、箱門方向等信息。系統可觸發不同位置的相機精準抓拍集裝箱可見面的高清圖像,并通過網絡將識別結果以及高清圖像傳輸至后端集中管控平臺做進一步的業務處理。

集裝箱起重機箱號智能視覺識別系統的前端設備,包括前端采集攝像頭、集裝箱起重機箱號識別服務器、交換機等通過網線連接,各岸橋與中控服務器之間通過碼頭預設光纜連接進行數據傳輸。系統網絡架構圖見圖1。

圖1 集裝箱起重機箱號識別系統網絡架構圖

3.2 后端集中管控系統

集中管控平臺作為岸邊集裝箱起重機箱號智能視覺識別系統的核心業務系統,是基于Nacos、MyBatis、ZeroMQ、WebSocket、Protobuf等成熟開源框架構建的Web后臺微服務應用。軟件采用微服務架構設計,系統采用雙機熱備部署,若某臺服務器出現異常情況,業務數據可自動切換到冗余備份服務器中進行處理。在理貨作業過程中,系統實時將前端采集識別系統中上傳的設備狀態、理貨作業等信息,存儲在Redis和MySql數據庫表中,并將理貨生產作業數據發送至理貨平臺。

3.2.1 數據預處理

在集裝箱號識別任務中,首先建立一個包含已標注的集裝箱號和相應類別信息的數據集,然后對集裝箱號進行預處理操作,以便為語義自編碼器的訓練和零樣本學習做準備。數據預處理包括以下步驟:

(1)去除噪聲。集裝箱號圖片通常會受到噪聲的影響,例如圖像中的模糊、光照變化等。通過圖像處理技術,如濾波和去噪算法,可以減少噪聲對集裝箱號圖像的影響。

(2)歸一化。為了保證不同集裝箱號之間的可比性,需要對集裝箱號進行歸一化操作,包括圖像尺寸的統一、圖像亮度的調整等,以確保輸入數據具有相似的特征表示。

(3)特征提取。為了將集裝箱號映射到語義空間中,需要從圖像中提取有意義的特征?？梢允褂镁矸e神經網絡等深度學習模型,或者使用傳統的計算機視覺特征提取方法,如局部二值模式、方向梯度直方圖等。

3.2.2 語義自編碼器的訓練

在零樣本學習任務中,需要使用已標注的數據集來訓練語義自編碼器模型。訓練過程可以分為編碼和解碼2個階段。

編碼階段將預處理后的數據集的特征向量輸入編碼器,獲取其在語義空間中的表示。編碼器負責將高維數據轉換為低維數據,并得到高維數據在語義空間的低維表示。解碼階段將語義空間中的表示返回解碼器,并通過一系列的步驟解碼,最終重構出與原始輸入數據盡可能相似的輸出。解碼器的目標是最小化重構誤差,使得解碼后的數據與原始輸入數據盡可能一致。

通過訓練語義自編碼器,能夠獲得編碼階段的特征向量到語義空間的投影矩陣W,為了能夠應對大規模數據,簡化模型,令語義空間到解碼器的投影矩陣W*=WT。

3.2.3 基于語義自編碼器的零樣本學習

在測試階段,利用已訓練好的語義自編碼器模型進行零樣本學習,實現對陌生集裝箱號的識別。將數據集的80%作為訓練集,20%作為測試集。

設Y={y1,…,ys}和Z={z1,…,zu}分別表示s個訓練集和u測試集的標簽,Y∩Z=φ。同樣SY={S1,…,Ss}∈Rs×k和SZ={s1,…,su}∈Ru×k表示相應的訓練集和測試集的語義表示(例如k維屬性向量)。給定N個樣本的訓練數據XY=(xi,yi,si)}∈Rd×N,其中xi是從其中一個可見類的第i張訓練圖像中提取的d維視覺特征向量,零樣本學習的目的是學習一個分類器f:XZ→Z即預測圖像的標簽來自于測試集的類,其中XZ={(xi,zi,si)}為測試數據,zi和si是未知的。

將給定N個樣本的訓練集數據XY=(xi,yi,si)}∈Rd×N,xi輸入到SAE中進行訓練,通過si和xi的關系得到視覺空間到語義空間的投影矩陣W。

對于測試集的集裝箱號圖片,將其提取好的特征向量輸入編碼器,獲取其在語義空間中的表示。然后,通過計算該表示與已知類別的語義表示之間的距離,可以確定其所屬的類別。通?？梢允褂脷W氏距離或余弦相似度等距離度量方法進行距離計算,距離越小,表示未見過的集裝箱號與已知類別越相似,從而達到準確分類的目的。

為了進行零樣本學習,還需要構建一個屬性空間,其中包含每個類別的屬性信息,如集裝箱類型、尺寸等。通過將屬性信息與語義表示相結合,可以提高零樣本學習的準確性。

在實際應用中,可以使用大規模的集裝箱號數據集進行訓練和評估,以驗證基于語義自編碼器的零樣本學習方法在集裝箱號識別任務中的性能;還可以探索其他改進方法,如引入注意力機制或生成對抗網絡等,進一步提高零樣本學習的準確性和泛化能力[3]。

通過以上方法,基于語義自編碼器的零樣本學習在集裝箱號識別上可以實現準確的分類,降低對大量已標注數據的依賴性,提高算法的適應性和泛化能力。

3.3 web前端系統

web前端子系統是可視化的交互平臺,基于LayUI框架、JavaScript、HTML5等前端核心技術開發實現,通過Tomcat服務器發布后,可直接通過瀏覽器訪問的前端可視化應用系統。

4 結語

基于語義自編碼器的零樣本學習方法,為解決集裝箱號識別中的零樣本學習問題提供了一種新的思路。通過有效地學習集裝箱號的語義表示,能夠在未見過的類別上實現準確的分類,提高集裝箱管理的效率和精度。