?

基于編解碼卷積神經網絡的船舶航速預測

2023-10-21 06:51樊家暢陳信強
關鍵詞:航速注意力船舶

陳 弓, 韓 冰, 樊家暢, 陳信強,3

(1.上海船舶運輸科學研究所有限公司, 上海 200135;2.上海海事大學 物流科學與工程研究院, 上海 201306;3.武漢理工大學 智能交通系統研究中心, 武漢 430063)

0 引 言

當前,我國水路運輸行業的發展已進入攻堅短板、突破航運技術瓶頸的關鍵階段,綠色、低碳和運行效率等得到了研究人員的廣泛關注。近年來,國際海事組織(International Maritime Organization,IMO)出臺了多項與船舶能效有關的措施[1],如船舶能效設計指數和船舶能效管理計劃等;IMO海洋環境保護委員會通過了船舶能效和碳排放強制性措施[2],以進一步減少船舶的燃料消耗和溫室氣體排放,以期在2050年實現比2008年減排50%的目標。國內也提出了很多與綠色航運有關的管控策略,發布了很多政策文件[3-4]。影響船舶能源利用效率的措施(如低速航行、航線選擇和氣象導航)和因素(如燃料的消耗、成本和排放)與船舶航速有線性或非線性關系,尤其是功率與航速之間呈三次方關系(即使航速發生微小的變化,也會對功率產生很大的影響),而調整航速不需要裝配額外的設備,具有較高的經濟效益[5]。因此,對船舶航速進行準確估計,可為油耗預測、航線規劃與優化、港口運行效率提升和導航系統開發等任務的開展提供準確的數據支撐,具有重要的研究意義。

當前,已有的船舶航速預測方法可分為基于物理模型的船舶航速預測和數據驅動的基于機器學習方法的船舶航速預測2種。

1) 基于物理模型的航速預測主要通過對全尺寸和小尺度模型的航速試驗數據進行回歸,得到航速、功率和螺旋槳轉速之間的關系,這種方法受船舶自身特征的限制,且需要投入多人力和物力。柏開祥等[6]通過數值模擬的方式模擬了風帆的空氣動力性能,基于水池試驗建立了板體水動力模型,根據最大推力原理,利用風動力與水動力的平衡方程求解出了各條航線上的最大船舶航速。鄭躍洲等[7]通過流固耦合方法對集成電機推進器周圍的流場和槳葉應力場進行了計算,同時采用體積力法替代螺旋槳的作用,對無人艇的航速進行了預報?;羝糩8]針對華南理工大學無人艇課題組研發的波浪推進無人艇開展了建模分析、數值計算、模型試驗和航速預測等研究,對其水動力學性能進行了測試。

2) 數據驅動的航速預測研究主要利用機器學習方法,基于實測的船舶航行數據和氣象數據預測船舶航速。這種方法無需借助與船舶建造和航行有關的物理知識,相比基于物理模型的航速預測方法,預測效果更好,計算過程更簡單。

高慧[9]利用支持向量機和采集到的帆船運動數據實現了對帆船航速的預測。李文楷[10]基于船舶自動識別系統(Automatic Identification System,AIS)數據,結合端到端框架和注意力機制設計了船舶行為預測模型,并與傳統的雙向長短時記憶網絡、門控循環單元和循環神經網絡(Recurrent Neural Network,RNN)等模型進行了對比,驗證了所設計模型的有效性和可靠性。朱曉晨等[11]基于機器學習方法提出了一種輕量化的船舶航速預測模型,將實時風速、風向、水深、水流速度、艉軸轉速、軸功率和主機油耗數據作為輸入參數,實現了對船舶航速的快速、準確預測,并將該方法與多種機器學習算法相比較,驗證了其有效性。部分學者基于灰色模型實現對船舶航速的預測,即針對航速預測任務構建物理模型與數據驅動相結合的船舶航速預測方法,這種方式的預測效果仍受物理模型局限性的影響。LIU等[12]利用一艘散貨船收集的午報數據和AIS數據集,采用灰度預測模型對船舶航速和燃油消耗進行了預測。ZHOU等[13]提出了基于編解碼卷積神經網絡的預測模型,該模型在預測長時間序列數據方面具有很好的效果,這已在多類時間序列數據集的測試中得到驗證。本文基于編解碼卷積神經網絡開展船舶航速預測研究,以期為智能船舶、智能航行和船舶能耗控制研究提供數據支撐。

1 航速預測方法

本文采用基于編解碼卷積神經網絡的Informer模型開展航速預測。首先,通過位置編碼操作對船舶時序數據進行編碼;其次,引入自注意力機制獲取與航速有關的數據序列并進行航速預測,同時在每次編碼時利用自注意力蒸餾減少信息冗余;最后,通過Informer模型的解碼器獲取船舶航速預測結果。

1.1 位置編碼

不同于RNN,Informer模型的編解碼機制無法處理序列數據元素的序列信息。為此,引入位置編碼機制實現對船舶航速信息的編碼。本文采用三角函數方法實現對輸入航速序列數據的位置編碼,位置編碼公式為

PE(pos,2j)=sin(pos/(2LX)2j/dmodel)

(1)

PE(pos,2j+1)=cos(pos/(2LX)2j/dmodel)

(2)

式(1)和式(2)中:X為輸入序列;LX為輸入序列的長度;pos為序列中元素的位置;j為位置編碼中正弦和余弦函數的下標;dmodel為輸入向量的維度;PE為編碼之后的位置向量。通過位置編碼,可更好地處理序列數據,從而提高模型的預測精度。

1.2 自注意力機制

與循環神經網絡不同,編解碼結構無法有效提取序列數據的長距離信息,因此引入自注意力機制解決該問題。經典的自注意力計算公式為

A(Q,K,V)=Softmax(QKT/d-1/2)V

(3)

式(3)中:Q為查詢矩陣;K為鍵矩陣;V為值矩陣;d為鍵矩陣的維度;A(Q,K,V)為Q、K和V等3個矩陣經過Softmax激活函數輸出的注意力表示張量。通過自注意力機制,模型可捕捉到序列中元素之間的長距離依賴關系,從而提升模型的性能。

1.3 隨機抽樣

已有研究表明,自注意力機制的概率分布具有潛在的稀疏性?;诮浀涞淖宰⒁饬C制進行定性分析發現,約有12%的自注意力模塊會在自注意力機制中發揮作用,且相關注意力模塊服從長尾分布。因此,可采用隨機抽樣策略選擇主導查詢,并引入相對熵計算方式降低算法的復雜度。相比其他采樣策略,隨機抽樣能更好地反映原始自注意力的分布特征,即能更有效地提取船舶航速的變化趨勢和變化規律。

1.4 編碼器

1.4.1 混合多頭自注意力機制

在深度學習領域,基于RNN的方法存在計算復雜度高和難以并行化等問題。由此,引入混合多頭自注意力機制,其表達式為

MA(X)=Mixed-Concat(h1,…,hn)

(4)

式(4)中:hn=A(Q,K,V),其中n為模型超參數,為預設的檢測頭數量;X為模型的輸入張量;MA(X)為將不同檢測頭輸出級聯得到的多頭注意力表示張量;Mixed-Concat()為具體的級聯操作,用于捕捉輸入序列中不同位置之間的依賴關系。通過混合多頭機制,模型可關注不同的信息。這有助于模型更好地理解和表示輸入序列,從而提升模型的預測性能。

1.4.2 自注意力蒸餾

由于自注意力機制自身的性質,編碼器的特征映射具有一定的冗余性。因此,在每個自注意力的輸出層后面加上蒸餾操作,使優勢特征能被模型重點關注和學習,并在下一層生成一個聚焦的自注意力特征圖,具體的計算公式為

Xt,j+1=MaxPool(ELU(Convld(Xt,j)AB))

(5)

式(5)中:Xt,j為輸入第j層編碼器的第t個輸入張量;()AB為注意塊;Convld()表示在時間維上執行一維卷積濾波器,并采用激活函數ELU();MaxPool()代表池化層;Xt,j+1為經蒸餾操作后第j+1層編碼器的第t個輸入張量。

1.5 解碼器

解碼器由2個混合多頭自注意力層疊加而成,與傳統的動態解碼不同,采用生成推理的方式解決長時間預測帶來的速度下降問題。輸入解碼器的向量為

Xt,de=Concat(Xt,s,Xt,0)

(6)

式(6)中:s為待預測向量的已知序列長度;Xt,0為待預測序列的填充數據,規避算法陷入自回歸狀態;Xt,de為輸入解碼器的向量。

1.6 損失函數

選擇均方誤差作為模型的損失函數,用于評價模型的預測性能,其計算公式為

(7)

2 試 驗

在船舶實際航行過程中,航速變化直接受船舶操縱的影響,航速的預測精度不僅與船舶歷史航速有關,而且與船舶采取的操縱措施密切相關。本文用于預測航速的船舶航行數據來源于船舶真實航行數據,由某船2個月的航行數據組成,按8∶1∶1的比例將這些數據劃分為訓練集、測試集和驗證集,在服務器上進行訓練和測試。該服務器的中央處理器(Central Processing Unit,CPU)型號為Intel Core i7-10700K;圖形處理器(Graphics Processing Unit,GPU)型號為NVIDIA Corporation GA104GL RTX A4000;內存大小為32 GB;顯存容量為32 GB。訓練環境:python版本號為3.6.5;pytorch版本號為1.7.1+cu110。訓練參數設置:編碼器層數為3層;解碼器層數為2層;每層中的檢測頭數量為8個;批處理大小設置為64;學習率為1×10-4;單次最大訓練次數為100次;模型收斂的停止次數設為20次。本文選取平均絕對誤差(Mean Absolute Error,MSE)、均方誤差(Mean Squared Error,MAE)、均方根誤差(Root Mean Squared Error,RMSE)、平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)和均方預測誤差(Mean-Square Prediction Error,MSPE)等5個評價指標對模型的預測效果進行量化分析[14]。

圖1和圖2分別為第一層編碼器和第三層編碼器輸出的注意力機制特征圖,其中右側表示顏色深淺的數值越大,代表該查詢向量與鍵向量的相似度越高。從圖1和圖2中可看出,通過注意力機制能有效地從輸入的時間序列中提取全局信息,盡管初始特征圖仍有很強的稀疏性,但隨著層數的增加和蒸餾操作的進行,從歷史序列中學習到的航速相關信息會更全面,從而有助于學習到時間序列中的長距離依賴信息,并有效提升模型的預測性能,得到良好的預測效果。

圖1 第一層編碼器輸出的注意力機制特征圖

船舶航速預測值與真實值對比見圖3,其中時間序列數據采樣點的時間間隔為5 min。從圖3中可看出,采用Informer航速預測方法預測的船舶航速與船舶真實航速較為接近,預測精度較高。由于模型中引入了自注意力機制,能更好地關注局部特征和全局特征,能有效抑制船舶航速急劇增加和急劇下降等航速異常波動數據的產生?;诖?采用本文構建的船舶航速預測模型預測的船舶航速與船舶真實航速的變化趨勢較為一致。此外,由圖3可知,本文提出的船舶航速預測方法在整個預測范圍內均能迅速準確地預測出船舶航速的變化趨勢,而人工神經網絡(Artificial Intelligence Neural Network, ANN)和RNN方法的航速預測精度略低。ANN方法在預測初期得到的航速數據與船舶真實航速數據較為接近,隨著預測時間的增加,該方法的預測精度略微下降。這主要是由于ANN方法能有效實現對船舶航速的線性預測,但不能有效捕捉船舶航速的非線性變化規律,因此其預測精度有待提升。

圖3 船舶航速預測值與真實值對比

RNN方法采用循環結構完成航速預測任務,RNN各層神經元在對當前網絡層的輸入信息進行提取過程中也考慮了前一時刻神經元的輸出信息,使得每個神經元都能從序列數據中學到與時間序列有關的特征信息?;诖?RNN模型在前幾個時間序列樣本點的預測精度優于ANN模型。隨著預測時間的增加,航速數據的預測精度逐漸下降。RNN模型從第8個數據點開始的航速預測結果與實際航速變化規律不同。即真實船舶在第8個數據點開始減速,速度呈下降趨勢,且維持了約15 min時間。然而,RNN自第8個數據點的船舶航速變化呈上升趨勢,且在第17個和第18個數據點也產生了較大的預測偏差??傮w而言,相比ANN模型和RNN模型,本文構建的Informer模型能準確、快速、有效地預測出船舶航速。

表1為采用不同模型得到的航速預測量化結果對比。由表1可知:采用本文構建的Informer模型得到的船舶航速MSE、MAE、RMSE、MAPE和MSPE分別為0.352、0.281、0.495、0.433和0.882,均小于ANN模型和RNN模型;采用ANN模型和RNN模型得到的MSPE分別為482.321和1 132.714,該數值顯著大于Informer模型;采用ANN模型和RNN模型得到的MSE分別為0.413和0.699,Informer模型的航速預測精度至少比這2種模型高15%。綜上,采用本文構建的Informer模型能獲得準確的航速預測結果。

表1 采用不同模型得到的航速預測量化結果對比

3 結 語

本文基于Informer模型對船舶航速進行預測,將原始的船舶航行數據作為模型輸入,引入多頭自注意力機制和自注意力蒸餾方法提高船舶航速的預測精度。對比試驗結果表明,采用Informer模型得到的船舶航速MSE、MAE、RMSE、MAPE和MSPE分別為0.352、0.281、0.495、0.433和0.882,均小于ANN模型和RNN模型,說明采用本文提出的船舶航速預測方法能獲得較好的船舶航速預測效果。在后續研究中,可融合水上交通視頻和雷達等多源傳感器數據開展船舶航速預測研究,為船舶智能航行精準控制提供高精度的數據支撐。

猜你喜歡
航速注意力船舶
VLCC在波浪中的航速優化與能效優化分析
提升全回轉港作拖輪航速的有效途徑
讓注意力“飛”回來
《船舶》2022 年度征訂啟事
船舶!請加速
BOG壓縮機在小型LNG船舶上的應用
低速水面目標航速精度分析及精確解算
“揚眼”APP:讓注意力“變現”
船舶壓載水管理系統
A Beautiful Way Of Looking At Things
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合