?

一種漁船軌跡預測的AM-LSTM 算法

2023-09-29 09:27李海濤蘇美玲張俊虎
關鍵詞:經度經緯度漁船

李海濤, 蘇美玲, 張俊虎

(青島科技大學 信息科學技術學院,山東 青島 266061)

據統計,到2020 年末,我國漁船總數達到56.33萬艘。在所有的漁船事故分類中,漁船碰撞產生的事故案件數最多、賠償款最多[1],漁船碰撞不利于海上航行安全;隨著遠洋捕撈的發展,船只遠離海岸,監管部門對漁船的監控會有所不足,一些越界捕撈的問題不能及時發現,不利于海洋漁業資源的可持續發展;海上航道管制會劃分一些禁區以及危險區,漁船航行可能不小心駛入這些區域,造成危險。提高漁船軌跡的預測精度,可以同時預測多個船只在某個時間的位置關系,判斷是否會發生碰撞,減少漁船碰撞事故;可以監控漁船的可能的越界捕撈行為,提高監管效率,預防越界捕撈的發生;可提前預測漁船是否要駛入禁區或危險區,提前預警,減少人員傷亡,保護財產安全。近年來隨著自動識別系統(automatic identification system,AIS)的發展,在漁船航跡方面積累了大量的數據,這些數據對分析漁船軌跡提供了極大的便利。對于船舶軌跡預測的研究大致分為兩個階段:第一階段是基于特定的運動學方程和傳統的機器學習算法進行預測;第二階段是基于神經網絡以及深度學習算法進行船舶軌跡預測。

在第一階段,文獻[2]使用灰色預測模型來處理船舶航跡中不確定參數,對其進行粗略估計。文獻[3]提出了一種基于灰色預測的方法構建船舶航行軌跡自動預測模型,并在此基礎上加入了緩沖算子進行改進,提高預測精度。文獻[4]使用了基于支持向量機的預測模型,模型的內部參數優化使用了差分進化算法。文獻[5]使用三階馬爾科夫鏈對漁船某個時刻的位置進行空間區域的預測。文獻[6]提出一種結合Transformer 模型和卡爾曼濾波的航跡預測方法。文獻[7]建立了基于高斯過程回歸(Gaussian process regression,GPR)和基于核嶺回歸(kernel ridge regression,KRR)的船舶自適應軌跡預測模型。文獻[8]利用Stacking的加權集成思想,集成了XGBoost、Light GBM、LSTM 的方法,構建了航跡預測模型。在此階段中,由于船舶航行過程中受海洋環境影響,而海洋環境因素是非線性因素,無法使用線性方程表示,基于運動學方程的方法無法完全表示其運動規律,可能會導致軌跡預測準確率下降。

在第二階段,文獻[9]優化了普通循環神經網絡,提出基于門控循環單元的循環神經網絡船舶軌跡預測算法,該算法以經緯度作為輸入,以經緯度作為輸出,經過實驗證明了該模型的實用性。文獻[10]采用BP神經網絡來預測船舶的軌跡,以經度、緯度、速度、真航角和對地航向作為輸入,以經緯度作為輸出,經過實驗證明,BP 神經網絡經由遺傳和粒子群混合算法優化后,預測效果最好。文獻[11]在LSTM 基礎上加入循環神經網絡模型構建RNN-LSTM 模型,使用循環神經網絡學習短期規律,使用LSTM 學習長期規律,預測船舶的軌跡信息。文獻[12]在LSTM 的基礎上結合小波變換,對數據進行平滑處理,并提出了WA-LSTM 航跡預測模型來提高預測航跡精度。文獻[13]主要使用3次樣條插值對AIS原始數據進行處理。文獻[14]構建了卷積神經網絡和雙向長短期記憶網絡混合的軌跡預測模型,該模型選擇經緯度、速度、真航角和對地航向5個船舶航行時的特征作為輸入,以經緯度作為輸出值,來預測船舶的位置信息。文獻[15]在LSTM 基礎上加入了卷積神經網絡構造CNNLSTM 模型,以經緯度、船速、航向以及舵角作為輸入來進行短期航跡預測。文獻[16]通過多層LSTM 網絡以經度、緯度、航速和航向作為輸入,對船舶軌跡進行研究,并取得了良好的效果。此階段建立的模型都僅將經緯度、航向和航速作為模型的輸入參數,并未考慮船體自身的影響,會影響準確率的提升。

由于傳統的機器學習方法以及BP網絡不適合對于軌跡時間序列的研究,本研究提出了基于LSTM 網絡對漁船軌跡預測方法。同時在模型數據輸入方面,不僅考慮了時間、經緯度、航向、航速等影響因素,還綜合考慮了漁船自身因素如漁船的長度、寬度、吃水深度等對漁船軌跡預測的影響。在網絡搭建方面,本研究在LSTM 的基礎上,引入注意力機制,提出了注意力機制和LSTM 結合的漁船軌跡預測模型(AM-LSTM)。

1 AM-LSTM 模型介紹

1.1 注意力機制

注意力機制[17]用來模仿人腦對環境的感知,人腦在關注事物時,往往會從中選擇出需要重點關注的部分而自然地忽略其他內容。而在漁船軌跡的預測方面,數據的輸入包括某一時間的緯度、經度、航速、航向、真航向角、漁船狀態、漁船長度、漁船寬度、吃水深度和時間間隔,數據影響因素較多,但是影響因子不同,通過注意力機制的模型,可以將所有的因素加入不同的權重,以此來影響未來某個時間的經緯度位置,提高預測的精度。注意力機制的結構如圖1所示,含m個特征的特征向量x={x1,x2,x3,…,xm},采用單層全連接神經網絡計算得到權重向量α={α1,α2,α3,…,αm}:

圖1 注意力機制作用圖Fig.1 Action diagram of attention mechanism

其中,Wα為訓練后的權重矩陣,bα為偏置向量,σ為sigmoid激活函數,函數公式如式(2)所示。

注意力機制在過程中會形成與輸入數據維度相同的權重參數矩陣W和偏置向量b,通過全連接網絡生成權重參數,注意力機制會將所獲得的權重參數與輸入數據相乘,即可獲得按重要程度劃分的新的輸入數據。

1.2 LSTM 神經網絡

LSTM 是經由循環神經網絡(recurrent neural network)演變而來,循環神經網絡相較于其他神經網絡的優勢是可以將上一時刻的信息,傳遞到當前時刻來使用。RNN 的結構如圖2、3所示。

圖2 RNN結構Fig.2 RNN structure

圖3 RNN單元結構Fig.3 RNN cell structure

圖2 中,xt表示第t時刻的數據輸入,A代表RNN 網絡,ht代表t時刻的輸出,將t時刻的數據經過處理傳到t+1時刻,形成鏈式的網絡結構。但是,由于RNN 的處理層通常為單tanh 層,在長時預測中,可能會導致梯度消失或梯度爆炸。

LSTM 網絡對RNN 的單元結構進行升級,主要解決了梯度消失或爆炸的問題。RNN 網絡的處理層比較簡單,而LSTM 的單元結構在其單元結構中加入了遺忘門ft,輸入門it和輸出門ot,LSTM的單元結構如圖4所示。

圖4 LSTM 單元結構Fig.4 LSTM cell structure

其中,

經過遺忘門、輸入門和輸出門3個步驟的處理后,最終輸出利用好時間序列信息之間的關聯性。更適合于漁船軌跡的預測問題。

1.3 AM-LSTM 模型結構

本研究將注意力機制與LSTM 進行結合,形成AM-LSTM 的神經網絡結構模型。模型結構如圖5所示。

圖5 AM-LSTM 網絡結構Fig.5 AM-LSTM network structure

模型主要包含輸入層、注意力機制層、LSTM層、池化層、LSTM 層和全連接層。由于添加了漁船自身屬性的特征,導致屬性增多,運算量過大,注意力機制層可標記不同特征的重要程度,增加預測準確率并減少計算量;LSTM 層可對序列數據進行訓練,獲取不同時間數據之間的關系;池化層用于壓縮數據,減少過擬合的發生;第二層LSTM 用于訓練壓縮后不同時間數據之間的關系;全連接層用于輸出預測的經緯度數據。

模型的具體流程:首先利用注意力機制將輸入的原始漁船序列數據重新進行權重分配,用漁船數據和權重系數相乘,獲得新的數據輸入到LSTM 層,在LSTM 中學習;隨后搭建LSTM 層,從加權特征序列中獲得隱藏的時序關聯信息,得到信息的隱藏層數據;將獲得的隱藏層數據傳入池化層,利用池化層進行降維、減少計算量;經過池化后的數據再進入第二層LSTM 層,最后將含全局隱藏信息的h″送入到全連接層,通過全連接層,得到預測的經度和緯度數據。

2 實驗數據

2.1 數據介紹

本研究使用MarineCadastre.gov提供的漁船AIS數據。使用2020年11月和12月的數據用來訓練和預測。原數據中包含MMSI號、時間、緯度、經度、航速、航向、真航向角、船名、IMO 號、呼號、船舶類型、航行狀態、船體長度、船體寬度、吃水深度等。AIS數據字典如表1所示。

表1 AIS數據字典Table 1 AIS data dictionary

本實驗使用經緯度40°N~50°N,120°W ~140°W 范圍內的漁船船只進行實驗,經過篩選后,共選擇出172 125條數據,將80%的數據用于訓練,20%的數據用于測試。

2.2 數據預處理

2.2.1 時間處理

大部分船舶軌跡的處理中,都采用插值的方法,將數據處理成時間間隔相等的序列,然后進行數據的訓練和測試。但是在這種情況下所插入的數據并不是真實數據,可能造成一定的誤差。本文采用加入一列時間間隔的屬性,用下一個時刻和當前時刻之間的時間差作為當前時刻的時間間隔,這樣的數據是真實數據,不會造成數據的誤差。也可在實際應用中,設置時間間隔,以此來設置預測多久以后漁船所在的位置。

2.2.2 數據歸一化

數據歸一化處理,是將原始數據按一定的公式,將數據歸于[0,1]之間,歸一化[18]的公式為

其中,X為歸一化后的數據值,x為原始數據值,xmin表示同屬性最小數據值,xmax表示同屬性最大數據值,經過公式的歸一化處理,所有數據歸于[0,1]之間,且不改變數據之間的權重比例,適合于漁船軌跡預測。

2.2.3 數據輸入

將漁船的緯度(lat)、經度(lon)、航速(sog)、航向(cog)、真航向角(angle)、運動狀態(status)、漁船長度(length)、漁船寬度(width)、吃水深度(draft)和時間間隔(timeGap)作為輸入,則在第t時刻的軌跡特征Y(t)為

訓練數據將5個歷史時刻的軌跡作為一個序列輸入,第6個時刻的緯度和經度數據作為標簽。每個軌跡之間的時差不超過1 800 s。漁船航跡預測模型的表達式為

3 結果與分析

3.1 實驗評估

本實驗使用均方誤差(mean square error,MSE)來評估預測結果的好壞程度。使用不同的模型進行預測,輸出的MSE 數值也會有所不同,MSE越小,代表實驗效果越好。

其中,m是預測數據的總個數,y是真實數據的值,是預測數據的值。

3.2 實驗結果對比

3.2.1 AM-LSTM 與LSTM 對比結果

使用AM-LSTM 與LSTM,在經度、緯度和經緯度總體3個維度上進行實驗對比,本實驗所使用的模型AM-LSTM,預測的準確度明顯優于其他兩個模型。使用真實數據與預測數據的差來展示預測的結果。

圖6和圖7中橫坐標代表第t個時刻,縱坐標代表真實值與預測值之間的差值。

圖6 緯度誤差對比圖Fig.6 Error comparison in latitude

圖7 經度誤差對比圖Fig.7 Error comparison in longitude

兩種模型在緯度上的預測結果差值如圖6 所示。由圖6可知,AM-LSTM 所得到的預測結果的誤差,明顯低于LSTM 神經網絡模型,AM-LSTM對緯度的預測精度更高。

兩種模型在經度上的預測結果差值如圖7 所示。由圖7可知,雖然實驗組在序列60~80之間略高于兩種神經網絡模型,但是大部分序列中仍是AM-LSTM 的精確度更高,從總體計算來說,是AM-LSTM 的預測數據誤差更小。

表2展示了兩種模型分別對緯度、經度和總體的預測值的均方誤差MSE??梢悦黠@看出使用AM-LSTM,分別對緯度和經度進行預測的模型準確度最高,效果最好。

表2 兩種模型的MSE對比Table 2 MSE comparison between two models

從圖6、圖7和表2的結果可以看出加入注意力機制的AM-LSTM 的效果明顯好于LSTM,證明了加入注意力機制的必要性。

3.2.2 消融實驗

漁船自身屬性是指漁船長度、寬度以及漁船的吃水深度。本實驗與未加入漁船自身屬性的特征以及是否使用時間間隔進行對比實驗,通過實驗結果如表3所示,從實驗數據看,加入漁船長度、寬度、漁船的吃水深度和使用時間間隔的模型準確率無論是緯度、經度還是總體的精確度均高于其他屬性模型的預測準確率。

表3 消融實驗MSE對比Table 3 Comparison of MSE in ablation experiment

3.2.3 不同模型之間對比結果

在處理后的AIS數據集上針對算法的性能提出AM-LSTM 模型與CNN-LSTM、RNN-LSTM、LSTM 和BP方法進行了實驗對比,使用總體損失值作為對比標準,見表4。

表4 AIS數據集各模型損失對比Table 4 Comparison of loss of each model in AIS data set

由表4中可以看出,使用5種不同的模型對相同數據集上進行實驗,測試的損失率有所不同。在測試集損失率上,本研究所提出的AM-LSTM 模型的實驗結果分別比CNN-LSTM、RNN-LSTM、LSTM 和BP 的實驗結果降低了40.1%,30.4%,65.5%,75.2%。因此本研究所提出漁船軌跡預測模型AM-LSTM 的性能均好于其他兩種模型。

4 結 語

本研究通過將注意力機制和LSTM 相結合,對漁船的軌跡進行預測研究。利用AM-LSTM 對大西洋區域內的AIS 漁船數據進行訓練、預測和分析,在神經網絡的輸入中添加了漁船的自身屬性特征,并使用注意力機制對網絡的輸入特征進行權重比例的疊加。實驗研究顯示,AM-LSTM 神經網絡模型的預測結果優于其他預測模型;加入漁船自身特征的模型軌跡的預測結果比未加入漁船自身特征的誤差小,效果好。在維護航海安全以及保護海洋漁業資源可持續發展工作中,使用AM-LSTM 神經網絡模型,能夠更好預防海上漁船碰撞事故的發生,同時更好的對漁船進行監控,對海洋資源的保護有很大作用。

猜你喜歡
經度經緯度漁船
漁船
巧用四步法 妙解地方時
巧用四步法 妙解地方時
千舟競發
國內新型遠洋金槍魚圍網漁船首航
基于經緯度范圍的多點任務打包算法
自制中學實驗操作型經緯測量儀
漁船驚魂
澳洲位移大,需調經緯度
抗生素入選2014年“經度獎”研究課題
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合