?

一種識別作戰意圖的層次聚合模型

2023-05-12 12:13李穎武君勝李偉剛董瑋房愛青
西北工業大學學報 2023年2期
關鍵詞:意圖卷積神經網絡

李穎, 武君勝, 李偉剛, 董瑋, 房愛青

(1.西北工業大學 計算機學院, 陜西 西安 710072; 2.西北工業大學 軟件學院, 陜西 西安 710072)

作戰意圖識別旨在對來自各種信息源的信息進行分析,從而解釋和判斷敵方想要達到的目的[1],正確且高效的對敵意圖識別能夠有效抵御或殺傷敵方目標。隨著科技的進步,軍事裝備力量逐漸向著無人化、智能化的方向發展。作為實現作戰過程智能化的重要一環,作戰意圖識別逐漸成為各國研究的熱點[2]。

傳統作戰意圖識別通常采用領域專家知識指導的模板匹配方法[3-6]或者基于貝葉斯網絡的推理方法[7-8]。模版匹配的方法是指敵方作戰意圖識別過程建立在領域專家制定的模板之上,通過匹配算法匹配模板得到敵方作戰意圖?;谪惾~斯網絡的方法是指依據戰場行為序列構建貝葉斯網絡,并由領域專家確定網絡參數實現敵方作戰意圖的推理。以往的軍事信息化建設落后,戰場數據相對匱乏,傳統方法可以較好地適應這種情景準確的作戰意圖識別,但是還存在以下問題未被有效解決。首先,現代戰場環境復雜多變,作戰樣式與作戰平臺更新迅速,從作戰單元采集的作戰目標狀態數據呈現多維、海量的特性。而傳統方法由于需要前期大量的領域知識建模,難以有效地處理特性以及數據之間復雜的依賴關系。其次,前期的領域知識模型構建也使得傳統方法的模型主觀性較強[9]。面對這樣的挑戰,研究者們開始探究如何通過神經網絡的方法進行作戰目標意圖識別。神經網絡的方法可以不依賴專家選擇特征,通過抽取與意圖相關的戰場態勢信息,更好地適應現代戰場數據。文獻[10-12]采用模糊神經網絡來進行意圖識別,該方法將模糊推理與神經網絡結合,在一定程度上提升了作戰意圖識別任務的精度,但該方法網絡層數淺,難以較好對復雜數據擬合。為了解決該問題,文獻[13]采用深度神經網絡(deep neural networks,DNN)對空中目標作戰意圖進行識別,可以達到一定的識別率,但沒有考慮到戰場情報數據的時序性特點。面對這種時序性特點,也有研究人員使用循環神經網絡(recurrent neural networks,RNN)識別意圖[14-15]。文獻[16]基于長短時記憶網絡(long short-term memory,LSTM)對作戰意圖進行分類,采用學習因子自適應調整策略提高模型的訓練效率,文獻[17-18]基于LSTM模型對空中目標進行意圖識別。綜上,當前神經網絡模型對意圖識別可以達到比較好的識別率,但在網絡模型的設計方面沒有考慮到作戰意圖識別面對的場景以及作戰實體狀態之間的關聯關系。

對于實戰場景下的作戰目標意圖識別問題,戰場情報數據是連續的,每個時間點傳感器收集的數據為作戰目標在這個時刻的狀態。隨著時間的推移,作戰實體實施一系列行為以達到行動意圖。因此,作戰意圖的識別具有層次性,由觀測方觀測敵方執行的一系列行為并不斷向上推理得到實施方的意圖。從時間角度來說,該過程是作戰目標狀態的遞進,從正向推進完成了作戰相應的作戰意圖,后續狀態又反向依賴前序狀態。所以,數據與數據之間存在著雙向依賴的復雜關聯。針對這樣的過程,當前的作戰意圖識別方法雖然在一定程度可以對作戰目標意圖進行識別,但無法滿足現代戰場作戰場景的層次性與作戰時序數據雙向依賴的復雜關聯性特征。所以,迫切需要一種感知場景特性的方法來完成作戰意圖識別任務,以提高識別效果。

綜上所述,針對當前模型所面對的挑戰,本文提出一種層次聚合框架,底層基于卷積神經網絡(convolutional neural networks,CNN) 通過卷積操作感知行為特征。中間層基于雙向長短時記憶網絡(bi-directional long short-term memory,Bi-LSTM[19]),將LSTM的神經元從2個不同的時間方向疊加,借助LSTM記憶長時依賴信息的能力,達到表達2個方向的長時依賴信息的目的。頂層通過注意力機制將特征聚焦于與識別意圖更加相關的高級特征,最終組合感知到的全局信息以識別目標作戰意圖。模型解決了當前意圖識別的一些局限,即缺乏對意圖層次性、時間特性與雙向依賴的表述。相比深度神經網絡方法模型識別準確率提高了18.34%,相比循環神經網絡方法提高了17.72%,相比長短時記憶網絡方法提高了7.7%。

1 問題描述

本問題針對的輸入是傳感器接收的連續時序數據,該數據是一個時間周期內作戰實體的特征參數,用以描述一個時間段內實體的作戰意圖。神經網絡對目標作戰意圖識別是從該時序數據中提取表達意圖的特征向量,并通過分類器對該向量學習得到最終作戰意圖的過程。該問題本質上是做神經網絡的分類任務。

假設給定一組作戰過程序列數據X=[x1,x2,…,xt]i∈RN×W,其中,R代表實數空間,N,W分別是序列長度、特征維度,每一條數據代表在特定時間點的作戰實體參數信息,[·]i代表第i個目標的特征向量,xt代表第t個作戰屬性。通過對作戰過程序列數據進行特征學習表征得到包含關鍵信息的嵌入。面對的問題可以形式化為如下數學表達

式中,[x1,x2,…,xt]i為序列中第i個目標的特征向量;[r1,r2,…,ri]i為對應的特征嵌入;f1為本文設計的層次聚合模型,本質上是一個映射函數;f2是一個分類器;yi是目標i的意圖。

2 作戰意圖識別模型

本節詳細介紹了所提出的層次聚合模型。模型針對作戰目標意圖識別面對的場景以及任務特征,通過層次聚合從作戰目標狀態數據中逐級學習局部特征,并通過注意力機制進行特征融合得到全局特征表示用以意圖識別。

在現代空戰中,戰場呈現復雜、多變等特征,所以需要通過有限信息感知來判斷態勢以評估作戰意圖。如圖1所示,作戰意圖識別是一個具有層次性的向上推理過程,父意圖可以分解為多個子意圖,而每個子意圖又可以分解為一系列的行為。以巡邏意圖為例,說明空中作戰目標進行巡邏時的意圖分解過程。首先,實體起飛離開基地;然后,執行非機動飛行子意圖向指定巡邏區域飛行;其次,進入巡邏區,然后繼續非機動飛行;最后,執行完巡邏任務,執行返回基地子意圖。因此,意圖識別是從作戰實體的各種狀態特征表現出發,先由狀態特征分析出敵方行為序列,再由行為序列逐層逆向推理上層意圖,最終逼近父意圖的過程。綜上所述,空中目標作戰意圖的識別任務具有層次性,作戰實體數據具有時序性,實體狀態之間存在雙向長時依賴關系。

圖1 作戰意圖識別層次圖

面對上述特性,本文提出一種層次聚合模型,自底向上感知作戰意圖。模型框架如圖2所示,分為5個部分,包括數據輸入、行為特征感知、意圖聚合、意圖聚焦以及意圖識別。首先,對描述空中目標實體狀態的數據進行處理并將輸入數據作為實體特征輸入行為特征感知模塊,其次,通過CNN感知行為特征并向上輸入至意圖特征聚合模塊,意圖特征聚合模塊通過Bi-LSTM網絡提取子意圖之間的雙向依賴關系,之后,將學習到的特征通過注意力機制聚焦,最終,通過softmax函數進行意圖識別。

圖2 空中目標作戰意圖識別框架

2.1 數據輸入

對于作戰數據,不同機型的不同特征狀態數據差別較大,需要對其歸一化處理來消除量綱影響。具體來說,作戰意圖對應的作戰動態屬性數據有較大波動,并且一些特征對應的數據范圍較大,如殲擊機以最大飛行速度攻擊,其范圍可達到2 000 km/h左右,相比其巡航速度有較大波動;低空和超高空偵察對應的高度分別為100~1 000 m和15 000 m以上。面對這樣的數據特征,選擇Z-score標準化方法將數據歸一到均值為0方差為1的分布中,如(3)式所述。

(3)

式中:μ為所有樣本數據的均值;?為所有樣本數據的標準差。

另外,作戰目標特征數據是由不同的傳感器在每個時間點上收集的,代表了目標在某一時刻的狀態。因此,該數據是具有時間特征的序列數據,它包含了目標的行動序列信息。這種非格式化的時間序列數據需要將其轉換為標準格式的數據然后通過CNN提取特征。如圖3所示,通過滑動窗口對原始數據進行預處理。具體來說,設置一個80 s的滑動窗口,以40 s為單位,每80 s為一個數據片對數據進行切分,得到的數據片有50%的重疊,可以保證捕捉到更多的行動細節。這樣,輸入的數據被表示為N×W大小的幀切片序列,其中,N為序列長度,W為特征維度。

圖3 行為特征感知模塊

2.2 行為特征感知模塊

作戰行為序列是作戰任務分解得到的一系列動作。作戰目標為了一定的作戰意圖需要完成一系列動作以達到某種特定的狀態,如圖1所示,目標執行一系列行為之后可以達到某種子意圖狀態。所以,為了識別目標最終意圖,首先需要從輸入數據中提取行為級的特征。為了達成該目的,本文提出了一個行為特征感知模塊用以提取序列數據的行為特征表示。如圖3所示,該模塊由2個卷積層和非線性激活層組成。具體來說,輸入被送入2個一維卷積層,2個卷積層采用ReLU激活函數激活以提取數據輸入中的行為特征。第一層卷積采用128個大小為1×9的卷積核對數據進行卷積操作,得到特征圖后,第二層采用64個大小為3×9的卷積核進行卷積。之后,將經過卷積層處理過的數據輸入到全連接層。為了防止過擬合,全連接層后添加一個隨機失活層,通過該層將網絡中的神經元隨機賦值為零,以提高網絡對數據的影響。

形式上,X=[x1,x2,…,xt]i∈RN×W為輸入特征序列,行為特征感知模塊通過卷積層學習到特征,該過程可以定義為

max(0,(X·Wc+bc))

(4)

式中:Wc表示權重;bc表示偏移量。

行為特征感知模塊學習到底層行為特征表示后,需要進一步將其送入意圖特征聚合模塊聚合成子意圖特征。

2.3 意圖特征聚合模塊

敵方目標作戰意圖是隨著時間推移不斷確定的,如圖1所示,行為序列組成一系列的子意圖,所以,這些子意圖之間也存在著關聯關系。圖4直觀展示了子意圖之間的依賴關系。對巡邏意圖來說,當作戰實體進入巡邏區時,起飛和非機動飛行是已經發生的狀態,非機動飛行和返回基地是未發生的狀態,只有發生了前面的起飛和非機動飛行才能發生進入巡邏區這個狀態,這是向前的依賴。而反過來說,作戰意圖是巡邏,那必然也會執行后面未發生的狀態,這是向后的依賴。因此,為了準確識別意圖,在高級特征表示的基礎上,需要更好地表達這種復雜的依賴關系,同時攜帶上述雙向依賴關系信息進行下一步學習。為了達成該目的,本文在行為感知層之后提出意圖特征聚合模塊,進一步對子意圖之間的長距離雙向依賴關系進行表示學習。

圖4 雙向依賴關系

綜上所述,意圖特征聚合模塊需要具備從正序和逆序2個方向提取長時依賴關系的全局感知能力,所以本文采用Bi-LSTM模型對特征進行表達。Bi-LSTM模型由2個方向不同的LSTM單元疊加,用來提取雙向長時依賴關系,最后將學習到的表達進行拼接形成全局特征。

Bi-LSTM的核心是LSTM單元,其內部構造如圖5所示。首先,由上一層輸出ht-1,細胞狀態信息Ct-1和原始數據x為輸入。其中,細胞狀態信息代表了上一層可以添加到下一層的信息。具體上, 如

圖5 LSTM內部結構

圖5的頂層通路所示,該通路貫穿整個LSTM單元,通過激活函數sigmoid和點乘單元組成的遺忘門來確定哪些信息得以遺忘,如公式(5)所示。

ft=σ(Wf[ht-1,xt]+bf)

(5)

式中:σ為sigmoid激活函數;ht-1是上一層的輸出;xt為輸入數據。

之后,將狀態更新為當前的狀態信息Ct,通過sigmoid函數來確定哪些數據保留,如公式(6)所示;通過tanh函數來確定哪些信息放入新的細胞狀態中,如公式(7)所示。然后結合上一細胞中要忘記的部分和當前需要加入到細胞中的信息來更新細胞狀態Ct,如公式(8)所示。

最后,通過激活函數sigmoid函數過濾信息選擇輸出的內容ht,通過點乘輸出內容ot與需要輸出的細胞狀態來實現,計算過程如公式(9)~(10)所示。

2.4 意圖聚焦模塊

在意圖識別過程中,每一個子意圖對識別最終意圖的貢獻不同,比如在巡邏意圖中,“進入巡邏區”與“離開基地”子意圖相比,對判斷作戰實體是否在執行巡邏的貢獻度更大,甚至起決定性作用。所以,為了進一步提高對意圖過程的表達能力,在經過意圖特征聚合模塊后,需要對這些特征表示分配不同的權重代表對識別意圖的貢獻度。具體過程如下:

通過意圖特征聚合模塊后得到特征表示為[h1,…,hn]∈RN×W,基于注意力機制針對每一個hi,計算出hi與所關注對象的相關程度,以其作為權重對特征表示整合拼接,得到最終的表示[r1,r2,…,rn]。計算過程如公式(11)所述。

(11)

式中,αi為權重。

2.5 意圖識別模塊

在完成意圖聚焦后,將帶有聚焦并攜帶全局特征的輸入送入前饋神經網絡,壓縮至意圖識別類別,再通過softmax函數輸出類別的概率。計算過程如公式(12)~(13)所示。

因為作戰意圖識別實際上是分類任務,所以選擇softmax將輸出表示為概率的形式,交叉熵(cross-entropy loss)作為損失函數衡量損失,優化器Adam[20]對損失最小化。softmax和交叉熵結合學習類別之間的信息并對正確標簽預測準確概率進行評估[21]。Adam優化算法參數采用默認參數,β1=0.9,β2=0.999,初始學習率設置為α=0.001。

3 實 驗

為了驗證所提出的層次聚合模型對作戰意圖的識別能力,首先,在空中目標意圖數據集上訓練模型。然后,設計對比實驗證明本文方法的優越性,將所提出模型與現有的一些簡單且高效的基線模型的識別準確率進行對比。最后,分別對行為特征感知、意圖特征聚合以及意圖聚焦3個模塊設計消融實驗驗證模型各個模塊的有效性。

3.1 模型訓練與戰術意圖識別結果

將模型在空中目標意圖數據集上訓練,該數據集規模為帶標簽數據27 452條,包括戰斗機的6種戰術任務,即巡邏、偵察、攻擊、突防、規避和巡航。對樣本數據進行切分得到數據片,由這些數據片組成樣本集。取70%為訓練集,30%為測試集。以混淆矩陣的方式呈現模型識別結果。如圖6所示,可以直觀地看出混淆矩陣的對角線顏色較深,說明模型可以達到比較好的分類效果。進一步地,分析混淆矩陣的結果可以得到,6類意圖中,攻擊、突防分類效果最好,這是由于這兩類意圖的辨識度較高。

圖6 層次聚合感知模型混淆矩陣

其中,攻擊意圖雖然樣本數量只有353條,但分類全部正確。而相反巡邏、規避與巡航3個意圖相似性較高,沒有攻擊與突防的識別效果好。其中,巡邏意圖有59條被預測為規避,57條被誤分類為巡航。規避和巡航分別有100條和99條被誤分類為巡邏。而對于偵察意圖,雖然辨識度不高,但是樣本數量大,所以分類效果也不錯,但還是有部分樣本被預測為巡航、巡邏與規避。

3.2 模型評估

為了驗證所提模型的優勢,本文對比了當前基于深度學習的意圖識別模型,包括周旺旺等所采用的DNN[13],趙佳歡等所采用的RNN[15]以及王志剛等所采用的LSTM[17]。進一步地,也對比了一些高效且簡單的基線模型,包括CNN[22]、GRU[23]以及Transformer[24]。將各個模型在空中目標意圖數據集上訓練,每個模型訓練5次。公平起見,將空中目標意圖數據進行相同的預處理,并以相同的劃分輸入到上述模型中進行意圖識別,最終將識別的各項評價指標與本文所提出的模型進行對比。結果如表1所示。

表1 不同模型識別效果對比

由對比實驗可知,傳統的深度神經網絡模型由于增加深度會造成局部最優的問題,并且沒有考慮到戰場作戰數據的時序性特點,所以難以達到較好的擬合效果;卷積神經網絡模型雖然采用權值共享和局部連接結構可以減少學習參數并提取局部特征,但由于也無法對時間序列上的變化進行建模,所以準確率也不是很好;循環神經網絡可以學習時間序列信息,但標準循環神經網絡無法學習長時間依賴信息,而對于意圖識別場景,作戰數據之間包含長時的關聯關系,該關系反映了子意圖之間的依賴。所以,提取長時依賴關系的循環神經網絡變體LSTM與GRU模型可以更好地表達意圖識別場景。為了在空中目標意圖識別任務上達到更好的識別效果,本文所提出的層次聚合模型結合作戰過程中敵方作戰意圖識別場景的特點,雙向學習全局特征,實驗表明可以達到89.16%的F1值,在所有模型中識別率最好,證明本文模型具有在復雜戰場情況下準確識別敵方目標意圖的能力。

3.3 模型分析

為了驗證所提模型各個模塊的有效性,設計3組消融實驗驗證每個模塊添加前后對作戰意圖識別準確率的影響。分別將底層行為特征感知模塊、意圖特征聚合模塊與意圖聚焦模塊移除,將移除以后的模型在空中目標意圖數據集上訓練并測試識別意圖準確率,以驗證每個模塊對模型識別準確率的影響,確定模塊有效性。

不同模塊消融實驗的結果如表2所示,從該表可以看出,移除行為特征感知模塊之后,在測試集上的準確率僅為82.1%,F1值為83.12%,相比于原模型,識別性能有大幅下降。移除了意圖聚合模塊之后,模型在測試集上的準確率為84.48%,F1值為84.41%,相比于原模型,性能有所下降,但與移除行為特征感知模塊性能的降幅相比要相對低一些。移除了意圖聚焦模塊之后,在測試集上的準確率為86.95%,F1值為87.39%,相比于原模型,性能下降了2%左右,相比于上面2個消融實驗的結果,顯然意圖聚焦模塊的存在對模型結果的影響最小。

表2 不同模塊消融實驗結果

3組消融實驗的混淆矩陣結果如圖7所示,其中圖7a)為移除行為特征感知模塊的實驗結果,從混淆矩陣看出,對角線上的正確結果相對降低。結合表2的結果,可以證明消除了機動性特征后,極度降低了模型表示能力。這說明,對基本的機動行為特征的學習對識別最終作戰意圖至關重要。這是由于目標的機動行為構成了最基本的飛行行為,所以對機動行為的感知是識別作戰意圖的前提。行為感知模塊通過濾波器在時序數據中提取行為的特征,這個操作中不同大小的卷積核在數據上滑動以感知低級的行為,將這些行為表達送入上層繼續學習可以提高模型表達能力,這是符合觀察行為細節以判斷整體意圖的基本邏輯的。

圖7b)為移除了意圖聚合模塊的混淆矩陣,結論與表2數據一致。性能有所下降原因是意圖聚合模塊的主要功能為感知和表達子意圖之間的雙向依賴關系,這可以為推斷意圖提供更多的信息,但它不是確定意圖的關鍵信息。

圖7c)為移除了意圖聚焦模塊的混淆矩陣,該矩陣與原模型效果相差最小。出現該結果的原因是意圖聚焦模塊對識別意圖來說能提供的信息對模型表達能力影響最小,該模塊的主要作用是對已學習到的特征表示分配權重,以影響作戰實體最終意圖的表示,所以是對已學習到的關鍵信息加以補充,但不是決定性信息。

圖7 各個模塊消融實驗結果

3.4 參數影響

在本節,分析了模型各個模塊參數的不同設置對模型表現的影響,其中包括行為感知模塊中的卷積層數和卷積核大小,意圖特征聚合模塊中的雙向長短時記憶單元數。實驗結果如圖8所示,圖8a)展示了卷積層數對模型準確率的影響。雙層卷積層的性能最好,進一步增加層數會增加模型的復雜性,導致過擬合使得模型性能下降。圖8b)展示了卷積核大小的影響。實驗結果表明空中目標意圖數據集需要更多的卷積核才能達到最佳的識別能力,這是因為增加卷積核的數量可以感知到更多的行為特征。另外,Bi-LSTM單元的數量也會影響性能,實驗結果如圖8c)所示,模型中需要較少的單元來感知雙向依賴,最佳單位數為32。進一步增加單元的數量也會增加模型的復雜性,并導致過擬合,使得模型性能下降。

圖8 參數實驗結果

4 結 論

1) 面對空中目標作戰意圖任務的層次性和分解的子意圖序列具有長時相互依賴的特點,提出一種層次聚合模型以識別目標作戰意圖。

2) 通過數據驅動的方法解決傳統作戰意圖識別中過于依賴領域專家知識進行決策的問題,并對比分析了各個神經網絡模型在該任務上的性能。

3) 與傳統方法相比,本文方法減少了人工成本以及對專家領域知識的依賴,與標準深度神經網絡和標準循環神經網絡相比,解決了無法利用長時全局依賴關系以及特征聚焦的問題。通過消融實驗驗證了所提模型各個模塊的有效性。

在未來的工作中,將針對相似意圖分類效果不明顯的問題進一步改進模型,后續將開展多通道模型的研究以增強模型表達能力,從而提取空中目標意圖數據集中更豐富的信息。

猜你喜歡
意圖卷積神經網絡
原始意圖、對抗主義和非解釋主義
陸游詩寫意圖(國畫)
基于3D-Winograd的快速卷積算法設計及FPGA實現
制定法解釋與立法意圖的反事實檢驗
神經網絡抑制無線通信干擾探究
從濾波器理解卷積
基于傅里葉域卷積表示的目標跟蹤算法
基于神經網絡的拉矯機控制模型建立
復數神經網絡在基于WiFi的室內LBS應用
基于支持向量機回歸和RBF神經網絡的PID整定
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合