?

基于高斯數據增廣的小樣本數據無人機編隊類型抗擾識別

2024-01-05 06:50馬琳琪李校男及鵬飛
無人系統技術 2023年6期
關鍵詞:隊形原始數據交點

馬琳琪,李校男,晁 濤,及鵬飛

(1. 哈爾濱工業大學控制與仿真中心,哈爾濱 150080;2. 四川騰盾科技有限公司,成都 610036)

1 引 言

無人機作為一種飛行器,可以在遙控或者自主控制下完成復雜飛行任務,近年來在軍事領域越來越多地被應用[1-2]。但由于單架無人機受到探測能力、武器運載能力等多項因素的限制,在任務難度高、任務范圍廣的情況下不具有優勢,因此出現了無人機群協同合作的作戰模式,這些無人機群通過編隊組織分工,可以完成戰場偵察、突防攻擊、火力支援等復雜任務[2]。隨著無人機在軍事作戰中的作用增強,如何監測敵方無人機并有效預警的相關研究逐漸開展,其中包括無人機集群的編隊類型識別。無人機集群通過調整隊形,可以完成不同的作戰任務,因此通過識別無人機集群的不同隊形,可以有效對來襲敵機進行預警預測,輔助指揮部門進行戰術決策。在軍事領域中常見的無人機隊形有楔形、菱形、縱形等,無人機采用菱形編隊可將保護對象圍在中間完成護送任務,采用縱隊可對目標進行地毯式打擊[1],因此無人機編隊類型的識別問題對于判斷敵方意圖并根據預測的意圖來為我方及時作出預警至關重要。

編隊類型識別問題從本質上來說是一種分類問題,通常采用基于模板匹配[3-4]或是機器學習的識別方法[5-7],模板匹配例如基于空間方向相似性[8]、基于領域知識[9]等,這些方法通常只針對一些具體的隊形模板,其隊形描述的方式固定,不適用于無人機坐標數據觀測不完全和含有雜波等干擾因素較多的情況,缺乏通用性。而基于機器學習的目標識別方法中,具有代表性的有基于BP(Back Propagation)神經網絡[10]、支持向量機SVM(Support Vector Machine)[11]、循環神經網絡RNN(Recurrent Neural Network)[12]等的目標識別算法,目前已有研究驗證了這些方法在無人機編隊識別問題中的有效性,但此類方法依賴大量的數據進行建模,對于小樣本情形下的編隊識別存在局限性?;诮Y合Hough 變換和K-means 聚類算法的隊形識別算法本質上也是一種模板匹配算法,這種方法可以通過提取編隊輪廓特征的方式將編隊類型與輪廓參數相匹配,雖然同其他的模板匹配方法一樣也需要建立模板庫,但該算法特征提取的步驟簡潔,相應特征的數據維度較小,并且可以在一定程度上過濾掉雜波等干擾因素的影響,同時相比于機器學習算法而言并不依賴于數據進行建模,因此該算法有著一定的優越性。

另外,無人機樣本量少本質上是目標分類領域的小樣本問題,針對小樣本問題現在常見的處理方式有兩種類型,一種是針對數據進行的數據增強(例如數據裁剪、翻轉、添加噪聲或是采用生成對抗網絡進行數據生成等),另一種是針對模型進行模型優化(例如遷移學習、多任務學習、元學習等),這些方法均可以對小樣本引起的模型魯棒性等問題進行改善。

本文旨在結合Hough 變換和K-means 聚類算法,對含有噪聲的無人機隊列進行類型識別。針對無人機數目較少影響參數空間交點求解與聚類效果的問題,提出了一種基于高斯模型的原始數據增廣方法,將原始數據與生成的虛擬數據融合,以提高聚類算法的精度及魯棒性。將這些圖形空間中的無人機坐標點數據通過Hough 變換映射為參數空間中的正弦曲線,統計這些正弦曲線的交點,去除重疊交點數較少的數據點,將剩余交點進行K-means 聚類,用聚類后的交點即可得到原圖像空間中直線的參數。

本文首先介紹了Hough 變換和K-means 聚類算法的基本原理。然后,通過分析含雜波小樣本隊列信息帶來的問題,詳細介紹了編隊類型抗擾識別算法流程。最后,以常見的菱形隊列為例,通過計算機仿真對算法的有效性進行了分析。

2 Hough變換原理

Hough 變換[13]由Paul Hough 提出,它的基本原理是利用圖像空間和Hough 參數空間的點-線對偶性,將圖像空間中的檢測問題轉換至參數空間中進行。以直角坐標系為例,在直角坐標系中的直線,其斜率-截距表達式如式(1),式(1)可等價變換為式(2)。

將x,y視為參數,k和b視為自變量,則x-y平面中的每一個點都對應k-b平面中的一條直線,因此,x-y平面中同一條直線上的點可以轉換成kb平面中的多條直線,這些直線的交點即可確定xy平面中這條直線的參數[4]。

這種基于斜率-截距表達式的Hough 變換,對于垂直于x軸的直線很難進行表達,因此Dude等[13]將極坐標引入,把直角坐標系中的數據轉換到極坐標系表示。直線L的極坐標表達式為

式中,ρ表示圖像空間中原點到直線的垂線段的長度,而θ表示這條垂線與極坐標中極軸的夾角。若將x,y看作是參數,對應地將ρ和θ看作是自變量,那么直線L上的任意一點都可以轉變成極坐標系下的一條正弦曲線,如圖1 所示。這些參數空間中的正弦曲線交于一點,這一點對應的ρ和θ即可確定直線L的表達式。

圖1 直線樣本及其Hough變換后曲線Fig.1 Straight line samples and their Hough transformed curves

3 K-means聚類算法原理

K-means[14]為最常用的基于歐氏距離的聚類算法,該算法的使用基于一個基本前提,那就是如果兩個目標在歐氏距離度量下的距離越小,那么他們的相似度就越大。本文對提取到的候選交點使用K-means 聚類得到類中心,以類中心作為最終選擇的直線參數,下面是算法的詳細介紹。

K-means 算法大致分為三步,第一步初始化類中心,第二步將數據點分配給最近的類中心,第三步更新類中心。其中第二步和第三步迭代進行,直到最后類中心穩定收斂。

針對第一步類中心的選擇,可以隨機選擇k個數據點,也可使用Lloyd[15]、K-means++[16]、SKMeans++[17]等方法動態選擇。經過綜合比較,本文最終使用K-means++選擇初始化k個類中心。

4 無人機編隊類型抗擾識別算法

本章將詳細介紹本文提出的基于高斯模型增廣原始數據的無人機編隊類型抗擾識別算法。首先分析了當樣本數據較少,且含有噪聲干擾時,直接使用Hough 變換會帶來的問題。進而提出使用高斯模型對原始數據進行增廣,以獲得更好的交點提取與聚類效果。

本章以菱形隊列為例,詳細闡述了使用Hough變換,K-means 聚類進行隊形輪廓提取的方法。在該方法中將無人機編隊中的單個無人機視作一個坐標點,根據無人機群中各個無人機的相對位置將其抽象為一個點集,每個點由一個橫縱坐標表示,然后以該點集作為識別算法的輸入數據,在菱形編隊示例中,該編隊的16 架無人機對應著二維平面中的16 個坐標點,如圖2 所示,算法的具體流程如圖3所示。

圖2 帶擾動的菱形隊形數據Fig.2 Perturbed diamond formation data

在實際應用中,可以通過雷達等觀測設備獲得無人機群的位置信息,再對獲得的觀測數據按照上述邏輯進行轉換,從而應用該識別算法進行編隊類型的識別。

4.1 基于高斯模型的數據增廣

在實際應用過程中,即使無人機保持直線編隊行進,受采集設備精度及噪聲影響,采集到的數據點也無法完美分布在同一直線上,這將導致參數空間中的曲線無法相交于一個點[18],如圖4所示。

圖4 帶擾動的直線樣本及其Hough變換后曲線Fig.4 The perturbed straight line sample and its Hough transformed curve

與圖1相比,圖4在原始圖像空間中的點不再完美符合直線分布,這樣一來,在參數空間中的曲線會相交于多個點。相交的點數增加無疑為問題的求解帶來了難度,需要求解的交點數增加,求得交點后如何選擇或融合為合適的一個點成為一個新的問題。

針對以上問題,已有前人的研究[4,19]選擇使用聚類算法來獲得最終的解,通過提取相交曲線數大于一定閾值的候選點,對候選點進行聚類,以最終的類中心作為結果。這樣的方法取得了不錯的效果。但由于在小樣本無人機編隊類型識別中,無人機的數目較少,可獲得的候選交點也會較少,聚類數據的不足無疑會嚴重影響聚類算法的準確性。因此本文提出了使用高斯模型在一定的小范圍內增廣原始數據,將原始數據與生成的虛擬數據一同進行Hough 變換與聚類,有效地增加了參數空間中的候選交點數,為聚類算法提供了更加充足的數據,能夠獲得更好的聚類效果。具體方法是將原始數據點視作一個高斯分布,而非獨立的點,則可以一定的方差σ,按照式(4)所示二維高斯概率分布來生成虛擬數據。

式中,(μ1,μ2)對應原始數據中的點(x,y),σ1與σ2為高斯分布中的標準差,為不失一般性,在本文中使用σ=σ1=σ2。圖5 即為對原始數據中每個點使用σ= 0.2 的二維高斯分布生成10 個虛擬數據點后的結果。

圖5 高斯增廣后數據分布Fig.5 Gaussian augmented data distribution

4.2 Hough變換與交點統計

得到增廣的數據后,對其使用Hough 變換即可得到參數空間的正弦曲線。為直觀展示數據增廣為交點選取帶來的有利影響,圖6 給出了原始數據和增廣后數據的參數空間曲線。

圖6 增廣后的樣本及其Hough變換后曲線Fig.6 Augmented samples and their Hough transformed curves

從圖中可以看出,使用高斯分布對原始數據進行增廣后,參數空間中的線條數增多,對應的交點數也明顯增加,這將大大提高算法對原始數據中噪聲的魯棒性。

由于使用計算機對曲線進行處理的過程中,直接在參數空間中通過曲線的解析式來獲得交點的解析解計算成本過高,可實施性不強,所以需要恰當的離散化手段對參數空間曲線進行離散化處理,然后根據離散化的結果,統計相交于同一點的曲線數,根據統計的重疊交點分布設定合適閾值獲得最后用于聚類的候選交點。離散化間隔如果選取過大,則在同一個離散網格內會囊括過多的點,甚至會包含進一些錯誤的交點;間隔若選取過小,則容易導致落在同一離散網格內的點過少而錯過最優交點,所以合適的離散化間隔選擇將尤為重要,如圖7 所示,即為選取Δθ為0.1 rad,Δρ為0.1 m時統計的重疊交點數分布圖。

圖7 重疊交點分布圖Fig.7 Overlapping intersection plots

統計出重疊交點數分布后,通過選擇合適的閾值提取出峰值點,提取出的峰值點將作為聚類的候選交點。重疊交點數的提取依賴合適的閾值,閾值選取過大會造成數據丟失,選取過小則會放大雜波干擾,影響后續的聚類效果,所以合適的閾值選擇也尤為重要,峰值點提取出來后便可以進一步聚類分析[20]。

4.3 交點聚類與隊形輪廓提取

得到提取出的峰值點后,應用K-means++進行初始類中心的選取,接著使用通用K-means 算法進行聚類,在參數空間中獲得期望的類中心,具體步驟如下:

(1)首先從候選交點數據集X={(θi,ρi),i=1,2,3...N}中隨機均勻選擇一個數據,將此數據點作為第一個初始類中心,記為c1。

(2)計算從每個數據點到已選擇類中心(初始時僅有c1)的距離。將cj和各個數據點xm之間的歐幾里得距離表示為d(xm,cj)。

(3)在數據集X中選擇余下的類中心,選擇的概率遵循

式中,Cp表示最接近cp的所有數據點的集合,即每次選擇類中心時,其被選擇概率與它到已選最近中心的距離成負相關。

(4)迭代步驟(3),直到選擇到了k個類中心。

使用K-means++選擇到k個類中心后,就可以在數據中迭代更新類中心直至最后收斂,具體步驟如(5)~(7)。

(5)計算所有數據點到每個類中心的歐幾里得距離,將每個數據點分配給離其最近的類中心,即對每一個樣本xp,將會按照式(6)分配給集合S(t):

式中,t代表迭代次數。

(6)計算每個簇S(t)中數據點的平均值,將此平均值作為新的k個類中心,

(7)迭代進行(5)、(6)步驟,直到最終的類中心不再改變。

至此,提取出的峰值點通過K-means 聚類算法提取出各個簇的類中心,將參數代回式(3)即可獲得在原始圖像空間取出的直線,如圖8所示。

圖8 高斯增廣后數據點的聚類與邊界提取Fig.8 Clustering and boundary extraction of data points after Gaussian augmentation

可以注意到,雖然菱形只有四條直線,但提取出的類中心是6個,對應著6條直線。這是因為正弦函數具有周期性,所以在選取計算的窗口中可能存在多于期望直線數的交點。但這些周期性的點映射回原圖像空間后會重疊,經過適當的濾波后便能融合在一起。獲得提取到的隊形輪廓后,使用模板匹配或神經網絡等方法即可獲得編隊類型識別結果。

5 仿真結果與分析

本文聚焦于無人機隊形識別,在常見的無人機隊形中選取了較為復雜的菱形隊列,通過生成含有噪聲的菱形無人機隊列數據來評估所提方法對編隊類型的識別性能。直接對原始數據使用識別算法與在高斯增廣后對數據使用抗擾識別算法的仿真結果對比如圖9所示。

圖9 原始數據與使用增廣數據仿真結果對比Fig.9 Comparison of original data and simulation results using augmented data

從實驗結果可以看到,在使用基于高斯模型的增廣數據后,可用于聚類的候選交點數目明顯增加,由此也獲得了更好的聚類效果。從最后映射回圖像空間的結果來看,使用增廣數據后提取的直線也更加準確。直接在原始數據上提取雖然提取到了正確的邊界,但還提取出了兩條錯誤的直線(另一條由于偏移過大,沒有顯示在圖9 選擇展示的范圍中)。這有力證明了使用基于高斯模型的增廣數據后,算法的魯棒性得到了顯著提升。

為進一步探索基于高斯模型的增廣數據對最終效果的影響,本文通過變化高斯模型中的標準差σ,探索不同σ對最終直線提取效果的影響。本文使用最終提取的隊形邊界直線的k,b參數與期望的標準直線的k,b參數的均方誤差作為評估指標。均方誤差越低,說明提取出的邊界信息越準確,具體結果如表1所示。

表1 使用不同σ得到邊界參數的均方誤差Table 1 Use different σto get the MSE of the boundary parameters

從表中可以看出,在使用了基于高斯模型的增廣數據后,模型提取出的隊形邊界更為準確,這是因為高斯分布的增廣數據有效增加了參數空間中的交點數,使K-means 聚類算法表現得更加穩定。除此之外,由于原始數據量小,且存在噪聲,加入額外高斯分布的數據能夠有效緩解原始數據中噪聲對識別算法帶來的負面影響。

本文所采用的算法與前面提到的數據增強方法有一定的相似性,但又略有不同,在做法上都是添加一定的高斯噪聲生成新的數據,前面提到的數據增強算法是直接生成高斯噪聲納入訓練數據,而本文是將生成的高斯噪聲圍繞原始數據點展開,即以原始數據作為原點生成相應的噪聲,這樣能夠更好地保留數據的特征。

從實驗結果來看,基于高斯模型擴充原始數據后,使用Hough 和K-means 算法能夠有效提取出無人機隊形邊界,這樣一來再使用模板匹配或神經網絡分類等方法就能輕松地識別無人機的編隊類型。

通過可視化的方式對仿真結果進行更加直觀的分析,如圖10 所示,可以看到當標準差等于0.3 時識別結果的均方誤差最?。?.46),以0.1的步長對標準差進行增大或者減小時,均方誤差均會增大,并且當標準差小于0.1 或者大于0.5時,均方誤差急劇增大,在0.1~0.5的范圍內變化則較為平緩。

圖10 邊界參數的均方誤差隨高斯模型標準差的變化Fig.10 The variation of mean square error of boundary parameters with Gaussian model standard deviation

仿真結果中原始模型的均方誤差高達45.1,而本文采用的方法可以將均方誤差降低至0.46,證實了方法的有效性。

為了進一步證實本文提出的基于高斯數據增廣的小樣本數據無人機編隊類型抗擾識別算法對多種常見無人機編隊類型識別的有效性,設計帶有噪聲的縱行及楔形編隊并使用該算法進行識別,其對應的待識別增廣數據和圖像空間邊界提取如圖11、圖12所示。

圖11 待識別編隊增廣數據Fig.11 The formation to be identified

圖12 圖像空間提取的邊界Fig.12 The boundary of image space

可以看到,本文提出的基于高斯數據增廣的小樣本數據無人機編隊類型抗擾識別算法在菱形編隊、楔形編隊、縱行編隊等常見編隊類型的邊界提取中均有著不錯的效果,在此邊界提取的基礎上可以進一步地有效進行編隊類型的判斷。

本文提出的基于高斯模型增廣原始數據的無人機機群特征聚類算法,將原始數據點視作一個高斯分布,而非獨立的點,從而將編隊中原始點擴充得到更豐富的候選點用于參數空間聚類,聚類得到的結果也更加趨近于真實值。這種方法的顯著優點是對噪聲或者缺失值有著相當好的魯棒性,因為圍繞每個原始點額外添加的數據點有效地抵消了噪聲的影響,豐富了樣本的特征。另外,相對于如文獻[3]所用到的基于模板匹配的識別算法來說,本文的算法流程簡化了特征提取步驟的繁雜計算,避免了針對隊形規律的公式推導,從而提高了匹配并識別不同類型編隊的靈活性;而相對于近期興起的機器學習方法來說[5],本文所采用的算法不依賴大規模數據集來訓練網絡,僅需要少量樣本來建立模板庫即可,很適合敵方無人機信息有限的應用場景。

6 結 論

本文創新性地提出了通過將無人機編隊原始數據點視作一個高斯分布的方式對原始數據進行增廣,在增廣數據的基礎上通過使用Hough 變換、離散化參數空間、統計重疊交點并提取聚類候選點、對候選點進行K-means 聚類的方法實現了對無人機隊形輪廓的提取,并以帶有噪聲的菱形編隊為例通過仿真實驗驗證了方法的有效性。其中,將原始數據中的每個點視作一個高斯分布的數據增廣方式以及離散化參數空間以進行交點統計的交點計算方式均是本文的重點創新點,如前文所述,前者有效改善了候選點的聚類效果,提取出了更加準確的邊界參數,后者則大大提高了交點統計的計算效率。文中也對應用該方法到工程場景中時的數據來源、數據處理方式進行了分析和說明。通過該方法提取出的無人機隊形輪廓能夠為編隊類型識別提供良好的特征表示。

本文提出的使用高斯模型增廣原始小樣本數據的方式,為后續的聚類算法提供了更加豐富的樣本,提高了聚類算法的魯棒性,為之后的相關研究提供了很好的參考。在使用Hough 變換提取隊形輪廓時,正弦函數帶來的周期性重復點的去重問題還有待進一步研究。

猜你喜歡
隊形原始數據交點
GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
受特定變化趨勢限制的傳感器數據處理方法研究
隊列隊形體育教案
詩歌的奇怪隊形(一)
閱讀理解
全新Mentor DRS360 平臺借助集中式原始數據融合及直接實時傳感技術實現5 級自動駕駛
借助函數圖像討論含參數方程解的情況
試析高中數學中橢圓與雙曲線交點的問題
無人機編隊機動飛行時的隊形保持反饋控制
指數函數與冪函數圖象的交點的探究性學習
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合