?

固定翼無人機多工況聚類及識別研究

2022-02-21 04:42盧俊鋼張世榮梁少軍
兵器裝備工程學報 2022年1期
關鍵詞:離群模式識別聚類

盧俊鋼,張世榮,梁少軍,楊 毅

(1.武漢大學 電氣與自動化學院, 武漢 430072;2.陸軍工程大學 軍械士官學校, 武漢 430075)

1 引言

無人機具有易開發、成本低、靈活性強等特點,近年來在軍事、民用領域得到了長足發展和廣泛應用。其中,固定翼無人機(Fixed-Wing Unmanned Aerial Vehicles,FW-UAVs)集成技術先進、造價高、系統復雜,一般應用于速度快、距離遠和續航久的場景。FW-UAV的性能會隨著運行時間增加逐漸衰退,導致故障發生率增高。FW-UAV一旦因故障墜毀會導致較大的經濟損失甚至引發軍事、政治和社會影響。故使用故障預測和健康管理技術提升無人機設備的可靠性與可用性具有重要意義,眾多學者圍繞此問題進行了大量深入研究。

FW-UAV的設備復雜性、任務規劃多變性和環境多樣性導致其工作狀態反復切換,呈現多工況特征,這給基于數據的故障預測和健康管理帶來諸多挑戰。因此,有必要對無人機的多工況問題進行研究。從數據挖掘角度看,FW-UAV的多工況分析是典型的數據分組問題,可以使用聚類算法解決,在線數據分類則屬于模式識別問題。常見的聚類算法有層次聚類、密度聚類和譜聚類等。目前已經出現了基于相似性(距離)、基于神經網絡和基于機器學習等方法的模式識別,并被廣泛應用于工業、軍事等領域。例如,張俊楠等將支持向量機與二叉樹結構相結合對分布式光纖擾動傳感系統的擾動模式進行了有效識別。別鋒鋒等利用ICEEMDAN算法提取了往復泵的故障特征,并使用GRNN神經網絡進行故障識別,有效提高了識別準確度。王爍等基于反向傳播神經網絡對多因素作用下破片對靶板的侵徹毀傷模式進行了有效識別。劉凡等利用小波包分解提取了電力變壓器的多維度能量特征,進而使用近鄰算法實現局部放電超高頻信號的模式識別。張陽陽等使用概率神經網絡對齒輪箱典型故障進行了有效識別。

以上方法在不同領域應用收到了較好效果,但無法直接應用于FW-UAV工況分析。主要原因在于:含類標的FW-UAV數據很難獲取,導致監督模式識別算法無法應用;FW-UAV數據鏈傳輸速率快,在線數據量大,對工況識別算法時效性要求高。為解決以上問題,本文將聚類分析與模式識別算法相結合,采用組合算法來實現無人機多工況的高效分析。擬提出一種基于分組的非監督密度聚類(Group-based DBSCAN,G-DBSCAN)算法,在不依賴數據工況類標基礎上實現多工況分析;并將提出一種基于多維度分解的快速工況識別算法(Pattern Recognition based on Dimensional Decomposition,PRDD),PRDD將進一步與聚類算法深度融合以實現FW-UAV在線數據工況識別的快速性和準確性。

2 FW-UAV多工況分析

FW-UAV執行任務的全流程包含起飛、巡航、遂行任務、返航、回收等多個階段,屬于典型的多工況過程,若將其簡單處理為一個工況,則會因模型失配降低故障預測、故障診斷、剩余壽命預測等數據驅動算法的準確率。

這里以某FW-UAV實際飛行數據集中縱向控制回路與速度控制回路相關數據為例,展示其多工況特征并說明工況分析的必要性。FW-UAV縱向控制回路與速度控制回路均是閉環反饋回路,相關的變量包括俯仰角、升降舵偏角、發動機缸溫、發動機轉速和高度共5維數據。圖1為某飛行時間段該5維數據歸一化后的飛行曲線。從圖1可以看出,隨著時間推移曲線幅值波動較大且各維度數據呈現非線性關系,無法從直觀角度辨識工況。為進一步分析無人機工況特征,下一節將基于數據分布特征,提出一種密度聚類算法對其進行多工況分析。

圖1 FW-UAVs某飛行時間段飛行曲線

3 多工況分析與識別算法

3.1 工況聚類

DBSCAN作為基于密度的聚類算法,能夠在數據集中找出具有不同大小和形狀的簇,對噪聲有較強的魯棒性,能基于數據自主推測聚類個數。DBSCAN的主要參數為掃描半徑和核心點最小數據量Min,算法將數據集中的樣本點分為核心點、邊界點和離群點3類。在DBSCAN算法中定義了兩點之間3種特殊關系:直接密度可達、密度可達以及密度相連。經典DBSCAN算法將原始數據集中的所有樣本點視為潛在的核心點逐個掃描,若確認為核心點則將與其密度相連的所有數據點視為同一類。以下提出了一種基于分組的DBSCAN算法,它將數據分布特性融入經典DBSCAN算法,旨在提高算法的效率。

對于數據集中的給定點,∈,令,表示點和之間的距離,,()表示點到其第個最近鄰點()的距離。在距離基礎上進一步定義分組核心點、分組離群點和分組待定點。

1) 分組核心點:對于給定點∈,若,(Min)≤,則將該點標記為分組核心點。這就意味著點與其第Min個最近鄰點的距離小于。

2) 分組離群點:對于給定點∈,若,(Min)>2,則將該點標記為分組離群點。

3) 分組待定點:給定點∈,當<,(Min)≤2時,將其標記為分組待定點。顯然,邊界點以及離群點都有可能是待定點,因此還需進一步采取策略進行識別。

使用基于KD樹的最近鄰搜索算法獲取數據集中的每個點到其第Min個最近鄰點的距離,并將得到的距離值以升序進行排序,就可以得到距離曲線(Min-th distance Curve,MC),如圖2所示。

圖2 樣本點到其第MinPts個最近鄰點的距離曲線

、、分別表示分組核心點、分組待定點以及分組離群點。以圖3(a)為例,此時Min=3,所有核心點、、、、均屬于。因為,(3)=,>2,故點屬于,而另外2個真實離群點與被臨時收集在中。此例說明包含了所有的核心點,包含了部分的真實離群點,而包含了邊界點和離群點。其中中的離群點并不參與最終的聚類結果,因此可以被直接剔除以提高算法效率。由于核心點將決定最終聚類的形狀、大小以及數量,因此可以對使用經典DBSCAN算法,并設置Min=1,以獲得聚類結果,如圖3(b)所示。由于已經獲得了數據間的距離矩陣,聚類結果獲取時可直接調用該矩陣以進一步提高算法效率。

圖3 2種方法的聚類結果示意圖

(1)

輸入:

(1):原始數據集

(2):掃描半徑

(3) Min:核心點最小數據量

輸出:

(1)、、:分組核心點、待定點、離群點類標

方法:

(1) 初始化=,=,=

(2) 使用基于KD樹的最近鄰搜索獲取MC曲線及距離矩陣

(3) for中每個點

if≤then=

else if<≤2then=

else=

end if

end for

(4) 將中的所有點都標記為噪聲

(5) 執行DBSCAN算法(,,1)來獲得每個核心點的簇ID

end if

end for

3.2 工況識別

前一節使用G-DBSCAN算法對FW-UAV原始數據完成聚類分析后,會將原始數據集分為若干個簇,并標以不用的類標,即完成數據分組。本文將密度聚類算法與工況識別深度結合,充分利用已完成聚類的核心點信息,融合主成分分析法,提出一種基于多維度分解的模式識別算法(PRDD),完成新數據的聚類類標模式識別。

該算法首先將聚類獲得的核心點數據以及新數據使用主成分分析法(principal component analysis,PCA)降維,以提高運算效率,進而對兩類數據進行維度分解,通過判斷各個維度上新數據一定鄰域內核心點數據的分布情況,結合邏輯運算粗略推定新數據周邊有無核心點。之后根據核心點數量以及與新數據的真實距離準確識別測試數據的類標。

輸入:

(1): G-DBSCAN中的核心點矩陣

(2): G-DBSCAN中的核心點類標矩陣

(3): 測試數據,即新數據

(4): G-DBSCAN算法中鄰域半徑

輸出:

(1):新數據的多工況識別類標

方法:

(1) 基于實現、的降維

(2) 初始化類標矩陣

(3) for中每個點do

創建的鄰近點集合,并初始化

for中每個點do

加入鄰近點集合

end if

end for

end for

if=then

標記為噪聲點

else if()==1 then僅一個核心點

if ‖-‖≤then‖·‖為二范數計算

else 標記為噪聲點

end if

else 從中剔除與距離大于的核心點

if=then

標記為噪聲點

else if()==1 then

else if()>1 then

if中所有核心點類標相同 then

end if

end if

end if

end for

以上算法相比較于傳統模式識別算法具有以下優勢:

1) 無額外參數。該算法僅需輸入G-DBSCAN算法(或是其他以密度聚類為核心的算法)的掃描半徑,因此可擺脫部分機器學習算法中所存在的超參數調節困擾;

2) 無需建模。該算法在深度研究密度聚類算法的基礎上,從維度分解以及數學規律層面對新數據進行工況識別,無需依靠訓練數據進行建模,故也不存在模型過擬合、欠擬合以及陷入局部最優的問題;3) 開銷小。該算法充分利用維度分解的便利性,在各個維度上分別執行查找運算,之后通過邏輯判斷將待處理范圍縮小后再運行計算開銷較大的距離運算。與其他基于相似性/距離、基于神經網絡和基于機器學習的模式識別方法相比,本算法具有顯著的計算優勢。

4 驗證

4.1 無人機多工況分析平臺

工況聚類和在線工況識別是無人機故障診斷和健康管理的前提,多工況分析平臺設計如圖4所示,該平臺可進一步服務于無人機故障診斷和健康管理系統。圖4中,機載飛行控制計算機采集飛機俯仰角、升降舵偏角、高度、發動機缸溫和轉速狀態信息,并編碼形成遙測數據通過數據鏈發送至地面設備。地面設備接收并處理遙測信息,在對遙測數據清洗和采樣后存入歷史飛行數據庫。終端設備封裝了G-DBSCAN算法以及PRDD工況識別算法,執行多工況聚類與識別算法運算。以下首先以獲得的實飛數據為例進行算法驗證。

圖4 無人機多工況分析平臺框圖

4.2 FW-UAV的工況分析與識別

利用圖4所示分析平臺獲取了FW-UAV的實飛數據集,以下取某次飛行數據用于算法驗證。從數據集中選取數據量=500的數據樣本,數據維度=5(飛行數據曲線見圖1)。首先使用PCA算法降至二維,并設置G-DBSCAN算法參數Min=8,=007,算法首先得到飛行采樣數據MC曲線。根據MC曲線縱軸距離值與的關系可將飛行采樣數據劃分為分組核心點、分組待定點和分組離群點。如圖5所示,圖中縱軸距離值小于等于的區間聚集了所有的分組核心點,在與2區間聚集了待定點數據,在大于2的區間收集了分組離群點,這一結果與3.1算法描述一致。

本文算法測試環境為Matlab 2020b,終端設備配置為主頻2.2 GHz,內存16 G。根據G-DBSCAN算法步驟,圖6(a)、圖6(b)和圖6(c)為使用分組策略所獲取的3種不同數據的聚類結果。圖6(a)為算法篩選出的離群數據。圖6(b)為篩選得到的分組核心點數據在重新設定Min=1之后執行經典DBSCAN算法所獲得的聚類結果,從圖中可以看出分組核心點被聚為5類,由于分組核心點聚類結果表征了聚類的大致分布結構,因此可以斷定最終聚類結果將被分為5類,且邊界點將分布在此5類核心點數據簇的邊緣。在圖6(c)中,分組待定點中的邊界點被劃分到各核心點組成的簇中,而離群點被單獨標記。此過程將針對分組待定點的聚類分析過程轉化為了聚類類標識別過程,提升了算法效率。匯總以上結果即可得到算法最終聚類結果,如圖6(d)所示。圖6(e)為傳統DBSCAN算法聚類結果,對比G-DBSCAN算法,后者在保證了不影響原有聚類效果的前提下,平均運行時間從0.021 27 s減少到0.006 3 s,有效提高了算法的效率。

圖5 無人機飛行數據的MC曲線

圖6 FW-UAVs飛行數據聚類結果示意圖

綜上,G-DBSCAN算法能更快獲取到聚類核心點,無需重復遍歷原始數據集,結合后續模式識別算法將有效提高整體技術路線運行效率。

從已完成聚類分析的數據集中提取核心點矩陣及其對應的類標矩陣,同時從該數據集中分別隨機選取20、35、50的數據制成測試數據20、35、50用于PRDD工況識別算法的驗證。首先使用PCA算法將核心點矩陣及3組測試數據降至2維,并將降維后的、20、35、50以及參數(聚類時設置的參數)輸入PRDD算法,結果如圖7所示。該算法在3種測試數據集下的識別率均達到100%。

圖7 3種測試數據集下的識別結果示意圖

為了進一步檢驗該算法的優劣,選取了幾類常見的模式識別算法進行比較:加權近鄰算法(weighted-nearest neighbor,WKNN)、反向傳播神經網絡(back propagation neural network,BPNN)、概率神經網絡(probabilistic neural network,PNN)以及支持向量機(support vector machine,SVM)。從數據集中隨機選取80%作為上述算法的訓練數據,剩余20%作為測試數據,使用上述算法分別對無人機工況進行識別,并將識別結果與PRDD算法的結果列表。如表1所示。

表1 不同模式識別算法的識別結果

由表1可知:文章所提算法在識別準確率和運行時間方面較其他算法具有明顯優勢,進一步驗證了算法的有效性和實用性。

5 結論

提出了“聚類分析-模式識別”相結合的多工況識別技術路線。聚類分析階段從數據挖掘角度分析FW-UAV飛行數據,使用非監督改進型密度聚類算法G-DBSCAN解決了FW-UAV工況劃分難題,與工況識別緊密結合,融合主成分分析法,提出了基于多維度分解的快速工況識別算法。在已有聚類核心點類標的基礎上,充分利用維度分解的計算便利性,通過執行查找和組合邏輯運算減小了計算開銷,并進一步進行精確識別。相比較于傳統模式識別算法,能夠在保持較高工況識別準確率的同時有效提高算法效率。

猜你喜歡
離群模式識別聚類
一種傅里葉域海量數據高速譜聚類方法
輕身調脂消渴片的指紋圖譜建立、化學模式識別及含量測定
I、II類單點故障模式識別與質量管控淺析
基于相關子空間的高維離群數據檢測算法
基于數據降維與聚類的車聯網數據分析應用
基于模糊聚類和支持向量回歸的成績預測
隨感
近荷獨坐
汽車外觀造型創新設計遺傳算法的應用
候鳥
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合