多無人機群任務規劃和編隊飛行的綜述和展望

2024-01-26 03:18劉正元吳元清李艷洲

指揮與控制學報 2023年6期

劉正元吳元清李艷洲王超

無人機(unmanned aerial vehicle,UAV)以其低成本,零人員傷亡,操作便捷簡單和靈活可靠的特點,源于1914 年被稱為AT 計劃的英國軍事試驗.隨著UAV 技術的成熟及應用范圍不斷擴大,其應用領域已涉及到國防、工業、民用以及科研領域.有許多國家都在積極開展UAV 研究與開發工作.我國UAV起步較晚,盡管UAV 研究已經有一百多年的歷史,但是UAV 群研究卻是在21 世紀逐步展開.美國國防部在2005 年8 月公布的《UAV 系統路線圖2005—2030》中,把UAV 自主控制等級劃分為1～10 個級別,其最高級別（10 個級別）以集群全自主為目標[1],即UAV 蜂群使用.美智庫“新美國安全中心”于2014 年10 月5 日發表《戰場機器人Ⅱ: 即將到來的蜂群》報告,第1 次系統地提出了無人系統蜂群戰術的概念.美國空軍于2016 年5 月公布《小型UAV 系統飛行計劃2016—2036》,在戰略上確認小型UAV 的未來與價值,明確“蜂群”,“編組”,“忠誠僚機”等3 種集群作戰理念[2].中國電子科技集團于2017 年6月順利完成了119 架固定翼小UAV 的集群飛行實驗[3].UAV 群已成為國內外研究熱點.

UAV 群在“數”“價”“質”“變”等4 個方面與多UAV 存在較大差異[4],根據其自主性及智能化程度從低至高依次可以劃分為UAV 機群、UAV 集群和UAV 蜂群,本文從這3 個概念對UAV 群進行界定.UAV 群是指為共同執行某一任務,通過互聯構成群組,通過無中心的局部交互、反應式規則和行為,涌現復雜的群體自組織能力,從而實現高度智能自主的集合體;或受統一指揮并保持目視聯系或戰術聯系的空中集群[5].賈永楠等對UAV 集群研究動因進行分析,并從模型、協議、平臺3 個視角對UAV集群研究進展進行綜述[6].王祥科等對小型固定翼UAV 集群在集群系統內涵、已有典型工程、關鍵技術3 個視角下的國內外研究情況進行了總結[7].賈高偉等分別從以邏輯和規則為基礎的自頂向下型任務規劃以及以集群智能出現為基礎的自底向上型任務規劃兩方面,綜合評述了UAV 集群任務規劃的研究現狀[8].劉學達等在UAV 集群協同控制研究領域對演化博弈理論在UAV 集群控制研究領域的運用前景進行探究,分別從情報共享、任務分配、資源調整以及編隊重組4 個方面,對其具體運用設想進行闡述[9].本文基于此得出結論: UAV 群技術應用主要服務于任務規劃與編隊飛行兩個層面,這兩個層面又是UAV 群得以實際應用的基礎與重點.盡管有一些關于UAV 群的研究涉及任務規劃與編隊飛行兩個方面[10],但是并未對二者結合后所產生的新內容與新問題進行專門細化,因此,迫切需要對多UAV 群任務規劃與編隊飛行相關研究狀況進行深入闡述,從而為今后多UAV群在實際應用中奠定理論基礎.本文旨在根據已有UAV 群在任務規劃、編隊飛行等方面的研究基礎上,對今后多UAV 群研究中應關注及存在的差異進行展望.

1 UAV 群任務規劃

任務規劃作為UAV 應用過程中的頂層規劃,它是針對任務所處環境態勢、任務需求和自身特性而提出的一種綜合調度方式,以在UAV 和任務之間建立合理的映射關系并保持機與機之間合理的協同配合.UAV 群的任務規劃包括任務分配與航跡規劃兩個方面.

1.1 UAV 群任務分配的研究

UAV 已在廣泛領域中進行了應用,因其任務在各領域存在較大差異,所以模型與算法設計各不相同.本節基于UAV 的功能視角,對其任務分配進行了3 類分類概述.通信傳輸功能,可實現多飛行器之間信息傳遞;導航定位功能,可確定飛行方向及飛行速度;監控管理功能,可以完成監視、控制、指揮等多種工作.攻擊功能,通常僅應用于軍事領域中,需要精確、有效地對目標物進行毀傷,具有很高的準確性.偵察搜尋的職能,它的任務需要廣泛的覆蓋范圍,對海上搜救、海上巡邏和軍事偵察都起著至關重要的作用[11-12].嚴飛等對偵察型與攻擊型UAV 構成的UAV群,采用合同網算法來解決任務分配問題[13].監管的職能,需要協同跟蹤、航道測繪[14-15],船舶大氣排放監管和農業噴水/藥物領域都有相關的研究.SHENA 等針對港口船舶排放協同探測問題,基于多UAV 船舶發射探測特性,給每架UAV 指派了帶時間的探測任務序列[16].為滿足動態環境下實時性需求,設計一種以禁忌搜索算法與“最小環”方法相結合的PSO 算法.保障功能,完成各種物資補給、人員救援以及環境勘測工作.通信傳輸功能,將各傳感器采集到的數據傳遞給指揮中心或其他用戶設備.閆輝等提出了一種在任務接力基礎上,考慮UAV 異構性與地理環境約束,旨在提升多UAV 系統總體續航時間的協同目標指派調度策略,解決了目標重要性動態變化下的協同目標指派問題[17].搜索跟蹤功能,獲取更詳細的信息,能夠實時掌握敵方態勢.監視探測功能,發現并跟蹤目標物.運輸配送功能,任務需要考慮多成本因素且研究范圍廣泛、變體問題多樣.有人考慮了選址-路徑規劃[18],有人考慮了逆向物流[19],也有人提出了協同卡車分配.MURRAY 和CHU 等介紹了一個新的旅行商問題——“飛行跟班旅行商問題”（flying sidekick traveling salesman problem,FSTSP）,并提出將UAV裝到卡車上方的設想,這種UAV 既能執行卡車上的一個交付任務,又能完成另外一個交付任務[20].

未來UAV 群任務分配過程中會有很多職能,其中涉及到很多方面的交叉知識,如具有察打職能、察配職能、察管職能甚至察配管職能的UAV 群.因此,對多目標任務規劃進行仿真是非常有必要的.由于異構UAV 群問題較難建模與解決,現有關于異構UAV 群研究的文獻還停留在察打功能UAV 群方面.

1.2 UAV 航跡規劃問題

UAV 的航跡規劃主要包括路徑規劃與軌跡優化.路徑規劃是對UAV 由初始位置到目標位置的計劃,而軌跡優化是對UAV 的初始位姿到目標位姿的計劃,它和時間相關.在飛行過程中,由于多架UAV 之間具有一定距離,且各UAV 運行環境不同,會產生相互干擾,從而導致無法實現最優解或達不到預期效果.而這些都將影響到最終的航線設計.因此,多UAV 航跡規劃通常屬軌跡優化問題,單UAV 航跡規劃則屬路徑規劃問題,其原因是多UAV 需考慮含有時間的四維空間,來適應多UAV 航跡點有可能重合的情況.本文航跡規劃沒有準確地區分路徑規劃與軌跡優化問題,并且對于航跡規劃研究方法主要分為兩大類型進行了總結: 一種是離線一次性航跡規劃,另一種是線上實時滾動規劃.

1.2.1 離線一次性航跡規劃

航跡規劃算法可以分為動態規劃法、導數相關法、最優控制理論、啟發式算法以及群智能算法等.在動態規劃法方面,重點介紹了A*,D*的算法[21-22].其中,A*是經典的靜態規劃算法,D*則發展出一種基于智能體之間信息交流與交互的多Agent動態規劃技術.該方法已成功應用于軍事領域.就導數相關法而言,主要包括最速下降法、牛頓法和共軛梯度法.諶海云為了解決人工勢場法容易陷入局部極小點且目標無法到達這一難題,提出一種“沿著目標方向作90°度運動”,以擺脫局部極小點的影響,并最終利用回歸搜索法對航跡作進一步全局優化[23].最優控制理論包括數學規劃法和圖論法.張博淵等利用可自適應選點自適應偽譜法,把UAV 編隊航跡優化控制問題化為一個非線性規劃問題來解決[24].以上這3 種算法都是傳統算法的一部分,隨規模的擴大、維數的增加易造成求解效率不高.

針對這種情況,本文提出一種現代智能算法,包括啟發式算法與群智能算法兩種.針對多目標優化問題,介紹了兩種不同類型的群體智能方法: 遺傳算法和禁忌搜索算法.遺傳算法是一種全局尋優技術,但其存在搜索效率低、易早熟收斂等缺點.在啟發式算法方面有進化算法、快速擴展隨機樹法.ZHANG和DUAN 等利用改進約束差分進化算法,對三維環境下UAV 最優路徑問題進行求解[25].武曉晶等根據半角樹枝裁剪策略,設計動態步長對隨機數進行雙向快速展開,同時結合貪心算法以避免陷入局部極小,最后利用B 樣條曲線對其進行光滑處理[26].但是這些方法都存在著計算量大、耗時長等缺點;而遺傳算法雖然具有收斂速度快、魯棒性強的優點,但它容易早熟且易于產生局部性停滯現象,從而不能滿足實時性要求.并且群智能算法在蟻群算法、粒子群算法、人工蜂群算法等方面已經有很多研究[27-29],本文對近幾年出現的幾種新穎群智能算法進行了總結.WANG等針對三維作戰環境中UAV 路徑規劃問題,提出改進蝙蝠算法[30].PANDEY 等利用改進螢火蟲群優化算法求解三維底層環境中UAV 路徑規劃[31].錢洲元提出了聯合修正自適應烏賊航跡規劃算法[32],該算法分別給出了2 種基于混沌擾動和變異學習的強化搜索,在算法迭代進程的基礎上,通過加權組合為一種聯合強化搜索方式,以達到高效深度搜索的目的,最后通過引入自適應權重來達到約減搜索空間的目的.XU等在各種對抗環境中構建障礙物模型,航跡規劃采用改進灰狼算法來實現,其改進途徑主要有種群初始化、衰減因子更新以及個體位置更新[33].湯安迪等提出了一種基于混沌麻雀搜索的UAV 航跡規劃方法: 先利用立方映射初始化群體,同時利用反向學習策略導入精英粒子,以加強群體多樣性和擴展搜索區域范圍,再引入正弦余弦算法,以利用線性遞減策略來平衡算法發展和探索的能力,在算法停滯狀態下利用高斯游走策略輔助其跳出局部最優狀態[34].

離線一次性算法雖然可能獲得航跡最優規劃問題,但是不能處理突現及動態障礙物問題,將導致UAV 碰撞毀傷,針對這一問題,很多學者著手對實時動態航跡規劃問題進行了研究.

1.2.2 線上實時滾動航跡規劃

線上實時動態航跡規劃多是以滾動時域控制為主流.RICHARDS 和BELLINGHAM 首先提出了滾動時域控制航跡規劃,它并沒有要求每次都要計劃到目標,而要劃分為幾個階段來計劃[35-36].王文彬等在文中提出基于滾動時域控制與快速粒子群優化相結合的方法[37].在此方法中,介紹了以VORONOI 圖為基礎,描述航跡端點到目標點之間距離估算的代價圖計算方法.基于滾動時域與人工勢場法相結合的思路,把路徑規劃轉化為一個優化問題,并采用最小距離與避障指標作為代價函數進行求解.但在實際應用中,這種代價圖是不可用的.ZHOU 等提出一種新型仿植物生長算法,相較于其他生物啟發算法,該算法利用趨光性及負向地性特征引導優化方向而非目標函數[38].這使得每個步驟僅需對下一路徑點進行取值優化,并不要求在所有路徑點上都設置目標函數.在此基礎上建立數學模型并設計相應的求解方法.為了驗證模型的有效性,將本文所給出的兩種啟發式算法應用于一個真實飛行任務當中.最后通過與A*、RRT、蟻群算法的算例對比表明: 植物生長算法路徑規劃能力強,參數配置合理,且算法運行效率較高,過程平穩.YAO 等在多UAV 三維協同路徑規劃過程中為解決目標跟蹤與避障難題,采用李亞普諾夫引導向量場對目標進行跟蹤,進而提出基于修正干擾流體動力系統以消除局部極小問題的避障新方法[39].在IIFDS 的框架內加入虛擬障礙策略與附加吸引流體策略,再巧妙融合兩種策略,在實現目標跟蹤與避障需求的前提下,對反應參數進行滾動水平優化.在多UAV 軌跡規劃中,XIA 等以時間分割取代傳統路點分割,構建了一種基于均勻時間區間的軌跡優化模型[40].同時引入虛擬航段來適應不同UAV 航跡長度并縮短總到達時間.為了解決傳統遺傳算法易早熟收斂及全局搜索能力差的問題,在進化初期采用交叉操作提高種群多樣性;后期使用變異算子增強個體間信息交流能力;同時考慮初始可行解集對求解結果的影響.在代價函數上引入非線性約束,并提出基于梯度的順序最小優化算法,使代價函數最小化,在每一次迭代過程中解耦出相互矛盾的約束,從而節約規劃時間.

將離線規劃方法與在線規劃方法相結合,在離線規劃之后,又通過在線規劃方法對其加以完善或者優化.這些研究為智能交通領域提供了一定的理論參考與實踐指導.熊佳新給出了一種基于全局與局部雙滾動窗口融合的航跡計劃方案[41].全局航跡規劃時采用概率路標圖法結合Dijkstra 算法對航跡粗略解進行規劃,然后對局部航跡采用變長變易率快速隨機搜索樹法進行校正.最后利用基于狀態預測的分布式協調算法,實現預定航跡的避碰航跡的優化.任敏等還采用概率路標圖法與Dijkstra 算法相結合的方法對全局航跡進行規劃,得到航跡的粗略解,然后采用免疫-離散粒子群混合算法對局部航跡進行校正[42].丁強等對于連續型航跡的規劃問題,首先采用粒子群算法對每架UAV 初始耦合系數進行搜索,構成全局航跡預規劃問題.然后在Tau-H 運動策略的基礎上引入與初速度有關的項目對其加以改進,采用滾動優化的方法來解決局部航跡重新規劃問題[43].

線上實時滾動式航跡規劃能夠有效地避開突現障礙物、動態障礙物等,但是由于對一些可視化技術及智能體技術的要求較高,因此,在實際上用于實時滾動式規劃航跡時存在著一些難題.

1.3 UAV 任務規劃研究

在航跡規劃中沒有考慮任務分配問題,通常沒有考慮UAV 的飛行特點,只是用UAV 路徑來近似代替UAV 航跡進行航跡規劃,給任務執行造成了一定程度的偏差.航跡規劃和任務分配并不是一個單純連續的過程,而是存在著十分密切的相互影響.因此,在任務分配之前必須首先明確兩者之間關系.本文以UAV 為對象,建立了一個多目標決策模型,并設計了一種啟發式算法來解決這一問題.最后通過仿真實驗驗證該方法的有效性.當前UAV 任務規劃主要有3 個研究內容,即首先對任務進行分配,然后對航跡進行規劃,其次對任務進行預先分配,最后根據任務或者航跡的變化情況,對航跡規劃以及任務重規劃進行研究,如果沒有對任務進行預先安排,則通過對實時任務進行規劃,來對實時任務進行優化分配,這時兩個問題會互相耦合在一起[44].

在第1 個研究方面中,陳俠等綜合考慮多UAV航跡規劃與任務分配指標,采用敵我博弈策略解決任務分配問題,然后利用Voronoi 圖法與快速展開隨機樹解決攻擊運動目標航跡問題[45].但該方法存在收斂速度慢、不穩定及效率低的缺陷,因此,提出一種基于區塊鏈的多UAV 協同空戰中航跡規劃系統架構,并進行仿真驗證.結果證明: 這種框架可以提高任務成功率.郭興海等首先采用區塊鏈式拍賣算法,對多智能體互聯計算進行任務指派,然后采用混沌遞減權重和動態權重量子粒子群算法進行航跡規劃[46].

在第2 個研究方面中,BISWAS 等提出的粒子群算法,以同時重新規劃矢量化為基礎來解決航跡規劃問題,并采用最近鄰域搜索策略,來解決任務分配模型問題,從而實現了不同UAV 對多個目標點的到達[47],當某個UAV 在飛行過程中發生故障時,另一個UAV 能夠分擔故障UAV 未到達目標點的任務.最后,對有靜態與動態障礙時,多任務條件下UAV 任務規劃問題進行模擬.它研究航跡在飛行過程中發生變化而引起任務改變的問題.LI 等研究了三維環境下多UAV 經過所需完成時間下特定任務點的路徑規劃問題,并在線轉換任務對最優飛行路徑優化問題進行了求解[48].在任務發生變化的情況下,設計任務分配算法為最適合的任務序列分配新的任務點,進而對最優飛行路徑進行再規劃,以確保每一架UAV都能及時飛過剩余任務點和新的任務點.針對路徑規劃問題,提出一種用于路徑規劃的改進果蠅優化算法,采用參考點與距離代價矩陣相結合的方法,達到快速平穩求解的目的.它研究任務改變引起航跡改變問題.

在第3 個研究方面中,孫小雷對多UAV 之間交會協同攻擊任務展開研究,將多階段航跡預測算法應用于實時航跡規劃MSPP,該算法是一種能夠為任務分配和調整過程提供必要的輸入來估算目標航程[49].介紹了課題的背景意義以及國內外發展現狀;給出了系統設計需求分析;再次根據實際應用對軟件系統框架及功能結構進行詳細設計;然后描述了軟件程序流程圖.MSPP 架構下包括基于A*算法路徑規劃、三次B 樣條曲線航跡平滑、Dubins 曲線航跡交會等.任務分配時綜合考慮以粒子群算法為核心的集中式和以聚類算法為核心的分布式兩種模式,由此構成一個完備的任務規劃體系結構.朱黔等在4個UAV 節點重要度評估指標的基礎上[50],使用一種改進的近似理想解排序法,來完成對UAV 節點的重要度評估,并在區域搜索時通過UAV 角色的動態切換,使協同搜索收益和網絡連通性達到均衡,最終使用分布式滾動時域優化來完成每架UAV 的線上移動計劃,從而達到多UAV 協同區域搜索的目的.

2 UAV 群編隊飛行

UAV 群編隊飛行是多架UAV 自主功能,UAV為了滿足任務需求,在特定結構下形成一定隊形排列組織方式,它包括編隊感知、編隊通信和編隊決策控制等有關理論研究.

2.1 UAV 群編隊的感知與通信

態勢感知（situation awareness,SA）的研究通常集中在理論模型、評估、一致性方面.從理論模型上看,有人研究了以Endsley 三級模型為基礎的個體態勢感知[51];有人研究了以群體為基礎的群體態勢感知[52];也有人研究了以分布式態勢感知為基礎的模型（distributed situation awareness,DSA）[53].黃匆等從信息層面以及系統獲取信息能力的角度出發,研究態勢感知模型的一致性[54].為了解決態勢感知中存在的不確定性問題,本文提出一種基于證據推理規則對態勢感知中的一致性進行評價,在置信結構中對每一類指標信息進行統一處理,利用擾動分析法對戰場環境進行仿真研究[55].但是這些模型都沒有涉及到群體態勢感知的相關內容.實際上,群體行為會導致局部認知不一致,從而影響整體態勢判斷.分布式集群態勢感知為集群控制與決策提供了依據,集群態勢協同感知的實現需要協同目標探測,目標識別與融合估計以及協同態勢了解與分享等技術[56].但這些模型都沒有考慮到網絡環境下各節點間可能存在不同程度的狀態不一致.因此,對態勢感知中狀態不一致性進行建模是十分必要的.SORENSEN 對分布式態勢感知評估（測量）進行研究[57].KALLONIATIS 等在文獻[58]中試圖把Endsley 的三級模型與DSA 模型聯合起來應用,從而為DSA 模型的構建提供一種思路.在此背景下,高楊等在文獻[59]中構建了一個同構與異構的DSA,并對兩個模型進行一致性分析及評價方法研究.經過對UAV 群分布式感知數據進行融合,要想較好地實現UAV 群內部協同決策與控制,還要涉及到群內部通信技術問題.

在對UAV 編隊通信進行研究時,UAV 間通信屬于端到端的技術（device to device,D2D）,主要是考慮UAV 間飛行自組網以及中繼通信.飛行自組網已開展了大量相關的研究工作,主要涉及空中機器人、無人駕駛航空自組網、UAV 自組網（UAANET）、UAV 網絡（networks of UAVs）和分布式航空傳感器網絡等[60].但是這些算法都存在著一定不足: 第一是不能保證傳輸的可靠性;第二是無法避免節點間由于碰撞而導致數據丟失或時延過大的現象發生.為了解決上述問題,本文提出一種新方法.在最優鏈路狀態路由協議的基礎上,ALSHBATAT 等引入定向天線提出DOLSR,利用飛行信息（狀態變量、傾斜度和偏航程度）選擇路由以降低端到端的延遲[61].ROSATI 等在充分考慮UAV 間相對飛行速度的基礎上,通過GPS 信息為飛行自組網提出了一種基于預報的OLSR 協議（P-OLSR 協議）[62].P-OLSR 協議有效地減少丟包率和增加吞吐量.在此背景下,付有斌等著重對飛行自組網中多種通信協議進行研究[63].CHEN 等采用等級法對UAV 飛行自組網進行定性評價[64].WANG 等采用公式法,對UAV 飛行自組網進行粗粒度定量評估[65].然而對于UAV 編隊通信系統而言,這些已有的研究成果還不能滿足實際應用需要.本文對現有的有關UAV 編隊通信研究進行分析與總結,并指出存在的不足與未來發展方向.趙海濤等在多次迭代基礎上提出的UAV 飛行自組網的評價方法,對UAV 的學習與進化能力做了進一步定量描述[66].對于通信中繼問題,吳鐘博等提出了一種綜合考慮UAV 成員鄰近域和編隊成員之間社會性依存關系的最優中繼選擇策略[67].也有把匹配博弈理論這一數學工具應用于UAV通信中繼網絡中[68],來求解分布式的無線資源的優化問題.這些研究成果都是針對單個節點進行分析的,忽略了鏈路狀態對數據傳輸過程的影響;而對于系統整體性能而言,只有當整個系統達到一定程度時才能獲得最優解.曾弘揚等將UAV 集群網絡能量效率作為優化對象,在匹配博弈基礎上給出分布式多跳中繼路徑選擇算法[69].IBRAHIM 等在文獻[70]中提出了一種以UAV 網絡合作通信為驅動力的可生存通信博弈方法,該博弈方法綜合考慮延遲、可實現率以及能源消耗指標.可以尋找最大化數據速率,最小化延遲,能量消耗等最優路徑.每架UAV 嘗試在納什網絡上組成游戲,以單跳式或者多跳式構建到達發射架路徑.純策略納什均衡算法下,每一架UAV 均能通過查看下一跳間所有可利用環節,來制定最優決策以最大化自身效用.針對上述混合網絡結構,提出了一種基于多目標優化算法的UAV 編隊通信方案,并通過仿真對該方案進行了分析.結果表明,采用這種方法可以有效地降低系統復雜度.混合策略下,每架UAV 都會依據一個概率值來選擇其策略,這樣就可以避免構建出的圖形中產生任意環路.

為均衡感知范圍融合與通信時延之間的關系,必須為UAV 集群編隊隊形制定適當的UAV 群間通信網絡，來滿足感知范圍分享最大化與通信時延最小化的要求.提出一種基于多智能體系統理論的分布式協同組網算法（MAC）,并對其進行了仿真驗證.結果表明該方法能有效地解決上述問題.最后分析了不同拓撲結構下網絡性能的差異.例如,大規模UAV集群可設計分簇網絡或者分層網絡來降低通信時延.

2.2 UAV 群的編隊控制問題

編隊決策控制問題在編隊感知、通信基礎上進行了進一步研究,一般都涉及到編隊感知、通信等問題.由于UAV 具有機動性強、續航時間長、隱蔽性好、作戰效能高等優點,在軍事領域得到了廣泛的應用,尤其在偵察方面發揮著越來越重要的作用.當前UAV 編隊隊形已經有多種風格,例如:“V 型”[71],“十字架形”“超天平形”“人字形”“鏢形”“三角形”等[72].

編隊控制解決了編隊穩定、路徑規劃和多圖軌跡優化等3 個難題[73].主要包括編隊集結、維持、轉換、避障4 部分.顧偉從航跡規劃角度出發,以編隊集結、維持與轉換為目標,構建最優效率模型[74].當前編隊決策控制主要分為集中式與分布式兩種類型,集中式可概括為領航-跟隨法與虛擬結構法兩種模式,分布式可概括為行為控制法與人工勢場法兩種模式,并結合一致性理論進行研究.分布式可分為3 種情況: 1）完全分散式;2）半集中型;3）混合式.其中,前兩類比較成熟且應用廣泛.后一類則在理論上還有待完善.由于每種方法各有利弊,一些研究著手對以上5 種方法進行整合,以期得到較優的求解方式,其中,集中式與分布式混合算法尤為突出.主要從這兩種解決方法出發對當今編隊控制研究進行概述.

2.2.1 領航跟隨法

領航-跟隨法也可以稱為長機-僚機法.該控制策略以預設編隊結構為基礎,以長機航向速度、航向角及高度跟蹤為手段進行僚機調整,以實現編隊隊形維持.與傳統控制方法相比,該方法具有響應速度快、穩定性好等優點;在系統出現故障時還能繼續工作而不需要更換舵面,因此,有很高的實用價值.另外它沒有考慮外界干擾問題.但它的魯棒性差,跟蹤誤差逐級后移和放大.

領航跟隨法可以分為4 種類型,第1 種方法是一個領航者引領多個跟隨者,這種方法也稱為長機模式,所有僚機都以編隊長機作為參考;第2 種方法是一個領航者引領一個跟隨者,這種方法也稱為前者模式,每架UAV 都以其前面的UAV 作為參考;第3 種方法是多個領航者引領多個跟隨者,是第1 種方法的拓展;第4 種方法是不僅存在領航者和跟隨者,還存在其他角色的UAV.PARK 等對一組沿圓形路徑飛行的UAV 進行分析,將等距編隊問題考慮到領導追隨方法框架下[75],但是他們設計的控制律無法被證明具有穩定性.本文主要討論前三種領航方式下的飛行控制系統設計與仿真.首先分析了領航過程中多機之間相對位置關系的變化情況,以及影響它們調整角度大小的因素,為后續建模打下基礎.袁文以長-僚模式為基礎,對多UAV 合作編隊控制問題進行研究[76],采用引導點航跡引導的方法設計編隊隊形維持問題,以人工勢場法為基礎給出多步狀態預測沖突避免算法.嵇亮亮討論長機模式與前一種模式協同編隊控制技術,以實現UAV 群編隊維持[77].XIE 等在文獻[78]中對多領航者、切換拓撲群系統自適應隊形跟蹤進行研究,并為實現隊形跟蹤引入分級灰太狼追蹤策略.展開領航跟隨法能夠分為4 種類型,第1 類方法是一個領航者帶領多個跟控器,這種方式也稱之為長機模式,每只UAV 均以編隊長機為參考.然后利用鄰近相對狀態信息,設計一種帶交換拓撲自適應編隊跟蹤協議,來證明群系統達到編隊跟蹤的充分必要條件.ZHAO 給出一個基于異構角色分布式協調控制方案[79].基于分布式模型預測控制設計分布式協調控制方案框架.探討領導者、協調者以及追隨者等異質角色對UAV 群協調控制性能的影響,并提出一種基于角色成本函數的UAV 群協調控制方法.針對不同作用的UAV 給出一套協調策略,來達到群體沖突化解的目的.

2.2.2 虛擬結構法

虛擬結構法是為UAV 編隊建立虛擬的長機或者虛擬的幾何中心,編隊內的UAV 均參考虛擬長機或者虛擬幾何中心進行移動,LEWIS 等于1997 年最先提出.但綜合虛擬長機并得到鄰機位置要求通信質量高、計算能力強,導致編隊可靠性差[80],因此,有必要加以改進.CHANG 在文獻[81]中把虛擬結構法分解為剛性虛擬結構法與彈性虛擬結構法兩大類,剛性結構法產生直線向量,彈性結構法產生曲線.秦澍祺等針對實際場景下并非所有UAV 均可接收虛擬領航者的信息問題[82],依據通信拓撲網絡設計了一種基于分布式虛擬結構的方法,并在此基礎上依據一致性編隊控制律使整個集群編隊趨于平穩.張佳龍等在反步推演法的基礎上,設計虛擬協同導引控制律來求解多UAV 的快速隊形重構問題,并迅速到達穩定狀態[83].而通過與模型預測控制方法、拉普拉斯方法（Laplace）的比較,得出動態響應迅速且穩態誤差較低的結論.CAI 等在虛擬目標點指導下,提出一種分布式模型預測控制方法[84],并為減輕UAV 編隊計算負擔考慮狀態預測誤差與代價函數收斂性事件觸發機制.符小衛等針對切換拓撲網絡中UAV集群系統避障控制問題開展了研究,提出了基于聯盟的UAV 集群避障控制算法,并采用一種新的柔性協同策略,來構建分布式虛擬環境下基于合作博弈的無人智能體系統.

虛擬結構法可劃分為兩種編隊控制方式: 一是每個UAV 跟隨一個特定的虛擬引導點,可以得到UAV 群所設計編隊.這種方式下的約束條件是UAV群必須是對稱的,并且能夠通信的UAV 之間的距離是固定且相等的;二是所有UAV 只跟隨一個特定的虛擬引導點,此時不能直接定義編隊結構,但會根據初始條件和設計的函數產生一個平衡的編隊.這種方式下要求任務UAV 之間不存在沖突,并且每個UAV至少有一個互相通信的UAV.

3 多UAV 群研究的未來展望

多UAV 群的任務規劃是編隊飛行的基礎,為不同UAV 群提供預先飛行規劃.多UAV 群的編隊飛行是對任務規劃的重規劃,更有利于應對飛行途中的實際情況.兩者相輔相成,共同實現多UAV 群重規劃和再規劃的不斷迭代.按復雜度區分為考慮編隊飛行的多UAV 群航跡規劃和任務規劃,并對兩者所涉及到的關鍵技術進行展望,如圖1 所示.

圖1 多UAV 群任務規劃和編隊飛行的關系Fig.1 The relationship between multiple UAV swarm mission planning and formation flying

3.1 考慮編隊飛行的多UAV 群航跡規劃

LI 和FANG 等提出了一種以虛擬點為單位進行編隊決策并對鴿子行為進行改進的道路規劃方法,該方法通過構建直線形、V 字形以及圓形3 種編隊,來確保UAV 群在有增加或減少時能夠安全跨越5 種障礙（單個、多個、陷阱、持續、動態）[86].許洋等提出了一種基于自適應分布式模型預測控制的快速粒子群優化[87],采用虛擬結構法與領航跟隨法結合的策略,提出了虛擬編隊引導點,對多UAV 進行自適應編隊控制.最后根據模型預測控制的思想,結合分布式控制方法,將協同航跡規劃轉化為滾動在線優化問題.張洪海等提出了一個基于路徑-速度解耦的UAV 編隊協同軌跡規劃方法[88].在路徑規劃階段設計了預瞄距離自適應,在速度規劃階段設計了基于災變策略下的遺傳算法（避免UAV 沖突）.最后通過柵格法和Dubins 曲線,仿真了二維平面下UAV 跟隨指定的隊形.

考慮針對編隊飛行的航跡規劃研究存在不少,但大部分只是討論多UAV 組成一個編隊進行航跡規劃的問題,未來面對多UAV 群運用的要求,需要作出相應的改變.本文從3 個方面闡述研究多UAV 群航跡規劃需要注意和改進的地方.

3.1.1 UAV 群通信、感知功能

為了實現UAV 群的全自主決策,UAV 群的通信功能必不可少.UAV 群的通信功能在于群內信息交流和群間信息交流,相同UAV 的通信范圍應該是以rc為半徑的球體,在UAV 群內可以采用拉普拉斯矩陣l=[lij]表示UAV 間的通信關系,當UAVi與UAVj存在通信鏈路時,lij=-1;不存在通信鏈路時lij=0 ;則當i=j 時,.為了讓群內所有UAV 可以間接通信,UAV群內的通信要求是通信鏈路中必然包含一個完整節點的可行樹.而群間UAV 的信息交流,需要滿足存在一對所屬不同編隊的UAVi,j建立通信關系,即.但UAV 群在途中僅僅考慮基礎通信是不完備的,由于通信存在延遲、噪音、競爭等問題,必然也帶來更復雜的建模和新的研究內容,比如最大容許時延、競爭信息發布等問題.由于通信功能可能受環境影響導致中斷,所以UAV 群應具備感知功能.

UAV 群的感知功能在于輔助群內決策和感知外部障礙,相同UAV 的感知范圍應該是以rv為半徑的球體.群內UAV 的互相感知,是為了通過觀察UAV 之間的距離來判斷UAV 是否到達指定位置.基于群內通信,群外的感知是每個UAV 感知范圍的疊加,則每個UAV 共享群感知范圍,只要任一UAVi,j發現障礙物,即.但UAV群在途中僅僅考慮基礎通信是不完備,所有UAV 即可獲得該障礙物位置信息.未來UAV 感知范圍可以結合視覺、慣性、動力等相關測量技術.

3.1.2 UAV 群編隊隊形和變換避障

為避免UAV 群中機與機之間發生沖突,需要設置安全距離jl,由于UAV 編隊不一定是在同一個平面,所以每個UAV 之間的空間距離必須大于等于jl,如式（1）.則每個UAV 群必然有一個機群大小,本文以安全距離作為UAV 編隊的依據,主要探討常見的3 種編隊隊形: 一字形、“人”字型和正多邊形.一字形是所有UAV 在水平方向或豎直方向上呈一條直線,相鄰UAV 之間的距離為安全距離.“人”字型是所有UAV 構造成兩條均勻分布的交線,并且交點處有一個UAV,每條交線上相鄰UAV 之間的距離為安全距離,此時只有保證兩交線夾角大于等于60°,才能保證所有UAV 之間距離大于等于安全距離.當UAV 數量為奇數時,“人”字型編隊的UAV 群是對稱的;當UAV 數量為偶數時,“人”字型編隊的UAV 群必然有一條交線中多一個UAV.正多邊形則是UAV構造成正多邊形的邊,并且每個頂點上有一個UAV,每條邊上相鄰UAV 之間的距離為安全距離,由于正多邊形的每個內角都大于等于60°,所以每個UAV之間的距離一定大于等于安全距離.使用正多邊形編隊時,要根據UAV 數量能整除的最小整數,來確定具體的正多邊形,所以只存在為質數的正多邊形.

UAV 群在避障時有兩種選擇: 保持編隊隊形和不保持編隊隊形.在保持編隊隊形情況下避障時,始終保持每個UAV 的速度、航向角和俯仰角一致,位置狀態必須保持相對穩定.而在不保持編隊隊形避障時,按約束情況由高到低可以分為3 種情況: 一是由某種編隊隊形變換為另一種編隊隊形,例如由正多邊形編隊變換為一字形編隊;二是由某種編隊隊形變換為通信約束范圍內的不規則隊形,即在滿足所有UAV 組成的通信鏈路中是一個完整的可行樹前提下,每個UAV 在動力學約束下可以前往任意空間位置;三是部分UAV 可以脫離編隊通信約束,獨自進行避障過程,在避障完成后再通過GPS 等定位信息與UAV 群匯合.

3.1.3 UAV 群之間的沖突

基于時間的四維空間下,兩個UAV 群若在某時段[t0,t1]內航跡的最近點tr 小于群間安全距離Rsafe（水平和豎直兩方面）,則代表這兩個UAV 群之間存在飛行沖突,沖突表達式如式（2）,其中,g=1 代表產生沖突.

一般來說,將高等級UAV 群作為低等級UAV群的虛擬障礙物,虛擬障礙物的構建如下所示: 每個UAV 會產生一個以Rsafe為半徑的虛球障礙[89],則在滿足所有UAV 虛球障礙的條件下,擴充將其形成封閉立體空間,形成UAV 群虛擬障礙物.不同編隊隊形的虛擬障礙物形式不同,在保持不影響沖突的前提下,通過將其外形進行平滑處理,可以極大提升求解效率: 在同一線段上的UAV 使用線段長度為長,虛球半徑為寬和高的圓柱體替代多個UAV 虛球,則整個UAV 編隊的虛擬障礙物可以由邊為圓柱體,頂點處為球缺圍成.一字形編隊由一個圓柱體和兩個半圓體拼接而成,“人”字型編隊由兩個圓柱體、一個四分之一圓體和兩個半圓體拼接而成,正n 邊形編隊由n 個圓柱體和n 個四分之一圓體拼接而成.

最近點距離dmin判別方式: 首先計算編隊間每個頂點之間距離,找到最近距離d1的兩個點,.然后找到距離a1第2 近的點,找到距離b1第2 近的點,由a1和a2組成線段A12,由b1和b2組成線段B12.

則p 點到b1的距離dpb1為

對式（4）求最小值:

得到點b1到線段A12的最短距離d2=mindpb1.同理可得到點a1到線段B12的最短距離d3=mindqa1（q為線段B12上的任意一點）.最終可以判斷兩個編隊間的最近距離.

3.2 考慮編隊飛行的多UAV 群任務規劃

尚沒有完全深入研究編隊飛行對多UAV 群任務規劃的影響.關啟學等基于向量場法提出了一種基于多任務執行的UAV 編隊路徑重構方法[90],但沒有具體分析編隊約束和編隊控制,而僅僅是簡單分析了路徑的重構方法.SHIN 等討論了UAV 群中的任務分配、通信網絡和編隊控制[91],提出了一個分布式決策的范式,但仍沒有具體探討多UAV 群任務規劃產生的新問題.UAV 群作為一個整體,雖然可以簡化UAV 與需求多對一映射關系為一對一關系,更好地實現任務規劃,但也會帶來許多新的研究問題.下面將從3 個方面對考慮編隊飛行的多UAV 群任務規劃與多UAV 任務規劃相對比,提出未來可以著手的新研究.

3.2.1 任務規劃目標的新內容

從任務目標方面去觀察,將會產生編隊變化效率、編隊生存力等新研究內容.在編隊變化效率目標中可以分成兩類進行研究: 一是最小能耗變化;二是最短時間變換.一般在考慮成本的任務規劃目標中,將會加入最小能耗變換的新目標,而在考慮最快到達目標點的任務規劃目標中,將會加入最短時間變換的新目標.編隊生存力是指UAV 群在部分UAV失效后仍能具有一定完成任務的能力,這就是UAV群自身帶有的抗毀性,其值在任務規劃目標中越大越好.比如在某些威脅因素區域,首先要判斷是否進入威脅區域,當選擇進入威脅區域時,要決定采用何種編隊隊形和航跡規劃通過威脅區域,以保證較大的編隊生存力.

而在多UAV 群中,由于不同UAV 群可能存在航跡的競爭,還可能存在不同等級,所以未來多UAV群的任務規劃復雜度將比多UAV 和單UAV 群更大.

3.2.2 任務規劃內容的新問題

當確定了任務目標的新內容后,就要具體研究考慮多UAV 群的任務規劃內容的新問題,可以從編隊出發前的初始預規劃和途中重規劃兩方面探討.在初始預規劃階段,不僅需要通過需求數量判斷機群中UAV 的數量,還要通過任務目的設計最有效的基礎編隊隊形.要考慮多方面因素如任務重要度等劃分UAV 群等級,還要針對不同編隊隊形設計不同的通信拓撲結構.

由于UAV 群體系龐大,更容易遇到突發情況,所以必須采用途中在線重規劃階段,以滿足UAV 群自組織、自學習、抗毀性等特性.比如,當UAV 群在飛行途中部分UAV 摧毀,首先反饋到任務分配中判斷是否有必要繼續執行任務,因為當UAV 數量少于一定閾值時,將不能保證完成任務.然后進行航跡重規劃,最后調整編隊飛行.而在某些沒有時間窗等硬性約束的任務情況下,UAV 群的途中重規劃可以不反饋到任務分配中,而只進行航跡和編隊重規劃.相比預規劃階段的新問題,途中重規劃的新問題才是考慮編隊飛行的重點和難點,如圖2 所示.一是實時調整UAV 編隊隊形,UAV 群在飛行途中可能存在多種不同的編隊隊形,以適應任務目標;二是根據編隊調整的狀態,實時調整通信拓撲結構;三是存在UAV群的解散和集合,當某UAV 群因任務失敗而解散前往協助其他UAV 群執行任務時,就需要考慮具體時間點和空間點與其他UAV 群集合.

圖2 多UAV 群任務規劃內容的新問題Fig.2 New problems of multiple UAV swarm mission planning content

3.2.3 任務規劃算法的新改變

針對初始預規劃和途中重規劃的不同階段,需要設計相對應的集中式和分布式算法.集中式算法和分布式算法都可以運用于初始預規劃和途中重規劃中,但由于初始預規劃和途中任務重分配考慮的內容多而且有通信延遲等限制,所以集中式算法主要運用于初始預規劃和途中任務重分配.而在途中航跡、編隊重規劃中更看重效率和自主性,所以分布式算法主要運用于途中航跡和編隊重規劃.集中式算法和分布式算法已經較為成熟,這里進一步強調近年來興起的分層分布式算法,該算法與UAV 群的途中重規劃有很好的貼合度,不僅能得到較好的UAV 群體決策結果,還能更快速、高效地求解結果.ZHANG 等在研究多UAV 路徑規劃問題上,考慮了一個包含4 個等級的社會鴿群算法[92].分層分布式算法可以引入群體決策中的一些優化思想,作為一個新的群體算法.Máté 在研究鴿群等級中發現分層的飛行領導模式并不是建立在分層的社會優勢結構之上[93].基于這個思想啟發,UAV 群中的UAV 等級應該隨著時間而不斷變化,這個等級變化要從歷史決策、當前狀態等相關屬性中產生.未來將分層分布式算法結合群體決策的優化思想運用到考慮編隊飛行的多UAV群途中任務重規劃中,將有助于利用群體決策的涌現性,實現既高效又簡單的仿生算法,如圖3 所示.

圖3 多UAV 群運用的新算法流程圖Fig.3 New algorithm flowchart of the multiple UAV swarm application

4 結論

在UAV 群任務規劃的研究現狀中,一是發現UAV 任務分配已涉及多方面研究領域;二是發現UAV 航跡規劃可以區分為離線和在線兩個方面的研究;三是在UAV 群任務規劃中發現存在3 種研究方式.在UAV 群編隊飛行的研究現狀中,從編隊感知通信和編隊控制兩部分綜述,編隊感知通信是編隊控制的基礎,并且在編隊控制中發現可以分為5 種控制方法.最后討論了多UAV 集群融合任務規劃和編隊飛行的新研究方向和相關問題,在考慮編隊飛行的多UAV 群航跡規劃中,主要提出了一種解決UAV 群之間的沖突解決方式;在考慮編隊飛行的多UAV 群任務規劃中,提出了目標的新內容、內容的新問題和算法的新改變.