?

不確定風場下平流層浮空器全局路徑規劃

2023-06-10 03:20翟嘉琪楊希祥鄧小龍龍遠張經倫柏方超
北京航空航天大學學報 2023年5期
關鍵詞:浮空器風場速度

翟嘉琪,楊希祥,鄧小龍,龍遠,張經倫,柏方超

(國防科技大學 空天科學學院,長沙 410073)

平流層浮空器是指依靠輕于空氣的氣體提供升力,工作于平流層并可實現持久駐空的浮空類飛行器[1-2],具有成本低、載重能力強、可長期駐空等優點。作為在臨近空間開展應用的主要平臺,平流層浮空器通過攜帶任務載荷,具備長時間、全方位、全天時和實時信息獲取能力,可以為高分辨率對地觀測、預警探測、通信中繼、防災減災、環境監測等提供技術途徑[3]。

目前平流層浮空器的研究主要關注長時駐空、區域駐留等方向[4-8]。例如,Loon 氣球已經完成了單球連續駐空335 天23 時的總飛行時間,并能提供網絡通信服務的飛行試驗[9],且Loon 團隊首次將強化學習應用于氣球的飛控系統,并在太平洋赤道附近進行了為期39 天,保持在定點距離50 km 以內區域駐留的驗證試驗[10];國內多個機構,如北京航空航天大學、中國科學院空天信息創新研究院、中國電子科技集團第三十八研究所等研究的平流層浮空器也基本具備長航時駐空和區域駐留的能力。針對未來戰場的快速變化及平流層浮空器的實際應用場景需求,如何實現從放飛點到目標區域的快速部署,即浮空器的路徑規劃,將是制約浮空器未來大規模應用的關鍵問題。

浮空器路徑規劃是指依靠風場環境和浮空器設計參數,在約束條件下(如能源、動力、時間及距離等),規劃從起始點到目標點的最優路徑,不同約束條件可以規劃出不同的飛行路徑。

目前的路徑規劃大多是針對無人機、水下航行器、機器人及無人駕駛車輛等對象[11-14],常見的路徑規劃方法主要分為2 類,即傳統路徑規劃和智能路徑規劃。其中,傳統路徑規劃中的路線圖構建方法簡單、易于實現,主要能用于二維路徑規劃中;單元分解法能完整描述環境信息,但是規劃速度與分解的單元個數息息相關;這2 種方法都需要通過搜索方法來尋找最優路徑,常見的有A*、D*方法;人工勢場法是一種虛擬算法,智能體在環境中受到來自目標點的吸引力勢場和來自障礙物的排斥力勢場組成的合勢場來決定其運動信息,該方法實時性好,計算簡單,但是容易出現局部鎖死、路徑振蕩等問題。針對傳統路徑規劃自適應性較差,提出智能路徑規劃方法,因其源于模擬人的經驗或生物的行為,具有自組織、自學習及一定的容錯能力,將其應用于路徑規劃中,可以提高系統的自主能力,使得系統更加靈活,自主性和適應性更強,主要包括遺傳算法、神經網絡、強化學習及深度強化學習等。

目前針對平流層浮空器的路徑規劃研究較少,多為無人機等研究對象,通過對比,大尺寸、低動態的平流層浮空器在飛行過程中更易受風場影響,因此,在浮空器的路徑規劃中可充分利用風場提供推力,同時引入一定的水平弱動力,在風場中可通過規劃動作序列,避免部分不利風場影響,快速部署至目標區域。

由于風場環境的不確定性和時空復雜性,基于隨機概率的方法是研究浮空器的路徑規劃問題的合理手段,為此,研究人員針對馬爾可夫決策過程(Markov decision process, MDP)方法進行了一定的研究。MDP 是一個描述系統與外部環境之間相互作用的模型,并嘗試選擇合理的動作使得累積報酬最大,不需要給定任何狀態下的監督信號,可以用來處理不確定情況下的規劃問題,在路徑規劃中應用廣泛。Wolf 等[15]提出一種基于MDP 的概率運動規劃方法,其研究對象是運行在土衛六的Montgolfieré氣球(熱氣球的一種),仿真結果指出該方法可實現Montgolfieré氣球在土衛六的全局路徑規劃。陳魁[16]基于MDP 模型設計了碼垛機器人的路徑規劃,采用最小二乘策略迭代方法設定基函數,求取最優狀態-動作值函數,并且基于激光測距儀設計了基于部分可觀MDP(partially observable Markov decision process,POMDP)的局部路徑規劃模型,使機器人具有避障能力。Yu 等[17]針對無人機在惡劣環境下的避碰問題,提出一種基于MDP 的方法,規劃出來的無人機路徑安全無碰,仿真結果表明,設計出來的路徑可有效避免障礙物的攻擊,但是該方法并沒有將環境的不確定性引入其中,環境信息提前確定,不能很好地滿足實際情況。Kularatne等[18]基于MDP 計算在不確定海洋環境下的水下航行器路徑規劃問題,約束條件是最低能耗和有效避障,仿真結果表明:MDP 方法更適用于起始點和目標點位置固定且不確定性已知的情況。Nanaz 等[19]通過對氣球的動力學模型進行簡化和解耦,將全局路徑規劃問題轉化為圖形搜索問題,使用Dijkstra方法計算給定目標點與土衛六上任意位置的最短時間路徑,但是該方法不適用于不確定情況下的路徑規劃。

本文以具有弱動力的平流層浮空器為研究對象,提出一種基于MDP 的全局路徑規劃方法。所提方法充分考慮了風場預測模型的誤差,并將誤差引起的風場不確定性引入MDP 模型中,建立浮空器的二維全局路徑規劃模型。

1 問題描述及基本假設

由于平流層浮空器在長期駐空過程中的運動多為二維平面運動,本文對基于MDP 的浮空器全局路徑規劃方法有以下4 個假設。

1)不考慮浮空器垂直方向的運動。

2)浮空器吊艙四周安裝4 個相互獨立的動力設備(電機和螺旋槳)為其提供水平驅動力,單個動力設備能提供的最大速度umax=5 m/s,浮空器最多允許2 個動力設備同時工作。

3)浮空器無動力時的速度與風速一致,即處于隨風飄飛的狀態。

4)不考慮浮空器的動力學特性,只考慮其運動學特性。

本文研究區域在我國某地區,浮空器在該區域內的位置用r?[x,y]表 示,其中x為 經度,y為緯度,風 速 用w(r,t)?[wx(r,t),wy(r,t)]表 示,其 中wx(r,t)和wy(r,t) 分 別表示在t時刻x軸 (東西方向)和y軸(南北方向)的風速大小。在給定區域內,以?x=0.3?,?y=0.3?為精度進行離散化,得到如圖1所示的21×21柵 格區域。針對柵格i,si表示浮空器的狀態信息,ri表示浮空器在狀態si下 的位置,w(ri,t)表示風場信息。

圖1 區域離散化示意圖Fig.1 Diagram of regional discretization

在風場的作用下,浮空器的速度v(si)=w(ri)+u(si),其中u(si)表 示浮空器在狀態si下自身所能提供的速度。針對柵格i,si表 示當前狀態,sj表示下一狀態,風場信息從狀態si到 達臨近狀態sj的過程中始終保持為w(ri),到達狀態sj時才更新為w(rj)。在目標點確定時,位于給定區域內任意位置的浮空器在風場和自身動力的共同作用下向目標點靠近,但是有的位置在共同作用下始終無法抵達目標點,而某些位置可以在很短的時間內到達目標點,如圖1 所示,即本文重點研究的區域可達性和最短時間的最優路徑問題。

定義浮空器的移動方向為正北、東北、正東、東南、正南、西南、正西、西北8 個方向,將360°平均分為8 個部分,如圖2 所示,其中,θi j為由狀態si進 入相鄰狀態sj將空間分成8 個部分的較小邊界角度。

圖2 浮空器狀態轉移方向Fig.2 Transition direction of a stratospheric aerostat

2 相關方法模型

2.1 馬爾可夫決策過程

MDP 是一種描述智能體和外部環境之間相互作用的模型,如圖3 所示,常被用來作為序列決策問題的框架,可以用一個五元組M=(S,A,P,R,γ)來表示[14],S代表環境狀態的集合,A代表智能體能執行的基本動作集合,Pa(s,s′)表 示智能體在狀態s下執行動作a到 達狀態s′的 概率,Ra(s,s′)表示智能體在狀態s下執行動作a到 達狀態s′所得到的即時獎勵,γ表示折扣因子,取值范圍為 [0,1],γ越大表示后續獎勵對當前獎勵的影響越大。

圖3 MDP 模型Fig.3 Model of Markov decision processes

當MDP 用來表示序列決策問題時,決策問題的解即為策略(π),是從狀態集合到動作集合的映射,即 π:S→A,求解MDP 即可表示為求解最優策略(π?)的問題,即浮空器在所處狀態采取的最優動作,使得所獲得的累積獎勵最大。累積獎勵可形式化表示為浮空器所處狀態的價值(狀態-值函數):

式中:Vπ(s) 為 執行策略 π后 在狀態s下 的價值;t為決策時刻;Rt為t時刻下的即時獎勵。

對于任意狀態,使得值函數最優的充要條件是Bellman 方程,最優策略 π?是使得值函數取得最大值時的策略:

式中:π?(s)為 智能體在狀態s下的最優策略。

求解最優策略常見的方法有策略迭代和值迭代[20],其中策略迭代需在每個狀態-值收斂后再進行策略提升,不斷地迭代直到策略收斂,而值迭代在狀態-值每更新一次之后進行策略提升,再重復進行狀態-值更新和策略提升直至狀態-值收斂[21]。因值迭代方法在本文研究的問題中具有更高的計算效率,本文采用值迭代方法進行求解。

2.2 二維風場分布

在實際情況下,風場數據為該區域內的各個離散氣象站提供的預測數據,在考慮風場因素時直接把某個氣象站的數據作為該區域內的整體風場數據,風向、風速只隨高度變化,不會對該區內各個高度的二維風場分布進行處理,但是在實際路徑規劃中,必須考慮二維風場的空間分布。本文根據各個氣象站的風場預測數據,采用雙線性差值法如圖4 所示,根據各點距離氣象站的距離確定權值,可以得到該區域內各個高度的二維風場分布,具體步驟如下:

圖4 雙線性差值法示意圖Fig.4 Diagram of bilinear interpolation method

1)二維線性差值。按照雙線性差值法如式(4)所示,可以得到二維區域內任意位置的數值。

式中:(x1,y1)、(x1,y2)、(x2,y1)、(x2,y2)、(x,y)分別為Q11、Q12、Q21、Q22、P的位置坐標。

2)確定權值。由于區域中各個點的風速風向與每個氣象站的實際數據有關,即目標點距離某個氣象站越近,該點的風速風向越接近該氣象站的實際數據,如圖5 所示,因此,目標點的氣象數據與各個氣象站在該點的權值有關,將其設置為與氣象站的距離成反比,為目標點與氣象站的水平距離,權值按照式(5)取值。

圖5 二維平面權值確定示意圖Fig.5 Diagram of determination of two-dimensional plane weights

式中:η為 權值;(xk,yk)為 待求目標的位置坐標;d為待求目標與已知點之間的距離;N為氣象站點數量。

3)二維風場可視化。二維風場速度的大小通過箭頭的長度和顏色表示,箭頭越短,顏色越藍,風速越??;風向通過箭頭的指向來表示,箭頭的方向即為風的來向。為了和浮空器的狀態數量保持一致,二維風場分布也劃分為 21×21個柵格。如圖6所示。

圖6 不同高度的二維風場分布對比Fig.6 Comparison of two-dimensional wind field distribution at different heights

2.3 不確定風場模型

由于風場模型可能存在的不準確性,風場數據存在一定的誤差,為了使得路徑規劃更加符合實際情況,本文將不確定性引入風場中,建立不確定風場模型。風場信息包括風向和風速,分別用 θi和wi表示,兩者具有相互獨立的概率分布,風速和風向由w(ri)表示[15]。

1)風向概率分布。風向概率分布采用von Mises 分布,該分布是圓上的連續概率分布,近似于包裹正態分布,是正態分布的圓形模擬,概率密度函數為

式中:θi=∠w(ri)為可獲得的風場數據中的實際風向,整個分布圍繞它展開,取值范圍為 [0?,360?],其中正北風向為 0?(3 60?),正東方向為 90?,以此類推可以得到所有風向對應的角度;κ為風向分布的集中程度,κ>0,且 κ →0,分布越分散,κ →∞,分布越集中;I0(κ)為0 階Bessel 修正函數。

2)風速概率分布。風速概率分布采用Gaussian分布,其概率密度函數為

式中:σi=ρwi,wi=//w(ri)//,w(ri)為可獲得的風場數據中的實際風速,整個風速分布圍繞它展開;ρ為分布幅度的參數,可按實際情況取值。

根據實際風場數據,在19 000 m 高度、37°經度、86°緯度處,風向 θi=251.916?,κ=1/400,風速wi=[0.344 6,?3.559],ρ=0.2,可以得到該點處的風向、風速的概率分布,如圖7 所示。

圖7 不確定模型下風向和風速概率分布Fig.7 Probability distribution of wind direction and speed under uncertain model

3 基于MDP 的全局路徑規劃

3.1 MDP 模型中關鍵參數設計

1)環境狀態集合S。本文浮空器所處區域,經過離散化得到 21×21個柵格,MDP 模型中的狀態S即為 21×21個柵格中的風速和風向。由于風向的范圍為 [0?,360?],按照圖3 中對角度和方向的劃分,風向可分為如下8個方向,分別為:①正北:[0?,22.5?]∪[337.5?,360?];②東北:[22.5?,67.5?];③正東:[67.5?,112.5?];④東 南:[112.5?,157.5?];⑤正 南:[157.5?,202.5?];⑥西 南:[202.5?,247.5?];⑦正 西:[247.5?,292.5?];⑧西北:[292.5?,337.5?];

當風場中的風向數值確定之后,浮空器在無動力情況下的移動方向就確定為這8 個方向之一。

2)基本動作集合A。浮空器自身的速度由4 個相互獨立的動力設備提供,且最多允許2 個設備同時工作,通過控制動力設備的開啟和關閉,可以得到9 個基本動作,正東方向為x軸正方向,正北方向為y軸正方向,浮空器基本動作方向如圖8 所示。動力設備均不工作,浮空器無動力:[0,0]m/s。

圖8 浮空器基本動作方向Fig.8 Basic action direction of stratospheric aerostat

只有1 個動力設備工作,浮空器分別具有向正北、正東、正南、正西方向的速度,通過調整動力設備使得浮空器可具備5 m/s 和2 m/s 的速度,速度大小為:[0,5],[5,0],[0,?5],[?5,0],[0,2],[2,0],[0,?2],[?2,0]m/s。

2 個動力設備同時工作(本文假設2 個設備所能提供的速度一致),浮空器分別具有向東北、東南、西南、西北的速度,通過調整動力設備使得浮空器在單個方向可具備5 m/s 和2 m/s 的速度,此時速度大小為:[5,5],[5,?5][?5,?5],[?5,5],[2,2],[2,?2],[?2,?2],[?2,2] m/s。

3)轉 移 概率P。Pa(si,sj)表 示浮 空 器 在狀 態si下 通過采取某個動作a進 入到狀態sj的概率。轉移過程中包括2 種模型:一種是確定模型,即浮空器在風速和自身驅動速度的共同作用下,從初始狀態si轉 移到的唯一確定的臨近狀態sj;另一種是不確定模型,即由于風場的不確定性,導致浮空器在不確定的風速和自身驅動速度的共同作用下,從初始狀態si轉 移到的臨近狀態sj是不確定的,是具有一定的概率的。在浮空器無動力的情況下,風向分布決定浮空器的轉移概率為

浮空器在無動力、速度為 [5,5]m /s 及 [?5,?5]m/s情況下的轉移概率分布情況如圖9 所示。

圖9 不確定風場下浮空器轉移概率分布Fig.9 Transition probability distribution of stratospheric aerostate under uncertain model

4)獎勵函數R。為描述浮空器狀態、動作和目標之間的關系,獎勵函數用Ra(si,sj)表示,具體含義為浮空器在選擇動作a的情況下由狀態si轉移到狀態sj所 消耗時間的負值,獎勵函數R為即時獎勵,且共有 21×21×9個 數值。浮空器在由狀態si移動到sj過 程中所消耗時間為 δt,則Ra(si,sj)=?δt,如下:

式中:dist(·,·)為 2 個柵格間的實際距離;vi,a為浮空器實際速度矢量,由風速和浮空器自身速度合成,vi,a=w(ri)+ua;w(ri)為 風場在位置ri處的矢量風速;u(si)為 浮空器在狀態si下所能提供的速度。

路徑規劃目的是使浮空器在給定區域內找到一條從起始點到目標點飛行時間最短路徑,因此,獎勵函數需考慮到距離區域邊界、遠離目標點、趨向目標點等所有情況,在確定風場下的獎勵函數為

式中:Ra(si,sj)表示浮空器分別在轉移過程中趨向目標點、遠離目標點及超出區域邊界時的即時獎勵,式(14)情況相同。

在不確定風場下,由于風場信息的不確定導致浮空器的實際速度也無法確定,本文用均值來表示浮空器在狀態si下 通過采取動作a得到的平均速度,此時相鄰2 個狀態的飛行時間為

由于風場的不確定性,導致浮空器由狀態si進入到相鄰狀態的sj也是無法確定的,通過不確定風場的轉移概率,不確定風場下的即時獎勵根據飛行時間期望值來確定,而飛行時間的期望值則根據轉移概率計算:

3.2 值迭代方法

本文中的風場模型包括確定風場和不確定風場2 種模型,因此,值迭代方法也分為2 種,在確定風場下,浮空器選擇動作后到達下一狀態是確定的;而在不確定風場下,浮空器選擇動作后到達下一狀態具有一定的概率,區別在于狀態轉移概率Pa(si,sj)如何求解,值迭代方法步驟如下:

步驟1輸入環境狀態、基本動作集合、即時獎勵、轉移概率、目標點位置,并初始化狀態值函數。

步驟2計算所有環境狀態下確定風場和不確定風場下的狀態值函數。

步驟3計算2 次狀態值函數的差值。

步驟4若差值達到值迭代收斂閾值,則末次計算的值函數即為最優狀態值函數,若未達到,則返回步驟2,迭代次數增加1 次。

步驟5若迭代次數大于最大迭代次數,則末次計算的值函數即為最優狀態值函數,若未達到,則返回步驟2,迭代次數增加1 次。

3.3 路徑規劃流程

全局路徑規劃流程見圖10。實現步驟如下:

圖10 全局路徑規劃流程Fig.10 Flowchart of global path planning

步驟1初始化參數。

步驟2以風場預測數據為輸入,建立二維風場模型。

步驟3針對風場不確定性,建立二維不確定風場模型。

步驟4以狀態集合、動作集合為輸入,計算狀態轉移概率。

步驟5以狀態集合、動作集合、目標點位置為輸入,計算2 種風場模型下的即時獎勵。

步驟6根據浮空器的即時獎勵和轉移概率,用值迭代方法計算浮空器的最優狀態值函數,并輸出最優狀態值函數和最優策略。

步驟7以飛行區域內任意位置為起始點,根據最優狀態值函數,獲得每次轉移的最優動作,結合風場得到轉移方向。

步驟8判斷是否到達目標點,若到達,則結束流程,若未到達,則返回步驟8。

4 仿真結果分析

將第3 節中的模型和方法應用于浮空器的全局路徑規劃,通過在MATLAB2020a 環境下建立的模型進行仿真,驗證參數設計和方法流程的有效性和工程實用性。

4.1 區域可達性仿真結果分析

在實際任務中,當給定目標點時,浮空器需要快速機動部署至目標區域實施任務,但是由于浮空器自身載荷能力、動力設備等限制,導致浮空器的驅動速度不高,抗風能力較弱。在沒有動力甚至在有一定動力的情況下,若浮空器自身驅動能力無法補償風場的不利影響,也會導致浮空器在某些位置無論采取何種動作均無法達到目標點。

本節主要對浮空器自身驅動速度與給定目標的可達性之間的關系進行分析,使用的是中國某地區的6 個氣象站點的氣象數據,按照第2 節中的方法得到19 000 m 高度的二維風場分布,給定目標點為[88.7?,41.2?],圖11 中白色方框所在位置,圖11 和圖12 分別為在確定風場和不確定風場的情況下,在無動力、單個動力設備提供的最大速度umax=2 m/s、umax=5 m/s時,浮空器在區域內任意位置到達給定目標的期望時間。

圖11 確定風場下不同最大抗風能力期望到達時間分布Fig.11 Distribution of expected arrival time at different speeds in certain wind field

圖12 不確定風場下不同速度期望到達時間分布Fig.12 Distribution of expected arrival time at different speeds in uncertain wind field

1)確定風場模型。在確定風場模型下,浮空器在每個狀態下的移動方向由該狀態下的風速、風向及浮空器自身提供的速度唯一確定。圖11 和圖12中柵格的顏色表示到達目標點的期望時間,顏色越紅到達時間越長,根據19 000 m 高度處的風場分布可知以北風分量為主,西風分量較小。當浮空器無動力時只能通過風場的作用到達目標點,只有在特殊幾個柵格狀態下可以快速部署到目標區域;當浮空器的單個動力設備提供最大速度為2 m/s 時,浮空器在某些位置下期望到達時間為100 h,當某些位置的期望到達時間過大時,在實際情況下可將其定義為不可到達點,即起始點不可選在這些位置;當浮空器的單個動力設備提供最大速度為5 m/s時,浮空器在給定區域內的大部分位置到達時間在10 h 以內,只有極少數的狀態下期望到達時間為14 h,該區域內的任意點均可作為起始點。

2)不確定風場模型。在不確定風場模型下,浮空器的實際速度和實際轉移方向是按照一定的概率進行分布的,通過Mont Carlo 方法統計得到風場的分布概率,由圖12 可知不確定風場與確定風場相比,期望時間的分布規律大致相同,風場按照第2 節中的概率分布,導致浮空器在轉移到臨近狀態時存在不確定性,根據轉移概率和即時獎勵(相鄰2 個狀態之間的飛行時間)來確定狀態值函數。隨著浮空器自身提供的驅動速度增加,給定區域內的各個位置可到達給定目標點的數量增加,因此,浮空器的水平驅動速度可改變區域內各位置相對于給定目標點的可達性。

3)2 種風場模型的對比。由圖11 和圖12 可知,當浮空器無動力時,對于給定目標點,不確定風場模型下較為合理期望到達時間占據柵格更多(藍色柵格),確定風場模型下不可達的柵格數量更多(紅色柵格);但是隨著浮空器水平驅動能力的加強,確定風場模型下藍色柵格的分布和數量與不確定風場模型下藍色柵格的分布和數量逐漸一致,說明浮空器的水平驅動能力可以抵消一部分風場不確定的影響。

4.2 最優路徑規劃仿真結果分析

本文規劃的路徑為最短時間路徑,浮空器在到達目標點的過程中需不斷根據實際風場來選擇最優動作序列,使其能夠在最短的時間內快速機動至目標區域。通過對浮空器在區域內各個位置的期望到達時間的分析,可以找到狀態轉移的最優方向,去除風場的作用,即可得到浮空器在不同驅動速度下的最優動作序列,浮空器在實際飛行中可按照最優動作序列控制執行機構作動,為浮空器的飛行決策提供指導。

圖13 和圖14 分別為確定風場和不確定風場下浮空器在不同起始點、不同速度下的最優動作序列和規劃出來的路徑。目標點的經緯度坐標設置 為 [88.7?,41.2?],起 始 點 經 緯 度 坐 標 設 置 為:[86.3?,42.4?]、[90.8?,37.3?],浮空器單個動力設備提供的最大速 度umax=2 m/s 、umax=5 m/s。圖13 和圖14 中的黑色箭頭為該位置下浮空器的最優速度方向,紅色箭頭為風向,在不確定風場中,紅色箭頭的長短表示風場分布在該方向的概率大小。

圖13 確定風場下路徑規劃和最優動作序列Fig.13 Path planning and optimal velocity sequence in certain wind field

圖14 不確定風場下路徑規劃和最優動作序列Fig.14 Path planning and optimal velocity sequence in uncertain wind field

浮空器自身的驅動能力、起始點的位置及風場模型均會影響浮空器最優策略即最優動作序列的選擇。圖13(a)和圖14(a)中,當浮空器單個動力設備能提供的最大速度為2 m/s 時,有的位置沒有黑色箭頭,說明在這些位置無論浮空器采取何種動作,都無法到達靠近目標點,因此,在浮空器實際飛行過程中應該避免到達這些位置;但是當浮空器單個動力設備能提供的最大速度為5 m/s 時,浮空器能夠在比較短的時間內到達目標點,相同位置下,由于浮空器自身速度的改變導致浮空器在整個區域的可達性也發生改變;對比圖13(b)、圖13(c)和圖14(b)、圖14(c)針對同一起始點和目標點規劃的路徑,在不確定風場下的路徑轉彎的次數更少,由于風場的概率分布,浮空器的實際速度也存在概率分布,導致在不確定風場下浮空器的路徑規劃更符合實際情況。

本文所提方法是在對整個風場環境和浮空器狀態空間進行有效的離散化的基礎上開展的,與基于圖搜索的路徑規劃方法有一定的相似之處。Dijkstra 方法是其中比較常用的路徑規劃方法,主要通過搜索空間來求解最優路徑,因此,搜索效率不高,尤其是在不確定風場下的路徑規劃問題,不適用于本文的研究背景。

5 結 論

1)本文所提方法能夠在不確定二維風場環境中規劃出一條針對目標點的最短時間路徑,并能給出給定區域內各個位置下的最優動作序列和期望達到時間,為浮空器的實際飛行執行機構作動策略提供理論依據。

2)本文所提方法還可提供浮空器在不同水平驅動能力下針對目標點的區域可達性,為后續浮空器的飛行策略提供指導。

猜你喜歡
浮空器風場速度
基于副氣囊的平流層浮空器高度控制
行駛速度
基于FLUENT的下擊暴流三維風場建模
速度
北約測試可改善戰場網絡系統的“氦風箏”新型浮空器
“最美風場”的贏利法則
比速度更速度——“光腦”來了
側向風場中無人機的飛行研究
基于AD7891的浮空器高速數據采集系統設計
風場條件下LPG 瞬時泄漏擴散的數值模擬
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合