彭玉明 尤偉 馬彥涵
(上海衛星工程研究所,上海 200240)
大氣進入過程的運動方程形式復雜,進入軌跡對控制變量高度敏感且進入過程的非線性約束較強,因此進入軌跡優化問題一直是研究的熱點。目前火星探測器大都沿用“海盜號”的氣動外形,依靠滾轉角的變化實現軌跡控制,控制能力較弱,因此在設計標稱軌跡時還需要考慮控制系統的跟蹤能力。傳統的軌跡優化方法首先根據約束條件確定一條軌跡,然后再設計控制系統,若控制系統無法跟蹤標稱軌跡,則重新規劃,如此反復直到滿足要求。在對軌跡進行優化設計時,完全不考慮控制系統的跟蹤能力,設計過程完全依靠經驗費時費力,且不一定能取得滿意的效果。因此本文提出一種考慮控制飽和的進入軌跡優化算法,把末端狀態的靈敏度加入到目標函數中,并與末端高度最高、燃料最省通過罰函數法結合到一起形成最終的優化目標[1-3]。
直接配點法的核心思想是通過離散化把最優控制問題轉化成非線性規劃問題,直接配點法是將整個時間過程劃分成N 段,每一段的兩端稱為節點,然后用多項式逼近每一段的狀態和控制變量[4-5]。根據多項式階次的不同,直接配點法又可以分為低階的梯形法、Simpson 法和高階的四階、五階方法,本文采用三階Simpson 法。
在時間[t0,tf]內將連續時間分成N 段(tf為未端時刻),每一個子區間為[ti,ti+1],記Ti為相鄰2個節點的時間間隔,s=(t -ti)Ti(s為歸一化變量;t為時間),在每個子區間上狀態變量x 可以用三次Hermite多項式表示
式中 c0、c1、c2、c3為多項式系數。
其邊界條件為
式中 x1和x2分別表示相鄰兩個節點的狀態。
把邊界條件代入式(1)中得
解上述線性方程組得
在子區間的中點處,即s=0.5 時,將式(3)代入式(1)得
式中 xmi為中點處的狀態量;xi為第i個節點的狀態量;xi+1為第i+1個節點的狀態量;fi,fi1+分別表示函數 f(x,u,t)在第i個子區間兩端點處的函數值,(其中,u為控制量)即
式中iu為第i個節點的控制量。
式中 ui1+為第i+1個節點的控制量。
當由公式(5)近似得到的中點處的導數與動力學方程在中點處的值足夠接近時,就認為多項式很好的逼近動力學微分方程,如圖1所示。
圖1 Simpson 法Fig.1 Simpson method
原來的動力學方程由N×m個Hermite-Simpson 積分形式的約束代替
式中 umi為中點處的控制變量,由兩端線性插值得到;tmi為中點對應的時刻。
定義決策變量Z為
式中 x為各節點狀態變量構成的狀態向量;mu為中點處控制量構成的控制向量。
定義Δi為各節點處狀態量逼近誤差
這樣動力學微分方程約束轉變成N×m個等式約束,問題轉化為有約束的非線性規劃問題,搜索決策變量最優值,使得Δi趨于零。
由于火星大氣特別稀薄,降落傘減速效果有限,為了使探測器能夠安全著陸,希望開傘高度越高越好,所以目標函數中應包含末端高度;另一方面,探測器上攜帶的燃料有限,過多的消耗燃料是不可取的,因此燃料最省也是優化的目標之一。然而,如果簡單的以末端高度最高或燃料最省為性能指標進行優化,得到的控制變量的形式很可能是最大–最小–最大的形式,雖然控制量留取一定余量,但是在存在較大不確定性擾動的情況下,會導致控制飽和,更加不利的是,像“海盜號”這一類小升阻比的探測器,軌跡控制能力較弱,加之進入段惡劣的氣動加熱環境以及大量不確定性因素,探測器很可能會因為控制飽和而無法跟蹤標稱軌跡,因此在選取目標函數時還要考慮控制系統能否跟蹤上標稱軌跡[6-7]。末端高度、燃料消耗以及跟蹤控制性能等幾個指標是相互對立的,因此采用罰函數法把3個性能指標統一到一起,本文選取目標函數J為
式中 cS,cu為加權系數;h(tf)為探測器末端高度;Js為末端狀態對進入軌跡的靈敏度函數;Ju為進入過程中關于燃料消耗的目標函數
式中 σ為滾轉角。
進入軌跡除了動力學方程的約束外,還考慮了初始條件約束、終端條件約束、過程約束和控制約束。初始狀態約束包括初始高度0r 、速度0v 、飛行路徑角0γ和航程 s0,即
探測器最后要到達指定開傘區域,并且滿足開傘條件,由于末端高度是目標函數之一,因此這里不做約束,末端條件約束為
式中fs為末端狀態靈敏度;fv為末端速度。末端時刻 tf自由無約束。
進入過程中,為了結構和設備的安全,需要考慮過載約束[8]。鑒于本文的研究對象為彈道升力式飛行器,其軸向和法向均有可能產生較大過載,因此本文過載約束na取總過載約束
式中 L為升力加速度;D為阻力加速度;na為過載;nmax為最大過載。
對動壓的限制應從其峰值和末端時刻來考慮,進入過程中動壓峰值q 應不超過給定的最大值qmax。
式中 ρ為大氣密度;V為飛行速度。
為了安全打開降落傘,末端時刻動壓應不超過給定的最大值
式中 c為常數;b 是與探測器半徑相關的常數[9]。
由于只考慮縱向運動,所以假設σ ∈ [ 0,π ],為了進行側向制導,控制量需要留取一定余量,控制約束為
式中 σmin為最小滾轉角;σmax為最大滾轉角。同時由于探測器上姿態執行機構的限制,滾轉角角速度和角加速度還必須滿足以下條件
式中 σ˙min為最小滾轉角速率;為最大滾轉角速率;為最小滾轉角加速度;為最大滾轉角加速度。
控制系統的抗擾動性能體現在末端狀態對進入軌跡的靈敏度上,靈敏度越小,說明末端狀態對進入軌跡的變化越不敏感,也就是說抗擾動性能越強,反之亦然。因此,若是把所有時間點上狀態擾動對末端狀態的影響用靈敏度函數表示出來,然后加入到目標函數中,這樣在設計最優軌跡時就考慮了控制系統的抗擾動性能。
根據靈敏度的定義,任意軌跡X(t t0,x0)相對初始時刻狀態 x0的靈敏度矩陣為
為簡化表達把S(t t0,x0)表示成 S(t,t0),它滿足以下微分方程
則反饋控制律變為
靈敏度矩陣微分方程變為
根據靈敏度矩陣的定義,容易證明上述靈敏度矩陣具有如下性質
式中 I7×7為7 維單位矩陣。
在進入過程中,主要關注狀態擾動對末端狀態的影響,因此定義ξ(x(tf),tf)函數
根據定義ξ(x(tf),tf)相對t 時刻的狀態擾動的靈敏度矩陣可以表示為
所以ξ(x(tf),tf)相對t 時刻的狀態擾動的靈敏度矩陣等于S(tf,t)。很顯然只有矩陣中的每一個元素同時最小才能使靈敏度最小[10]。通過積分得到末端狀態對所有時刻狀態擾動的靈敏度,因此靈敏度函數JS為
式中Si,j(tf,t )表示靈敏度矩陣中第(i,j)個元素;ci為加權系數。
探測器進入火星大氣層的初始約束條件為:[r0,v0,γ0,s0]=[3 522 000,6 000,-0.2,0],末端約束條件v(tf)≤350m/s ;s(tf)=935km ;最大過載值nmax=8gn;最大動壓值q=10 0 00Pa,末端動壓 qf≤750Pa;最大加熱率=70kW/m2;控制變量約束為,11.5°≤ σ≤168.5°,-20(°) s≤ σ˙≤20(°) s,-5 (°) s2≤≤5(°) s2。
不考慮擾動對末端飛行路徑角的影響,靈敏度函數的加權系數為 c1=1,c2=1,c3=0,c4=0.01;反饋增益為k=-[0.01 0.005 50 0.001]。
圖2、3 是加權系數 cs和cu取不同值時所得到的最優控制曲線。
圖2 進入段最優控制軌跡Fig.2 Entry optimal control trajectory
圖3 cu=10 時進入段最優控制軌跡Fig.3 Entry optimal control trajectory while cu=10
從圖中可以看出,當cs=0,即目標函數中不包括靈敏度,最優控制軌跡大部分時間處于控制約束邊緣,當存在擾動時,控制系統很可能會因為控制飽和而無法跟蹤標稱軌跡。當uc=10,即考慮燃料消耗以后,控制軌跡變得平滑,但是仍有大部分時間處于飽和狀態。隨著 cs的不斷增大,最優控制軌跡離約束邊界越來越遠,抗擾動性能逐漸增強,但代價是末端高度越來越低,因此實際應用時需要根據具體情況采取不同方案。表1 給出了cs和cu取不同值時的末端高度。最優軌跡確定以后采用蒙特卡洛仿真方法進一步驗證考慮控制飽和的火星進入軌跡優化方法的有效性。具體仿真參數見表2。
表1 不同參數情況下的末端高度Tab.1 Terminal altitude for different parameters
表2 進入段蒙特卡洛仿真參數Tab.2 Entry Monte Carlo simulation parameters
圖4 是采用線性反饋控制律跟蹤最優軌跡得到的實際控制軌跡,如前文所料,cs越大,控制量飽和的時間越少,當cs=0時,即不考慮狀態靈敏度,在200s 以后控制量一直處于飽和狀態,而考慮了狀態靈敏度以后,在150s 以后基本不會出現控制量飽和。圖5 是 cs取不同值時末端狀態誤差分布。從圖中可以看到僅考慮末端高度時,末端誤差高度、速度、航程誤差分別約為2000m,100m,10km,隨著 cs的逐漸增大,目標函數中狀態靈敏度的權重越來越大,末端狀態誤差逐漸減小,當cs=0.005時末端高度、速度和航程誤差分別減小到100m,5m/s,1km,進入著陸精度顯著提高,這說明考慮控制飽和的進入軌跡優化算法是有效的。
圖4 反饋控制Fig.4 Feedback control
圖5 末端狀態誤差分布Fig.5 Terminal state error distribution
本文采用直接配點,對火星大氣進入軌跡進行優化設計,并考慮了狀態靈敏度對進入軌跡的影響,仿真算例表明,在目標函數中加入狀態靈敏度以后,進入軌跡不再靠近邊界,控制飽和的現象明顯減少,進而減小了末端狀態估計誤差。
References)
[1]Leavitt J,Mease K.Feasible Trajectory Generation for Atmospheric Entry Guidance[J].Journal of Guidance,Control,and Dynamics,2007,30(2):473-481.
[2]高濱.火星探測器著陸技術[J].航天返回與遙感,2009,30(1):1-9,20.GAO Bin.Mars Exploration Entry,Descent and Landing Technologies[J].Spacecraft Recovery & Remote Sensing,2009,30(1):1-9,20.(in Chinese)
[3]于瑩瀟, 田佳林.美國新型載人火星探測技術方案[J].航天返回與遙感,2009,30(3):1-7,15.YU Yingxiao,TIAN Jialin.USA New Mars Exploration Technology Concept[J].Spacecraft Recovery & Remote Sensing,2009,30(3):1-7,15.(in Chinese)
[4]Shen H J,Seywald H,Powell R W.Desensitizing the Minimum-fuel Power Descent for Mars Pinpoint Landing[J].Journal of Guidance Control and Dynamics,2010,33(1):108-115.
[5]Seywald H,Kumar R R.Desensitized Optimal Trajectories[R].AMA report No 03-16,2003.
[6]包進進, 榮偉.火星探測器進入階段穩定性分析[J].航天返回與遙感,2011,32(4):6-13.BAO Jinjin,RONG Wei.Mars Explorer Stability Analysis in the Entry Phase[J].Spacecraft Recovery & Remote Sensing,2011,32(4):6-13.(in Chinese)
[7]Seywald H.Desensitized Optimal Trajectories with Control constraints[R].AMA report No.03-28,2003.
[8]Shen H J,Seywald H,Powell R W.Desensitizing the Pin-point Landing Trajectory on Mars[C].AAS/AIAA Astrodynamics Specialist Conference,Honolulu,HI,2008.
[9]Tang S,Conway B A.Optimization of Low-thrust Interplanetary Trajectories Using Collocation and Nonlinear Programming[J].Journal of Guidance Control and Dynamics,1995,18(3):599-604.
[10]陳曉, 張偉, 彭玉明.基于器間測量的火星進入過程實時高精度導航[J].航天返回與遙感,2012,33(6):17-23.CHEN Xiao,ZHANG Wei,PENG Yuming.Mars Entry Real-time Navigation Based on Orbiter Tracking Data[J].Spacecraft Recovery & Remote Sensing,2012,33(6):17-23.(in Chinese)