李國軍,韓一士,陳東杰,許中石
(浙江警察學院公共基礎部,浙江 杭州310053)
迭代學習控制(Iterative learning control,簡稱ILC)適用于在有限區間作重復操作的場合,通過利用上一次的控制輸入和輸出誤差來產生當前次的控制輸入,以便改進輸出效果,經過多次迭代以后,系統能夠實現完全無誤差跟蹤[1-2].由于設計簡單,在線計算量小并且具有動態特性,所以ILC被應用于工業機器人控制,化工過程控制等場合.
有限時間控制(Finite time control,簡稱FTC)方法雖然能夠在有限時間內讓跟蹤誤差趨于零,但它不能抑制確定性擾動.ILC通過多次迭代學習以后,能夠完全抑制時間軸上的確定性擾動.
應用ILC方法時,要求每次的初始定位誤差必須等于零或者某個固定值,但這在實際中不可能做到,因此這種嚴格的要求限制了ILC的應用,也決定著在整個控制過程中不可能做到完全無誤差跟蹤.實際應用時只能做到在某個指定區間實現實際完全跟蹤(Practical complete tracking,簡稱PCT).在PCT情形下,放松了對初始定位條件的限制,而且PCT允許每次迭代時初始狀態各不相同.
為了實現PCT,很多學者做了大量有益的工作[3?23].目前的解決方法主要分為兩類,一類是壓縮映射方法,另一類是Lyapunov-like方法.在壓縮映射方法研究過程中,文[5]討論了初始定位誤差對于系統跟蹤性能的影響.通過對系統魯棒性的分析,作者認為跟蹤誤差收斂至初始狀態誤差的某個鄰域,而且該鄰域的半徑和初始定位的誤差大小成正比.因此,要想提高跟蹤性能,必須提高初始定位的準確度.在固定初態誤差下,如果利用脈沖函數,系統能夠實現完全跟蹤.但在實際中,脈沖函數是不存在的,所以這種完全跟蹤也是不可能實現的.文[6]和[7]指出,在固定初態誤差(誤差不為零)情形下,迭代學習方法能夠實現漸近跟蹤,讓誤差漸近收斂于零.文[8-9]提出了一種基于固定初態誤差的修正方法,能夠在指定區間上實現完全跟蹤.對于具有高相對階的系統.文[10]提出了一種修正方法,在完成對初態誤差的修正以后,能夠確保系統達到完全跟蹤.針對非線性連續系統.文[11]提出了一種針對任意初態的修正方法,但這種方法不能完全修正初始誤差,而且只適用于一階系統.
在收斂性分析過程中,Lyapunov-like方法帶來了很大的方便,并且也取得了一些成果[12?26].目前最流行的Lyapunov-like 方法是時變邊界層方法和吸引子方法.文[15]引入邊界層的概念,由于邊界層隨著時間單調收斂至零,所以在邊界層限定下的控制誤差也漸近收斂至零,但此方法只能漸近跟蹤,達不到完全跟蹤.文[18-20]利用吸引子達到了實際完全跟蹤.對于一類離散時變不確定系統,文[21]提出了一種針對任意初態和時變軌跡的離散自適應ILC方法,能夠確保系統沿著迭代軸漸近收斂,沿著時間軸在指定區間內逐點收斂.對于可參數化非線性系統,文[22]解決了非一致性軌跡問題,并引入了復合能量函數,給收斂性分析帶來了方便.對于帶有時變迭代參數的不確定系統,文[23]利用內??刂品椒ㄔO計參數學習律,確保系統收斂.對于一類反饋可線性化系統,文[24]提出了一種狀態反饋ILC,實現了漸近跟蹤.但是當控制增益受狀態影響時,文中沒有提出解決方法.在假定控制增益有上下界和不確定部分可參數化的情形下,文[25]提出了一種帶反饋的ILC方法解決了此類問題.
目前,在任意初態下實現實際完全跟蹤的算法都是基于Lyapunov-like方法.本文提出了一種基于壓縮映射的迭代學習算法,該算法在任意初態下,能夠確保系統收斂并且可以實現PCT性能,最后通過一個例子驗證了該方法的有效性.
考慮下述線性定常系統
其中,t ∈[0,T]是有限時間;k= 1,2,···表示迭代次數;xi,k(t)∈Rn(i= 1或2),yk(t)∈Rr,uk(t)∈Rm,(相應可以簡寫為xi,k,uk,yk)分別表示第k次迭代的系統狀態,控制輸入和輸出向量.A,B,C是合適維數的系統參數矩陣,并且B右可逆.
設yd(t)(簡寫為yd)是給定的期望軌跡,設x1,d(t)和x2,d(t)(相應簡寫為x1,d和x2,d)是給定的期望狀態,ek(t)=yd ?yk表示第k次輸出誤差.
假設2.1初始狀態x1,k(0)隨機,x2,k(0)=x2,d(0),并且狀態x1,k(t)和x2,k(t)可測.
本文研究的情形可以對應于實際受控對象處于靜止狀態(速度誤差為零),但有位移誤差的情形.
本節的任務是設計一個控制算法,使得系統(2.1)能夠在指定時間內跟蹤上期望軌跡.為此,我們提出下面的控制律.
式中,
其中,h是預先給定的時間常量,為B的右逆.
事實上,控制律中的函數Θ(t)并不唯一,但必須滿足下面的性質.
性質3.1對于函數Θ(t),當積分上限滿足t ∈[h,T]時,有
證
注3.1這個定理表明,每一個Θ(t)函數,在經過2次積分以后有類似于脈沖函數的作用.在實際中,脈沖函數是不存在的,因此可以用這樣一個函數來代替脈沖函數.
這一節著重分析系統(2.1)在應用控制律(3.1)以后的收斂性.在分析之前,先引入下面的定義和引理.
定義4.1函數x(t)的λ范數‖x(t)‖λ按如下方式定義.
其中‖·‖是按以下方式定義的某種范數.如果Z(t)是一個n維向量并且Z(t)=(z1(t),··· ,zn(t))T,那么如果Z(t)是一個矩陣函數并且Z(t) ={zij} ∈Rm×n,那么關于λ范數,有下面的引理.
引理4.1
引理4.2設級數bk滿足下列條件,
如果0≤ρ<1,那么
上節提出的控制律(3.1)中,引入了初始修正函數Θ(t),關于初始修正有下面的定理.
鄉鎮衛生院吊了一夜鹽水的英,第二天一早就稀里糊涂地被救護車送到縣人民醫院。她被帶到婦科檢查室,一個年輕女醫生走進來,叫她脫掉褲子。英開始沒有聽清楚,女醫生又說了一遍,英站在那里不知所措。女醫生又大聲說了一遍,英明白后開始手忙腳亂地解開褲子,可能因為過于緊張,也可能因為用力太大,褲子的紐扣散了,叮當一聲掉落在地板上。英彎腰撿了好幾次才撿起,像愛護寶貝一樣,將扣子放進了褲兜里。年輕女醫生瞧了瞧英,緊接著將戴手套的手伸向她下身。英有些猝不及防,還從來沒有人這樣看過自己下半身,更不用說用手不停地去觸摸。
定理4.1如果初始狀態是任意有限值,CB??赡?并且存在一個矩陣Γ滿足
那么修正控制律(3.1)能夠讓系統(2.1)跟蹤上期望軌跡,并且在區間t ∈[h,T]上,能夠達到一致性跟蹤.
證為了方便書寫,記
在控制律(3.1)的作用下,當t ∈[0,h],假定軌跡
可實現,即對于下面的系統當x?2,d(0)=x2,d(0)時,存在控制量u?d(t) 使得輸出為˙y?d(t).
對于系統(2.1),應用控制律(3.1)可得
在上式兩端同時乘以矩陣C,可得
所以當t ∈[0,h]并且‖I ?CB?!?1時,根據引理4.2可知,
也就是說,在[0,h]上一致收斂于0.
當t=h時,根據Θ(t)函數的性質有
同理,當t ∈[0,h]時,可得
在上式兩端同時乘以矩陣C,可得
同樣假設下面的軌跡
可實現,即當系統(2.1)存在任意初始偏差x?1,d(0)≠ x1,d(0)時,存在控制量u?d(t) 使得輸出為yd?(t).相應的虛擬系統如下
該系統相應的誤差記為e?k(t)=y?d(t)?yk(t).
由式(4.11)和(4.12)可得
同理,當‖I ?CB?!?1時,根據引理4.2,可得
同樣,當t=h時,根據Θ(t)函數的性質有
根據上面的推導結果可知,當t=h并且k →∞時,有yk(t)=yd(t)成立,也就是說,相應地誤差為零,系統處于理想狀態.
當t ∈(h,T]時,對于任意的xi,k+1(t)?xi,k(t),i=1,2,有
當i=1時,在上式的兩端同時乘以矩陣C,并取λ范數,根據引理4.1可得
當λ足夠大,并且‖I ?CB?!?1時,根據引理4.2可得
當i=2時,用同樣的方法能夠得到下面的結果,
而且,如果對式(4.17)的兩端取導數后再乘以矩陣C,并通過整理可得到下面的2-D模型.
對于上述的2-D模型,如果A,B,C為矩陣,可根據下面的線性矩陣不等式得到Γ(詳情見文[26]).
其中,Ar=A,Br=BΓ,Cr=CA,Dr=I ?CBΓ,上標T表示轉置,P為對稱正定陣.
考慮如下二階系統
該系統的作業區間為[0,1],狀態修正區間為[0,0.2].系統的跟蹤軌跡為系統運行之前初始狀態為x1,k(0)=0.5rand(rand產生0到1之間的隨機數值),x2,k(0)=0,仿真中迭代次數為15次.
圖5.1中,點線代表期望軌跡,虛線,點劃線與細實線分別代表第13,14和15次的實際軌跡(圖5.2和此相同).從圖中可以看出控制律(3.1) 在t= 0.2 時完成狀態修正,完全跟蹤上期望軌跡.
圖5.3和圖5.4中,虛線,點劃線與細實線分別代表第13,14和15次的實際跟蹤誤差.
圖5.1 期望軌跡yd和實際軌跡yk
圖5.2 期望狀態軌跡˙yd和實際狀態軌跡˙yk
圖5.3 各次迭代實際跟蹤誤差ek(t)
圖5.4 各次迭代實際跟蹤狀態誤差˙ek(t)
圖5.5 相應的控制量uk(t)
圖5.5中,虛線,點劃線與細實線分別代表第13,14和15次的實際控制量.從圖中可以看出,在修正狀態x1,k(t)時,需要很大的控制量.考慮到控制量的限制,一般要求修正時間不能太短.
上面的仿真驗證了本文所提算法對于線性定常系統而言,不僅能夠完成初始狀態誤差修正,而且能夠在指定區間達到一致性跟蹤.
本文討論了線性定常系統存在任意初態誤差的迭代學習控制問題,借助壓縮映射手段,提出了一種帶修正因子的控制策略.在控制過程中,控制算法首先在指定時間內修正初態誤差.當修正好所有的狀態誤差后,系統能夠達到無誤差跟蹤.而且本文也從理論和實踐兩方面驗證了此算法的有效性.