?

任意初態下的迭代學習控制策略

2019-03-30 08:21李國軍韓一士陳東杰許中石
應用數學 2019年2期
關鍵詞:修正軌跡矩陣

李國軍,韓一士,陳東杰,許中石

(浙江警察學院公共基礎部,浙江 杭州310053)

1.引言

迭代學習控制(Iterative learning control,簡稱ILC)適用于在有限區間作重復操作的場合,通過利用上一次的控制輸入和輸出誤差來產生當前次的控制輸入,以便改進輸出效果,經過多次迭代以后,系統能夠實現完全無誤差跟蹤[1-2].由于設計簡單,在線計算量小并且具有動態特性,所以ILC被應用于工業機器人控制,化工過程控制等場合.

有限時間控制(Finite time control,簡稱FTC)方法雖然能夠在有限時間內讓跟蹤誤差趨于零,但它不能抑制確定性擾動.ILC通過多次迭代學習以后,能夠完全抑制時間軸上的確定性擾動.

應用ILC方法時,要求每次的初始定位誤差必須等于零或者某個固定值,但這在實際中不可能做到,因此這種嚴格的要求限制了ILC的應用,也決定著在整個控制過程中不可能做到完全無誤差跟蹤.實際應用時只能做到在某個指定區間實現實際完全跟蹤(Practical complete tracking,簡稱PCT).在PCT情形下,放松了對初始定位條件的限制,而且PCT允許每次迭代時初始狀態各不相同.

為了實現PCT,很多學者做了大量有益的工作[3?23].目前的解決方法主要分為兩類,一類是壓縮映射方法,另一類是Lyapunov-like方法.在壓縮映射方法研究過程中,文[5]討論了初始定位誤差對于系統跟蹤性能的影響.通過對系統魯棒性的分析,作者認為跟蹤誤差收斂至初始狀態誤差的某個鄰域,而且該鄰域的半徑和初始定位的誤差大小成正比.因此,要想提高跟蹤性能,必須提高初始定位的準確度.在固定初態誤差下,如果利用脈沖函數,系統能夠實現完全跟蹤.但在實際中,脈沖函數是不存在的,所以這種完全跟蹤也是不可能實現的.文[6]和[7]指出,在固定初態誤差(誤差不為零)情形下,迭代學習方法能夠實現漸近跟蹤,讓誤差漸近收斂于零.文[8-9]提出了一種基于固定初態誤差的修正方法,能夠在指定區間上實現完全跟蹤.對于具有高相對階的系統.文[10]提出了一種修正方法,在完成對初態誤差的修正以后,能夠確保系統達到完全跟蹤.針對非線性連續系統.文[11]提出了一種針對任意初態的修正方法,但這種方法不能完全修正初始誤差,而且只適用于一階系統.

在收斂性分析過程中,Lyapunov-like方法帶來了很大的方便,并且也取得了一些成果[12?26].目前最流行的Lyapunov-like 方法是時變邊界層方法和吸引子方法.文[15]引入邊界層的概念,由于邊界層隨著時間單調收斂至零,所以在邊界層限定下的控制誤差也漸近收斂至零,但此方法只能漸近跟蹤,達不到完全跟蹤.文[18-20]利用吸引子達到了實際完全跟蹤.對于一類離散時變不確定系統,文[21]提出了一種針對任意初態和時變軌跡的離散自適應ILC方法,能夠確保系統沿著迭代軸漸近收斂,沿著時間軸在指定區間內逐點收斂.對于可參數化非線性系統,文[22]解決了非一致性軌跡問題,并引入了復合能量函數,給收斂性分析帶來了方便.對于帶有時變迭代參數的不確定系統,文[23]利用內??刂品椒ㄔO計參數學習律,確保系統收斂.對于一類反饋可線性化系統,文[24]提出了一種狀態反饋ILC,實現了漸近跟蹤.但是當控制增益受狀態影響時,文中沒有提出解決方法.在假定控制增益有上下界和不確定部分可參數化的情形下,文[25]提出了一種帶反饋的ILC方法解決了此類問題.

目前,在任意初態下實現實際完全跟蹤的算法都是基于Lyapunov-like方法.本文提出了一種基于壓縮映射的迭代學習算法,該算法在任意初態下,能夠確保系統收斂并且可以實現PCT性能,最后通過一個例子驗證了該方法的有效性.

2.問題闡述

考慮下述線性定常系統

其中,t ∈[0,T]是有限時間;k= 1,2,···表示迭代次數;xi,k(t)∈Rn(i= 1或2),yk(t)∈Rr,uk(t)∈Rm,(相應可以簡寫為xi,k,uk,yk)分別表示第k次迭代的系統狀態,控制輸入和輸出向量.A,B,C是合適維數的系統參數矩陣,并且B右可逆.

設yd(t)(簡寫為yd)是給定的期望軌跡,設x1,d(t)和x2,d(t)(相應簡寫為x1,d和x2,d)是給定的期望狀態,ek(t)=yd ?yk表示第k次輸出誤差.

假設2.1初始狀態x1,k(0)隨機,x2,k(0)=x2,d(0),并且狀態x1,k(t)和x2,k(t)可測.

本文研究的情形可以對應于實際受控對象處于靜止狀態(速度誤差為零),但有位移誤差的情形.

3.控制器設計

本節的任務是設計一個控制算法,使得系統(2.1)能夠在指定時間內跟蹤上期望軌跡.為此,我們提出下面的控制律.

式中,

其中,h是預先給定的時間常量,為B的右逆.

事實上,控制律中的函數Θ(t)并不唯一,但必須滿足下面的性質.

性質3.1對于函數Θ(t),當積分上限滿足t ∈[h,T]時,有

注3.1這個定理表明,每一個Θ(t)函數,在經過2次積分以后有類似于脈沖函數的作用.在實際中,脈沖函數是不存在的,因此可以用這樣一個函數來代替脈沖函數.

4.收斂性分析

這一節著重分析系統(2.1)在應用控制律(3.1)以后的收斂性.在分析之前,先引入下面的定義和引理.

定義4.1函數x(t)的λ范數‖x(t)‖λ按如下方式定義.

其中‖·‖是按以下方式定義的某種范數.如果Z(t)是一個n維向量并且Z(t)=(z1(t),··· ,zn(t))T,那么如果Z(t)是一個矩陣函數并且Z(t) ={zij} ∈Rm×n,那么關于λ范數,有下面的引理.

引理4.1

引理4.2設級數bk滿足下列條件,

如果0≤ρ<1,那么

上節提出的控制律(3.1)中,引入了初始修正函數Θ(t),關于初始修正有下面的定理.

鄉鎮衛生院吊了一夜鹽水的英,第二天一早就稀里糊涂地被救護車送到縣人民醫院。她被帶到婦科檢查室,一個年輕女醫生走進來,叫她脫掉褲子。英開始沒有聽清楚,女醫生又說了一遍,英站在那里不知所措。女醫生又大聲說了一遍,英明白后開始手忙腳亂地解開褲子,可能因為過于緊張,也可能因為用力太大,褲子的紐扣散了,叮當一聲掉落在地板上。英彎腰撿了好幾次才撿起,像愛護寶貝一樣,將扣子放進了褲兜里。年輕女醫生瞧了瞧英,緊接著將戴手套的手伸向她下身。英有些猝不及防,還從來沒有人這樣看過自己下半身,更不用說用手不停地去觸摸。

定理4.1如果初始狀態是任意有限值,CB??赡?并且存在一個矩陣Γ滿足

那么修正控制律(3.1)能夠讓系統(2.1)跟蹤上期望軌跡,并且在區間t ∈[h,T]上,能夠達到一致性跟蹤.

證為了方便書寫,記

在控制律(3.1)的作用下,當t ∈[0,h],假定軌跡

可實現,即對于下面的系統當x?2,d(0)=x2,d(0)時,存在控制量u?d(t) 使得輸出為˙y?d(t).

對于系統(2.1),應用控制律(3.1)可得

在上式兩端同時乘以矩陣C,可得

所以當t ∈[0,h]并且‖I ?CB?!?1時,根據引理4.2可知,

也就是說,在[0,h]上一致收斂于0.

當t=h時,根據Θ(t)函數的性質有

同理,當t ∈[0,h]時,可得

在上式兩端同時乘以矩陣C,可得

同樣假設下面的軌跡

可實現,即當系統(2.1)存在任意初始偏差x?1,d(0)≠ x1,d(0)時,存在控制量u?d(t) 使得輸出為yd?(t).相應的虛擬系統如下

該系統相應的誤差記為e?k(t)=y?d(t)?yk(t).

由式(4.11)和(4.12)可得

同理,當‖I ?CB?!?1時,根據引理4.2,可得

同樣,當t=h時,根據Θ(t)函數的性質有

根據上面的推導結果可知,當t=h并且k →∞時,有yk(t)=yd(t)成立,也就是說,相應地誤差為零,系統處于理想狀態.

當t ∈(h,T]時,對于任意的xi,k+1(t)?xi,k(t),i=1,2,有

當i=1時,在上式的兩端同時乘以矩陣C,并取λ范數,根據引理4.1可得

當λ足夠大,并且‖I ?CB?!?1時,根據引理4.2可得

當i=2時,用同樣的方法能夠得到下面的結果,

而且,如果對式(4.17)的兩端取導數后再乘以矩陣C,并通過整理可得到下面的2-D模型.

對于上述的2-D模型,如果A,B,C為矩陣,可根據下面的線性矩陣不等式得到Γ(詳情見文[26]).

其中,Ar=A,Br=BΓ,Cr=CA,Dr=I ?CBΓ,上標T表示轉置,P為對稱正定陣.

5.數值仿真

考慮如下二階系統

該系統的作業區間為[0,1],狀態修正區間為[0,0.2].系統的跟蹤軌跡為系統運行之前初始狀態為x1,k(0)=0.5rand(rand產生0到1之間的隨機數值),x2,k(0)=0,仿真中迭代次數為15次.

圖5.1中,點線代表期望軌跡,虛線,點劃線與細實線分別代表第13,14和15次的實際軌跡(圖5.2和此相同).從圖中可以看出控制律(3.1) 在t= 0.2 時完成狀態修正,完全跟蹤上期望軌跡.

圖5.3和圖5.4中,虛線,點劃線與細實線分別代表第13,14和15次的實際跟蹤誤差.

圖5.1 期望軌跡yd和實際軌跡yk

圖5.2 期望狀態軌跡˙yd和實際狀態軌跡˙yk

圖5.3 各次迭代實際跟蹤誤差ek(t)

圖5.4 各次迭代實際跟蹤狀態誤差˙ek(t)

圖5.5 相應的控制量uk(t)

圖5.5中,虛線,點劃線與細實線分別代表第13,14和15次的實際控制量.從圖中可以看出,在修正狀態x1,k(t)時,需要很大的控制量.考慮到控制量的限制,一般要求修正時間不能太短.

上面的仿真驗證了本文所提算法對于線性定常系統而言,不僅能夠完成初始狀態誤差修正,而且能夠在指定區間達到一致性跟蹤.

6.結論

本文討論了線性定常系統存在任意初態誤差的迭代學習控制問題,借助壓縮映射手段,提出了一種帶修正因子的控制策略.在控制過程中,控制算法首先在指定時間內修正初態誤差.當修正好所有的狀態誤差后,系統能夠達到無誤差跟蹤.而且本文也從理論和實踐兩方面驗證了此算法的有效性.

猜你喜歡
修正軌跡矩陣
Some new thoughts of definitions of terms of sedimentary facies: Based on Miall's paper(1985)
修正這一天
軌跡
軌跡
軌跡
軟件修正
進化的軌跡(一)——進化,無盡的適應
初等行變換與初等列變換并用求逆矩陣
基于PID控制的二維彈道修正彈仿真
矩陣
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合