?

間歇性通信下多移動機器人的分布式切換預測控制①

2024-02-13 12:25陳嘉旻劉安東滕游
高技術通訊 2024年1期
關鍵詞:移動機器人編隊子系統

陳嘉旻 劉安東 滕游

(浙江工業大學信息工程學院 杭州310023)

近年來,工業產業升級,單一機器人很難滿足現如今的工業生產模式,便捷、高效的機器人團隊協作正在克服傳統工業生產的挑戰,并適用于新興行業的需求[1]。相比于單機器人,多機器人協作具有更好的魯棒性和容錯能力,同時也提高了執行任務的能力和效率。

多機器人協作通常要求多個機器人按照一定的空間軌跡協同完成任務,從而可以刻畫為一個編隊問題。編隊控制方法有領航-跟隨法[2-4]、虛擬結構法[5-7]和基于行為法[8-10]等。模型預測控制(model predictive control,MPC)作為解決分布式協作的有效控制方法,近年來被學者廣泛應用于機器人編隊控制中[11-13]。文獻[11]針對多個非完整移動機器人編隊,提出了一種基于神經動態優化的非線性MPC 控制。通過利用該方法來維持期望的領航者-跟隨者的位置關系。文獻[12]采用分布式MPC 和改進的虛擬結構方法,提出了一種多移動機器人編隊預測控制算法,有效改善了編隊結構的靈活性。文獻[13]通過將路徑同步參數引入到預測性能指標,提出了一種基于擴展狀態觀測器的分布式模型預測控制方法,采用前饋補償策略解決了具有未知擾動下的多移動機器人編隊控制問題。

上述的編隊控制方法在一般的情況下都假設系統的通信不受到任何限制,即每一個機器人在編隊運動中都可以獲得系統中其他機器人的所有狀態信息。而在實際應用場景下,移動機器人自身所攜帶的電池能源有限,機器人的單次使用時間受到一定的限制。并且隨著移動機器人的數量增加,系統的通信負荷呈指數級增加。為此,在多機器人編隊問題中還需要考慮系統的通信能力。如文獻[14]針對在通信受限的情況下多機器人編隊的問題,提出了一種分散控制率,其中將信息流分為了2 種時間尺度,并且隨著信息交互時間的延長,允許間歇性信息丟失,以降低通信負載。文獻[15]提出了一種事件觸發控制算法,以顯著減少編隊控制更新,消除多智能體節點間的連續通信。文獻[16]為了解決在通信拓撲切換下車輛隊列的協同控制問題,提出了一種分布式MPC 策略,利用該方法保證在車輛運動時系統的穩定性。以上的分布式MPC 控制算法大多采用靜態拓撲結構或給定順序的切換拓撲結構,其中切換拓撲結構算法都沒有給出切換律的設計方法。并且當系統工作狀態不符合給定的切換律時,其控制系統將無法保證穩定。為此本文將在切換拓撲結構算法的基礎上,給出切換律的設計方法。

本文針對機器人編隊運動中的通信交互問題展開研究,提出了多移動機器人在間歇通信下的編隊控制算法。首先,通過將切換拓撲策略描述為間歇性通信,將多機器人編隊建模為一類帶有路徑參數同步約束項的切換系統模型,并針對名義模型提出了一種分布式切換預測控制方法,然后給出各子系統切換時穩定的條件以及控制器的設計方法。其次,結合級聯控制系統的方法設計路徑參數同步控制器,使多移動機器人在完成路徑跟蹤的同時,進一步完成路徑參數同步。最后,通過給定的通信控制序列,多移動機器人完成子系統之間的切換,每一次切換代表不同的通信拓撲結構,從而達到機器人間歇通信的目的。

1 問題描述

1.1 運動學模型

考慮一個具有n個移動機器人的編隊系統,其中移動機器人以期望的隊形來跟蹤預先設定的參考路徑Γi(τi) 上的虛擬機器人,τi為預先設定的路徑參數。在慣性坐標參考系下,機器人i的運動學模型表示為

其中,φi為移動機器人前行方向相對于X軸的方向角,ui=(vi,ωi)T表示移動機器人i的線速度和角速度向量。

移動機器人在慣性坐標系下的跟蹤誤差向量表示為

其中,ηi=[xie,yie,φie]T為虛擬機器人i的狀態向量。

令虛擬機器人i的速度向量為uri=(vri,ωri)T,對式(2)求導可得如下的跟蹤誤差模型:

令ui=[vricos(φri -φi)-vi,ωri -ωi]T,ηi=[xie,yie,φie]T,將系統式(3)在平衡點處(ηi=0,ui=0) 線性化可得如下的連續狀態空間模型:

其中,Ai=I +ApiT,B=BpT。為了簡單起見,本文考慮的參考路徑Γi(τi) 為圓形。由于Γi(τi) 是關于τi的函數Γi(τi)=col(ηi(τi),φi(τi)),為了實現協同控制問題,需要通過設置τi的更新方程,來完成實際的編隊結構和虛擬編隊結構的協調[13]。不失一般性,τi的更新方程設置為

其中,εi為路徑參數更新方程的控制輸入,Δεi為其控制增量,δi為系數矩陣。

綜上所述,本文考慮的多移動機器人編隊控制問題可以描述為如下2 個控制任務:

(1)路徑跟蹤任務。首先,讓虛擬移動機器人沿著給定的參考路徑運動,當編隊結構中的路徑參數達到同步時,虛擬機器人將位于期望的編隊結構上,最后使實際的移動機器人能夠跟蹤上相應的虛擬移動機器人,即

(2)編隊路徑參數同步任務。確保所有的路徑參數τi(t) 同步,從而使虛擬機器人維持期望的虛擬編隊結構:

圖1 編隊路徑設置示意圖

1.2 通信約束

由1.1 節可知,本文的控制目標為完成路徑跟蹤和路徑參數同步,因此在設計控制器時,分別引入路徑跟蹤控制器和路徑參數同步控制器

為了方便設計控制器,采用分布式預測控制方法。首先,根據文獻[17]將式(10)轉化為如下形式:

為關于路徑參數的矩陣,本文將其視為系統的擾動;θij表示不同子系統之間通信的通或斷,當通信連接時取1,反之取0,由θij構成的矩陣θ可表示不同的通信拓撲結構;σ(k)∈{0,1,2,…} 表示由拓撲結構決定的切換信號,即σ(k)是θ(k) 的一個映射;Kiσ(k)為切換信號依賴的控制器增益。

由式(13)可知,Φ(k)中只含有路徑參數,不含有系統狀態ˉη(k)。為此可將系統式(13)看成一個名義系統部分和系統擾動Φ(k) 組成。因此,名義系統模型為

本文的任務分別是路徑跟蹤任務和路徑參數同步任務。由控制器式(9)可知,本文的控制器設計按照這2 個任務可分為2 部分,即分別針對系統的名義模型式(14)和路徑參數式(6)設計路徑跟蹤控制器和路徑參數同步控制器。由于本文將系統式(13)分解為名義系統式(14)和干擾項Φ(k),而系統式(14)與路徑參數εi無關,從而可以并行設計路徑跟蹤控制器u1i和路徑參數同步控制器u2i。因此,本文的目的考慮具有間歇性通信的多機器人編隊系統式(13),針對名義系統式(14)采用分布式切換預測控制方法設計控制器增益Kiσ(k)(k);針對路徑參數同步更新方程式(6)采用分布式預測控制器設計路徑參數更新方程控制增量Δεi(k),保證多機器人系統完成編隊任務。

2 基于MPC 的編隊同步控制

2.1 分布式切換MPC 控制算法

系統采用級聯控制系統的控制方法,首先設計切換MPC 控制器來完成機器人的路徑跟蹤,之后在此基礎上設計一個MPC 控制器,用于完成機器人的路徑參數同步任務。

本節的目的是通過切換MPC 策略為系統式(13)的名義模型式(14)設計一個穩定控制器。通過切換MPC 控制算法,使移動機器人在通訊切換時仍然保持各子系統穩定,并獲得最佳的系統性能。

為此,假設切換系統式(14)的每個子系統都存在一個穩定的MPC 控制器,同時每個子系統與要最小化的性能指標相關聯,每個子系統根據預先設定的通信序列進行切換,同時代價函數之間進行切換。為了給系統式(14)設計一個穩定化的控制器,考慮以下有限時域最優控制問題:

問題1:

其中,N是預測步長,Piσ(k)是正定對稱矩陣,Kiσ(k)是在k時刻需要設計的狀態反饋控制器增益。

定義1 考慮系統式(14),若存在正常數c和λ,使得對于任意的初始條件(t0)∈Rn,系統的解滿足

則系統式(14)指數穩定并具有指數衰減率,其中α=k -k0。

定義2 對任意ξ2>ξ0≥0,令Nσ(ξ1,ξ2) 表示切換信號σ在間隔(ξ1,ξ2) 內的切換次數。若存在ξa>0和N0≥0 使得不等式Nσ(ξ1,ξ2) ≤N0+成立,那么,ξa稱為切換信號σ的平均駐留時間,N0稱為抖動界。

定理1 如果存在正標量λ <1和μ >1,正定矩陣Pi(k)>0,Kil(k),l=0,1…,使得以下不等式成立:

證明1 如果不等式(18)成立,則有:

由于不等式Υil(k +1,N) ≤λ2Υil(k,N),Υia(k,N) ≤μΥib(k,N),對于切換信號σ(k),由式(20)~(22)可得以下不等式關系:

基于定理1 中的穩定性條件,狀態反饋控制器的存在條件由以下定理給出。

定理2 給定正標量λ <1和μ >1,考慮以下半正定規劃問題:

如果該問題有解,則存在穩定化的狀態反饋控制器使得切換系統指數穩定且具有指數衰減ρ(λ,其控制器增益其中,注:不等式(18)~ (20)是切換系統穩定的充分條件,分別對應式(28)、(32)、(31),若優化問題式(28)有解,則可以保證不等式(18)~(20)成立。

證明首先選擇如下的李雅普諾夫函數。

對式(33)應用Schur 補引理可得以下不等式:

綜上,算法1 如下。

步驟1 初始化。設置k=0,并選擇常數μ和通信切換序列。

步驟2 信息采集。在k時刻,通過通信網絡測得各移動機器人的狀態。

步驟3 優化。求解最小化問題minζi(k) 得到相應的Kil(k)和Pil(k)。

步驟4 參數調整。調整參數λ,把步驟3 求得的Kil(k)和Pil(k) 代入式(32)判斷不等式是否成立。如果不等式成立,則Kil(k) 為各子系統的穩定化控制器的增益。如果不成立則繼續調整參數λ,以判斷不等式(32)是否成立。

步驟5 滾動時域。令k=k +1,跳轉至步驟2。

2.2 路徑參數同步預測控制

本節的目的是在上一節的基礎上,為系統的擾動設計控制器,即路徑參數控制器,使移動機器人完成編隊任務。為了提高多移動機器人的路徑跟蹤性能,在較短的時間內使移動機器人位于期望位置,并提高系統的動態性能,將同步參數和路徑參數的控制增量引入預測性能指標,則每個移動機器人的路徑參數可以進行單獨優化,將其目標函數定義為

其中,τi(k +j| k)、τj(k +j| k)和Δεi(k +j| k) 分別為τi(k +j)、τj(k +j)和Δεi(k +j)在k時刻的預測值,M為預測時域取值為1,τr為給定的標量參數。Wi >0和Si >0 為給定的權重矩陣,Gi為給定的耦合項的權重矩陣,為移動機器人集合。

在k時刻,通過最小化MPC 性能指標,可以得到最優解,以下為最小化問題

以上優化問題為典型的QP 問題,依據一階KKT(Karush-Kuhn-Tucker)條件,可以求得最小化問題式(36)的解為

由于式(37)中包含了鄰居子系統輸入,可采用迭代策略求解,即鄰居子系統輸入采用上一迭代時刻值替代,從而將式(37)增廣后可得:

其中,Ω=diag{Ω1,…,Ωn},Ψ=(Ψ1,…,Ψn)T,Δε(k)=(Δε1(k),…,Δεn(k))T,G(i,j)=p為迭代次數。因此,通過選擇合適的權重矩陣Wi >0、Si >0和Gi,使得ρ(Ω-1G)<1,則式(38)是收斂的。同時名義系統式(14)是漸近穩定的,從而有

綜上,算法2 如下。

步驟1 初始化。在k=0 時刻,設置迭代次數p=0 輸入路徑參數τi以及參數μ和λ。

步驟2 信息交互。移動機器人i通過算法1設置的通訊序列,間歇性地將自身的狀態信息與控制信息傳遞給相鄰移動機器人j,同時也獲得相鄰機器人的狀態和控制信息。

步驟3 優化。機器人i通過式(36)計算出其局部最優解。

步驟4 參數調整。調整參數Wi、Si和Gi,使得ρ(Ω-1G) <1。并令(k)(k) 并結束迭代,跳轉至步驟5,否則令p=p +1 跳轉至步驟2 繼續執行。

步驟5 滾動時域。令k=k +1,跳轉至步驟2。

3 仿真驗證及分析

為了驗證本文提出算法的有效性,仿真時考慮由3 個移動機器人組成的編隊系統,其編隊隊形為等邊三角形結構,邊長為3 m。同時在給定的通信序列下,移動機器人進行通信切換,最后使移動機器人能夠沿著給定的參考路徑,并保持編隊結構進行編隊運動。多移動機器人的具體參數設置如下:參考路徑是分別是半徑4 m、3 m 和1 m 的同心圓。

移動機器人的初始狀態為

切換系統的權重矩陣選取為

路徑跟蹤優化的權重矩陣為

路徑參數的初始值為

采樣周期為0.2 s,并給出一組切換序列如下:

其中通信切換系列中的0、1、2 分別對應圖2 中的3種通信拓撲結構。

圖2 機器人通信拓撲結構示意圖

從序列中可以得知,各子系統切換次數為53次,通過算法1 可以得到μ=1.1,λ=0.993 2;通過子系統的切換順序和平均駐留時間的定義,可以得到tα=400/53=7.547 2。因此在這種情況下,可以進一步得到tα >=Inμ/2In(1/λ)=6.984 2,平均駐留時間滿足定理1 的式(23),那么系統指數穩定且具有指數衰減率ρ(λ,ta)=仿真結果如圖3 和圖4 所示。圖3 為移動機器人的狀態誤差曲線,機器人在40 s 左右可以完成路徑跟蹤。圖4 為誤差控制輸入。

圖3 移動機器人狀態誤差曲線

圖4 移動機器人誤差控制輸入

圖5中τ12、τ23和τ13分別為路徑參數τ1和τ2之差、τ2和τ3之差以及τ1和τ3之差。移動機器人1和移動機器人2 最后收斂的角度差是60 °,移動機器人2 和移動機器人3 最后收斂的角度差是60 °,移動機器人1 和移動機器人3 最后收斂的角度差是0 °。移動機器人圖中的路徑參數誤差在40 s 左右趨于0,那么移動機器人在40 s 后可以實現期望的編隊運動。

圖5 移動機器人路徑參數誤差曲線

圖6 為移動機器人運動軌跡的仿真圖。圖中分別選取了3 組不同時刻的編隊運動情況,t=0 s,t=4 0 s和t=80 s。t=0 s時為初始時刻,虛線三角形為虛擬機器人形成的期望編隊結構,實線三角形為實際機器人形成的初始編隊結構。顯然在初始時刻實際機器人沒有形成期望的編隊結構,當t=40 s 時3 組移動機器人基本形成期望的編隊結構,與虛擬機器人的軌跡基本重合。最后選取t=80 s 時刻,可以看到多移動機器人可以在間歇通信的情況下,穩定地保持期望的編隊結構運動。

圖6 移動機器人編隊運動軌跡圖

4 結論

本文針對在間歇通信條件下的編隊控制問題,提出了一種分布式切換預測控制方法。利用分布式MPC 方法,結合級聯控制系統方法,分別針對系統的名義模型部分和路徑參數同步項設計了控制器,并給出系統指數穩定的充分條件以及平均駐留時間。機器人編隊系統在切換拓撲策略下,實現間歇通信的目的。仿真實驗表明,多移動機器人在通信受限的情況下,利用本文所提出的算法,機器人仍然可以較好地完成編隊運動,從而達到了在大規模機器人協同控制中降低通信負載的要求。

猜你喜歡
移動機器人編隊子系統
2023年1月25日,美軍一次演習期間,空軍正在進行編隊飛行
不對中轉子系統耦合動力學特性研究
移動機器人自主動態避障方法
GSM-R基站子系統同步方案研究
駝峰測長設備在線監測子系統的設計與應用
基于事件驅動的多飛行器編隊協同控制
基于Twincat的移動機器人制孔系統
基于預測控制的無人機編隊內部避碰
多彈編隊飛行控制技術研究
車載ATP子系統緊急制動限制速度計算
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合