?

列車自動運行迭代學習控制算法的研究

2011-08-07 08:42竇鵬飛王化深
鐵路計算機應用 2011年9期
關鍵詞:列車運行控制算法軌跡

竇鵬飛,王化深

(北京交通大學軌道交通控制與安全國家重點實驗室,北京100044)

采用先進的列車自動控制(ATC)技術,可以提高行車的密度、效率與安全性[1],列車自動運行(ATO)系統是ATC系統中用于取代司機并對列車進行自動控制的智能子系統,其功能包括列車的自動啟動、自動調速、自動停車和定點停車等。作為ATC的一個重要子系統,ATO是提高軌道交通列車運行效率、實現列車高密度運行的關鍵[2]。

ATO系統的核心技術是列車速度自動控制(ASC)算法,列車速度自動控制的主要功能是根據接收到的來自ATP的目標速度,對列車的牽引與制動實施控制。其控制目標是在有限時間區間上對給定計劃速度曲線(由ATP系統計算得到的一次模式制動曲線)進行完全跟蹤。ATO速度控制算法的性能對整個系統的效率、安全性、準時性、舒適性和節能具有重大的影響,是列車自動控制系統的關鍵技術之一[3]。

早期的ATO算法基于列車動力學模型的經驗公式,通過比例、積分、微分(PID)控制技術實現列車速度調整?;赑ID的ATO速度控制算法是目前為大部分城市軌道交通ATO系統所采用,并且具有成功應用經驗的控制算法[4~5]。許多學者后來提出各種改進的PID算法(智能型PID算法),主要是通過與其他智能控制算法結合實現對PID控制器的參數的自整定。20世紀80年代,一些學者開始嘗試將模糊控制應用到ATO中,其控制質量高于PID,并能實現多目標控制。但由于經驗不完善導致控制規則不能細化,致使模糊控制不能適應控制過程中列車動力系統參數的不斷變化。許多研究將專家系統運用到ATO中,但專家系統中專家知識仍然是移植自駕駛員的經驗,因此專家系統與模糊控制一樣無法克服因經驗不完善而帶來的控制質量的下降。

1 ATO控制器設計

1.1 迭代學習控制

在城市軌道交通實際運營中,列車在區間的運行是由運行圖及運行計劃決定的,因此是近似重復的。在重復的任務中,受控系統會表現出相似的行為,但上述PID控制算法及一些智能控制算法都未能充分利用系統在重復過程中的有用信息,不能在過去的操作中對系統知識進行學習。而迭代學習控制方法在提出之前,其創始人Arimoto就充分認識到這點,所有迭代學習控制在構造當前的控制行為時,可以學習并充分利用過去重復操作中的重要信息[6]。因而,迭代學習控制以完全跟蹤為目標,對系統的先驗知識要求較少,可用于具有強不確定性,復雜非線性的列車自動駕駛控制。

迭代學習控制的核心思想是:在具有重復性的系統中進行軌跡跟蹤時,利用前幾次操作得到的控制輸入和誤差信息修正本次跟蹤的控制輸入,使控制任務完成得更好[6~7]。

相對于PID控制,迭代學習控制器的設計需要較少的系統知識,本質上是一種無模型的控制方法,而且非常適用于像列車速度控制這種非線性控制系統。相對于其他智能控制方法如模糊控制、專家系統等,迭代學習控制通過重復操作,不斷學習并積累“控制經驗”,以保證隨著迭代次數的增加控制效果會不斷提高或保持穩定,而不需要總結人工經驗然后向控制器移植。但是,迭代學習控制應用于ATO中,必須考慮安全性要求,如果控制穩定性差,精度不足,列車速度極有可能超出限速從而觸發緊急制動停車。

在文獻[9] 中,作者將迭代學習控制應用到列車自動駕駛中,從理論上證明了系統的收斂性,仿真結果也顯示經過數次迭代后能夠保證很高的控制精度。但其算法的設計不能保證迭代初期列車運行的安全性,即列車速度會超出限速,這將引發列車實施緊急制動。在本文控制方案的設計中,將引入一些改進措施來解決這一問題。

1.2 ATO迭代學習控制算法

列車的動力學模型可以表述為[10]

在實際中,牽引力與制動力不會同時作用于列車。在不同的工作狀況下,列車的受力情況各不相同。不考慮緊急制動的情況,把列車的工況劃分為加速、動力制動(調速制動)、惰行、常用制動。在這4種工況中,牽引力Ftr(t)與主動制動力Fb(t)只有一個在起作用。

在迭代學習控制中,列車動力學模型改寫為:

在文獻[1] 和文獻[9] 中,取迭代學習控制律為uk(t)=uk-1(t)+gek-1(t)時,學習增益g只要滿足|1-g|≤γ<1,系統即收斂。然而,其迭代學習控制方案設計不能避免迭代初期因控制不穩定導致列車超速觸發緊急制動停車。

為避免迭代初期列車超速,我們提出一種新的控制方案。在迭代控制的初期,期望軌跡的設定遠低于計劃速度曲線,因此,即便列車速度會超出期望軌跡,這種冗余設計也能保證速度不會超過計劃速度曲線。隨著迭代次數的增加,設置期望軌跡接近并保持為計劃速度曲線。因為控制精度逐漸提高,期望軌跡的設置既能保證列車速度不會超出計劃速度曲線,又能保證經過一定的迭代后列車在該算法的控制下按照計劃速度曲線運行,完成控制任務。

圖1為整個迭代學習控制過程中期望軌跡的變化,前10次迭代中,期望軌跡逐漸向列車在區間運行的計劃速度曲線逼近。并且在最后10次迭代中,期望軌跡一致為計劃速度曲線。

為了實現變期望軌跡漸近跟蹤,學習律中加入期望軌跡的變化信息,并改寫為:

其中,esk(t)=sk(t)-sk-1(t),為2次迭代之間期望軌跡的變化信息。通過在學習律中加入期望軌跡的變化信息,迭代學習控制能夠響應期望軌跡的變化,并根據變化量的相關信息對列車進行額外的超前控制,更有效地控制列車,使其按新的期望軌跡運行。

圖1 迭代過程中期望軌跡的變化

期望軌跡的設置可以保證esk(t)的值隨迭代次數的增加而單調下降,并且由于期望軌跡最后與計劃速度曲線保持一致而不再變化,即

esk(t)=0,k≥m,m為一常數。

因此,期望軌跡變化信息esk(t)的加入不會改變控制的收斂性。

2 仿真結果及分析

[10] ,在仿真中,設定運行中列車單位質量所受的基本阻力rv為:

假設區間長度Ls為6 km,設置列車單位質量所受的附加阻力ws=ws+wi+wr:

列車在區間中運行的計劃速度曲線為:

與之對應的列車計劃運行軌跡為:

仿真中,學習律中的學習增益取g=0.9,gs=1,帶入式(3),得uk(t)=uk-1(t)+0.9·ek-1(t)+esk(t)。圖2顯示了仿真結果。

圖2 速度跟蹤曲線

2.1 速度跟蹤曲線

圖2為仿真得到的速度跟蹤曲線。由于在初次迭代中,設置的期望軌跡低于列車在區間的計劃速度曲線,所以在迭代學習控制下,列車速度不會超出速度曲線,從而避免出現列車超出限速觸發ATP實施緊急制動的情況。由于期望軌跡逐漸逼近計劃速度曲線,故仿真中隨著迭代次數的增加,列車的速度逐漸接近速度曲線,在第12次迭代中,列車的運行曲線與計劃速度曲線重合而且沒有超速。這一結果表明,變期望軌跡的設計可以有效地防止因控制初期的不穩定性導致列車超速觸發緊急制動停車。學習律中引入期望軌跡變化信息可以使迭代學習控制對變化的期望軌跡進行有效跟蹤,期望軌跡保持穩定后,迭代學習控制能快速地以高精度控制列車按期望軌跡運行。

2.2 位置跟蹤曲線

圖3 位置跟蹤曲線

圖3為位置跟蹤曲線,顯示了列車運行軌跡與計劃運行軌跡的關系。在迭代初期,由于較低的期望軌跡設置,列車沒有完成計劃的整個行程。隨著迭代次數的逐漸增加,計劃速度曲線成為期望軌跡,列車運行也逐漸接近計劃運行軌跡。在第12次迭代中,列車實際運行軌跡與計劃運行軌跡重合,列車完成預訂的行駛計劃。

2.3 牽引力變化曲線與列車運行加速度曲線

圖4 牽引力變化曲線與列車運行加速度曲線

迭代學習控制具有很高的平穩性,可以避免列車頻繁的加速與減速切換,保證旅行的舒適度。從圖4所示的列車牽引力變化曲線中可以看到,在列車運行過程中,牽引力沒有出現較大或者頻繁的波動,當目標速度逐漸增加或降低,列車需要進行加速或減速時,列車牽引力能夠快速響應,對列車進行加速或制動。從圖4中的列車運行過程中加速度變化曲線可以看到,在計劃速度曲線中勻速運行區段,列車的加速度能夠穩定地保持在零附近,即列車的牽引力全部用于克服列車運行基本阻力與線路附加阻力,而不會對列車產生額外的加速度或減速度。在計劃速度曲線中列車速度變化階段,加速度能夠保持恒定,不會出現震蕩。

2.4 速度跟蹤誤差與位置跟蹤誤差

圖5中的列車平均速度誤差曲線顯示,隨著迭代次數的增加,列車的速度誤差逐漸減小,經過一定的迭代之后,列車的速度誤差可以保持在零附近的水平。平均誤差結果顯示,該迭代學習算法的控制效果隨著迭代次數的增加而迅速提高,基于該算法的ATO在經過幾次學習之后能夠保證列車運行的高精度與平穩性。

圖5 速度跟蹤誤差與位置跟蹤誤差

圖5中的列車位置誤差顯示,在迭代初期,位置追蹤誤差處于較高水平,這是因為列車速度控制中期望軌跡的設置致使列車不能在有限的時間范圍內跑完一個區間全程。隨著迭代次數的增加,位置誤差迅速下降,從第11次迭代開始,由于計劃速度曲線成為期望軌跡,基于迭代學習算法的ATO能夠控制列車跑完區間全程,位置追蹤誤差降低到0附近,并維持在這一較低水平。該結果顯示,迭代初期較低的期望軌跡設置造成列車無法在計劃的時間內完成整個旅程。因此,合理的期望軌跡設計會縮短需要的迭代學習次數,同時又不會對列車的安全運行造成負面影響。

3 結束語

迭代學習控制是一種無模型控制方法,經過足夠次數的迭代學習后可以保證較高的控制精度,因此非常適用于像列車速度控制這類控制目標重復的復雜非線性系統。在本文中,我們提出了基于迭代學習的ATO控制算法來控制列車按照計劃速度曲線行車。為了避免迭代初期的控制誤差導致列車速度超出計劃速度曲線觸發ATP緊急制動停車,在迭代學習控制的初期,設置低于計劃速度曲線的期望軌跡,隨著迭代次數的增加,期望軌跡快速接近并保持為計劃速度曲線。在學習律中加入期望軌跡的變化信息,以實現迭代學習控制算法對變化期望軌跡的跟蹤。由于在一定迭代次數后期望軌跡將保持計劃速度曲線不變,故學習律中期望軌跡變化信息的加入不會改變系統在迭代方向上的收斂性。

仿真結果表明,在迭代學習的初期,列車運行速度不會超出計劃速度曲線,從而可以有效避免緊急制動停車的發生。隨著迭代次數的增加,列車的運行速度曲線逐漸接近并最終與計劃速度曲線重合,列車的運行軌跡也與計劃運行軌跡一致。仿真得到的速度追蹤誤差和位置追蹤誤差也顯示:隨著迭代次數的增加,列車的速度誤差與位置誤差快速接近并保持在零水平。因此,本文提出的迭代學習算法在列車自動運行控制中具有良好的控制能力,可以保證列車運行的高精度、高平穩性與高安全性。

參考文獻:

[1] 唐濤,黃良驥. 列車自動駕駛系統控制算法綜述[J] . 鐵道學報,2003,25(2): 98-102.

[2] 黃良驥,唐濤.地鐵列車自動運行系統的分析與設計[J] .城市軌道交通研究,2003,6(2):51-55.

[3] 陳榮武,劉 莉,諸昌鈐. 基于CBTC的列車自動駕駛算法[J] . 計算機應用,2007,27 (11):2649-2651.

[4] 劉賀文,趙海東,賈利民. 列車運行自動控制(ATO)算法的研究[J] . 中國鐵道科學,2000,21(4):38-43.

[5] 劉海東,毛寶華,丁 勇,和天健.列車自動駕駛仿真系統算法及其實施研究[J] .系統仿真學報,2005,17(3):577-580.

[6] 許建新,侯忠生.學習控制的現狀與展望[J] .自動化學報,2005,31(6): 943-955.

[7] 李仁俊,韓正之. 迭代學習控制綜述[J] . 控制與決策,2005,20(9):961-966.

[8] 池榮虎,侯忠生,于 鐳,隋樹林. 高階無模型自適應迭代學習控制[J] . 控制與決策,2008,23(7):795-798.

[9] Yi Wang, Zhongsheng Hou, Xingyi Li, A Novel Automatic Train Operation Algorithm Based on Iterative Learning Control Theory[C] . IEEE International Conference on Service Operations and Logistics, and Informatics, Beijing, 2008: 1766-1770.

[10] 中華人民共和國鐵道部.列車牽引計算規程[Z] . 北京:中國鐵道出版社,1999.

猜你喜歡
列車運行控制算法軌跡
改善地鐵列車運行舒適度方案探討
軌跡
軌跡
紡織機械手專利瞄準控制算法
CBTC系統列車運行間隔控制仿真研究
軌跡
基于ARM+FPGA的模塊化同步控制算法研究
進化的軌跡(一)——進化,無盡的適應
列車運行控制系統技術發展趨勢分析
相同徑路的高速列車運行圖編制方法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合