?

間歇過程的批內自優化控制

2022-12-03 14:31葉凌箭
自動化學報 2022年11期
關鍵詞:設定值被控間歇

葉凌箭

化工過程普遍存在不確定性,如何采用有效的優化方法找到不確定條件下系統的真實最優點,對提高化工企業的經濟效益發揮著關鍵作用[1].大規?;み^程的控制系統通常為分層遞階結構[2-3],控制層(下層)的主要任務是抑制底層擾動,跟蹤優化層傳遞來的被控變量設定值,優化層(上層)根據調度層(頂層)傳達的生產任務指標等,對當前工況進行識別,執行相應的優化算法計算出最優設定值,傳遞給控制層執行.

優化層執行的優化算法通常以化工過程的非線性模型為基礎,以傳統的“二步法” 實時優化[4-5]為例,首先確定模型的不確定參數,運行過程中采集系統的輸出量數據,對未知參數進行估計,再基于更新的系統模型進行重優化,計算出被控變量的最優設定值后傳遞給控制層.這一過程通常還需要結合數據調和、穩態檢測等技術手段加強優化結果的可靠性,工業過程的優化周期一般為4~8 小時.針對傳統的“二步法”的缺點,近年來涌現出了新的實時優化方法,如Bonvin 課題組提出的修正項自適應方法(Modifier adaptation)[6-7],通過對標稱模型的約束及梯度進行修正,即使不估計擾動參數也能收斂到真實最優點.文獻[8-10]考慮運行層之間的不同時間尺度,提出了數據驅動的多速率分層運行優化控制方法,基于Q 學習對基礎控制回路的設定值進行在線優化,使運行層能更好地優化控制性能指標.自優化控制(Self-optimizing control,SOC)[11-13]提出通過離線選擇控制層的被控變量,設定值則在線保持不變,提供了實時優化的另一種研究思路.在自優化控制中,被控變量可以是常規物理量的函數,即構造虛擬量進行控制,可使系統的操作變量可以在不確定性下進行自尋優.當底層控制的優化作用較強時(經濟損失可接受),甚至可以省略單獨的優化層,從而簡化控制系統.相比傳統的優化方式,自優化控制的優化在工作頻率為秒/分的反饋控制中完成,因此優化速度得到大幅度提升,在一系列研究中表現出良好的效果[14-17].

間歇過程是一類批次加工的化工過程,具有規模小、靈活性高的特點,在需求多元化的現代市場中應用越來越廣泛.相比連續化工過程,間歇過程具有“多重時變”的操作特征[18-19].一方面,間歇過程具有重復特性,可以引入學習機制從歷史批次的數據中提煉出有用的信息,改進后續批次的跟蹤控制和經濟指標優化,典型的如迭代學習控制[18,20-23]、批間實時優化[23-24]等控制和優化技術.另一方面,由于其時變特性,間歇過程在批次內無穩定操作點,相比連續過程的控制和穩態優化更具挑戰[25-27].自優化控制經過近20 年的發展,針對連續過程已報道了一系列被控變量求解方法[12,28-31],但是針對需動態優化的間歇過程仍缺乏足夠的研究.值得注意的是,由于從批間角度看間歇過程是一個靜態過程[32],近年來文獻[33-34]提出了間歇過程的批間自優化控制方法.此類方法僅利用了間歇過程的重復性,基于已有的靜態自優化控制方法求解被控變量,然后設計批間控制器調節輸入軌跡,逐批次將被控變量控制于恒定設定點,實現實時優化.但批間優化本質上還是靜態方法,由于需要若干個批次才能實現被控變量的跟蹤控制,優化作用慢,因此未充分發揮自優化控制的優勢.此外,批間優化只對具有重復特性的擾動具有效果,當系統受到高頻擾動作用時,批間控制器難以實現有效的實時優化.

最近,Ye等[35]提出了一種針對間歇過程的動態自優化控制方法,通過考慮批內變量的因果性,最終得到了具有優化作用的控制律.設計控制系統時,選擇被控變量和設計控制器通常是兩個獨立任務[36],前者主要考慮經濟指標的優化,后者關注于如何更好地跟蹤控制被控變量,保證控制系統的穩定性和魯棒性.如何在此前提下求解批內被控變量,仍是一個開放的課題.

本文研究了間歇過程的批內自優化控制問題,貢獻如下:1)基于自優化控制策略提出以輸出變量的線性組合為被控變量(虛擬變量),在批次運行過程中對其進行跟蹤控制,以控制手段實現實時優化;2)根據是否在過程不同階段切換被控變量,給出了兩種自優化控制策略,對每種策略又分別給出了兩種設定軌線選取方案;3)引入擴張組合矩陣,將這些情形統一描述為具有不同結構約束的最優組合矩陣求解問題,并推導得到了其中一種方案的解析解計算方法.目前為止,本文所提方法在國內外文獻中未見報道.

1 連續過程的自優化控制

對連續化工過程,考慮如下靜態優化問題

其中,J為經濟指標,分別是操縱變量、擾動變量和測量變量,g和gin為輸出變量的模型函數和約束條件.

擾動變量d變化且在線不可測是化工過程偏離最優點的主要原因.當擾動變量d變化時,式(1)的解是d的函數,不妨記為uopt(d).實時優化的任務是在d未知的前提下,尋找到新的最優值uopt,實現過程的最優操作.自優化控制(SOC)通過構造虛擬的被控變量c=Hy,當反饋控制器將c控制在恒定設定值cs上時,控制器輸出能自動逼近當前的實際最優值uopt(d). 當組合矩陣H每行有且只有一個1,其余為0 時,c為輸出變量y的子集,此時退化為傳統的以單變量為被控變量的情形.更一般的情況下,H中的非零元素提供了更多優化自由度,可提高系統的閉環經濟性能.例如,假設系統自由度nu=2,y=[T P cA]T,包括溫度T,壓力P和物質A的濃度cA,考慮兩種情況:

H1對應的被控變量c=H1y為T和cA(單個物理量),H2的被控變量為3 個物理量的線性組合.顯然,前者為后者的一種特殊形式.

為求解一般情形的最優組合矩陣H,研究人員針對不同過程特性和衡量標準提出了求解方法[12,28-31].以一種針對線性系統的局部法(Exact local method)為例[28],首先定義損失函數L

對給定的d,將J(u,d)在最優點uopt處進行二階泰勒展開

引理1[35].Lav(H)=Lav(QH),其中Q為任意nu維非奇異方陣.

引理1 表明,式(9)的解非唯一(因為控制c=Hy和c=QHy等效).利用該特性,可以先求解出式(9)的一個特解,再推廣至通解形式.文獻[24]給出了最優H的一個特解,即

2 間歇過程的自優化控制

2.1 間歇過程優化

考慮一類帶不確定參數的間歇過程優化問題

對式(11)所示的動態優化問題,通??梢曰跀抵捣▽⑵浣茷殡x散化的非線性規劃(Non-linear programming,NLP)問題[37]

式中,N為間歇過程在操作區間[ 0,tf] 內的離散段數,代表離散后的非線性狀態方程和輸出方程.

對上述間歇過程的優化問題,文獻[27-28]提出了批間自優化控制方法,即構造被控變量c=Hy,利用間歇過程的重復特性逐批次將c控制在恒設定值上.從批間角度看,間歇過程是一個靜態過程,因此第1 節中針對連續過程的被控變量求解方法可以較為直接地拓展至間歇過程.但批間優化需要經歷若干批次實現被控變量的控制,優化速度較慢.并且,若擾動的變化頻率較高(如非重復性擾動),則難以實現被控變量的跟蹤控制,優化效果有限.

2.2 批內自優化控制策略

本文研究間歇過程的批內自優化控制方法,即在單批次中控制被控變量實現實時優化.與批間優化相比,批內優化的響應速度更快,能提高優化效果.由于跟蹤控制在單批次內完成,批內優化能應對非重復性擾動.對被控變量c=Hy及其設定值cs,考慮如下幾種策略:

策略1.H和cs保持恒定;

策略2.H恒定,cs時變;

策略3.H和cs均時變.

策略1 為連續過程中采用的自優化控制方法,對具有時變特性的間歇過程,一般難以取得理想效果.策略2 采用恒定被控變量,其設定值為動態軌線,較策略1 更適合間歇過程.策略3 進一步考慮具有切換結構的控制系統,對離散化的間歇過程,在 [ti,ti+1)時間段內控制一組新的被控變量,如圖1 所示.

圖1 間歇過程的離散化變量及自優化控制策略Fig.1 Discretization of batch processes and self-optimizing control strategy

結合間歇過程的時變特性,本文主要研究策略2 和策略3的被控變量求解問題.對此,引入如下假設條件:

可以看到,方案1 中被控變量的設定軌線固定不變.而方案2的被控變量設定軌線在當前批次運行過程中不斷利用測量值進行修正.相比方案1,方案2 更加充分地利用了過程信息,理論上能進一步提高優化效果,但需求解額外的決策變量H′(i),i=1,···,N.

為推導這兩種方案中損失函數與組合矩陣H之間的關系,定義如下超向量

與策略2 相比,策略3 中兩種方案的組合矩陣H是時變的,即需求取N個組合矩陣H(i),i=1,···,N.同理,對策略3 求解如下最優化問題

從以上分析看到,對不同的控制策略和設定值選取方案,可以統一歸結為具有不同結構的擴張組合矩陣的求解問題,可以在優化問題中對施加等式約束實現.一般來說,具有特定結構的組合矩陣難以求得閉合解,需使用數值優化算法.

注1.以上提出的4 種被控變量選擇方案,從控制角度看,執行策略2 (方案1)最簡單,但優化效果可能較差;策略3 (方案4)理論上的優化效果最好,但被控變量需要不斷切換,并且設定軌線也要在線修正.針對具體過程,需結合過程特性和優化性能結果綜合考慮這兩個因素,選擇最合理的自優化控制方案.

2.3 策略3 (方案4)的解析解

下面提出一種針對策略3 (方案4)的閉合解求解方法.如式(19)所示,此時為塊下三角矩陣.為表述方便,將式(19)所示的表達式記為

通過合理利用轉化矩陣Q,定理1 將目標函數及約束條件分解到每個離散時間節點,能夠沿時間軸依次求解出子矩陣(i). 對?i=1,···,N,求解如下優化問題

式(26)為帶等式約束的二次型凸優化問題,可進一步求得解析解.

定理 2.對式(26)所示的帶等式約束的二次型凸優化問題,其閉合解為

證明.式(26)在形式上與第1 節靜態自優化控制問題一致,閉合解(27)的推導過程可參見文獻[28].□

綜上,本文求取最優擴張組合矩陣的計算步驟如圖2 所示,其中策略3 (方案4)可直接應用定理2 求得閉合解,其他3 種情況則需使用數值優化法求取.由于目標函數Lav是的非線性函數,優化問題(17)和(20)不能保證得到全局最優解.對此,策略3 (方案4)得到的解析解可作為數值優化的初始解進行尋優.

圖2 最優擴張組合矩陣 的求解步驟Fig.2 Procedure for solving the optimal extended combination matrix

3 仿真研究

3.1 間歇反應器描述

本節研究一個帶副反應的間歇反應器,主副反應分別為A+B →C和 2B →D,其中反應物A在初始時刻投放完畢,B在反應過程中實時投放,實時流量為操縱變量u(t).體系的模型方程為

式中,cX表示物料X的濃度,V為持液量,其他符號含義及標稱值列于表1.

表1 間歇反應器參數及標稱值Table 1 Parameters for the reactor model and nominal values

操作目標為在 [ 0,tf] 操作時段內最大化產物產量C的同時減少副產物D,即表示為如下優化問題

在表1 所示的標稱工況下,使用數值優化方法求解式(33)可得到u(t)的最優輸入軌跡(圖3).可以看到,此時u(t)整個軌線處于可行域內,最優值Jopt=0.271687 mol.反應常數k1和k2為不確定擾動,變化范圍為其標稱值的±40%.當k1和k2變化時,u(t)的最優輸入軌跡隨之改變.

圖3 標稱點的最優輸入軌跡Fig.3 Optimal input trajectory at the nominal point

4 被控變量計算示例

為更清晰地闡述本文方法,以N=2 為例(即[0,tf]被均勻離散為兩段),介紹如何使用第2 節中的方法求解不同被控變量.離散后的優化變量個數=2,對式(33)進行重優化后得到Hessian 矩陣和V矩陣

考慮使用cA和cB構造被控變量,對離散系統進行線性化,得到

其中,測量變量=[yT(0)yT(1)yT(2)]為cA、cB分別在0,125 min 及250 min 時刻的量組成.得到上述矩陣后,可以構造式(17)和式(20)所示的優化問題來求解被控變量,結果如下.

1)策略2 (方案1):H=[-0.0026 0.0035],即整個時間段內都控制被控變量c(t)=-0.0026cA+0.0035cB. 經計算,前125 min的設定值為cs(1)=-0.000303,后125 min的設定值為cs(2)=-0.000059.

2)策略2 (方案2):求解得到的擴張組合矩陣為

4.1 批內自優化控制效果

由于N=2 難以逼近整個間歇操作過程,后文設置N=20 并以相同的方法重新求解被控變量,同時,在測量變量中加入體積變量V提高優化效果.從表2 可觀察到:

表2 損失函數LavTable 2 Loss functionLav

1)4 種方案的損失Lav在N=20 時,相比N=2都大幅度降低;

2)策略2 (方案1)的損失函數為0.0083,策略2 (方案2)通過在線設定值修正,進一步將損失減少到0.0024;

3)策略3 (方案3)的損失為0.0069,略低于策略2 (方案1);

4)策略2 (方案3)的損失為 0.0024,與策略3(方案4)的損失0.0022 很接近,表明不切換被控變量也能得到較好的優化控制效果.

基于表2的結果,策略2 (方案2)與策略3 (方案4)效果接近,但前者無需在線切換被控變量,更易于在線控制,因此考慮使用策略2 (方案2)對該反應器進行批內自優化控制.此外,動態仿真中將與策略2 (方案1)的結果進行對比,有助于進一步理解本文方法.

策略2 (方案1)的被控變量為c1(t)=0.0062cA+0.002cB+0.0831V,設定值軌線如圖4 所示.為進一步獲取平滑的設定值軌線,使操作更為平穩,對這些離散點進行回歸分析,得到平滑的設定值軌跡方程cs(t)=0.0877+3.705×10-5t-1.97×10-8t2,為一條隨時間t變化的連續曲線,如圖4 所示.對該系統可以采用普通的PI 控制器對被控變量c1(t)進行跟蹤控制.

圖4 策略2 (方案1)的設定值軌線Fig.4 Setpoint trajectory for Strategy 2 (Scheme 1)

策略2 (方案2)的被控變量為c2(t)=0.0026cA+0.00032cB+0.0830V,設定值軌線在每批次運行過程中采集測量值進行在線修正.為增強操作平穩性,在tk時刻計算得到tk+1時刻的設定點后,在[tk,tk+1]時間段內設置斜坡形設定值軌線,使設定軌線維持連續性.同樣使用PI 控制器跟蹤控制得到的被控變量c2(t).

不確定參數k1和k2分別改變 +20%和 -20%時的優化控制效果如圖5 所示,從圖5(a)中可以看到,兩種方法分別對c1(t)和c2(t)都實現了較好的閉環跟蹤控制,其中,c2(t)的設定軌線根據批內采集到的測量值進行了調整,相比自身的標稱軌線有一定程度的上移;圖5(b)顯示不同方法的控制輸入u(t)軌跡,其中,控制c1(t)時的u(t)軌跡相比標稱操作更靠近當前工況真實的最優軌線,性能指標J有所提高 (J=0.34374→0.34505),顯示出一定的優化控制效果.控制c2(t)時的u(t)軌跡更靠近最優軌線,其性能指標J=0.34701和最優值Jopt=0.34755差別不大.同時注意到控制c2(t)時的u(t)軌跡振蕩更加劇烈,這是因為c2(t)的設定軌線不斷在線修正,為了得到滿意的控制效果,使用了高增益PI 控制器 (Kp=20).這并不影響最終得到滿意的優化效果 (L=0.00054),從另一個角度說明了間歇過程中控制關鍵變量的重要性.

圖5 批內自優化控制效果 ( k1 :+20%,k2 :-20%)Fig.5 Within-batch self-optimizing performance ( k1 :+20%,k2 :-20%)

不確定參數k1和k2分別改變 -40%和 +40%時的優化控制效果如圖6 所示,此時系統的不確定性向另一個方向變化,并且幅度更大.從圖6(a)中可以看到,兩種方法同樣對c1(t)和c2(t)都實現了較好的閉環跟蹤控制,其中,c1(t)的設定軌線不變,而c2(t)的設定軌線相比自身的標稱軌線有一定程度的下移.從圖6(b)來看,雖然控制c1(t)能將u(t)軌跡向著真實的最優軌線的方向調節,其性能指標J從標稱操作的0.09646 提高到0.10312,但作用有限,距離最優值Jopt=0.12252 仍有較大差距.控制c2(t)進一步提高了優化控制效果,其性能指標為J=0.11602,相比最優性能只有0.006的損失(此時k1,k2的變化較大,該損失在一定程度上由系統的非線性導致).此外,控制c2(t)時的u(t)軌跡同樣振蕩較為劇烈,但隨反應進行,u(t)大致圍繞著最優軌線上下波動.

圖6 批內自優化控制效果 ( k1 :+40%,k2 :-40%)Fig.6 Within-batch self-optimizing performance ( k1 :+40%,k2 :-40%)

表3 進一步統計了100 組隨機擾動下各方法的非線性損失,其中隨機擾動 [k1k2] 均勻分布在各自的變化范圍.可以看到,相比標稱操作(平均損失0.0036)和以單變量cB(平均損失0.0042)為被控變量的情形,兩種批內自優化控制方法有效提高了經濟性能,其中,策略2 (方案1)中控制c1(t)將平均損失減少到0.0026,策略2 (方案2)中控制c2(t)進一步將平均損失減少到0.0007,幾乎可以忽略不計.此外,最大損失和標準差等統計量也呈現出相同的變化趨勢,如表3 所示.

表3 100 組隨機擾動下的非線性損失統計量Table 3 Statistics of nonlinear losses for 100 groups of random disturbances

5 結束語

本文研究了間歇過程的批內自優化控制問題,在單批次運行過程中控制一組虛擬的被控變量(輸出變量的線性組合),實現間歇過程的實時優化.對此,給出了兩種自優化控制策略(被控變量恒定但設定值時變;被控變量和設定值均時變).對它們的設定值選取問題又分別提出兩種方案(設定值軌線固定不變;設定值軌線在線修正),共計4 種方法.通過引入擴張組合矩陣,將這4種方法統一描述為具有不同結構約束的最優求解問題,并推導得到了策略3(方案4)的解析解計算方法(定理2).

本文提出的4 種被控變量選擇方法,其對應的閉環控制系統具有不同的復雜度和優化性能.針對一般的實際間歇過程,應綜合考慮這兩個因素并取得合理權衡.間歇反應器的仿真研究中,采用策略2(方案2)(恒定被控變量:c2(t))得到的控制結構較為簡單,并且能通過在線修正c2(t)的設定值增強優化效果,是較為合理的方案.

猜你喜歡
設定值被控間歇
中年女性間歇習練太極拳的強度、能量消耗與間歇恢復探究分析
間歇供暖在散熱器供暖房間的應用
冷軋鍍鋅光整機延伸率控制模式的解析與優化
間歇俯臥位通氣在新生兒呼吸窘迫綜合征中的應用效果
靖邊畔溝長6油層采油制度效益研究
港警在“修例風波”中拘捕近萬人
PID 控制在水電廠有功調節的應用
西氣東輸二線人機交互界面的防呆系統
目標設定值傳感器的原理與檢修
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合