常紹敏, 丁翊珊, 邱潔, 王燕青
西南大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院, 重慶 400715
經(jīng)過半個(gè)多世紀(jì)的發(fā)展, 線性二次最優(yōu)控制問題(LQ問題)被廣泛研究[1-2]. 但是, 已有的結(jié)果大多是系統(tǒng)的狀態(tài)和控制都不帶有任何約束, 同時(shí)現(xiàn)有的算法的收斂速度也鮮有涉及. 近期, 文獻(xiàn)[3]考慮了帶終端約束的隨機(jī)系統(tǒng)的LQ問題, 研究了該問題的可解性問題. 本文是在文獻(xiàn)[3-4]的基礎(chǔ)上研究一類帶有終端約束的確定系統(tǒng)的LQ問題, 并給出了數(shù)值計(jì)算方法, 最后通過具體例子驗(yàn)證了數(shù)值方法的有效性.
本文考慮以下狀態(tài)方程:
(1)
性能指標(biāo)為
其中:T>0,A∈Rn×n,B∈Rn×m,Q∈Rn×n,R∈Rm×m.
經(jīng)典的LQ問題為: 對(duì)于受控系統(tǒng)(1), 在平方可積的控制函數(shù)空間中, 尋找最優(yōu)控制, 極小化二次性能指標(biāo)J(·). 但在實(shí)際問題中, 控制函數(shù)通常帶有一定的約束. 本文中考慮使得系統(tǒng)狀態(tài)達(dá)到特定目標(biāo)的控制集, 即狀態(tài)帶有終端約束的LQ問題. 對(duì)于狀態(tài)的預(yù)期目標(biāo)xT∈Rn, 定義控制函數(shù)類
U∶= {u(·)∈L2(0,T; Rm)|x(T;x0,u(·))=xT}
帶終端約束的LQ問題(簡記為CLQ問題)描述如下:
對(duì)于給定的x0,xT∈Rn, 尋找控制u*(·)∈U, 使得
(2)
如果滿足(2)式的u*(·)存在, 則其被稱為CLQ問題的最優(yōu)控制, 相應(yīng)的狀態(tài)x*(·)∶=x(·;x0,u*(·))被稱為最優(yōu)狀態(tài), (x*(·),u*(·))被稱為最優(yōu)對(duì). 上述問題稱為帶有終端約束的線性二次最優(yōu)控制問題(簡稱為CLQ問題).
為了保證控制集U的非空性和CLQ問題的可解性, 我們?cè)诒竟ぷ髦凶魅缦录僭O(shè):
(A) 系統(tǒng)(1)在區(qū)間[0,T]上精確能控, 即Rank(B,AB, …,An-1B)=n;Q為半正定矩陣,R為正定矩陣.
引理1系統(tǒng)(1)在[0,T]上精確能控的充要條件為系統(tǒng)(1)的Gram矩陣Ψ(0,T)可逆, 其中
Φ(·)滿足
采用拉格朗日乘子法, 我們首先將CLQ問題轉(zhuǎn)化為無約束的LQ問題. 引入拉格朗日泛函:
Jλ(u(·))=J(u(·))+2〈λ,x(T)〉
其中x(T): =x(T;x0,u(·))為系統(tǒng)(1)的狀態(tài)在t=T處的值. 對(duì)于給定的λ, 無約束的LQ問題即(LQ)λ問題為:
利用引理2, 求解CLQ問題的最優(yōu)控制, 就可以轉(zhuǎn)化為求解如下兩個(gè)子問題:
(1) (LQ)λ問題的最優(yōu)控制問題;
對(duì)于(LQ)λ問題的可解性, 有如下定理.
(4)
證(LQ)λ問題唯一可解性可以用文獻(xiàn)[1]第七章定理2.1的方法得到. 現(xiàn)在證明定理的剩余部分.
我們記
由ε的任意性, 可得
(5)
另一方面, 由方程組(4)容易得到
兩邊積分, 從而
(6)
由(5)式和(6)式可得
又由u(·)的任意性, 得到
定理1給出了最優(yōu)控制的開環(huán)表示, 而在應(yīng)用中, 人們更希望給出閉環(huán)表示, 即狀態(tài)反饋形式. 接下來, 我們就研究CLQ問題的閉環(huán)表示. 我們引入Riccati方程:
(7)
和兩個(gè)常微分方程(簡稱ODE):
(8)
(9)
關(guān)于方程(7),(8),(9)的適定性, 讀者可以參考文獻(xiàn)[1,5].
其中φ(·),yλ(·)分別是方程(8),(9)的解.
證設(shè)x(·)是如下ODE的解
(10)
(11)
利用方程(7)-(9), 我們可以得到
下面引入輔助系統(tǒng)
(12)
引理4系統(tǒng)(12)在[0,T]上精確能控的充要條件是系統(tǒng)(1)在[0,T]上精確能控.
通過引入
引理5P(T)是正定矩陣.
進(jìn)一步對(duì)兩邊在[0,T]上積分, 有
從而
現(xiàn)在我們可以綜合前面的結(jié)果, 得到CLQ問題的可解性.
根據(jù)定理3, 可以得到CLQ問題的基于狀態(tài)反饋的最優(yōu)對(duì)的計(jì)算方法. 具體計(jì)算步驟如下:
1) 選取最優(yōu)參數(shù)λ*.
①解得Riccati方程(7)和ODE(8)的解P(·),φ(·).
②求解最優(yōu)參數(shù)λ*=P-1(T)(φ(T)-xT).
2) 解得最優(yōu)參數(shù)λ*所對(duì)應(yīng)ODE(9)的解yλ*(·).
現(xiàn)在, 我們通過一個(gè)具體的例子, 利用上述計(jì)算方法, 得到CLQ問題的最優(yōu)對(duì).
解: 將條件數(shù)據(jù)代入Riccati方程(7)得其精確解為
由ODE(8)解得
φ(t)=0
進(jìn)而可以計(jì)算最優(yōu)參數(shù):
再由ODE(9)解得
最后可以計(jì)算最優(yōu)對(duì)為
由例1可知, 即便對(duì)于1維系統(tǒng), 要求解CLQ問題仍然十分復(fù)雜, 這就促使我們研究上述計(jì)算方法的數(shù)值算法. 接下來我們上述的計(jì)算方法給出數(shù)值計(jì)算的版本, 首先將時(shí)間區(qū)間[0,T]均分為N份, 即有
0=t0 CLQ問題數(shù)值算法: Λ=diag{μ1,μ2, …,μm0, 0, …, 0},μi>0,i=1,2,…,m0 定義 2) 選取最優(yōu)參數(shù)λ*的近似值λ. ①求解Riccati方程(7)如下: 采用Euler方法求解ODE(8), 得到其數(shù)值解φi,i=0,1,…,N. ②求解近似最優(yōu)參數(shù)λ 3) 利用Euler方法求解近似最優(yōu)參數(shù)λ所對(duì)應(yīng)ODE(9), 得到其數(shù)值解yi,i=0,1,…,N. 4) 求解近似最優(yōu)對(duì)(xi,ui),i=0,1,…,N: xi=Piyi+φi,ui=R-1BTyi 取N=25, 用數(shù)值算法得到例1的數(shù)值解, 和精確解的比較見圖1. 圖1 精確解與離散方程解的對(duì)比 圖2 Riccati方程與最優(yōu)對(duì)離散化計(jì)算方法的收斂性 本文利用參數(shù)選擇的方法對(duì)帶有終端約束的LQ問題給出了可解性的理論結(jié)果, 同時(shí)基于最優(yōu)控制的閉環(huán)表示給出了計(jì)算最優(yōu)對(duì)的數(shù)值算法. 與基于開環(huán)表示的確定/隨機(jī)系統(tǒng)的LQ問題算法相比, 本文算法的優(yōu)勢(shì)在于: 避免了條件數(shù)學(xué)期望的計(jì)算, 避免使用梯度下降法等算法[6-10], 從而大大減少了計(jì)算量.4 結(jié)論