帶有終端約束的線性二次最優(yōu)控制問題①

2022-06-14 00:52常紹敏丁翊珊邱潔王燕青

西南師范大學(xué)學(xué)報(bào)（自然科學(xué)版） 2022年5期

常紹敏，丁翊珊，邱潔，王燕青

西南大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院，重慶 400715

經(jīng)過半個(gè)多世紀(jì)的發(fā)展，線性二次最優(yōu)控制問題(LQ問題)被廣泛研究[1-2]．但是，已有的結(jié)果大多是系統(tǒng)的狀態(tài)和控制都不帶有任何約束，同時(shí)現(xiàn)有的算法的收斂速度也鮮有涉及．近期，文獻(xiàn)[3]考慮了帶終端約束的隨機(jī)系統(tǒng)的LQ問題，研究了該問題的可解性問題．本文是在文獻(xiàn)[3-4]的基礎(chǔ)上研究一類帶有終端約束的確定系統(tǒng)的LQ問題，并給出了數(shù)值計(jì)算方法，最后通過具體例子驗(yàn)證了數(shù)值方法的有效性．

1 預(yù)備知識(shí)

本文考慮以下狀態(tài)方程：

(1)

性能指標(biāo)為

其中：T>0，A∈Rn×n，B∈Rn×m，Q∈Rn×n，R∈Rm×m．

經(jīng)典的LQ問題為：對(duì)于受控系統(tǒng)(1)，在平方可積的控制函數(shù)空間中，尋找最優(yōu)控制，極小化二次性能指標(biāo)J(·)．但在實(shí)際問題中，控制函數(shù)通常帶有一定的約束．本文中考慮使得系統(tǒng)狀態(tài)達(dá)到特定目標(biāo)的控制集，即狀態(tài)帶有終端約束的LQ問題．對(duì)于狀態(tài)的預(yù)期目標(biāo)xT∈Rn，定義控制函數(shù)類

U∶= {u(·)∈L2(0，T； Rm)|x(T；x0，u(·))=xT}

帶終端約束的LQ問題(簡記為CLQ問題)描述如下：

對(duì)于給定的x0，xT∈Rn，尋找控制u*(·)∈U，使得

(2)

如果滿足(2)式的u*(·)存在，則其被稱為CLQ問題的最優(yōu)控制，相應(yīng)的狀態(tài)x*(·)∶=x(·；x0，u*(·))被稱為最優(yōu)狀態(tài)， (x*(·)，u*(·))被稱為最優(yōu)對(duì)．上述問題稱為帶有終端約束的線性二次最優(yōu)控制問題(簡稱為CLQ問題)．

為了保證控制集U的非空性和CLQ問題的可解性，我們?cè)诒竟ぷ髦凶魅缦录僭O(shè)：

(A) 系統(tǒng)(1)在區(qū)間[0，T]上精確能控，即Rank(B，AB， …，An-1B)=n；Q為半正定矩陣，R為正定矩陣．

引理1系統(tǒng)(1)在[0，T]上精確能控的充要條件為系統(tǒng)(1)的Gram矩陣Ψ(0，T)可逆，其中

Φ(·)滿足

2 主要定理

采用拉格朗日乘子法，我們首先將CLQ問題轉(zhuǎn)化為無約束的LQ問題．引入拉格朗日泛函：

Jλ(u(·))=J(u(·))+2〈λ，x(T)〉

其中x(T)： =x(T；x0，u(·))為系統(tǒng)(1)的狀態(tài)在t=T處的值．對(duì)于給定的λ，無約束的LQ問題即(LQ)λ問題為：

利用引理2，求解CLQ問題的最優(yōu)控制，就可以轉(zhuǎn)化為求解如下兩個(gè)子問題：

(1) (LQ)λ問題的最優(yōu)控制問題；

對(duì)于(LQ)λ問題的可解性，有如下定理．

(4)

證(LQ)λ問題唯一可解性可以用文獻(xiàn)[1]第七章定理2.1的方法得到．現(xiàn)在證明定理的剩余部分．

我們記

由ε的任意性，可得

(5)

另一方面，由方程組(4)容易得到

兩邊積分，從而

(6)

由(5)式和(6)式可得

又由u(·)的任意性，得到

定理1給出了最優(yōu)控制的開環(huán)表示，而在應(yīng)用中，人們更希望給出閉環(huán)表示，即狀態(tài)反饋形式．接下來，我們就研究CLQ問題的閉環(huán)表示．我們引入Riccati方程：

(7)

和兩個(gè)常微分方程(簡稱ODE)：

(8)

(9)

關(guān)于方程(7)，(8)，(9)的適定性，讀者可以參考文獻(xiàn)[1，5]．

其中φ(·)，yλ(·)分別是方程(8)，(9)的解．

證設(shè)x(·)是如下ODE的解

(10)

(11)

利用方程(7)-(9)，我們可以得到

下面引入輔助系統(tǒng)

(12)

引理4系統(tǒng)(12)在[0，T]上精確能控的充要條件是系統(tǒng)(1)在[0，T]上精確能控．

通過引入

引理5P(T)是正定矩陣．

進(jìn)一步對(duì)兩邊在[0，T]上積分，有

從而

現(xiàn)在我們可以綜合前面的結(jié)果，得到CLQ問題的可解性．

3 最優(yōu)控制的計(jì)算方法

根據(jù)定理3，可以得到CLQ問題的基于狀態(tài)反饋的最優(yōu)對(duì)的計(jì)算方法．具體計(jì)算步驟如下：

1) 選取最優(yōu)參數(shù)λ*．

①解得Riccati方程(7)和ODE(8)的解P(·)，φ(·)．

②求解最優(yōu)參數(shù)λ*=P-1(T)(φ(T)-xT)．

2) 解得最優(yōu)參數(shù)λ*所對(duì)應(yīng)ODE(9)的解yλ*(·)．

現(xiàn)在，我們通過一個(gè)具體的例子，利用上述計(jì)算方法，得到CLQ問題的最優(yōu)對(duì)．

解：將條件數(shù)據(jù)代入Riccati方程(7)得其精確解為

由ODE(8)解得

φ(t)=0

進(jìn)而可以計(jì)算最優(yōu)參數(shù)：

再由ODE(9)解得

最后可以計(jì)算最優(yōu)對(duì)為

由例1可知，即便對(duì)于1維系統(tǒng)，要求解CLQ問題仍然十分復(fù)雜，這就促使我們研究上述計(jì)算方法的數(shù)值算法．接下來我們上述的計(jì)算方法給出數(shù)值計(jì)算的版本，首先將時(shí)間區(qū)間[0，T]均分為N份，即有

0=t0

CLQ問題數(shù)值算法：

Λ=diag{μ1，μ2， …，μm0， 0， …， 0}，μi>0，i=1，2，…，m0

定義

2) 選取最優(yōu)參數(shù)λ*的近似值λ．

①求解Riccati方程(7)如下：

采用Euler方法求解ODE(8)，得到其數(shù)值解φi，i=0，1，…，N．

②求解近似最優(yōu)參數(shù)λ

3) 利用Euler方法求解近似最優(yōu)參數(shù)λ所對(duì)應(yīng)ODE(9)，得到其數(shù)值解yi，i=0，1，…，N．

4) 求解近似最優(yōu)對(duì)(xi，ui)，i=0，1，…，N：

xi=Piyi+φi，ui=R-1BTyi

取N=25，用數(shù)值算法得到例1的數(shù)值解，和精確解的比較見圖1．

圖1 精確解與離散方程解的對(duì)比

圖2 Riccati方程與最優(yōu)對(duì)離散化計(jì)算方法的收斂性

4 結(jié)論

本文利用參數(shù)選擇的方法對(duì)帶有終端約束的LQ問題給出了可解性的理論結(jié)果，同時(shí)基于最優(yōu)控制的閉環(huán)表示給出了計(jì)算最優(yōu)對(duì)的數(shù)值算法．與基于開環(huán)表示的確定/隨機(jī)系統(tǒng)的LQ問題算法相比，本文算法的優(yōu)勢(shì)在于：避免了條件數(shù)學(xué)期望的計(jì)算，避免使用梯度下降法等算法[6-10]，從而大大減少了計(jì)算量．

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

帶有終端約束的線性二次最優(yōu)控制問題①

1 預(yù)備知識(shí)

2 主要定理

3 最優(yōu)控制的計(jì)算方法

4 結(jié)論