耿曉琦, 張志雄
(四川大學(xué)數(shù)學(xué)學(xué)院, 成都 610064)
無窮時區(qū)上的最優(yōu)控制在經(jīng)濟學(xué)中有廣泛應(yīng)用[1-2].在實際應(yīng)用中,由于貼現(xiàn)率往往不是常數(shù),此類問題的最優(yōu)控制則具有時間不一致性.1955年,Strotz較為系統(tǒng)地研究了有限時區(qū)上的時間不一致最優(yōu)控制問題[3], 指出非常值的貼現(xiàn)率是導(dǎo)致最優(yōu)控制問題具有時間不一致性的原因之一.文獻[4-6]提出了時間不一致的Ramesy模型中容許控制成為均衡控制的必要條件.在離散時間框架下,文獻[7]構(gòu)造了一個階梯函數(shù)并證明其為均衡控制.在連續(xù)時間框架下,當(dāng)值函數(shù)充分光滑時文獻[8]推導(dǎo)了關(guān)于值函數(shù)的微分方程和與其等價的積分方程,并證明當(dāng)貼現(xiàn)率為常數(shù)時此微分方程即為HJB方程.此外,在一定條件下,該文獻也證明了均衡控制的存在性.此外,文獻[9]運用微分對策來處理時間不一致的問題,并提供一個具體例子來說明任意初始狀態(tài)的最優(yōu)控制在下一時刻不再保持最優(yōu).
在本文中,我們研究一類無窮時區(qū)上的時間不一致問最優(yōu)控制問題.當(dāng)貼現(xiàn)率充分大時,我們通過針狀變分的方法推導(dǎo)了容許控制成為均衡控制的充要條件.當(dāng)貼現(xiàn)函數(shù)為指數(shù)型時,此結(jié)果退化為無窮時區(qū)上的Pontryagin最大值原理.最后本文給出了一個應(yīng)用.
考慮如下受控方程:
(1)
目標(biāo)泛函
(2)
其中f:[0,+∞)×Rn×U→Rn,g:[0,+∞)×Rn×U→R,ρ:[0,+∞)×[0,+∞)→R,x0∈Rn,U是Rm的非空子集,u(·)取值于U.對任意(t,x)∈[0,+∞)×Rn,(x(s),u(s))滿足方程
(3)
考慮如下容許控制集:
U={u(·):[0,+∞)→
(4)
(5)
|f(t,0,u)|≤K(1+|u|);
|g(t,x,u)|≤K(1+|x|λ+1+|u|2);
|f(t,x1,u1)-f(t,x2,u2)|≤
|fx(t,x1,u1)-fx(t,x2,u2)|≤
?(|x1-x2|+|u1-u2|);
|gx(t,x,u)|≤K(1+|x|λ+|u|2).
注1當(dāng)條件(A1)滿足時,對任意(t,x)∈[0,+∞)×Rn,(x(s),u(s))及u(·)∈U,系統(tǒng)(1)和(3)有唯一解.當(dāng)λ=1時,該控制問題包含具常系數(shù)的無窮時區(qū)上的LQ問題.在投資-收益模型中,x(·)表示資本,u(·)表示投資,目標(biāo)泛函(2)表示總收益,條件 (A1)第二式和第五式則表示收益有某種增長性限制.
條件(A2) 對任意s,t∈[0+,∞),ρ(s,t)≥0,ρ(t,t)=1;ρ在[0,+∞)×[0,+∞)上連續(xù)可微;存在K0>λK+K,以及連續(xù)函數(shù)c0(t),對于任意t>0,存在T≥t,使得對任意s≥T,ρ(s,t)≤c0(t)e-K0s成立.
注2若ρ(s,t)=e-ρ0(s-t),原問題退化為時間一致的最優(yōu)控制問題,ρ0即為貼現(xiàn)率.
記H(s,t,x,u,p):[0,+∞)×[0,+∞)×Rn×U×Rn→R為Hamilton函數(shù)
H(s,t,x,u,p)=〈f(s,x,u),p〉+
ρ(s,t)g(s,x,u).
(6)
引理 3.1對任意的t∈[0,+∞),x∈Rn,u(·)∈U,J(t,x;u(·))有限.
c1(s,t,x,u)eKs
(7)
引理得證.
(8)
其中
g(t,x*(t),u*(t))+
(9)
證明步驟1當(dāng)t≤s≤t+ε時,由條件(A1)和系統(tǒng)(3)可得
其中
我們有
從而
(10)
同理,我們可以估計x*(·)在[t,t+ε]的模
|x*(s)-x*(t)|≤
(11)
由式(10)(11),對任意t≤s≤t+ε,有
(12)
其中
當(dāng)s>t+ε時,由條件(A1),式(12)及Gronwall不等式,對任意s>t+ε有
(13)
由式(12),(13),對任意s>t,有
(14)
f(t,x*(t),u*(t))]+o(ε)
(15)
步驟3令Yε(·)為下列方程的解:
(16)
(17)
其中
且
記
當(dāng)s≥t+ε時,由式(15)和Gronwall不等式得
其中
且對任意s≥t+ε,
由此可得
(18)
類似推導(dǎo)式(17)的方法,對任意s≥t+ε有
(19)
因此,對任意s≥t+ε,由條件(A1),式(19)及Gronwall不等式,對任意s≥t+ε有
|Y(s)-Yε(s)|≤
(20)
最終,我們有
(21)
其中,關(guān)于o2(ε,s)有如下估計:
(22)
這里
步驟4計算得出
g(s,x*(s),u*(s))]ds+
g(s,x*(s),u*(s))]ds=
(23)
因此
g(t,x*(t),u*(t))
(24)
令
由之前的計算可知
當(dāng)0<ε<ε0時,由條件(A1)(A2),式(19)及式(21)和(22)有
[c1(s,t,x*(t),u*)+1]λeλKs+
C(t)+1)eKsds<+∞.
由控制收斂定理,我們有
(25)
由式(24)(25),定理得證.
推論3.3假設(shè)條件(A1)(A2)成立,且u*(·)∈U.則u*(·)是系統(tǒng)(1)~(3)的弱均衡控制當(dāng)且僅當(dāng)下列等式成立:
H(t,t,x*(t),u*(t),ψ(t,t))=
(26)
其中ψ(·,·):[0,+∞)×[0,+∞)→Rn滿足
ψs(s,t)=-Hx(s,t,x*(s),u*(s),ψ(s,t)).
證明 記D(·),Z(·)分別為下列方程的解:
(27)
(28)
其中I為n階單位矩陣,AT為矩陣A的轉(zhuǎn)置.對任意s≥t,我們有
Y(s)=D(s)D-1(t)Y(t).
對任意s≥0,我們有Z-1(s)=DT(s).記M:[0,+∞)×[0,+∞)→Rn,ψ:[0,+∞)×[0,+∞)→Rn.令
gx(r,x*(r),u*(r))dr
(29)
ψ(s,t)=Z(s)M(s,t)
(30)
容易證明:對任意s,t≥0,Z(s)和M(s,t)是有限的,且|Z(s)|≤eKs,|Z-1(s)|≤eKs.直接計算可得
ψs(s,t)=-Hx(s,t,x*(s),u*(s),ψ(s,t))
H(t,t,x*(t),u*(t),ψ(t,t))]+
(31)
因為U是可分的,故存在U的可數(shù)稠子集,記為Q,我們可以將其表示為Q={v1,v2,v3, …}.令
其中n∈N,j∈N+.這樣所構(gòu)造出的控制依然滿足uj,n(·)∈U.
記Fj,n=Euj,n∩[n,n+1).則[n,n+1)Fj,n為零測集.故
H(t,t,x*(t),vj,ψ(t,t))-
H(t,t,x*(t),u*(t),ψ(t,t))≤0,t∈Fj,n.
記Fn=∩j≥1Fj,n.則[n,n+1]Fn仍為零測集,且
H(t,t,x*(t),vj,ψ(t,t))-
H(t,t,x*(t),u*(t),ψ(t,t))≤0,t∈Fn,j∈N+.
由條件(A1),我們可以推出H(s,t,x,u,p)關(guān)于u是連續(xù)的.由于Q是U的稠子集,我們有
H(t,t,x*(t),u*(t),ψ(t,t))=
(32)
因n是任意的,故式(26)成立.
H(t,t,x*(t),u*(t),ψ(t,t))≤0,t∈E.
由定理3.2可得
J(t,x*(t);u*(·))≤εo(1,t),
0,a.e.t∈[0,+∞).
故u*(·)為系統(tǒng)(1)~(3)的均衡控制.證畢.
|f(t,0,u)|≤K;
|g(t,x,u)|≤K(1+|x|λ+1);
|f(t,x1,u1)-f(t,x2,u2)|≤
|fx(t,x1,u1)-fx(t,x2,u2)|≤
|gx(t,x,u)|≤K(1+|x|λ).
注3記U1為所有可測函數(shù)u(·):[0,+∞)→U構(gòu)成的集合.根據(jù)以上的證明過程,當(dāng)以條件(A3)替換條件(A1),以U1替換U時,引理3.1,定理3.2及推論3.3依然成立.若控制集U是無界的,該控制系統(tǒng)不再包含LQ問題,但容許控制集的范圍可以變得更大.對于閉環(huán)情形,我們?nèi)钥刹扇》N方式來證明閉環(huán)均衡策略的充要條件.
我們給出該方法在經(jīng)濟學(xué)上的一個應(yīng)用.考慮如下方程
(33)
目標(biāo)泛函
(1-θ)e-ρ2(s-t))(x(s)-σu(s)2)]ds
(34)
其中x0∈R,U=[0,1],0<δ≤1,0≤θ≤1,ρ1≥ρ2>1,0<σ≤1,這里x(s)代表在s時刻的資產(chǎn)總量,x0代表初始時刻的資產(chǎn)總量,u(s)代表在s時刻的投資,σu(s)2代表投資過程中產(chǎn)生的花費或者消耗,δ代表資產(chǎn)的損耗系數(shù).如果0<θ<1,ρ2<ρ1,則該控制問題具時間不一致性.
可以驗證,條件(A2)和(A3)成立,且K=1.通過計算,我們有
H(t,t,x*(t),u,ψ(t,t))=
x*(t)(1-δψ(t,t))+(-σu2+ψ(t,t)u)
(35)
從而此控制即為該模型唯一的均衡控制.
當(dāng)然,在初始時刻,uv*(·)也依然可能不是最優(yōu)的.但即使可能找到初始時刻的最優(yōu)控制,根據(jù)上述的計算此最優(yōu)控制也不是該模型的均衡控制.