張 丹,傅 勤
(蘇州科技大學(xué) 數(shù)理學(xué)院,江蘇 蘇州 215009)
近年來,多智能體系統(tǒng)的研究已經(jīng)成為復(fù)雜系統(tǒng)研究的熱點(diǎn)問題。 其中一致性問題在多智能體系統(tǒng)的分布式協(xié)調(diào)設(shè)計(jì)領(lǐng)域中占據(jù)著重要的地位。另一方面,迭代學(xué)習(xí)控制源于機(jī)器人應(yīng)用[1],適用于有限時(shí)間內(nèi)具有重復(fù)運(yùn)動(dòng)性質(zhì)的被控系統(tǒng),自1984年提出完整的算法以來便受到眾多學(xué)者的關(guān)注[1-4]。因該算法簡單有效,已有許多基于迭代學(xué)習(xí)算法的多智能體系統(tǒng)一致性控制問題的研究成果[5-6]。 文獻(xiàn)[5]研究了一類由拋物型或雙曲型方程構(gòu)建而成的多智能系統(tǒng)的一致性迭代學(xué)習(xí)控制問題。文獻(xiàn)[6]進(jìn)一步研究了具有時(shí)滯的線性和非線性多智能體系統(tǒng)的一致性迭代學(xué)習(xí)控制問題。目前研究的多智能體系統(tǒng)多為由經(jīng)典偏微分方程構(gòu)建而成,而退化偏微分方程作為偏微分方程中一類特殊的方程,超出了古典理論的研究范圍,因此被廣泛應(yīng)用于如天體力學(xué)、氣候?qū)W、種群遺傳學(xué)等學(xué)科[7-8],具有重要的研究價(jià)值,進(jìn)而引起了許多學(xué)者的研究興趣[9-10]。文獻(xiàn)[9]介紹了退化拋物型方程的物理背景和解存在的唯一性等相關(guān)內(nèi)容。文獻(xiàn)[10]針對(duì)邊界退化的拋物型和雙曲型方程,研究了其邊界精確能控性問題。目前,也有將迭代學(xué)習(xí)控制方法應(yīng)用于退化系統(tǒng)的研究成果[11-12],文獻(xiàn)[11]研究了一維拋物型和雙曲型退化系統(tǒng)的迭代學(xué)習(xí)控制問題,利用壓縮映射原理,證明了在P型學(xué)習(xí)律的作用下系統(tǒng)的輸出誤差于L2空間內(nèi)收斂。文獻(xiàn)[12]進(jìn)一步研究了退化高階拋物型系統(tǒng)的迭代學(xué)習(xí)控制問題。然而對(duì)由退化偏微分方程(非經(jīng)典方程)構(gòu)成的退化多智能體系統(tǒng),如何進(jìn)行迭代學(xué)習(xí)控制,據(jù)筆者所知,尚無相關(guān)的研究。
本研究在文獻(xiàn)[11]研究的基礎(chǔ)上,考慮一類退化多智能體系統(tǒng)的迭代學(xué)習(xí)控制問題,該類系統(tǒng)中所有智能體是由文獻(xiàn)[11]中的退化系統(tǒng)構(gòu)建而成。基于網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),構(gòu)建得到的學(xué)習(xí)律和收斂條件,能同時(shí)適用于拋物和雙曲兩種類型的系統(tǒng)。當(dāng)學(xué)習(xí)律作用于系統(tǒng),迭代次數(shù)趨于無窮時(shí),該一致性誤差能夠收斂于零。
符號(hào)約定:I m表示m×m單位陣。1N表示分量均為1的N維列向量。對(duì)函數(shù)取模,定義
引理1GL至少有一個(gè)以1N為特征向量的零特征值,且GL所有的非零特征值均有正實(shí)部。Laplacian矩陣GL具有單重零特征值的充要條件是圖G含有生成樹[13]。
引理2若有向圖G有生成樹,則的每個(gè)特征值都有正實(shí)部[14]。
引理3對(duì)任意給定的矩陣,若譜半徑ρ(M) <1,則至少存在一種矩陣范數(shù)使得
引理4對(duì)任意矩陣范數(shù),至少存在一種與之相容的向量范數(shù),使得對(duì)任意和有
在適定的初、邊值(齊次邊值)條件下,由文獻(xiàn)[11]給出的退化雙曲型系統(tǒng)構(gòu)建得到如下退化多智能體系統(tǒng):
設(shè)動(dòng)態(tài)系統(tǒng)(1)在有限時(shí)間[0,T]內(nèi)是可重復(fù)的,則在第k(k=0,1,2,…,N)次迭代時(shí),系統(tǒng)(1)可表示為:
注1由文獻(xiàn)[11]可知,只需要選取初始控制均存在唯一,結(jié)合式(2)和式(3),進(jìn)而可知存在唯一,
假設(shè)1有向圖G有生成樹。
假設(shè)2沿用文獻(xiàn)[11],對(duì)所有的k,第i個(gè)智能體的初、邊值定位條件設(shè)定為:
假設(shè)3對(duì),有,其中C為未知常數(shù),而d1,d2為已知常數(shù)。
對(duì)系統(tǒng)(2)構(gòu)建如下的Ρ 型學(xué)習(xí)律
其中,q>0為學(xué)習(xí)增益。取q使得
成立,這里ρ表示譜半徑。
式(5)可寫成緊湊形式,即
進(jìn)一步,
由式(4)及引理3,存在ε>0 使得
結(jié)合假設(shè)3,式(6),式(8)及引理4,并利用基本不等式,可推得
定理若關(guān)于系統(tǒng)(2)的假設(shè)1—3成立,則在學(xué)習(xí)律(3)的作用下,當(dāng)?shù)螖?shù)趨于無窮時(shí),L2空間中的一致性誤差能夠收斂于零,即
證明式(7)兩端左乘,并從0 →1 對(duì)x積分,能夠得到
分部積分并結(jié)合假設(shè)2中邊值條件,可得
將式(11)~式(13)代入式(10),可推得
應(yīng)用Gronwall引理并結(jié)合假設(shè)2中初值無偏差,則有
另一方面,由基本不等式,有
再次應(yīng)用Gronwall引理并結(jié)合假設(shè)2中初值無偏差,有
取λ>1 ,則
因?yàn)镽N-1中的所有范數(shù)都是等價(jià)的,所以存在兩個(gè)正數(shù)τ和σ使得
將式(14)代入式(15)并結(jié)合式(16)有
將上述不等式代入式(9),可推得
再由式(16)可得
于是
注2對(duì)于由文獻(xiàn)[11]中拋物型的退化系統(tǒng)構(gòu)建而成拋物型退化多智能體系統(tǒng),即:
構(gòu)建的學(xué)習(xí)律及收斂條件同樣適用。其次,若在初始條件存在偏差情況下,同文獻(xiàn)[5],也可推得任兩個(gè)智能體于2L空間中一致性誤差有界。
構(gòu)建如下形式的退化多智能體系統(tǒng):
圖1 變化趨勢(shì)圖
研究了退化多智能體系統(tǒng)的迭代學(xué)習(xí)控制問題,該類系統(tǒng)由一維雙曲型退化偏微分方程構(gòu)建而成。構(gòu)建P型學(xué)習(xí)律對(duì)系統(tǒng)進(jìn)行迭代學(xué)習(xí)控制,當(dāng)?shù)螖?shù)趨于無窮時(shí),系統(tǒng)于有限時(shí)間區(qū)間上的輸出誤差能夠收斂于零。仿真結(jié)果驗(yàn)證了方法的有效性。