葉成蔭, 井元偉
(1.東北大學(xué)信息科學(xué)與工程學(xué)院,遼寧沈陽(yáng) 110819;2.遼寧石油化工大學(xué)計(jì)算機(jī)與通信工程學(xué)院,遼寧撫順 113001)
隨著傳輸控制協(xié)議(transmission control protocol,TCP)應(yīng)用的快速增長(zhǎng),網(wǎng)絡(luò)擁塞越來(lái)越頻繁。主動(dòng)隊(duì)列管理(active queue management,AQM))成為擁塞控制的研究熱點(diǎn)。文獻(xiàn)[1]對(duì)TCP網(wǎng)絡(luò)的非線性動(dòng)態(tài)模型進(jìn)行了線性化處理后得到了一個(gè)線性定常TCP網(wǎng)絡(luò)模型,并分析了隨機(jī)早期丟棄(random early discard,RED)算法不穩(wěn)定的原因。然而依據(jù)該模型設(shè)計(jì)的AQM控制器[2]在魯棒性方面遇到了一些困難,因?yàn)門CP網(wǎng)絡(luò)的高度變化使得網(wǎng)絡(luò)參數(shù)很難長(zhǎng)時(shí)間保持在常值。對(duì)于時(shí)變TCP網(wǎng)絡(luò)而言,由于滑??刂葡到y(tǒng)中的滑動(dòng)模態(tài)與系統(tǒng)的攝動(dòng)和外界干擾無(wú)關(guān)[3],因此滑??刂圃赥CP網(wǎng)絡(luò)擁塞避免方面取得了較好的效果[4]。但以上文獻(xiàn)只適用于線性系統(tǒng)模型。文獻(xiàn)[5]基于非線性TCP網(wǎng)絡(luò)動(dòng)態(tài)模型[6]設(shè)計(jì)了一種滑模控制器,增強(qiáng)了系統(tǒng)的魯棒性,但是這類控制器要求TCP負(fù)載和往返時(shí)延的界必須事先獲得。然而在實(shí)際應(yīng)用中,由于TCP負(fù)載和往返時(shí)延具有較大突發(fā)性和時(shí)變性,它們的界很難確定,從而造成控制器在實(shí)際中很難實(shí)現(xiàn)。文獻(xiàn)[7]利用擁塞窗口和往返時(shí)延信息設(shè)計(jì)了一種非線性主動(dòng)隊(duì)列管理控制器,但是由于擁塞窗口信息在路由器端很難獲得,使得控制器在實(shí)際應(yīng)用中很難實(shí)現(xiàn)。
徑向基函數(shù)(radial basis function,RBF)神經(jīng)網(wǎng)絡(luò)具有良好的非線性逼近能力[8],若將滑??刂婆cRBF神經(jīng)網(wǎng)絡(luò)相結(jié)合設(shè)計(jì)控制器,則能進(jìn)一步提高控制效果。近年來(lái),在電力系統(tǒng)和電機(jī)磁鏈等領(lǐng)域取得了一些較好的成果[9-10],但在TCP網(wǎng)絡(luò)的擁塞控制方面則鮮有報(bào)道。
本文首先將TCP網(wǎng)絡(luò)的非線性動(dòng)態(tài)模型轉(zhuǎn)換成仿射非線性形式。然后基于滑模變結(jié)構(gòu)的控制理論設(shè)計(jì)了一個(gè)滑模控制器。然而由于TCP負(fù)載和往返時(shí)延具有較大突發(fā)性和時(shí)變性,使得網(wǎng)絡(luò)系統(tǒng)參數(shù)是未知時(shí)變的,從而導(dǎo)致滑??刂破髟趯?shí)際應(yīng)用中很難實(shí)現(xiàn)。為此,本文使用RBF神經(jīng)網(wǎng)絡(luò)逼近網(wǎng)絡(luò)系統(tǒng)參數(shù),依據(jù)李雅普諾夫理論設(shè)計(jì)了RBF神經(jīng)網(wǎng)絡(luò)權(quán)值的自適應(yīng)律,采用RBF神經(jīng)網(wǎng)絡(luò)的輸出作為滑模控制器的參數(shù),從而使得滑模控制器易于實(shí)現(xiàn)。
文獻(xiàn)[6]采用基于速率的流體流分析方法,給出了TCP網(wǎng)絡(luò)非線性動(dòng)態(tài)模型為
式中:r(t)為TCP連接的源端發(fā)送速率;q(t)為瞬時(shí)隊(duì)列長(zhǎng)度;N(t)為TCP網(wǎng)絡(luò)的負(fù)載;R(t)為往返時(shí)延;Tp為傳播時(shí)延;C0為鏈路帶寬;0≤p(t)≤1為分組丟棄/標(biāo)記概率,可以看作用于調(diào)節(jié)發(fā)送速率和鏈路隊(duì)列長(zhǎng)度的控制輸入。
令eq=q(t)-qd,qd為期望的隊(duì)列長(zhǎng)度。記x1=eq,x2=,則有
于是非線性模型(1)可表示為
滑模變結(jié)構(gòu)控制器的設(shè)計(jì)由兩部分組成。首先,設(shè)計(jì)具有良好的動(dòng)態(tài)特性的滑動(dòng)模面為
接著,設(shè)計(jì)使滑動(dòng)模態(tài)存在的滑??刂破鱱(t),為
其中:ueq為滑模等效控制;us(t)為切換控制,用于實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)系統(tǒng)的攝動(dòng)和外加干擾的魯棒控制;ρ>0是切換增益。
定理1 系統(tǒng)(4)在控制律(6)、(7)和(8)的作用下能在有限時(shí)間內(nèi)到達(dá)滑動(dòng)模面,并保證滑動(dòng)模面是漸近穩(wěn)定的,即使滑動(dòng)模態(tài)存在條件<0成立。
證明:選取Lyapunov函數(shù)如下
于是,對(duì)V關(guān)于時(shí)間t求導(dǎo),得到
將式(6)、式(7)和式(8)代入,得到
當(dāng)t→∞時(shí),s(t)→0,滑動(dòng)模面s(t)=0總能在有限時(shí)間內(nèi)到達(dá),而且是漸近穩(wěn)定的。
在實(shí)際應(yīng)用中,由于TCP負(fù)載N(t)和往返時(shí)延R(t)具有較大突發(fā)性和時(shí)變性,所以f(t)和g(x,t)是未知時(shí)變的,控制器很難實(shí)現(xiàn)。可采用RBF網(wǎng)絡(luò)的輸出(t)和(x,t)代替f(t)和g(x,t),實(shí)現(xiàn)自適應(yīng)神經(jīng)滑模控制。
RBF神經(jīng)網(wǎng)絡(luò)具有如下形式,即
式中:y(x,ω)是神經(jīng) RBF 網(wǎng)絡(luò)的輸出;x=[x1,x2]是輸入狀態(tài)向量;ω∈Rn是RBF神經(jīng)網(wǎng)絡(luò)的權(quán)向量;向量φ(x)∈Rn是高斯型函數(shù),其形式為
式中:ci∈R2n是第i個(gè)神經(jīng)元的中心位置;σi∈R是第i個(gè)神經(jīng)元的寬度。
采用RBF網(wǎng)絡(luò)建立(t)和(x,t)的模型,網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 RBF網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 RBF network structure
為了進(jìn)一步分析,引進(jìn)如下假設(shè):
假設(shè)1 對(duì)于任意給定的逼近精度ε,存在權(quán)向量w和v,使得和分別逼近于f和g,即存在權(quán)向量w和v,使得
成立。
令wt和vt分別表示權(quán)向量w和v在t時(shí)刻的估計(jì)值,控制律(7)和(8)改寫為
式中:
由中值定理可以得到
則RBF網(wǎng)絡(luò)的權(quán)值采取自適應(yīng)機(jī)制在線調(diào)整為
令Θ=[wv]T,則 RBF網(wǎng)絡(luò)的權(quán)值誤差為(t)=Θt-Θ,逼近誤差為η(t)=Ο(‖(t)‖2)+Ο(ε)。
定理2 如果假設(shè)1成立,且滿足ρ(t)>‖η(t)‖,則系統(tǒng)(4)在控制律(6)、(13)和(14)以及自適應(yīng)律(19)的作用下能在有限時(shí)間內(nèi)到達(dá)滑動(dòng)模面,并保證滑動(dòng)模面是漸近穩(wěn)定的。
證明:考慮如下李雅普諾夫函數(shù):
將控制律(6)、(13)和(14)代入得到
由假設(shè)1以及式(17)、式(18)和式(19)得到
當(dāng)選擇滑模切換增益ρ(t)>‖η(t)‖時(shí),
當(dāng)t→∞時(shí),s(t)→0,滑動(dòng)模面s(t)=0總能在有限時(shí)間內(nèi)到達(dá),而且是漸近穩(wěn)定的。
參照文獻(xiàn)[1],網(wǎng)絡(luò)參數(shù)的選擇為,N=100,C0=1 250 分組/s,R=0.2 s,qd=100 分組?;C婵刂茀?shù)c=10,切換增益ρ=10。神經(jīng)元的中心ci在0和1之間隨機(jī)取值,神經(jīng)元的寬度σi都取1。為了便于性能分析,本文對(duì)文獻(xiàn)[2]提出的比例積分(proportional-integral,PI)控制器和文獻(xiàn)[5]提出的滑??刂?sliding mode control,SMC)與本文的神經(jīng)滑模控制器(neural sliding mode control,NSMC)進(jìn)行了仿真,仿真結(jié)果如圖2~圖5所示。
從圖2可以看出,當(dāng)網(wǎng)絡(luò)參數(shù)確定時(shí),PI控制器、SMC控制器和NSMC控制器都能使瞬時(shí)隊(duì)列長(zhǎng)度穩(wěn)定在期望值附近。但是PI控制器產(chǎn)生的波動(dòng)較大,收斂時(shí)間也比較長(zhǎng);NSMC控制器和SMC控制器都具有較好的收斂性能,能較快地收斂到期望值附近。
圖2 網(wǎng)絡(luò)參數(shù)確定時(shí)隊(duì)列長(zhǎng)度比較Fig.2 Comparison of queue lengths with fixed network parameters
從圖3可以看出,當(dāng)網(wǎng)絡(luò)負(fù)載N從100變化到200,其它網(wǎng)絡(luò)參數(shù)不變時(shí),PI控制器顯示出較大的穩(wěn)態(tài)誤差和較慢的暫態(tài)響應(yīng);SMC與NSMC相比,在穩(wěn)態(tài)過(guò)程中隊(duì)列長(zhǎng)度變化有較大幅度振蕩。
當(dāng)往返時(shí)延R從0.2 s變化到0.3 s,其它網(wǎng)絡(luò)參數(shù)不變時(shí)的仿真結(jié)果如圖4所示。PI控制器經(jīng)過(guò)較大地振蕩之后能夠收斂于期望值,而且在穩(wěn)態(tài)過(guò)程中,隊(duì)列長(zhǎng)度變化比較劇烈;NSMC同SMC相比,能使隊(duì)列長(zhǎng)度很快收斂于期望值,并且穩(wěn)態(tài)時(shí)的隊(duì)列長(zhǎng)度變化較小而且平緩。
圖3 較大TCP負(fù)載時(shí)隊(duì)列長(zhǎng)度比較Fig.3 Comparison under higher TCP loads
圖4 較大往返時(shí)延時(shí)隊(duì)列長(zhǎng)度比較Fig.4 Comparison with larger round-trip time
當(dāng)往返時(shí)延R從0.2 s變化到0.3 s,網(wǎng)絡(luò)負(fù)載N從100變化到200時(shí),仿真結(jié)果如圖5所示。PI控制器的收斂速度較慢,隊(duì)列長(zhǎng)度波動(dòng)較大;SMC控制器在開始時(shí)隊(duì)列長(zhǎng)度變化比較劇烈,而NSMC控制器的隊(duì)列長(zhǎng)度變化比較平緩。
圖5 網(wǎng)絡(luò)參數(shù)變化時(shí)隊(duì)列長(zhǎng)度比較Fig.5 Comparison of queue lengths with variable network parameters
針對(duì)TCP網(wǎng)絡(luò)的擁塞控制問(wèn)題,將滑??刂婆cRBF神經(jīng)網(wǎng)絡(luò)相結(jié)合設(shè)計(jì)了一種主動(dòng)隊(duì)列管理算法。該算法具有以下特點(diǎn):
1)由于TCP負(fù)載和往返時(shí)延具有較大的突發(fā)性和時(shí)變性,使得網(wǎng)絡(luò)系統(tǒng)參數(shù)是未知時(shí)變的。為此,使用RBF神經(jīng)網(wǎng)絡(luò)逼近網(wǎng)絡(luò)系統(tǒng)參數(shù),從而使得控制器易于實(shí)現(xiàn)。
2)基于李雅普諾夫穩(wěn)定性理論設(shè)計(jì)了RBF神經(jīng)網(wǎng)絡(luò)權(quán)值的自適應(yīng)律,使得網(wǎng)絡(luò)系統(tǒng)參數(shù)得到了較好的估計(jì),并且保證了網(wǎng)絡(luò)系統(tǒng)的穩(wěn)定性。
3)采用RBF神經(jīng)網(wǎng)絡(luò)的輸出作為滑??刂破鞯膮?shù)設(shè)計(jì)了一種主動(dòng)隊(duì)列管理算法,使得系統(tǒng)狀態(tài)能在有限時(shí)間內(nèi)到達(dá)滑動(dòng)模面,并保證滑動(dòng)模面是漸近穩(wěn)定的,而且瞬時(shí)隊(duì)列長(zhǎng)度具有較好的暫態(tài)和穩(wěn)態(tài)性能。
本文設(shè)計(jì)控制器時(shí),未考慮到無(wú)響應(yīng)流對(duì)系統(tǒng)造成的影響,這將是下一步的研究工作。
[1]HOLLOT C,MISRA V,GONG W B.A control theoretic analysis of RED[C]//Proceedings of IEEE INFOCOM,April 22-26,2001,Anchorage,USA.2001:1510-1519.
[2]HOLLOT C,MISRA V,TOWSLEY D,et a1.On designing improved controllers for AQM routers supporting TCP flows[C]//Proceedings of the IEEE INFOCOM,April 22-26,2001,Anchorage,USA.2001:1726-1734.
[3]WANG S P,GAO W B.Robustness and invariance of variable structure systems with multiple inputs[C]//Proceedings of the A-merican Control Conference,June 21-23,1995,Seattle,USA.1995:1035-1039.
[4]REN F Y,LIN C,YING X H.Design a congestion controller based on sliding mode variable structure control[J].Computer Communications,2005,28(9):1050-1061.
[5]YAN P,GAO Y,?ZBAY H.A variable structure control approach to active queue management for TCP with ECN[J].IEEE Transactions on Control Systems Technology,2005,13(2):203-215.
[6]KELLY F P.Mathematical modeling of the Internet[C]//Mathematics Unlimited-2001 and Beyond,January 25,2001,Berlin,Germany.2001:685-702.
[7]陳瑋,王銀河,井元偉,等.TCP網(wǎng)絡(luò)主動(dòng)隊(duì)列管理的非線性狀態(tài)反饋跟蹤控制[J].電機(jī)與控制學(xué)報(bào),2009,13(5):762-765.
CHEN Wei,WANG Yinhe,JING Yuanwei,et al.Nonlinear state feedback tracking control algorithm for active queue management of TCP network[J].Electric Machines and Control,2009,13(5):762-765.
[8]PARK J,SANDBERG I W.Universal approximation using radial basis function networks[J].Neural Computation,1991,3(2):246-257.
[9]徐慶宏,戴先中.基于在線學(xué)習(xí)RBF神經(jīng)網(wǎng)絡(luò)的汽門開度自適應(yīng)補(bǔ)償控制方法[J].電機(jī)與控制學(xué)報(bào),2010,14(2):13-19.
XU Qinghong,DAI Xianzhong.Online learning RBF neural network-based adaptive compensative control scheme for governor system[J].Electric Machines and Control,2010,14(2):13-19.
[10]劉國(guó)榮,張道祿.電機(jī)磁鏈神經(jīng)網(wǎng)絡(luò)觀測(cè)器的研究[J].電機(jī)與控制學(xué)報(bào),2011,15(8):81-87.
LIU Guorong,ZHANG Daolu.A study of motor flux neural network observer[J].Electric Machines and Control,2011,15(8):81-87.