劉昆
關(guān)鍵詞: 粒子群算法優(yōu)化; 支持向量機(jī); 網(wǎng)絡(luò)流量; 混沌預(yù)測(cè); 平均絕對(duì)誤差; 蟻群算法
中圖分類(lèi)號(hào): TN711?34; TP393 ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼: A ? ? ? ? ? ? ? ? ? ?文章編號(hào): 1004?373X(2019)02?0120?04
Chaotic prediction of network traffic based on particle swarm algorithm
optimization and support vector machine
LIU Kun
(Xuhai College, China University of Mining & Technology, Xuzhou 221008, China)
Abstract: In allusion to the large average prediction absolute errors existing in traditional network traffic prediction methods, a network traffic chaotic prediction method based on particle swarm algorithm optimization and support vector machine (SVM) is proposed. The particle swarm algorithm is used to optimize the SVM method. The optimized SVM method is used to conduct chaotic prediction of network traffic. The prediction results show that the average prediction absolute error value of the improved prediction method is respectively 65.3% and 34.3% lower than that of the FCM?LSSVM network traffic prediction method and Morlet?SVR and ARIMA combined prediction method, which indicates that the improved prediction method has a certain advantage.
Keywords: particle swarm algorithm optimization; support vector machine; network traffic; chaotic prediction; average absolute error; ant colony algorithm
網(wǎng)絡(luò)性能解析與網(wǎng)絡(luò)規(guī)劃設(shè)計(jì)的根本即為網(wǎng)絡(luò)流量模型的構(gòu)建。網(wǎng)絡(luò)流量模型的準(zhǔn)確與否對(duì)設(shè)計(jì)高性能網(wǎng)絡(luò)協(xié)議、高性能的網(wǎng)絡(luò)設(shè)備、高效網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)、流量預(yù)測(cè)與網(wǎng)絡(luò)規(guī)劃、擁塞控制與負(fù)載均衡等都具有關(guān)鍵作用[1]。信息技術(shù)快速發(fā)展,對(duì)于網(wǎng)絡(luò)的使用普遍增加,為人們的工作及生活帶來(lái)了眾多便利以及各方面的雙重享受[2]。同時(shí),隨著政府機(jī)關(guān)和企事業(yè)單位信息化程度的加深,網(wǎng)絡(luò)信息的傳輸、處理及儲(chǔ)存的性能好壞在很大程度上對(duì)核心競(jìng)爭(zhēng)力造成了影響。然而黑客技術(shù)的發(fā)展與網(wǎng)絡(luò)技術(shù)發(fā)展速度相近,使得網(wǎng)絡(luò)安全事件頻繁出現(xiàn),導(dǎo)致網(wǎng)絡(luò)安全問(wèn)題突出,而對(duì)網(wǎng)絡(luò)流量的預(yù)測(cè)是預(yù)防網(wǎng)絡(luò)安全的關(guān)鍵技術(shù)[3]。對(duì)此,提出基于粒子群算法優(yōu)化支持向量機(jī)的網(wǎng)絡(luò)流量混沌預(yù)測(cè)方法,并進(jìn)行實(shí)驗(yàn)分析。實(shí)驗(yàn)結(jié)果表明,采用改進(jìn)預(yù)測(cè)方法的平均絕對(duì)誤差較低,具有一定的優(yōu)勢(shì)。
1.1 ?粒子群算法原理
粒子群優(yōu)化算法即為對(duì)覓食鳥(niǎo)群進(jìn)行尋優(yōu)處理的一種算法,其中每一只“鳥(niǎo)”表示一個(gè)粒子,鳥(niǎo)群所尋找的“食物”就是所求的最優(yōu)解[4]。
采用粒子群優(yōu)化算法對(duì)一群隨機(jī)粒子進(jìn)行初始化處理,粒子i的位置表示為D維向量[xi=x1,x2,…,xn],粒子運(yùn)行速度為[vi=v1,v2,…,vn]。每一個(gè)粒子所在區(qū)域即為一個(gè)預(yù)定解。把[xi]轉(zhuǎn)入到目標(biāo)函數(shù)中,計(jì)算得到其適應(yīng)值,依據(jù)適應(yīng)值的大小對(duì)其優(yōu)劣進(jìn)行區(qū)分[5]。在每一次迭代中,粒子通過(guò)搜尋兩個(gè)解對(duì)自己所在區(qū)域和速度進(jìn)行優(yōu)化:一個(gè)是粒子自身所在最佳區(qū)域,記作Pbest;另一個(gè)是整體粒子群目前為止搜尋的最優(yōu)解,即為Gbest。粒子群優(yōu)化算法具體流程圖如圖1所示。
1.2 ?支持向量機(jī)算法
采用支持向量機(jī)對(duì)網(wǎng)絡(luò)流量進(jìn)行預(yù)測(cè)時(shí),存在回歸領(lǐng)域過(guò)大,預(yù)測(cè)不準(zhǔn)的問(wèn)題,即支持向量機(jī)回歸。對(duì)此在非線(xiàn)性環(huán)境下,采用支持向量機(jī)函數(shù)進(jìn)行擬合處理,擬合時(shí)要采用線(xiàn)性回歸函數(shù)[fx=ω?x+b]擬合[xi,yi],[i=1,2,…,n],[xi∈Rn]當(dāng)作輸入量,[yi∈R]為輸出量,即需要確定[ω]和[b]。在采用支持向量機(jī)進(jìn)行網(wǎng)絡(luò)流量預(yù)測(cè)時(shí),其懲罰函數(shù)是影響預(yù)測(cè)結(jié)果的重要因素,也是支持向量機(jī)中一個(gè)重要的概念?,F(xiàn)有的方法經(jīng)常需要在優(yōu)化模型前對(duì)該函數(shù)進(jìn)行選定,對(duì)不同的優(yōu)化問(wèn)題選取不同的損失函數(shù),因此即使是同一個(gè)優(yōu)化問(wèn)題的損失函數(shù)也會(huì)形成不一樣的模型[6?7]。算法泛化能力的大小,會(huì)影響對(duì)網(wǎng)絡(luò)流量的預(yù)測(cè)準(zhǔn)確率。對(duì)此在支持向量機(jī)復(fù)雜程度及錯(cuò)分樣本間選取一個(gè)平均值作為懲罰因子,增強(qiáng)該算法的泛化程度。當(dāng)流經(jīng)網(wǎng)絡(luò)輸入層時(shí),若懲罰因子過(guò)小,則超出樣本的懲罰度較小,樣本訓(xùn)練誤差較大,泛化能力較低[8?9],錯(cuò)誤預(yù)測(cè)率較高;反之,若懲罰因子太大,則算法的學(xué)習(xí)精度較低,泛化能力不高。因此,要選取最適合優(yōu)化模型的懲罰因子,才可保證網(wǎng)絡(luò)流量預(yù)測(cè)的穩(wěn)定性及高效性[10]。支持向量機(jī)的結(jié)構(gòu)示意圖如圖2所示。
由圖2可知,在支持向量機(jī)的運(yùn)行過(guò)程中,需要選取核函數(shù)把非線(xiàn)性的輸入值映射到高維特征空間中,且核函數(shù)要滿(mǎn)足其定理特征。
2.1 ?粒子群優(yōu)化支持向量機(jī)算法
粒子群優(yōu)化支持向量機(jī)的具體流程圖如圖3所示。
標(biāo)準(zhǔn)粒子群優(yōu)化算法詳細(xì)步驟:
1) 初始化粒子群,設(shè)定各類(lèi)參數(shù),確定群體規(guī)模、維度迭代次數(shù)和粒子速度區(qū)域搜索空間的上下界限,隨機(jī)形成每個(gè)粒子所在區(qū)域和速度,設(shè)目前位置是每個(gè)粒子的初始位置[11],從中選取出全局最優(yōu)極值,并標(biāo)記其最優(yōu)值序號(hào)及位置。
2) 評(píng)價(jià)每個(gè)粒子,并根據(jù)定義的適應(yīng)度函數(shù),計(jì)算每個(gè)粒子的適應(yīng)值。
3) 個(gè)體極值更新。在此步驟中,將每個(gè)粒子的適應(yīng)值與個(gè)體極值的最優(yōu)值進(jìn)行對(duì)比,若適應(yīng)值較高,則把當(dāng)前粒子位置當(dāng)作最優(yōu)位置,對(duì)個(gè)體極值進(jìn)行更新。
4) 如果每個(gè)粒子個(gè)體最優(yōu)值中最佳位置是目前全局的極值,那么把個(gè)體極值規(guī)定成最優(yōu)位置,更新全局極值與粒子序號(hào)。
5) 更新粒子狀態(tài)。分別對(duì)粒子的位置和速度進(jìn)行更新。當(dāng)目前粒子速度大于最大值時(shí),選取最大速度值,當(dāng)前粒子速度小于最小速度值時(shí),選取最小值。
6) 檢驗(yàn)是否可以終止。如滿(mǎn)足終止條件,則輸出解;反之,返回步驟2)繼續(xù)進(jìn)行尋優(yōu)。
終止條件可通過(guò)實(shí)際問(wèn)題進(jìn)行設(shè)定,目前常選擇最大迭代次數(shù)來(lái)確定最佳位置的最小閾值,也可通過(guò)搜索粒子群的最佳位置來(lái)確定最小適應(yīng)閾值。
2.2 ?網(wǎng)絡(luò)流量混沌預(yù)測(cè)
由于網(wǎng)絡(luò)流量預(yù)測(cè)方法引入附加參數(shù)較多,采用算法過(guò)程中需要加入大量的隨機(jī)操作,使得預(yù)測(cè)方法無(wú)法依據(jù)算法的優(yōu)化水平對(duì)解空間的變化做出對(duì)應(yīng)調(diào)整,缺乏動(dòng)態(tài)性。對(duì)此采用上述提出的粒子群算法優(yōu)化支持向量機(jī)法,結(jié)合混沌理論對(duì)網(wǎng)絡(luò)流量進(jìn)行預(yù)測(cè)。經(jīng)過(guò)把搜索進(jìn)程相應(yīng)的混沌軌跡進(jìn)行遍歷,可預(yù)防搜索過(guò)程中出現(xiàn)局部最優(yōu)的現(xiàn)象,同時(shí),保持算法的全部尋優(yōu)能力,依據(jù)最優(yōu)解空間與算法目前的運(yùn)行次數(shù),動(dòng)態(tài)地收縮搜索區(qū)域,提高網(wǎng)絡(luò)流量混沌預(yù)測(cè)精度,其預(yù)測(cè)流程如下:
1) 通過(guò)對(duì)權(quán)值及閾值等參數(shù)進(jìn)行編碼處理,建立粒子與參數(shù)之間的映射聯(lián)系;
2) 采用粒子群優(yōu)化支持向量機(jī)方法確定粒子迭代次數(shù)及最優(yōu)粒子位置;
3) 采用線(xiàn)性遞減策略確定慣性權(quán)重;
4) 調(diào)整選取學(xué)習(xí)因子,求出網(wǎng)絡(luò)流量的混沌時(shí)間序列,確定迭代次數(shù)及收縮因子界限;
5) 根據(jù)以上設(shè)置結(jié)果,確定適應(yīng)度函數(shù),計(jì)算混沌變量,并對(duì)最新解進(jìn)行評(píng)價(jià);
6) 調(diào)整最優(yōu)參數(shù),得到較優(yōu)的參數(shù),將多個(gè)值輸入到網(wǎng)絡(luò),輸出值即為該點(diǎn)網(wǎng)絡(luò)流量預(yù)測(cè)值。
3.1 ?實(shí)驗(yàn)軟硬件環(huán)境設(shè)計(jì)
實(shí)驗(yàn)過(guò)程總采用Intel奔騰雙核CPU,4.00 GB內(nèi)存,500 GB硬盤(pán)的計(jì)算機(jī),其操作系統(tǒng)使用Microsoft Windows 8 旗艦版。使用Matlab R2017b在Version 7.11.0.584 32 bit(WIN 32)下進(jìn)行實(shí)驗(yàn)分析。
3.2 ?實(shí)驗(yàn)性能指標(biāo)
實(shí)驗(yàn)過(guò)程中采用平均絕對(duì)誤差MAE為評(píng)價(jià)指標(biāo)來(lái)評(píng)價(jià)實(shí)驗(yàn)的預(yù)測(cè)結(jié)果,在實(shí)驗(yàn)中,平均絕對(duì)誤差MAE的值越小,則預(yù)測(cè)精度就越高。
[MAE=1ni=1nxi-x′i]
式中:[xi]為實(shí)際值;[x′i]為預(yù)測(cè)值;[n]為樣本數(shù)。
3.3 ?平均絕對(duì)誤差驗(yàn)證
在驗(yàn)證過(guò)程中,采用改進(jìn)預(yù)測(cè)方法與FCM?LSSVM網(wǎng)絡(luò)流量預(yù)測(cè)方法、Morlet?SVR和ARIMA組合預(yù)測(cè)方法為對(duì)比進(jìn)行實(shí)驗(yàn)分析,實(shí)驗(yàn)結(jié)果如圖4所示。
由圖4可知,采用FCM?LSSVM網(wǎng)絡(luò)流量預(yù)測(cè)方法時(shí),其隨著預(yù)測(cè)時(shí)間的增加而發(fā)生上下劇烈浮動(dòng)的現(xiàn)象,且平均絕對(duì)誤差值多次達(dá)到100%,只有少數(shù)情況下其平均絕對(duì)誤差值達(dá)到了0,整體平均絕對(duì)誤差值約為78%。采用Morlet?SVR和ARIMA組合預(yù)測(cè)方法時(shí),其平均絕對(duì)誤差值雖然出現(xiàn)多次波動(dòng),但波動(dòng)幅度較小,且整體平均絕對(duì)誤差值約為47%。采用改進(jìn)預(yù)測(cè)方法時(shí),其預(yù)測(cè)過(guò)程中出現(xiàn)的平均絕對(duì)誤差較小,約為12.7%,且較為穩(wěn)定,相比FCM?LSSVM網(wǎng)絡(luò)流量預(yù)測(cè)方法及Morlet?SVR和ARIMA組合預(yù)測(cè)方法分別降低了65.3%,34.3%,具有一定的優(yōu)勢(shì)。
傳統(tǒng)方法在進(jìn)行網(wǎng)絡(luò)流量預(yù)測(cè)時(shí),存在預(yù)測(cè)平均絕對(duì)誤差較大的問(wèn)題,為此提出基于粒子群算法優(yōu)化支持向量機(jī)的網(wǎng)絡(luò)流量混沌預(yù)測(cè)方法。該方法分別分析已有粒子群算法與支持向量機(jī)方法,并采用粒子群算法對(duì)支持向量機(jī)方法進(jìn)行優(yōu)化,進(jìn)而實(shí)現(xiàn)網(wǎng)絡(luò)流量的混沌預(yù)測(cè)。預(yù)測(cè)結(jié)果表明,改進(jìn)預(yù)測(cè)方法的平均絕對(duì)誤差值遠(yuǎn)遠(yuǎn)低于FCM?LSSVM網(wǎng)絡(luò)流量預(yù)測(cè)方法、Morlet?SVR和ARIMA組合預(yù)測(cè)方法,具有一定的優(yōu)勢(shì)。
參考文獻(xiàn)
[1] 林智華,高文,吳春明,等.基于離散粒子群算法的數(shù)據(jù)中心網(wǎng)絡(luò)流量調(diào)度研究[J].電子學(xué)報(bào),2016,44(9):2197?2202.
LIN Zhihua, GAO Wen, WU Chunming, et al. Data center network flow scheduling based on DPSO algorithm [J]. Acta Electronica Sinica, 2016, 44(9): 2197?2202.
[2] 耿越.基于混沌粒子群神經(jīng)網(wǎng)絡(luò)的瓦斯?jié)舛阮A(yù)測(cè)[J].中國(guó)煤炭,2017,43(3):124?129.
GENG Yue. Chaotic PSO?RBFNN in coal mine gas concentration prediction [J]. China coal, 2017, 43(3): 124?129.
[3] 張宏立,李瑞國(guó),范文慧,等.基于量子粒子群的全參數(shù)連分式混沌時(shí)間序列預(yù)測(cè)[J].控制與決策,2016,31(1):52?58.
ZHANG Hongli, LI Ruiguo, FAN Wenhui, et al. Chaotic time series prediction of full?parameters continued fraction based on quantum particle swarm optimization algorithm [J]. Control and decision, 2016, 31(1): 52?58.
[4] 楊景明,陳偉明,車(chē)海軍,等.基于粒子群算法優(yōu)化支持向量機(jī)的鋁熱連軋機(jī)軋制力預(yù)報(bào)[J].計(jì)量學(xué)報(bào),2016,37(1):71?74.
YANG Jingming, CHEN Weiming, CHE Haijun, et al. Rolling force prediction based on support vectors machine with particle swam optimization [J]. Acta Metrologica Sinica, 2016, 37(1): 71?74.
[5] 張進(jìn),丁勝,李波.改進(jìn)的基于粒子群優(yōu)化的支持向量機(jī)特征選擇和參數(shù)聯(lián)合優(yōu)化算法[J].計(jì)算機(jī)應(yīng)用,2016,36(5):1330?1335.
ZHANG Jin, DING Sheng, LI Bo. Improved particle swarm optimization algorithm for support vector machine feature selection and optimization of parameters [J]. Journal of computer applications, 2016, 36(5): 1330?1335.
[6] 王振武,孫佳駿,尹成峰.改進(jìn)粒子群算法優(yōu)化的支持向量機(jī)及其應(yīng)用[J].哈爾濱工程大學(xué)學(xué)報(bào),2016,37(12):1728?1733.
WANG Zhenwu, SUN Jiajun, YIN Chengfeng. A support vector machine based on an improved particle swarm optimization algorithm and its application [J]. Journal of Harbin Engineering University, 2016, 37(12): 1728?1733.
[7] 方一鳴,鄭賀軍,劉樂(lè),等.基于模擬退火粒子群算法優(yōu)化支持向量機(jī)參數(shù)的連鑄漏鋼預(yù)報(bào)[J].中國(guó)機(jī)械工程,2017,28(12):1462?1467.
FANG Yiming, ZHENG Hejun, LIU Le, et al. Breakout prediction for continuous casting based on SA?PSO to optimize parameters of SVM [J]. China mechanical engineering, 2017, 28(12): 1462?1467.
[8] 汪華斌,盧自立,邱杰漢,等.基于粒子群算法優(yōu)化支持向量機(jī)的巖爆預(yù)測(cè)研究[J].地下空間與工程學(xué)報(bào),2017,13(2):364?369.
WANG Huabin, LU Zili, QIU Jiehan, et al. Prediction of rock burst by improved particle swam optimization?based support vector machine [J]. Chinese journal of underground space and engineering, 2017, 13(2): 364?369.
[9] 殷榮網(wǎng).基于FCM?LSSVM網(wǎng)絡(luò)流量預(yù)測(cè)模型[J].計(jì)算機(jī)工程與應(yīng)用,2016,52(1):105?109.
YIN Rongwang. Network traffic predicting model based on FCM?LSSVM [J]. Computer engineering and applications, 2016, 52(1): 105?109.
[10] 趙建龍,曲樺,趙季紅,等.基于Morlet?SVR和ARIMA組合模型的網(wǎng)絡(luò)流量預(yù)測(cè)[J].北京郵電大學(xué)學(xué)報(bào),2016,39(2):53?57.
ZHAO Jianlong, QU Hua, ZHAO Jihong, et al. A comprehensive forecasting model for network traffic based on Morlet?SVR and ARIMA [J]. Journal of Beijing University of Posts and Telecommunications, 2016, 39(2): 53?57.
[11] 譚躍,譚冠政,鄧曙光.基于遺傳交叉和多混沌策略改進(jìn)的粒子群優(yōu)化算法[J].計(jì)算機(jī)應(yīng)用研究,2016,33(12):3643?3647.
TAN Yue, TAN Guanzheng, DENG Shuguang. Improved particle swarm optimization algorithm based on genetic crossover and multi?chaotic strategies [J]. Application research of computers, 2016, 33(12): 3643?3647.