張 兵 鄧 衛(wèi)
(1華東交通大學(xué)土木建筑學(xué)院,南昌 330013)
(2東南大學(xué)交通學(xué)院,南京 210096)
經(jīng)濟(jì)圈交通網(wǎng)絡(luò)SVM評(píng)價(jià)方法
張 兵1鄧 衛(wèi)2
(1華東交通大學(xué)土木建筑學(xué)院,南昌 330013)
(2東南大學(xué)交通學(xué)院,南京 210096)
為了快速高效、科學(xué)合理地對(duì)經(jīng)濟(jì)圈交通網(wǎng)絡(luò)發(fā)展水平進(jìn)行評(píng)價(jià),建立了一種新的機(jī)器評(píng)價(jià)方法——支持向量機(jī)(SVM)綜合評(píng)價(jià)方法.在對(duì)支持向量機(jī)理論研究分析的基礎(chǔ)上,應(yīng)用支持向量機(jī)多分類方法建立綜合評(píng)價(jià)模型,提出了基于支持向量機(jī)理論的經(jīng)濟(jì)圈交通網(wǎng)絡(luò)機(jī)器評(píng)價(jià)步驟,運(yùn)用Matlab 7.0軟件編程實(shí)現(xiàn),并在綜合評(píng)價(jià)程序中選用RBF核函數(shù).最后,分別應(yīng)用支持向量機(jī)綜合評(píng)價(jià)方法、神經(jīng)網(wǎng)絡(luò)綜合評(píng)價(jià)方法和物元評(píng)價(jià)方法對(duì)珠三角和長三角經(jīng)濟(jì)圈交通網(wǎng)絡(luò)發(fā)展水平進(jìn)行評(píng)價(jià).結(jié)果表明,當(dāng)選取合適的核函數(shù)以及相應(yīng)的懲罰參數(shù)時(shí),支持向量機(jī)評(píng)價(jià)方法在多模式識(shí)別及小樣本數(shù)據(jù)分類上具有明顯效果,比基于BP神經(jīng)網(wǎng)絡(luò)的評(píng)價(jià)方法效率更高、更準(zhǔn)確.因此,該評(píng)價(jià)方法能夠高效地評(píng)價(jià)經(jīng)濟(jì)圈交通網(wǎng)絡(luò)發(fā)展水平.
交通網(wǎng)絡(luò);經(jīng)濟(jì)圈;評(píng)價(jià);支持向量機(jī);神經(jīng)網(wǎng)絡(luò)
支持向量機(jī)(support vector machine,SVM)是20世紀(jì)90年代中期由Vapnik[1]基于統(tǒng)計(jì)學(xué)理論中的VC維理論以及結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理而提出的一種全新的機(jī)器學(xué)習(xí)方法.針對(duì)有限樣本,SVM建立了一套完整、規(guī)范的基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí)理論和方法,減少了算法設(shè)計(jì)的隨意性.目前,SVM已成為機(jī)器學(xué)習(xí)的研究熱點(diǎn),國內(nèi)外研究主要集中在模式識(shí)別、數(shù)據(jù)挖掘、概率密度估計(jì)、數(shù)據(jù)預(yù)測(cè)等領(lǐng)域[2-4],而應(yīng)用SVM 進(jìn)行交通系統(tǒng)評(píng)價(jià)的相關(guān)研究還比較少.
由于經(jīng)濟(jì)圈交通網(wǎng)絡(luò)綜合評(píng)價(jià)非常復(fù)雜,各個(gè)因素互相影響,呈現(xiàn)出復(fù)雜的非線性關(guān)系,可以看成是一個(gè)典型的非線性、高維模式的分類問題,所以本文運(yùn)用SVM理論對(duì)其進(jìn)行評(píng)價(jià).根據(jù)SVM具有較強(qiáng)模式識(shí)別能力的特點(diǎn),通過對(duì)已有小樣本評(píng)價(jià)指標(biāo)數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí),計(jì)算出經(jīng)濟(jì)圈交通網(wǎng)絡(luò)發(fā)展水平的正確分類,從而確定經(jīng)濟(jì)圈交通網(wǎng)絡(luò)發(fā)展水平.基于支持向量機(jī)理論的綜合評(píng)價(jià)完全依靠評(píng)價(jià)數(shù)據(jù)映射在高維特征空間內(nèi)的分布狀態(tài),消除了評(píng)價(jià)過程中的隨機(jī)性和評(píng)價(jià)專家主觀上的不確定性以及認(rèn)識(shí)上的模糊性,同時(shí),評(píng)價(jià)過程可以運(yùn)用計(jì)算機(jī)編程實(shí)現(xiàn),操作簡單,學(xué)習(xí)效率高,從而具有較高的評(píng)價(jià)效率.
支持向量機(jī)理論最初來自于對(duì)數(shù)據(jù)分類問題的處理[5].該方法的機(jī)理可以簡述為:尋找一個(gè)滿足分類要求的最優(yōu)分類超平面,使得超平面在保證分類精度的同時(shí),能夠使超平面兩側(cè)的空白區(qū)域最大化.理論上來說,支持向量機(jī)能夠?qū)崿F(xiàn)對(duì)線性可分?jǐn)?shù)據(jù)的最優(yōu)分類[6].由于SVM 是以樣本間的距離作為劃分依據(jù)的模式識(shí)別方法,具有較好的泛化能力,其數(shù)學(xué)模型中樣本僅以點(diǎn)積形式出現(xiàn),使得這種方法很容易推廣到非線性情況[7].
SVM的原理就是通過在原空間或經(jīng)投影后在高維空間中構(gòu)造最優(yōu)分類面,將給定的屬于2個(gè)類別的訓(xùn)練樣本分開,構(gòu)造超平面的依據(jù)是2類樣本離超平面的距離最大化.對(duì)于線性可分問題,其原理是設(shè)定劃分訓(xùn)練集的初始超平面,并根據(jù)最大間隔原則對(duì)其進(jìn)行優(yōu)化,確定最終的決策超平面(決策函數(shù)),從而使得訓(xùn)練集中的樣本能夠正確分類;對(duì)近似線性可分問題,則是通過引入松弛變量,來“軟化”線性可分問題對(duì)優(yōu)化間隔的要求,即允許有不滿足約束條件的樣本點(diǎn)存在,并引入一個(gè)懲罰參數(shù)加以適當(dāng)限制,從而將近似線性可分問題轉(zhuǎn)化為線性可分問題進(jìn)行求解.而對(duì)于非線性可分問題,可通過一個(gè)非限制性核函數(shù)將輸入向量映射到高維線性特征空間,將非線性可分問題轉(zhuǎn)化為線性可分問題進(jìn)行求解.因此,近似線性可分問題和非線性可分問題最終都可以轉(zhuǎn)化為線性可分問題進(jìn)行求解.
假設(shè)線性可分類問題的訓(xùn)練集為
其中,xi∈X=Rn,yi∈Y={+1,- 1},i=1,2,…,n.考慮問題為線性可分,則在Rn中必存在著超平面:
使得訓(xùn)練點(diǎn)中的正類輸入和負(fù)類輸入分別位于超平面的兩側(cè),或者是存在參數(shù)對(duì)(ω,b),使得
根據(jù)規(guī)范超平面的形式及其充要條件,結(jié)合最大間隔原則,分類問題可表述成一個(gè)最優(yōu)化問題:
對(duì)于近似線性可分問題,由于需要適當(dāng)“軟化”對(duì)間隔的要求,即允許有不滿足約束條件yi((ω·xi)+b)≥1的樣本點(diǎn)存在,故引入松弛變量 ξi≥0,i=1,2,…,n,從而得到新的約束條件:
為了避免ξi取太大的值,可引入懲罰參數(shù)C>0,在目標(biāo)函數(shù)里對(duì)它們進(jìn)行懲罰.于是,原始問題轉(zhuǎn)化為最優(yōu)化問題:
按照最優(yōu)化理論中凸二次規(guī)劃的解法,可將其轉(zhuǎn)化為 Wolfe對(duì)偶問題來求解.因此,構(gòu)造 Lagrange函數(shù)并推導(dǎo)出原問題的Wolfe對(duì)偶問題為
式中,αi為Lagrange乘子.
假設(shè)是對(duì)偶問題(7)的任一解,可以得到原始問題的一個(gè)解(ω*,b*,ξ*).然后計(jì)算;選擇α*的一個(gè)小于C的正分量,并據(jù)此計(jì)算xj).最后構(gòu)造超平面(ω*·x)+b*=0,求得決策函數(shù):
對(duì)于非線性可分問題,引入實(shí)現(xiàn)線性映射的核函數(shù)K(xi,xj).選擇不同的核函數(shù)K(xi,xj),可構(gòu)成不同的支持向量機(jī),其決策函數(shù)的形式為
從低維空間向高維空間映射過程中空間維數(shù)會(huì)急速增長,在特征空間中直接計(jì)算最優(yōu)分類超平面將變得非常復(fù)雜,而支持向量機(jī)采用核函數(shù)則可以將這一問題轉(zhuǎn)化到輸入空間中進(jìn)行.目前,常用的核函數(shù)主要有:
①線性核函數(shù)
②多項(xiàng)式核函數(shù)
③徑向基核函數(shù)(RBF)
④多層感知器核函數(shù)(Sigmoid核函數(shù))
由于RBF核函數(shù)可以將樣本非線性地映射到更高維的空間中,從而解決了類別和屬性間非線性的關(guān)系問題,并且RBF核函數(shù)數(shù)值限制條件較少,參數(shù)的數(shù)目也較少.而線性核函數(shù)是RBF核函數(shù)的特例,Sigmoid核函數(shù)取某些特定參數(shù)時(shí)的性能與RBF核函數(shù)相同[8].因此,本文在SVM 評(píng)價(jià)模型中選擇RBF核函數(shù).
由于在SVM中引入了最優(yōu)超平面,因此,可以利用這種特性對(duì)數(shù)據(jù)進(jìn)行分類,使得SVM只是一個(gè)二元分類算法,即尋找一個(gè)滿足分類要求的分割平面,并使訓(xùn)練集中的點(diǎn)距離該分割平面盡可能遠(yuǎn).然而,當(dāng)運(yùn)用SVM理論進(jìn)行綜合評(píng)價(jià)時(shí),需要對(duì)評(píng)價(jià)對(duì)象進(jìn)行評(píng)價(jià)確定其評(píng)價(jià)等級(jí),即判斷評(píng)價(jià)對(duì)象所屬類,這是多元分類問題,因此需要構(gòu)造多分類模型.目前,支持向量機(jī)多分類模型主要有“一對(duì)一”方法和“一對(duì)多”方法[7].由于后者具有較高的分類速度,能避免分類中的不可分區(qū)域,并且在計(jì)算機(jī)編程時(shí)相對(duì)容易實(shí)現(xiàn),因此在SVM多分類評(píng)價(jià)中,多選用“一對(duì)多”方法.
2.1.1 “一對(duì)一”方法
“一對(duì)一”方法(one-against-one method)是在k類訓(xùn)練樣本中構(gòu)造所有可能的2類分類器,每個(gè)分類器僅在k類中的2類訓(xùn)練樣本上訓(xùn)練,分別構(gòu)造k(k-1)/2個(gè)SVM分類器.在構(gòu)造類別i和類別j的SVM子分類器時(shí),樣本數(shù)據(jù)集分別選取屬于類別i和類別j的樣本數(shù)據(jù)作為訓(xùn)練樣本數(shù)據(jù),并將屬于類別i的數(shù)據(jù)標(biāo)記為正,將屬于類別j的數(shù)據(jù)標(biāo)記為負(fù).測(cè)試時(shí),將測(cè)試數(shù)據(jù)對(duì)k(k-1)/2個(gè)SVM子分類器分別進(jìn)行測(cè)試,并累計(jì)各類別的得分,選擇得分最高者對(duì)應(yīng)的類別為測(cè)試數(shù)據(jù)的類別.
2.1.2 “一對(duì)多”方法
“一對(duì)多”方法(one-against-rest method)的主要思想是在k類訓(xùn)練樣本中分別構(gòu)造k個(gè)支持向量機(jī)子分類器.在構(gòu)造第i個(gè)支持向量機(jī)子分類器時(shí),將屬于第i類別的樣本數(shù)據(jù)標(biāo)記為正類,不屬于i類別的數(shù)據(jù)標(biāo)記為負(fù)類.測(cè)試時(shí),對(duì)測(cè)試數(shù)據(jù)分別計(jì)算各個(gè)子分類器的決策函數(shù)值,并選取最大函數(shù)值所對(duì)應(yīng)類別作為測(cè)試數(shù)據(jù)的類別.因此,該方法只需要訓(xùn)練k個(gè)兩分類支持向量機(jī),故其所得到的分類函數(shù)的個(gè)數(shù)(k個(gè))較少,分類速度相對(duì)較快.但是,由于每個(gè)分類器的訓(xùn)練都需要將全部的樣本作為訓(xùn)練樣本,這樣需要求解k個(gè)二次規(guī)劃問題,因此其訓(xùn)練速度隨著訓(xùn)練樣本數(shù)量的增加而急劇降低.
基于支持向量機(jī)理論的綜合評(píng)價(jià)實(shí)質(zhì)上就是將評(píng)價(jià)對(duì)象經(jīng)標(biāo)準(zhǔn)化處理,運(yùn)用理想分類器經(jīng)決策函數(shù)運(yùn)算輸出分類結(jié)果,即為綜合評(píng)價(jià)等級(jí).SVM評(píng)價(jià)不僅避免了模糊綜合評(píng)價(jià)和灰色聚類等方法權(quán)重賦值和隸屬函數(shù)確定中的人為因素的影響,而且在有較多評(píng)價(jià)對(duì)象時(shí),具有較高的評(píng)價(jià)效率.SVM綜合評(píng)價(jià)模型步驟為:
①確定評(píng)價(jià)的種類.若評(píng)價(jià)對(duì)象劃分為e個(gè)等級(jí),采用“一對(duì)多”分類方法,共構(gòu)造e個(gè)兩分類支持向量機(jī).
②按照評(píng)價(jià)對(duì)象各評(píng)價(jià)指標(biāo)的e個(gè)分類等級(jí),每個(gè)等級(jí)分別設(shè)計(jì)m個(gè)訓(xùn)練樣本,這樣總訓(xùn)練樣本數(shù)為me個(gè).
③先用訓(xùn)練樣本進(jìn)行訓(xùn)練,對(duì)參數(shù)進(jìn)行校正,通過實(shí)驗(yàn)確定不同的參數(shù),然后比較選擇較好的參數(shù),這里取σ2=0.2,C=1.采用k-fold交叉驗(yàn)證優(yōu)化參數(shù),其基本思想是首先將樣本隨機(jī)等分成k份,每份中的2類樣本數(shù)具有相同的比例,然后輪流選擇其中1份為測(cè)試集,其余k-1份為訓(xùn)練集,進(jìn)行交叉驗(yàn)證,不斷調(diào)整核參數(shù),當(dāng)測(cè)試誤差達(dá)到理想值時(shí),即可得到最優(yōu)核參數(shù)C和r,得到的分類器即為理想分類器.
④將評(píng)價(jià)對(duì)象數(shù)據(jù)標(biāo)準(zhǔn)化,即將數(shù)據(jù)轉(zhuǎn)換到[0,1]區(qū)間內(nèi),輸入SVM 模型中求解出特征值.
⑤根據(jù)輸出的特征值,確定評(píng)價(jià)對(duì)象的分類.
基于SVM的綜合評(píng)價(jià)模型如圖1所示.
圖1 基于SVM的綜合評(píng)價(jià)模型
基于SVM的綜合評(píng)價(jià)與基于BP神經(jīng)網(wǎng)絡(luò)的綜合評(píng)價(jià)同屬于機(jī)器評(píng)價(jià),有必要對(duì)2種機(jī)器評(píng)價(jià)方法進(jìn)行對(duì)比分析.
神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)方法的機(jī)理是根據(jù)學(xué)習(xí)模式的數(shù)據(jù),通過學(xué)習(xí)和訓(xùn)練,找出輸入與輸出之間的內(nèi)在聯(lián)系,進(jìn)而求得問題的解.該方法對(duì)于弱化權(quán)重向量求解中的人為因素,是十分有益的.并且基于BP網(wǎng)絡(luò)的評(píng)價(jià)方法能夠處理含有噪聲或不完全的數(shù)據(jù),具有較強(qiáng)的容錯(cuò)能力[9].
對(duì)于線性可分?jǐn)?shù)據(jù)的二值分類,如果采用神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn),可以簡單描述為系統(tǒng)隨機(jī)產(chǎn)生一個(gè)超平面并移動(dòng)它,直到訓(xùn)練集合中屬于不同類別的點(diǎn)正好位于該超平面的不同側(cè)面,則分類完成.但是這種機(jī)理決定了其不能保證最終所獲得的分割平面位于2個(gè)類別的中心,這對(duì)于分類問題的容錯(cuò)性是不利的.而保證最終所獲得的平面位于2個(gè)類別的中心對(duì)于分類問題的實(shí)際應(yīng)用是相當(dāng)重要的.
與傳統(tǒng)機(jī)器評(píng)價(jià)方法相比,SVM綜合評(píng)價(jià)方法不僅克服了傳統(tǒng)機(jī)器評(píng)價(jià)方法對(duì)樣本數(shù)據(jù)要求過高的缺點(diǎn),還有效地克服了維數(shù)災(zāi)及局部極小問題,并在處理非線性問題時(shí)計(jì)算簡便、誤差極小,顯示了其優(yōu)越性.神經(jīng)網(wǎng)絡(luò)方法雖然也能解決非線性問題,但由于其存在結(jié)構(gòu)不易確定、易陷入“過學(xué)習(xí)”和局部極小等固有的缺陷,從而限制了其實(shí)際應(yīng)用.
SVM綜合評(píng)價(jià)方法與基于BP神經(jīng)網(wǎng)絡(luò)的評(píng)價(jià)方法相比較,其主要優(yōu)點(diǎn)有:
1)不需要大批量的樣本,而是針對(duì)有限樣本.SVM能充分利用訓(xùn)練樣本的分布特性在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折中,并且目標(biāo)是得到現(xiàn)有信息下的最優(yōu)解而不是樣本數(shù)趨于無窮大時(shí)的最優(yōu)值,解決了樣本數(shù)據(jù)不足帶來的問題.
2)SVM評(píng)價(jià)模型最終將評(píng)價(jià)過程轉(zhuǎn)化為一個(gè)二次型尋優(yōu)問題,從理論上說,得到的將是全局最優(yōu)解,解決了在神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)方法中無法避免的局部極值問題.
3)SVM評(píng)價(jià)模型將復(fù)雜系統(tǒng)問題通過非線性變化轉(zhuǎn)換到高維特征空間,并構(gòu)造線性判別函數(shù)來實(shí)現(xiàn)原始空間中的非線性判別函數(shù),特殊性質(zhì)的核函數(shù)能保證機(jī)器有較好的推廣能力并能巧妙地解決高維問題.
4)SVM評(píng)價(jià)模型的目標(biāo)是結(jié)構(gòu)風(fēng)險(xiǎn)最小化,同時(shí)考慮了經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍的最小化,因而SVM評(píng)價(jià)模型具有較好的推廣能力.
根據(jù)經(jīng)濟(jì)圈交通網(wǎng)絡(luò)特征,篩選出表征經(jīng)濟(jì)圈交通網(wǎng)絡(luò)特性的20個(gè)指標(biāo)構(gòu)建經(jīng)濟(jì)圈交通網(wǎng)絡(luò)指標(biāo)體系,通過查找相應(yīng)年鑒以及指標(biāo)統(tǒng)計(jì)數(shù)據(jù),計(jì)算各指標(biāo)對(duì)應(yīng)屬性值以及預(yù)測(cè)目標(biāo)年屬性值,運(yùn)用SVM評(píng)價(jià)綜合方法進(jìn)行橫向和縱向?qū)Ρ仍u(píng)價(jià).經(jīng)濟(jì)圈交通網(wǎng)絡(luò)評(píng)價(jià)指標(biāo)與對(duì)應(yīng)屬性值如表1所示.
根據(jù)SVM相關(guān)理論及SVM多分類器原理,經(jīng)濟(jì)圈交通網(wǎng)絡(luò)SVM評(píng)價(jià)方法步驟如下:
步驟1 抽取訓(xùn)練樣本和測(cè)試樣本
按照評(píng)價(jià)指標(biāo)體系分級(jí)標(biāo)準(zhǔn),對(duì)應(yīng)每一等級(jí)建立10組樣本數(shù)據(jù),共5×10=50組樣本數(shù)據(jù),每一組樣本數(shù)據(jù)對(duì)應(yīng)20個(gè)指標(biāo)數(shù)值和1個(gè)對(duì)應(yīng)等級(jí)值,“優(yōu)”、“良”、“中”、“一般”、“差”5個(gè)等級(jí)分別用數(shù)值1~5對(duì)應(yīng).最后,在樣本數(shù)據(jù)中從每個(gè)等級(jí)抽取2組數(shù)據(jù)作為測(cè)試樣本,則測(cè)試樣本共計(jì)10組.
表1 珠三角經(jīng)濟(jì)圈與長三角經(jīng)濟(jì)圈交通網(wǎng)絡(luò)評(píng)價(jià)指標(biāo)屬性值
步驟2 評(píng)價(jià)指標(biāo)標(biāo)準(zhǔn)化
由于各個(gè)指標(biāo)屬于不同的數(shù)量級(jí),沒有統(tǒng)一的度量標(biāo)準(zhǔn),因此要對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,使之無量綱化和歸一化.設(shè)xij(i=1,2,…,n;j=1,2,…,m)為評(píng)價(jià)系統(tǒng)內(nèi)第i個(gè)評(píng)價(jià)對(duì)象中第j個(gè)指標(biāo)的原始值,設(shè)x0j為第j個(gè)指標(biāo)在各評(píng)價(jià)對(duì)象中的最優(yōu)值(“效益”型指標(biāo)取該指標(biāo)在各評(píng)價(jià)對(duì)象中的最大值,“成本型”指標(biāo)取該指標(biāo)在各評(píng)價(jià)對(duì)象中的最小值),于是X0=(x01,x02,…,x0m)為該系統(tǒng)內(nèi)的最優(yōu)指標(biāo)集(所對(duì)應(yīng)的方案為最優(yōu)方案),即參考數(shù)列.實(shí)驗(yàn)表明,若不進(jìn)行指標(biāo)標(biāo)準(zhǔn)化處理,則會(huì)降低機(jī)器評(píng)價(jià)運(yùn)算速度,增加評(píng)價(jià)誤差.
步驟3 構(gòu)造多分類支持向量機(jī)
選擇“一對(duì)多”方法構(gòu)造多分類SVM模型,并基于Matlab 7.0軟件以及SVM工具箱進(jìn)行編程,其中核函數(shù)取RBF核函數(shù).設(shè)懲罰因子初值C=1,σ2=0.2,用步驟1中的50個(gè)有效樣本對(duì)支持向量機(jī)進(jìn)行訓(xùn)練.將10組測(cè)試樣本代入SVM模型,輸出的對(duì)應(yīng)類別若不符合實(shí)際,則利用k-fold交叉驗(yàn)證優(yōu)化參數(shù),直到輸出和測(cè)試樣本類別一致為止.
步驟4 判別評(píng)價(jià)對(duì)象所屬類別
將指標(biāo)數(shù)據(jù)標(biāo)準(zhǔn)化后的6組評(píng)價(jià)對(duì)象輸入支持向量機(jī)模型(SVM綜合評(píng)價(jià)程序),計(jì)算求出所屬類別.當(dāng)懲罰因子C=2,σ2=0.4時(shí),分別進(jìn)行5次運(yùn)算,輸出6組評(píng)價(jià)對(duì)象的所屬類別,如表2所示.
為了驗(yàn)證輸出類別的正確性,即評(píng)價(jià)結(jié)果的合理性,按照物元評(píng)價(jià)方法進(jìn)行評(píng)價(jià),所得到的計(jì)算結(jié)果與運(yùn)用SVM分類得到的結(jié)果完全相同(見表2).為了驗(yàn)證SVM評(píng)價(jià)方法在機(jī)器評(píng)價(jià)中的優(yōu)勢(shì),采用基于BP神經(jīng)網(wǎng)絡(luò)的評(píng)價(jià)方法[10],對(duì)同一樣本數(shù)據(jù)及評(píng)價(jià)對(duì)象進(jìn)行評(píng)價(jià).設(shè)置神經(jīng)網(wǎng)絡(luò)隱層節(jié)點(diǎn)數(shù)為20,輸出維數(shù)為5,訓(xùn)練次數(shù)為100,對(duì)上述50組有效樣本進(jìn)行訓(xùn)練學(xué)習(xí),然后輸入6組待評(píng)價(jià)數(shù)據(jù),分別進(jìn)行5次運(yùn)算,計(jì)算結(jié)果和運(yùn)算時(shí)間如表2所示.
表2 基于SVM的經(jīng)濟(jì)圈交通網(wǎng)絡(luò)評(píng)價(jià)結(jié)果
由表2可看出,基于SVM的評(píng)價(jià)算法與基于神經(jīng)網(wǎng)絡(luò)的評(píng)價(jià)算法相比,計(jì)算時(shí)間至少降低了94.12%,并且經(jīng)過多次連續(xù)運(yùn)算結(jié)果穩(wěn)定,沒有出現(xiàn)過學(xué)習(xí)和泛化性問題.而基于神經(jīng)網(wǎng)絡(luò)的評(píng)價(jià),經(jīng)過5次運(yùn)算得到的評(píng)價(jià)結(jié)論不盡相同.這是由于基于神經(jīng)網(wǎng)絡(luò)的評(píng)價(jià)機(jī)理決定了其分類最終獲得的分割面相當(dāng)靠近訓(xùn)練集中的點(diǎn),從而出現(xiàn)“過學(xué)習(xí)”現(xiàn)象,造成神經(jīng)網(wǎng)絡(luò)方法的泛化性能較差.而SVM評(píng)價(jià)方法中引入了最優(yōu)超平面,使訓(xùn)練集中的點(diǎn)距離該分割平面盡可能遠(yuǎn),也就是保證分割平面兩側(cè)的空白區(qū)域最大,因此評(píng)價(jià)結(jié)果穩(wěn)定性較好.
對(duì)評(píng)價(jià)結(jié)果進(jìn)行分析,2020年珠三角經(jīng)濟(jì)圈交通網(wǎng)絡(luò)發(fā)展水平為等級(jí)2,即發(fā)展水平為“良”,2007年、2008年、2012年珠三角經(jīng)濟(jì)圈交通網(wǎng)絡(luò)發(fā)展水平為等級(jí)3,因此都處于“中等”狀態(tài),而2006年珠三角經(jīng)濟(jì)圈與2007年長三角經(jīng)濟(jì)圈交通網(wǎng)絡(luò)發(fā)展水平則處于“一般”狀態(tài).由于評(píng)價(jià)對(duì)象X1和X6分類結(jié)果都為等級(jí)4,X2,X3和X4的分類結(jié)果都為等級(jí)3,因此需要進(jìn)一步對(duì)評(píng)價(jià)對(duì)象進(jìn)行優(yōu)劣排序,可以根據(jù)評(píng)價(jià)對(duì)象數(shù)據(jù)映射到特征空間內(nèi)與最優(yōu)超平面之間的最短距離判斷其優(yōu)劣.計(jì)算同一等級(jí)下評(píng)價(jià)指標(biāo)數(shù)據(jù)在SVM中映射到特征空間內(nèi)時(shí)與超平面的距離值,結(jié)果如表3所示.
表3 經(jīng)濟(jì)圈交通網(wǎng)絡(luò)SVM評(píng)價(jià)距離值
根據(jù)表3,在同一等級(jí)3時(shí)(評(píng)價(jià)等級(jí)“中”),評(píng)價(jià)對(duì)象X2,X3和X4的評(píng)價(jià)指標(biāo)數(shù)據(jù)在SVM 中映射到特征空間中與超平面(分類3)的距離排序?yàn)閐4>d3>d2,因此評(píng)價(jià)對(duì)象X4?X3?X2(“?”表示優(yōu)于),即珠三角經(jīng)濟(jì)圈交通網(wǎng)絡(luò)發(fā)展水平狀況為:X5?X4?X3?X2?X1.
而在輸出等級(jí)為4時(shí)(評(píng)價(jià)等級(jí)“一般”),評(píng)價(jià)對(duì)象X1和X6的評(píng)價(jià)指標(biāo)數(shù)映射到特征空間中與超平面(分類4)的距離相比較有d6>d1,即X6?X1,因此2006年長三角經(jīng)濟(jì)圈交通網(wǎng)絡(luò)的發(fā)展水平比同時(shí)期的珠三角經(jīng)濟(jì)圈交通網(wǎng)絡(luò)發(fā)展水平要高一些.綜上,可以確定評(píng)價(jià)對(duì)象的優(yōu)劣排序?yàn)?X5?X4?X3?X2?X6?X1.
1)與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)方法相比,支持向量機(jī)評(píng)價(jià)方法從結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則出發(fā),求解的是一個(gè)二次型尋優(yōu)問題從而得到全局最優(yōu)解,有效地解決了過學(xué)習(xí)、非線性以及局部極小等問題,在小樣本、非線性、高維模式下的系統(tǒng)評(píng)價(jià)問題中具有許多特有的優(yōu)勢(shì).
2)經(jīng)濟(jì)圈交通網(wǎng)絡(luò)SVM評(píng)價(jià)方法,具有評(píng)價(jià)效率高、客觀性強(qiáng)、評(píng)價(jià)結(jié)論準(zhǔn)確等優(yōu)點(diǎn),并可以運(yùn)用計(jì)算機(jī)快速評(píng)價(jià),適用于具有較多評(píng)價(jià)對(duì)象的復(fù)雜系統(tǒng),因此在經(jīng)濟(jì)圈交通網(wǎng)絡(luò)多指標(biāo)綜合評(píng)價(jià)中有著較好的應(yīng)用前景.
[1]Vapnik V.Statistic learning theory[M].2nd ed.New York:Springer-Verlag,1999.
[2]鄧乃楊,田英杰.數(shù)據(jù)挖掘中的新方法——支持向量機(jī)[M].北京:科學(xué)出版社,2005.
[3]劉偉,孫林.基于支持向量機(jī)的課堂教學(xué)質(zhì)量評(píng)價(jià)[J].合肥工業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2010,33(7):968-971.
Liu Wei,Sun Lin.Classroom teaching quality assessment based on support vector machine[J].Journal of Hefei University of Technology:Natural Science Edition,2010,33(7):968-971.(in Chinese)
[4]梁雪春,龔艷冰,肖迪.一種多核加權(quán)支持向量機(jī)的水質(zhì)預(yù)測(cè)方法[J].東南大學(xué)學(xué)報(bào):自然科學(xué)版,2011,41(S1):14-17.
Liang Xuechun,Gong Yanbing,Xiao Di.Novel method for water quality prediction based on multi-kernel weighted support vector machine[J].Journal of Southeast University:Natural Science Edition,2011,41(S1):14-17.(in Chinese)
[5]Boser B,Guyon L,Vapnik V.A training algorithm for optima margin classifier[C]//Fifth Annual Workshop on Computational Learning Theory.Baltimore,MD,USA:ACM Press,1992:144-152.
[6] Vapnik V,Gokowich S,Smola A.Support vector method for function approximation,regression estimation,and signal procession[M]//Advances in Neural Information Processing Systems9.Cambridge,MA,USA:MIT Press,1997:281-287.
[7]徐紅敏.基于支持向量機(jī)理論的水環(huán)境質(zhì)量預(yù)測(cè)與評(píng)價(jià)方法研究[D].長春:吉林大學(xué),2007.
[8]劉坤,劉賢趙,孫瑾,等.基于支持向量機(jī)的水環(huán)境質(zhì)量綜合評(píng)價(jià)[J].中國環(huán)境監(jiān)測(cè),2007,23(3):81-84.
Liu Kun,Liu Xianzhao,Sun Jin,et al.Comprehensive assessment of water environmental quality based on support vector machine[J].Environmental Monitoring in China,2007,23(3):81-84.(in Chinese)
[9]陳君,李聰穎,丁光明.基于BP神經(jīng)網(wǎng)絡(luò)的高速公路交通安全評(píng)價(jià)[J].同濟(jì)大學(xué)學(xué)報(bào):自然科學(xué)版,2008,36(7):927-931.Chen Jun,Li Congying,Ding Guangming.Traffic safety assessment of freeway based on BP neural network[J].Journal of Tongji University:Natural Science,2008,36(7):927-931.(in Chinese)
[10]周偉,張生瑞,高行山.基于模糊理論和神經(jīng)網(wǎng)絡(luò)技術(shù)的公路網(wǎng)綜合評(píng)價(jià)方法研究[J].中國公路學(xué)報(bào),1997,10(4):76-83.
Zhou Wei,Zhang Shengrui,Gao Xingshan.A study of the comprehensive evaluation for the road network based on the fuzzy theory and neural network[J].China Journal of Highway and Transport,1997,10(4):76-83.(in Chinese)
SVM evaluation method of transportation network in economic circle
Zhang Bing1Deng Wei2
(1College of Civil Engineering and Architecture,East China Jiaotong University,Nanchang 330013,China)
(2School of Transportation,Southeast University,Nanjing 210096,China)
To evaluate the development level of the transportation network in economic circle efficiently and scientifically,a new machine evaluation method called support vector machine comprehensive evaluation method is established.The comprehensive evaluation model is built by the support vector machine multi-classification method based on the analysis of the support vector machine theory,and the steps of the evaluation of the transportation network in economic circle are proposed.Then,comprehensive evaluation procedure is realized by Matlab 7.0 software and the radial basis function(RBF)kernel is selected.Finally,the support vector machine comprehensive evaluation method,the neural network evaluation method and the matter-element evaluation method are applied to evaluate the development level of transportation network of the Pearl River Delta and the Yangtze River Delta economic circles.The results show that the support vector machine comprehensive evaluation method has a significant effect in multi-pattern recognition and small sample data classification,and it is more efficient and more accurate than the evaluation method based on BP neural network when appropriate kernel function and corresponding punishment parameters are selected.Therefore,the proposed evaluation method can efficiently evaluate the development level of the transport network in economic circle.
transportation network;economic circle;evaluation;support vector machine(SVM);neural network
U491
A
1001-0505(2012)06-1227-06
10.3969/j.issn.1001 -0505.2012.06.037
2012-04-12.
張兵(1981—),男,博士,講師,zbing1981@sohu.com.
國家高技術(shù)研究發(fā)展計(jì)劃(863計(jì)劃)資助項(xiàng)目(2007AA11Z202).
張兵,鄧衛(wèi).經(jīng)濟(jì)圈交通網(wǎng)絡(luò) SVM 評(píng)價(jià)方法[J].東南大學(xué)學(xué)報(bào):自然科學(xué)版,2012,42(6):1227-1232.[doi:10.3969/j.issn.1001-0505.2012.06.037]