楊嘉慶 周俊峰
摘要:本文系統(tǒng)地介紹了神經(jīng)網(wǎng)絡(luò)模型中徑向基函數(shù)網(wǎng)絡(luò)模型的數(shù)學(xué)理論,包括他的原理,算法步驟和實(shí)證過(guò)程。
關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò)模型 徑向基函數(shù)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)是一種基于腦與神經(jīng)系統(tǒng)的仿真模型,它是模擬人的神經(jīng)結(jié)構(gòu)思維并行計(jì)算方式啟發(fā)形成的一種信息描述和信息處理的數(shù)學(xué)模型。它具有自我學(xué)習(xí)能力,從一組輸入數(shù)據(jù)中學(xué)習(xí),然后不斷調(diào)整模型參數(shù),以建造更合適的模型。因此,神經(jīng)網(wǎng)絡(luò)的工作過(guò)程一般來(lái)講包含兩個(gè)階段:
訓(xùn)練階段:主要是調(diào)整網(wǎng)絡(luò)神經(jīng)元間的連接權(quán)值和連接方法等,因?yàn)槭聦?shí)上正是連接方式和連接權(quán)值決定了神經(jīng)網(wǎng)絡(luò)的信息處理能力,所以訓(xùn)練過(guò)程至關(guān)重要。同時(shí),神經(jīng)網(wǎng)絡(luò)因?yàn)榫哂凶詫W(xué)習(xí)和自組織的顯著特征,它既可以有導(dǎo)師也可以無(wú)導(dǎo)師的自主學(xué)習(xí),從而能夠適應(yīng)外界環(huán)境的復(fù)雜變化。
驗(yàn)證階段:在這個(gè)階段網(wǎng)絡(luò)的各項(xiàng)已經(jīng)訓(xùn)練好的參數(shù)都不會(huì)發(fā)生變化,此階段的工作過(guò)程主要體現(xiàn)在建立輸入數(shù)據(jù),然后根據(jù)已經(jīng)訓(xùn)練好的最有參數(shù)建立系統(tǒng)模型,然后再得到輸出數(shù)據(jù),最后比較實(shí)際數(shù)據(jù)與輸出數(shù)據(jù)的誤差。
人工神經(jīng)網(wǎng)絡(luò)在數(shù)學(xué)上已經(jīng)得到證明,當(dāng)條件允許時(shí),它可以無(wú)限可能地逼近實(shí)際函數(shù),這意味著無(wú)論反映實(shí)際規(guī)律的函數(shù)有多復(fù)雜,形式有多不規(guī)范,神經(jīng)網(wǎng)絡(luò)都能逼近那些并不“友好”的函數(shù),這樣得天獨(dú)厚的特點(diǎn)對(duì)于復(fù)雜多變的股票市場(chǎng)無(wú)疑具有特別實(shí)際的意義,也因此使得神經(jīng)網(wǎng)絡(luò)在許多領(lǐng)域都得到了成功應(yīng)用。
目前學(xué)界比較重視同時(shí)實(shí)際應(yīng)用中也比較廣泛的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法有前饋式神經(jīng)網(wǎng)絡(luò)(BP網(wǎng)絡(luò)),徑向基函數(shù)網(wǎng)絡(luò)(RBF),反饋式網(wǎng)絡(luò)等。目前BP神經(jīng)網(wǎng)絡(luò)在各個(gè)領(lǐng)域中得到較多的應(yīng)用,但是BP神經(jīng)網(wǎng)絡(luò)也有一個(gè)比較致命的弱點(diǎn),就是網(wǎng)絡(luò)收斂過(guò)程常常難以超越局部極小范圍而無(wú)法最終收斂到全局最小。徑向基函數(shù)網(wǎng)絡(luò)是一種三層前饋式神經(jīng)網(wǎng)絡(luò),包括輸入層、隱含層和輸出層,在RBF網(wǎng)絡(luò)中,隱含層節(jié)點(diǎn)的作用實(shí)際上就是執(zhí)行一種非線性變換,使當(dāng)有外界輸入后,它會(huì)利用基函數(shù)實(shí)現(xiàn)線性加權(quán)組合,從而達(dá)到從輸入空間到隱層空間的非線性映射。它具有特別出眾的非線性方面的擬合能力,理論上能夠無(wú)限度的逼近任意給定的非線性函數(shù)。這樣,徑向基函數(shù)網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程可以看作是在高維空間中尋找對(duì)于一個(gè)已經(jīng)指定訓(xùn)練數(shù)據(jù)而言的最優(yōu)擬合超平面。
1.首先對(duì)原始數(shù)據(jù)進(jìn)行歸一化處理,然后構(gòu)建訓(xùn)練集的輸入向量和輸出向量。以每5天的收盤價(jià)作為輸入向量,這樣的做的好處是能夠使股票數(shù)據(jù)的趨勢(shì)性規(guī)律更明顯的顯現(xiàn)出來(lái),然后以第6天的收盤價(jià)作為輸出向量。
2.確定最優(yōu)隱節(jié)點(diǎn)數(shù),通過(guò)不斷的嘗試,在1~50的范圍內(nèi),40是最優(yōu)隱節(jié)點(diǎn)數(shù)。
3.在確定好了隱節(jié)點(diǎn)數(shù)后,進(jìn)行實(shí)際值得預(yù)測(cè)。測(cè)試集的輸入向量是后20組的股票收盤價(jià),直接采用MATLAB自帶工具箱進(jìn)行預(yù)測(cè)。
4.模型結(jié)果評(píng)價(jià)。得到預(yù)測(cè)數(shù)據(jù)之后,對(duì)測(cè)試結(jié)果進(jìn)行分析評(píng)價(jià),評(píng)價(jià)的指標(biāo)即是上文所提到的均方根誤差(RMSE)、平均相對(duì)誤差(MAPE)和相關(guān)系數(shù)R,對(duì)同一個(gè)預(yù)測(cè)變量,其RMSE與MAPE取值越小,說(shuō)明預(yù)測(cè)精度越高。R是對(duì)預(yù)測(cè)值序列和樣本序列線性相關(guān)程度的衡量。相關(guān)系數(shù)有如下性質(zhì):若R的值越大,預(yù)測(cè)值序列與參考值序列線性關(guān)系越密切,預(yù)測(cè)精度也就越高。一般而言,線性相關(guān)系數(shù)越大,其均方根誤差和平均相對(duì)誤差越小,對(duì)各個(gè)不同的預(yù)測(cè)變量RMSE與MAPE相差很大,沒(méi)有統(tǒng)一的標(biāo)準(zhǔn),而R是一個(gè)標(biāo)準(zhǔn)的位于[-L1]區(qū)間的數(shù)值,便于分析比較。所以在本例中,使用相關(guān)系數(shù)R作為衡量模型預(yù)測(cè)精度的標(biāo)準(zhǔn),RMSE與MAPE僅做輔助參考用。結(jié)果表明,神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)精度在預(yù)期范圍內(nèi),不過(guò)模型結(jié)果仍需進(jìn)一步完善。
總體來(lái)說(shuō),人工神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)效果還是比較可靠的,尤其針對(duì)小規(guī)模樣本,而且神經(jīng)網(wǎng)絡(luò)的時(shí)間和內(nèi)存空間的開(kāi)銷都極其有限,需要注意的就是如何選取對(duì)預(yù)測(cè)精度其重要作用的隱節(jié)點(diǎn)數(shù)。