国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

長短時記憶神經(jīng)網(wǎng)絡(luò)模型改進

2016-09-10 22:26唐寅
時代金融 2016年24期
關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò)

【摘要】由于神經(jīng)網(wǎng)絡(luò)自身的高度自學(xué)習(xí)性,穩(wěn)定性以及抽象模擬能力,相比于統(tǒng)計學(xué)以及計量經(jīng)濟學(xué)中的數(shù)學(xué)模型,神經(jīng)網(wǎng)絡(luò)用于預(yù)測金融時間序列更具優(yōu)勢。本文在深入分析LSTM神經(jīng)網(wǎng)絡(luò)對股指進行短期時間序列預(yù)測的可行性。

【關(guān)鍵詞】LSTM RNN 神經(jīng)網(wǎng)絡(luò) 股指預(yù)測

一、LSTM神經(jīng)網(wǎng)絡(luò)分析

LSTM(長短時記憶)神經(jīng)網(wǎng)絡(luò)是建立在RNN上的一種新型深度機器學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)。在這個模型中LSTM單元包含一個嘗試將信息儲存較久的存儲單元。這個記憶單元的入口被一些特殊的門控制,被控制的功能包括保存、寫入和讀取操作。這些門都是邏輯單元,它們負責(zé)在神經(jīng)網(wǎng)絡(luò)的其它部分與記憶單元連接的邊緣處設(shè)定權(quán)值。這個記憶單元是一個線型的神經(jīng)元,有自體內(nèi)部連接。具體來說就是其在每一個神經(jīng)元內(nèi)部加入了三個門,分別是輸入門、輸出門和忘記門。用來選擇性記憶反饋的誤差函數(shù)隨梯度下降的修正參數(shù)。當(dāng)忘記門被打開時,自己連接權(quán)值為1,記憶單元將內(nèi)容寫入自身。當(dāng)忘記門輸出為0時,記憶單元會清除之前的內(nèi)容。輸出門允許在輸出值為1的時候,神經(jīng)網(wǎng)絡(luò)的其它部分將內(nèi)容記入記憶單元,而輸入門則允許在輸出值為1的時候,神經(jīng)網(wǎng)絡(luò)的其它部分讀取記憶單元。模型結(jié)構(gòu)如下:

Cell,就是神經(jīng)元狀態(tài)的記憶,有個叫做state的參數(shù)來記錄狀態(tài)的。Forget Gate:將上一次神經(jīng)元的狀態(tài)選擇性遺忘修正參數(shù)。對于每個存儲單元,三套權(quán)重從輸入訓(xùn)練而得,包括先前時間步中完整的隱藏狀態(tài)。一個帶入到輸入節(jié)點,在上圖的底部。一個帶入到忘記門,在最右側(cè)顯示。另一個帶入到輸出門,在頂部最左側(cè)的顯示。每個黑色節(jié)點與一個激活函數(shù)相關(guān)聯(lián),典型的激活函數(shù)為S型函數(shù)。單元中最中央的節(jié)點即內(nèi)部狀態(tài),并且以數(shù)量1為權(quán)重來跨越時間步,再反饋到本身。內(nèi)部狀態(tài)的自連接邊,被稱為恒定誤差傳送帶或CEC。

以前傳遞為例,輸入門來決定何時讓激活狀態(tài)傳入存儲單元cell,而輸出門決定何時讓激活傳出存儲單元,這些都是通過訓(xùn)練學(xué)習(xí)而確定的。最后忘記門用來學(xué)習(xí)是否記憶上一個神經(jīng)元狀態(tài)的全部或部分或完全遺忘。后傳遞也是同樣的道理,輸出門是在學(xué)習(xí)什么時候讓誤差流入存儲單元,而輸入門則學(xué)習(xí)什么時候讓它流出存儲單元,并傳到神經(jīng)網(wǎng)絡(luò)的其它部分。忘記門也是一樣。以下按照一般算法的計算順序來給出每個部分的公式:

帶下標(biāo)L的是跟Input Gate相關(guān)的,連向Input Gate包括:外面的輸入,來自Cell的那個虛線(虛線叫做peephole連接),帶H的是一個泛指,因為LSTM的一個重要特點就是其靈活性,cell之間可以互聯(lián),hidden units之間可以互聯(lián),所以這個H就是泛指這些連進來的東西,可以看成是從外面連進了的三條邊的一部分。

FORGET GATE:

后向傳播中的偏微分求導(dǎo)由于非常復(fù)雜,在這里就不贅述了,只要明白對每個門中經(jīng)過的參數(shù)求偏導(dǎo)是為了按梯度的方向進行收斂并修正權(quán)值。

二、LSTM神經(jīng)網(wǎng)絡(luò)模型的優(yōu)勢及問題

LSTM的出現(xiàn)的原因其實是因為RNN轉(zhuǎn)換成超級長的傳統(tǒng)神經(jīng)網(wǎng)絡(luò)后,利用BP反向傳播的時候,誤差會逐級減小,但由于展開的太長了,誤差需要歸因到每一層每一個神經(jīng)元,這會導(dǎo)致整個訓(xùn)練過程無法逃離局部最優(yōu)解。LSTM正是解決了這個問題,他將每一層的神經(jīng)元設(shè)計成具有多個“門”的結(jié)構(gòu),這使得誤差在傳播過程中,有些可以直接通過“門”,不用歸因于當(dāng)前神經(jīng)元,誤差就完好無損的直接通過到下一層了,因此收斂性很好。

三、LSTM神經(jīng)網(wǎng)絡(luò)模型的算法改進

α學(xué)習(xí)速率是與誤差函數(shù)的一階導(dǎo)數(shù)相乘,來控制隨梯度下降的步長的,雖然α是變化的但是每一次歸因?qū)τ诿總€自變量來說是相同的。可以將α設(shè)為誤差函數(shù)的二階導(dǎo)數(shù),這樣以每一自變量下降的不同速度來隨梯度下降。這種改變的理論依據(jù)源于著名的數(shù)學(xué)理論擬牛頓法。

具體公式為:wn∈w=wold+H-1wold

這里的w為權(quán)值的向量矩陣,H-1為hessian矩陣,這里就是將學(xué)習(xí)速率α設(shè)為誤差函數(shù)的二階導(dǎo)數(shù),從而使每一個自變量(權(quán)值)下降的速度隨各自梯度下降,使模型收斂的更加準確。

四、實證分析

研究對象:選取日成交量最大的標(biāo)普500指數(shù)作為基礎(chǔ)研究對象來驗證模型的準確性,運用LUA語言進行編程,并以TORCH作為深度學(xué)習(xí)框架。進行訓(xùn)練預(yù)測擬合圖形并計算誤差。

LSTM模型預(yù)測誤差均值為0.783%股指。模型收斂的更小,誤差更小,模型預(yù)測準確。

參考文獻

[1]Andrej Karpathy.The Unreasonable Effectiveness of Recurrent Neural Networks[R].,2015.3.

[2]胡新辰.于LSTM的語義關(guān)系分類研究[M].哈爾濱工業(yè)大學(xué).2015.6.

[3]李小燕.灰色神經(jīng)網(wǎng)絡(luò)預(yù)測模型的優(yōu)化研究[D].武漢理工大學(xué).2009.

作者簡介:唐寅(1991-),男,漢族,貴州金沙人,現(xiàn)就讀于首都經(jīng)濟貿(mào)易大學(xué),碩士學(xué)位,研究方向:電子商務(wù)。

猜你喜歡
神經(jīng)網(wǎng)絡(luò)
基于遞歸模糊神經(jīng)網(wǎng)絡(luò)的風(fēng)電平滑控制策略
BP神經(jīng)網(wǎng)絡(luò)在路標(biāo)識別上的應(yīng)用研究
神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
基于Alexnet神經(jīng)網(wǎng)絡(luò)的物體識別研究
基于BP神經(jīng)網(wǎng)絡(luò)的旋轉(zhuǎn)血泵生理控制
基于神經(jīng)網(wǎng)絡(luò)MRAS的速度辨識仿真研究
基于神經(jīng)網(wǎng)絡(luò)的拉矯機控制模型建立
復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
基于支持向量機回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
基于神經(jīng)網(wǎng)絡(luò)分數(shù)階控制的逆變電源
浮梁县| 大足县| 通江县| 蒲城县| 邵阳县| 康平县| 黄龙县| 西丰县| 南城县| 灵台县| 浦江县| 随州市| 安多县| 三原县| 博湖县| 丰城市| 普宁市| 武鸣县| 疏勒县| 若羌县| 西和县| 彝良县| 新津县| 营山县| 郯城县| 济阳县| 伊川县| 运城市| 监利县| 离岛区| 驻马店市| 宁津县| 尼勒克县| 崇左市| 称多县| 安达市| 渭源县| 洛南县| 五寨县| 仙游县| 象山县|