黎 紅,王宏勇
(南京財經(jīng)大學(xué)應(yīng)用數(shù)學(xué)學(xué)院,江蘇 南京 210023)
分形理論的創(chuàng)始人B B Mandelbrot[1]在研究股票價格時間序列的波動規(guī)律時發(fā)現(xiàn),股票價格序列呈現(xiàn)尖峰胖尾的統(tǒng)計特征,不服從正態(tài)分布,因此提出用分形分布來描述股票收益序列.研究[2-5]表明,金融市場的波動具有明顯的非線性分形特征.將分形的理論和方法與某些統(tǒng)計分析模型或者數(shù)據(jù)挖掘技術(shù)相結(jié)合,成為研究現(xiàn)代金融市場的非線性范式.[6-9]在分形分析方法中,基于迭代函數(shù)系理論發(fā)展起來的分形插值技術(shù)是擬合數(shù)據(jù)的新方法[10],它尤其適合應(yīng)用于研究非平穩(wěn)數(shù)據(jù)和非光滑曲線的逼近、擬合及趨勢預(yù)測[11-12].在利用分形插值方法對數(shù)據(jù)進(jìn)行擬合和預(yù)測時,分形插值迭代函數(shù)系的一組自由參數(shù)——縱向尺度因子,對于擬合效果具有決定性的影響.翟明岳[13]令所有的縱向尺度因子都相等,再利用數(shù)據(jù)序列的分形維數(shù)或者Hurst指數(shù)求出這些相等的縱向尺度因子.當(dāng)然,也有其他求縱向尺度因子的方法[14],但是計算非常復(fù)雜.此外,利用分形插值進(jìn)行預(yù)測時,對于最后一個預(yù)測值常常需要先給出期望值,然后利用外推法來確定其他預(yù)測點(diǎn)的值.因受到預(yù)先給定的期望值的影響,這些預(yù)測值的精確性難以保證.近年來,支持向量機(jī)(Support Vector Machine,SVM)越來越多地被應(yīng)用于金融時間序列的預(yù)測[7,15-18].SVM是一種基于統(tǒng)計理論發(fā)展起來的數(shù)據(jù)挖掘方法,在求解小樣本、非線性和高維模式識別問題時有優(yōu)勢;但是在多目標(biāo)預(yù)測和實(shí)時控制方面能力欠缺,每次僅能預(yù)測1個值.針對在選取縱向尺度因子時遇到的這些問題,筆者提出一種確定縱向尺度因子的新方法,并在此基礎(chǔ)上建立一個改進(jìn)的分形插值模型,將該模型與SVM模型相結(jié)合,形成混合預(yù)測模型.
SVM預(yù)測模型的基本思想是,通過非線性映射φ將樣本數(shù)據(jù)xi映射到高維特征空間,并在該空間進(jìn)行線性回歸.設(shè)訓(xùn)練樣本集為{(xi,yi),i=1,2,…,l},則回歸模型為f(x)=(ω·φ(x))+b,對應(yīng)的優(yōu)化問題為:
在構(gòu)建SVM預(yù)測模型時需選取懲罰參數(shù)和核函數(shù),這2個參數(shù)的選取直接影響模型預(yù)測的精度.本研究取徑向基核函數(shù)K(xi,x)=exp(-γ‖xi-x‖2),在LIBSVM仿真平臺上實(shí)現(xiàn)SVM算法.
對于區(qū)間I=[a,b],給定劃分Δ={x0,x1,…,xN},滿足a=x0 (1) 滿足端點(diǎn)條件 (2) 由(1),(2)式可得: (3) (4) 由上述可知,當(dāng)插值點(diǎn){(xi,yi):i=0,1,…,N}給定且縱向尺度因子di(i=1,2,…,N)確定時,可由(3)式求得相應(yīng)的系數(shù)ai,ci,ei,fi(i=1,2,…,N),迭代函數(shù)系也就確定了.因此,如何確定自由參數(shù)di是確定迭代函數(shù)系的關(guān)鍵.以往一種簡單的做法是令所有的di都相等,先求出Hurst指數(shù),再利用(4)式來計算di.但通過這種方法確定的di和由此得到的分形插值曲線,在實(shí)際應(yīng)用中擬合效果不佳.為了提高分形插值的擬合精度,筆者根據(jù)數(shù)據(jù)的自身信息提出一種確定di的新方法. 對于數(shù)據(jù)集{(Xi,Yi),i=0,1,…,m},從中等距或非等距地選取插值點(diǎn){(Pj,Qj),j=0,1,…,k},k {(Pj-1,Qj-1),(Xl,Yl),(Xl+1,Yl+1),…,(Xl+n,Yl+n),(Pj,Qj)}, 則這些數(shù)據(jù)點(diǎn)之間的高度差 dj0=Yl-Qj-1,dj1=Yl+1-Yl,…,dj,n+1=Qj-Yl+n. 記 djmax=max(Qj-1,Yl,Yl+1,…,Yl+n,Qj),djmin=min(Qj-1,Yl,Yl+1,…,Yl+n,Qj). 令 (5) 按照(5)式確定的di,能夠?qū)⑾噜彶逯禂?shù)據(jù)之間的局部變化趨勢和整體變化幅度考慮在內(nèi),且滿足條件|di|<1,這使得所構(gòu)造的分形插值函數(shù)在局部更逼近原始數(shù)據(jù). 接下來建立基于改進(jìn)的分形插值與SVM的混合預(yù)測模型.對于已知數(shù)據(jù){(Xi,Yi),i=0,1,…,m},假設(shè)已選取插值點(diǎn)為{(Pj,Qj),j=0,1,…,k},并由(5)式求得dj(j=1,2,…,k),現(xiàn)需要預(yù)測未來數(shù)據(jù){(Xi,Yi),i=m+1,m+2,…,m+r}.由于有r個未知預(yù)測點(diǎn),因此在利用分形插值進(jìn)行預(yù)測時需要先確定下一個插值點(diǎn)(Pk+1,Qk+1)和縱向尺度因子dk+1.(Pk+1,Qk+1)可利用SVM算法求出,dk+1可根據(jù)(5)式求出.利用(Pk+1,Qk+1)和dk+1,再構(gòu)建一個新的迭代函數(shù)系進(jìn)行分形插值,得到相鄰插值點(diǎn)(Pk,Qk)與(Pk+1,Qk+1)之間的所有數(shù)據(jù){(Xi,Yi),i=m+1,m+2,…,m+l},且(Pk+1,Qk+1)=(Xm+l,Ym+l),l≤r.按此步驟繼續(xù)下去,直至得到全部的預(yù)測數(shù)據(jù){(Xi,Yi),i=m+1,m+2,…,m+r}. 選取上海證券綜合指數(shù)(簡稱上證綜指)2006年1月4日至2017年3月13日共2 718個日收盤數(shù)據(jù)作為R/S分析對象,以確認(rèn)上證綜指序列的分形特征和可預(yù)測性. 圖1 上證綜指的R/S分析結(jié)果Fig. 1 R/S Analysis Result of Shanghai Composite Index 圖1是上證綜指的R/S分析結(jié)果.由R/S分析可得H=0.680 4,從而可知上證綜指的日收盤數(shù)據(jù)時間序列具有長程相關(guān)性,可用分形方法進(jìn)行預(yù)測. 下面將上證綜指2016年1月4日至2017年1月3日共245個日收盤數(shù)據(jù)作為分形插值研究對象,這些原始數(shù)據(jù)如圖2所示.通過間隔為4的等距分割選取插值點(diǎn),再利用(5)式計算縱向尺度因子,建立分形插值模型,對這245個日收盤數(shù)據(jù)進(jìn)行插值擬合.圖3給出了分形插值擬合的結(jié)果.從圖3可以看出,采用縱向尺度因子的新計算方法所建立的分形插值模型對上證綜指日收盤數(shù)據(jù)進(jìn)行擬合,精度較高,表明該模型能很好地描述上證綜指日收盤數(shù)據(jù)的走勢. 圖2 上證綜指2016年1月4日至2017年1月3日的日收盤數(shù)據(jù)Fig. 2 Daily Closing Data of Shanghai Composite Index from 2016-1-4 to 2017-1-3 圖3 上證綜指2016年1月4日至2017年1月3日的分形插值擬合Fig. 3 Fractal Interpolation Fitting of Shanghai Composite Index from 2016-1-4 to 2017-1-3 接下來預(yù)測最后4天(2016年12月28—30日和2017年1月3日)的日收盤數(shù)據(jù).根據(jù)分形插值法,要預(yù)測未來4天的數(shù)據(jù),就需要知道下一個插值點(diǎn)(2017年1月3日)的日收盤數(shù)據(jù)和相應(yīng)的縱向尺度因子.下面利用SVM算法來進(jìn)行計算. 圖4 SVM參數(shù)尋優(yōu)結(jié)果Fig.4 Result of SVM Parameter Optimization 由于SVM模型預(yù)測的都是相鄰的下一個點(diǎn)的值,因此需適當(dāng)增加樣本規(guī)模以提高預(yù)測精度.對1990年12月21日至2017年1月3日的上證綜指日收盤數(shù)據(jù)每隔4天選取1個數(shù)據(jù),就得到1 592個數(shù)據(jù),以最后一個(2017年1月3日的收盤數(shù)據(jù))作為預(yù)測數(shù)據(jù).利用Matlab和LIBSVM進(jìn)行參數(shù)尋優(yōu)與建模,懲罰參數(shù)和核函數(shù)的取值范圍均為[2-4,24].圖4示出了SVM參數(shù)優(yōu)化的結(jié)果. 通過SVM模型預(yù)測得到2017年1月3日的收盤數(shù)據(jù)為3 139.8元,再根據(jù)已知的di計算出插值區(qū)間2016年12月27日至2017年1月3日的參數(shù)d,這樣就可以利用分形插值預(yù)測出2016年12月28—30日和2017年1月3日的日收盤數(shù)據(jù).表1列出了原始數(shù)據(jù)與預(yù)測數(shù)據(jù)的比較結(jié)果. 表1 原始數(shù)據(jù)與預(yù)測數(shù)據(jù)的比較 圖5 3種預(yù)測方法的比較Fig. 5 Comparison of Three Prediction Methods 提出了一種確定分形插值迭代函數(shù)系縱向尺度因子的新方法,并由此建立了一個改進(jìn)的分形插值模型.將該模型與SVM模型相結(jié)合,構(gòu)造了可以預(yù)測時間序列變化趨勢的混合預(yù)測模型.將混合預(yù)測模型應(yīng)用于上證綜指日收盤數(shù)據(jù)的分析和預(yù)測:通過R/S分析得到上證綜指日收盤數(shù)據(jù)的Hurst指數(shù)為0.680 4,說明上證綜指的日收盤數(shù)據(jù)具有長程相關(guān)性,是可預(yù)測的;利用改進(jìn)的分形插值模型對上證綜指2016年1月4日至2017年1月3日的日收盤數(shù)據(jù)進(jìn)行分形插值擬合,獲得了很好的擬合效果;利用混合預(yù)測模型對上證綜指2016年12月28—30日和2017年1月3日的日收盤數(shù)據(jù)進(jìn)行預(yù)測,預(yù)測效果較另外2種方法更好.筆者相信,基于改進(jìn)的分形插值與SVM的混合預(yù)測模型在對時間序列的分析和預(yù)測中將有廣泛的應(yīng)用. 參考文獻(xiàn): [1] MANDELBROT BENOIT B.New Methods in Statistical Economics[J].Journal of Political Economy,1963,71(5):421-440. [2] PETERS EDGAR E.Fractal Market Analysis:Applying Chaos Theory to Investment and Economics[M].New York,Chichester,Brisbane,Toronto,Singapore:John Wiley & Son,Inc.,1994. [3] 王明濤.基于R/S法分析中國股票市場的非線性特征[J].預(yù)測,2002,21(3):42-45. [4] YUAN Ying,ZHUANG Xintian,JIN Xiu.Measuring Multifractality of Stock Price Fluctuation Using Multifractal Detrended Fluctuation Analysis[J].Physica A:Statistical Mechanics and Its Applications,2009,388(11):2 189-2 197. [5] 王宏勇,郭麗娜.國際黃金期價與美元指數(shù)交互關(guān)系的多重分形分析[J].數(shù)理統(tǒng)計與管理,2015,34(5):878-889. [6] RICHARDS GORDON R.A Fractal Forecasting Model for Financial Time Series[J].Journal of Forecasting,2004,23(8):586-601. [7] NI Liping,NI Zhiwei,GAO Yazhuo.Stock Trend Prediction Based on Fractal Feature Selection and Support Vector Machine[J].Expert Systems with Applications:An International Journal,2011,38(5):5 569-5 576. [8] MOGHADDAM AMIN HEDAYATI,MOGHADDAM MOEIN HEDAYATI,ESFANDYARI MORTEZA.Stock Market Index Prediction Using Artificial Neural Network[J].Journal of Economics,Finance and Administrative Science,2016,21(41):89-93. [9] OZTEKIN ASIL,KIZILASLAN RECEP,FREUND STEVEN,et al.A Data Analytic Approach to Forecasting Daily Stock Returns in an Emerging Market[J].European Journal of Operational Research,2016,253(3):697-710. [10] BARNSLEY MICHAEL F.Fractal Functions and Interpolation[J].Constructive Approximation,1986,2(1):303-329. [11] WANG Hongyong,YU Jiashan.Fractal Interpolation Function with Variable Parameters and Their Analytical Properties[J].Journal of Approximation Theory,2013,175(4):1-18. [12] 王宏勇,馬 麗.基于分形插值模型的股價時間序列分析及預(yù)測[J].統(tǒng)計與決策,2009(16):29-30. [13] ZHAI Mingyue.A New Method for Short-Term Load Forecasting Based on Fractal Interpretation and Wavelet Analysis[J].Electrical Power & Energy Systems,2015,69(1):241-245. [14] MAZEL DAVID S,HAYES MONSON H.Using Iterated Function Systems to Model Discrete Sequences[J].IEEE Transactions on Signal Processing,1992,40(7):1 724-1 734. [15] 梁 循.支持向量機(jī)算法及其金融應(yīng)用[M].北京:知識產(chǎn)權(quán)出版社,2012:1-15. [16] TAY FRANCIS E H,CAO L J.Modified Support Vector Machines in Financial Time Series Forecasting[J].Neurocomputing,2002,48(1-4):847-861. [17] WANG Shuai,SHANG Wei.Forecasting Direction of China Security Index 300 Movement with Least Squares Support Vector Machine[J].Procedia Computer Science,2014,31:869-874. [18] WANG Jianzhou,HOU Ru,WANG Chen,et al.Improvedv-Support Vector Regression Model Based on Variable Selection and Brain Storm Optimization for Stock Price Forecasting[J].Applied Soft Computing,2016,49:164-178.3 上海證券綜合指數(shù)序列的分析與預(yù)測
4 結(jié)語