張竑魁
摘 要:股票價格的走勢會影響到上市公司未來的發(fā)展以及投資者決策。基于二元Logit回歸模型,利用上證綜指大盤數(shù)據預測新疆板塊股票價格走勢。實證結果表明:上證綜指收盤價和交易金額對新疆板塊股票價格的影響是顯著的,并且利用所建立的Logit模型對新疆板塊股票價格走勢的預測較為準確。
關鍵詞:新疆股市;上證綜指;Logit回歸模型
中圖分類號:F83
文獻標識碼:A
doi:10.19311/j.cnki.1672-3198.2016.08.051
1 引言
隨著援疆政策的實施以及“絲綢之路經濟帶”戰(zhàn)略構想的提出,新疆經濟的發(fā)展取得了巨大進步。自1994年2月新疆首家公司新宏信(今宏源證券)在深圳證券交易所掛牌交易以來,經過20多年的發(fā)展,新疆上市公司已達43家,總市值已超過7000多億。新疆板塊股市的表現(xiàn)可以從側面反映新疆經濟的發(fā)展狀況,因此了解新疆板塊股票價格走勢情況,具有重要的現(xiàn)實意義。
在股票價格預測方面,有兩種方法較為常用。一種是神經網絡預測法,另一種是支持向量機。在神經網絡預測方面,李響(2008年)利用神經網絡對單個股票價格走勢進行了預測。林倩瑜、馮少榮、張東站(2010年)把神經網絡和模式識別兩種方法相結合。劉海玥、白艷萍(2011年)把AR模型和神經網絡相結合。薛佳佳(2012年)把灰色GM(1,1)模型和神經網絡模型相結合。
在支持向量機預測方面,楊新斌、黃曉娟(2010年)利用支持向量機對股價預測進行仿真實驗,實證結果表明支持向量機在預測精度上要優(yōu)于神經網絡。王晴(2010年)把自回歸模型與支持向量機相結合。楊震(2012年)把統(tǒng)計學與支持向量機結合。龍真真、張正文(2014年)把SVM模型和支持向量機結合。李坤、譚夢羽(2014)將小波分解與支持向量機方法相結合。
Logit模型在社會學中應用較多,但也有學者開始把Logit模型應用到股市中。程海波(2009年)利用Logit模型對上市公司財務指標和超額收益率進行了研究,結果表明,以上市公司財務指標為變量,預測股票是否存在超額收益率具有良好的效果。易寧明、周文強、何鳴(2011年)運用Loigt模型檢驗了技術交易規(guī)則在中國股票市場上的有效性。
本文借鑒學者們的理論成果和方法,在構建二元Logit模型的基礎上,利用上證綜指大盤數(shù)據對新疆板塊股票價格走勢進行預測。以期為新疆上市公司以及投資者們在關注新疆股市時提供科學依據。
2 數(shù)據、變量及方法
2.1 樣本概況
本研究所用數(shù)據來源于同花順數(shù)據庫,所用數(shù)據主要是上證綜合指數(shù)收盤價、交易金額、交易總手、新疆板塊43只股票收盤價,數(shù)據時間跨度是從2015年1月5號到5月29號,數(shù)據形式為每天每五分鐘交易數(shù)據。
新疆總共有43家上市公司,第一產業(yè)有13家,占總行業(yè)的30.23%,第二產業(yè)有24家,占55.18%,第三產業(yè)6家,占13.95%,綜合類一家,占2.33%。由此可知,新疆作為我國欠發(fā)達地區(qū),經濟的發(fā)展主要還是依靠第二產業(yè)和第一產業(yè)。
中國股市從2015年1月5號到5月29號,這段期間處于大牛市。其中上證綜指收盤價從1月5號的3258.63一路飆升到5月29號的4607.93點。交易金額和交易總手也是大幅上漲。
2.2 變量選取及設定
本研究主要利用大盤數(shù)據預測新疆板塊股票價格整體走勢,為了衡量新疆板塊股票價格的整體增降,我們選取了新疆43只股票每五分鐘的最高價和最低價求其平均值,然后對43只股票每五分鐘股價的平均值求其上四分位點,利用下一期上四分位點除以上一期上四分位點得到的值代表新疆板塊整體股價的增與降,大于1代表新疆板塊整體股價在增,小于等于1代表新疆板塊整體股價在降,把增的記為1,降的記為0,使其成為二元變量,作為因變量,用Y表示。上證綜指交易總手、交易交額、收盤價三個方面的數(shù)據分別滯后一階、二階和三階,構造了9個自變量。其中交易總手滯后一階、二階和三階用變量X11、X12、X13表示,交易金額滯后一階、二階和三階用變量X21、X22、X23表示,收盤價滯后一階、二階和三階用變量X31、X32、X33表示。每個自變量的取值小于下四分位點記為1,大于下四分位點小于上四分位點記為2,大于上四分位點記為3。
2.3 模型選擇
Logit模型根據因變量的取值情況,可以大致分為兩類,一類是二元Logit模型,另一類是多元Logit模型。本研究分析的是新疆板塊股票的整體走勢,升取值為1,降取值為0,滿足了二元Logit回歸模型的要求。二元Logit模型核心思想是要判斷一種現(xiàn)象是否發(fā)生的概率大小。因變量可以取0或1,當取1時,就是對象發(fā)生的概率,取0時,也就是對象不發(fā)生的概率。
Logit模型的一般表達式為:
ln(Pi1-pi)=yi=α+βxi(1)
由上式可知回歸方程的因變量是某個具體選擇概率比的對數(shù)。Logit函數(shù)具有以下兩個重要特點:第一個是當Xi的取值較小且逐步減小時,Pi趨近0的速度會越來越慢;反過來隨著Xi的取值較大且逐步增大時,Pi接近1的速度也越來越慢。而當Xi取值中等且增加較快時,Pi的變化會比較快。Pi與Xi之間應呈非線性關系。第二個是Pi的變化始終在0和1之間。
3 實證分析
本文基于R軟件,利用逐步回歸法建立Logit回歸模型,在模型中,不顯著的自變量直接去除。最終模型回歸結果如公式2所示:
Y=0.658-0.034X21+0.034X22+0.17X31-0.18X32(2)
其中模型的LR chi2統(tǒng)計量為86.67,模型的Psendo R2 統(tǒng)計量為0.345,這說明本研究建立的模型統(tǒng)計是顯著的。
(1)通過公式2可知,表示上證指數(shù)交易金額滯后一階和滯后二階的變量X21和X22對因變量Y的發(fā)生概率的影響是顯著的,但回歸系數(shù)符號相反,分別為-0.034和0.034。從數(shù)值來看,這說明交易金額滯后一階和二階對因變量Y的發(fā)生概率影響不大。表示上證綜指收盤價滯后一階和滯后二階的變量X31和X32對因變量Y的發(fā)生概率的影響是顯著的,但回歸系數(shù)符號相反,分別為0.17和-0.18。從數(shù)值上看,上證綜指收盤價對新疆股票價格的影響要大于交易金額。
(2)為了利用此模型對新疆板塊股票價格進行預測,首先檢驗此模型預測的準確性。對訓練樣本進行準確率測度。訓練樣本數(shù)總共4974個,代表新疆整體股票上升的有4889,占總樣本的98.27%,代表新疆整體股票下降的有185個,占樣本總量的3.72%。最終預測結果顯示,股票上升被誤判為下降的有1089個,下降的被誤判為上升的有93個,總誤判率為23.76%。但是在股票投資中,以風險較小化的投資思想。投資者主要規(guī)避的看漲的股票反而降。通過以上可知,把股價降的判斷為增的有93個,占總樣本的1.86%,這說明此模型犯錯幾率較小。
(3)在測試樣本中選取一個時間點,以此時間點為基準,往后每五分鐘一個測試點,總共選取10個測試點。統(tǒng)計結果顯示,處了第一個測試點被完全誤判,其余測試點被誤判的概率都小于50%。其中對第四個測試點(基準點下20分鐘)預測的準確率最高,準確率為75%。
4 結束語
通過模型預測結果可知,本文所建立的二元Logit模型對新疆板塊股票價格走勢的預測精度達到了預期目的。
參考文獻
[1]李響.基于BP神經網絡的股價預測[J].大連海事大學學報,2008,(S1):114-116.
[2]林倩瑜,馮少榮,張東站.基于神經網絡和模式匹配的股票預測研究[J].計算機技術與發(fā)展,2010,(05):17-20+25.
[3]劉海玥,白艷萍.時間序列模型和神經網絡模型在股票預測中的分析[J].數(shù)學的實踐與認識,2011,(04):14-19.
[4]薛佳佳.基于差值灰色RBF網絡模型股票指數(shù)預測[J].統(tǒng)計與決策,2012,(22):77-79.
[5]楊新斌,黃曉娟.基于支持向量機的股票價格預測研究[J].計算機仿真,2010,(09):302-305.
[6]王晴.組合模型在股票價格預測中應用研究[J].計算機仿真,2010,(12):361-364.
[7]楊震.基于后效時間長度的股票價格預測[J].計算機仿真,2012,(02):378-381.
[8]龍真真,張正文.基于模糊核超球的快速分類算法在股票預測中的應用[J].計算機系統(tǒng)應用,2014,(01):197-201+148.
[9]李坤,譚夢羽.基于小波支持向量機回歸的股票預測[J].統(tǒng)計與決策,2014,(06):32-36.
[10]程海波.股票投資價值的logit模型研究——對滬市A股制造行業(yè)的實證分析. [C].中國會計學會,2009:8.
[11]尹宇明,周文強,何鳴.中國股市技術交易規(guī)則有效性的計量分析——以長期橫盤形態(tài)為例[J].現(xiàn)代財經(天津財經大學學報),2011,(06):81-86.