程叢電, 馬晶鑫
(沈陽(yáng)師范大學(xué) 數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院, 沈陽(yáng) 110034)
?
統(tǒng)計(jì)學(xué)
基于一種炒股行為生成的隨機(jī)變量與分布估計(jì)
程叢電, 馬晶鑫
(沈陽(yáng)師范大學(xué) 數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院, 沈陽(yáng) 110034)
從大數(shù)據(jù)、機(jī)器學(xué)習(xí)和行為金融學(xué)的角度出發(fā),通過(guò)設(shè)計(jì)一個(gè)算法定義了一個(gè)表現(xiàn)按照某種初級(jí)炒股行為買(mǎi)賣(mài)一支股票的收益狀況的隨機(jī)變量R,并進(jìn)行有關(guān)研究?;谶@支股票的一定的折現(xiàn)歷史數(shù)據(jù)運(yùn)用所設(shè)計(jì)的算法求出R的一個(gè)樣本;根據(jù)該樣本做出R的一個(gè)經(jīng)驗(yàn)分布;再根據(jù)該經(jīng)驗(yàn)分布建立關(guān)于R的近似解析分布的一個(gè)序,并進(jìn)而給出一種求優(yōu)化近似解析分布的方法?;赗的生成方式及相關(guān)探討展示它的意義,并揭示出一些值得進(jìn)一步研究的問(wèn)題。所做工作可為炒股提供一定的啟示,可為從大數(shù)據(jù)、機(jī)器學(xué)習(xí)和行為金融學(xué)的角度出發(fā)進(jìn)一步研究股市提供一定的啟示。
股市; 大數(shù)據(jù); 行為金融學(xué); 隨機(jī)變量; 分布; 估計(jì)
股票是股份公司為融資而發(fā)行給股東作為持股憑證并借以取得股息和紅利的一種有價(jià)證券。股票市場(chǎng)是一個(gè)非常龐大而且復(fù)雜的體系,每天都有著巨額財(cái)富“產(chǎn)生和幻滅”,社會(huì)上各方面因素錯(cuò)綜復(fù)雜的運(yùn)轉(zhuǎn)無(wú)時(shí)無(wú)刻不影響著股市的變化,而股市的狀況又與國(guó)民經(jīng)濟(jì)發(fā)展乃至股民的利益息息相關(guān)。因此,關(guān)于股市的研究具有重要的意義,在過(guò)去的十幾年里從各種不同的角度出發(fā)研究股市的文獻(xiàn)層出不窮。
Kim等[1](2004)運(yùn)用帶有優(yōu)化變換的神經(jīng)網(wǎng)絡(luò)考慮了股市預(yù)測(cè)問(wèn)題;Fonseka等[2](2008)發(fā)展了一個(gè)運(yùn)用滯后相關(guān)分析現(xiàn)階段我國(guó)對(duì)股市數(shù)據(jù)的數(shù)據(jù)挖掘算法;李濤等[3](2009)考察了城市居民的風(fēng)險(xiǎn)態(tài)度與其投資行為的關(guān)系;徐新新[[5](2015)展示了統(tǒng)計(jì)分析方法在股票最優(yōu)投資方面的應(yīng)用;張力[6](2016)給出了一種股票市場(chǎng)投資組合策略構(gòu)造并討論了相關(guān)模型檢驗(yàn)問(wèn)題。隨著大數(shù)據(jù)[7-8]受到廣泛的關(guān)注,學(xué)者們開(kāi)始從數(shù)據(jù)挖掘的角度研究股市。唐滔[9](2013)研究了云計(jì)算在股票數(shù)據(jù)分析領(lǐng)域的應(yīng)用與實(shí)現(xiàn)問(wèn)題;王春峰[10]等研究了伴隨互聯(lián)網(wǎng)的發(fā)展衍生的媒體關(guān)注度與股票收益之間的關(guān)系。另一方面,受到新興邊緣科學(xué)行為金融學(xué)的影響,近年來(lái)有不少學(xué)者從行為金融學(xué)的角度研究股市問(wèn)題。李靜[11](2012)從行為金融學(xué)的角度出發(fā)研究了股票市場(chǎng)投資者的行為;杜 飛[12](2014)從行為金融學(xué)的視角出發(fā)考查了股票市場(chǎng)動(dòng)量效應(yīng)和反轉(zhuǎn)效應(yīng)的形成機(jī)制; 李濤等[13](2015)探討了人格特征與股票投資的關(guān)系。
受到以上幾方面研究動(dòng)態(tài)的啟發(fā),本文嘗試建立一個(gè)能夠在一定程度上表現(xiàn)某種炒股行為收益狀況的隨機(jī)變量,并根據(jù)一定的實(shí)際數(shù)據(jù)生成樣本、估計(jì)分布暨給出一些值得探討的問(wèn)題。
在實(shí)際中不少剛剛步入股市的人這樣炒股:瞄準(zhǔn)一支股票(或板塊),觀察一段時(shí)間后估算出其平均價(jià)格,然后見(jiàn)到其價(jià)格一定程度低于平均價(jià)格時(shí)買(mǎi)入,再見(jiàn)到一定程度高于平均價(jià)格時(shí)即賣(mài)出,若是過(guò)一定階段不出現(xiàn)賣(mài)點(diǎn)的話(huà),便不管多少也就拋了。稱(chēng)此為初級(jí)炒股行為(Junior actions of speculation on stocks,簡(jiǎn)記JASS)。為了研究按照J(rèn)ASS方式炒作某支股票X的收益狀況及其與股市其他方面的關(guān)系,擬通過(guò)算法1與其輸出R來(lái)抽象地刻畫(huà)該炒股行為及其收入狀況。
算法1
輸入: 正整數(shù)l和s,正實(shí)數(shù)ε和δ;股票X的股價(jià):
輸出: 收益值R。
3) 若k
6) 輸出R,然后停機(jī)。
易知,算法1和輸出R抽象地刻畫(huà)了JASS方式與其收入。 所以,可以通過(guò)它們研究JASS與其收益,以及從某一特定的角度研究股市,在一定程度上揭示股市這個(gè)巨復(fù)系統(tǒng)的奧秘。
定義收益隨機(jī)變量R后,自然要考慮R的分布狀況。本節(jié)專(zhuān)門(mén)討論這一問(wèn)題。
2.1折現(xiàn)
有效地估計(jì)R的分布狀況,需要較大的樣本,由于利率關(guān)系,當(dāng)觀察期較長(zhǎng)時(shí)間前后的數(shù)據(jù)具有某種較大的“異質(zhì)性”,即同是1個(gè)單位的貨幣前后的實(shí)際價(jià)值差異較大;為了消除利率的這種不良影響,應(yīng)首先統(tǒng)一“單位”,即進(jìn)行“折現(xiàn)”。如下的算法2可用于完成該項(xiàng)任務(wù)。
算法2
1) 令t:=0,I=1。
2)t:=t+1,I:=I×(1+it)。
ⅰ)i:=0;
ⅲ) t 運(yùn)用算法2可將過(guò)去T年中每日的股價(jià)折成初始時(shí)刻的現(xiàn)值,從理論上講,這就在一定程度上消除了利率的不良影響。 2.2 分布估計(jì) 以滬市的大連熱電為例,選取2011年初至2015年末每日的開(kāi)盤(pán)價(jià)、收盤(pán)價(jià)、最高價(jià)和最低價(jià)作為數(shù)據(jù),并取l=30,s=60,ε=0.2,δ=0.1,先用算法2進(jìn)行折現(xiàn)處理,再按上述方式重新排序,然后用下面的算法3便可獲得R的一個(gè)容量為(365T-90)的一個(gè)樣本{Rj}(由于存在周六、周日,及其他一些缺失值,按每年244天進(jìn)行統(tǒng)計(jì)與計(jì)算,得到的樣本的容量實(shí)際上為(244×5-90)=1130) )。 算法3 輸出: 收益值R的樣本{Rj},l 1) 令j:=l。 2) 置j:=j+1。若j≥365T-s, 轉(zhuǎn)3,否則置i:=-l,繼續(xù)往下進(jìn)行。 ⅱ)i:=i+1,返回(1),否則繼續(xù)往下進(jìn)行。 ⅲ) 調(diào)用算法1。 ⅳ)Rj=R。 3) 輸出{Rj},然后停機(jī)。 由{Rj}可以得到關(guān)于R的如表1所示的分組不完全數(shù)據(jù);根據(jù)該組數(shù)據(jù)又可做出R經(jīng)驗(yàn)密度曲線(xiàn)(參見(jiàn)文獻(xiàn)[14]第154頁(yè)的6.3),分別見(jiàn)下面的表1與圖1。 表1 MATLAB數(shù)據(jù)分析結(jié)果 圖1 數(shù)據(jù)的經(jīng)驗(yàn)密度曲線(xiàn) 圖1中折線(xiàn)所表示的函數(shù)f(x)為“滬市大連熱電這支股票的收益隨機(jī)變量”R的基于前5年數(shù)據(jù)的經(jīng)驗(yàn)密度曲線(xiàn)。根據(jù)樣本{Rj}和該曲線(xiàn)走勢(shì)可以發(fā)現(xiàn):收益率為0的情況高達(dá)85% 以上;收益率為負(fù)值的情況為14.34%;而收益率為正值的情況所占的比例相當(dāng)小。 該結(jié)果與大部分股民炒股收益非正這一實(shí)際情況是一致的;另一方面這也說(shuō)明了模型基本上可刻畫(huà)初級(jí)炒股者行為的本質(zhì)。 注2: 計(jì)算是通過(guò)在一臺(tái)Intel(R) Pentium(R)(Dual E2160 @ 1.80GHz 1.80 GHz, 0.99GB RAM)的個(gè)人計(jì)算機(jī)上運(yùn)行算法3的Matlab語(yǔ)言程序而完成的. 雖然經(jīng)驗(yàn)分布易求、直觀,但不利于理論研究,為了便于理論研究,可進(jìn)一步根據(jù)樣本{Rj}與所求R的經(jīng)驗(yàn)分布,利用某種分布估計(jì)方法,探索R的具有較好擬合度的理論分布。例如可按下面(A)、(B)、(C)這3步獲取R的近似分布。 1) 按文獻(xiàn)[15-16]的方法求出R的近似g-h分布;或先根據(jù)以往的經(jīng)驗(yàn)及有關(guān)思考, 設(shè)R服從某類(lèi)參數(shù)分布f(x,θ1,θ2,…,θk),然后用最大似然估計(jì)法求出相應(yīng)最大似然估計(jì);或用其他某種方法求出R的某近似解析分布。 2) 設(shè)g,h是R的2個(gè)近似解析分布的密度,f為圖1中經(jīng)驗(yàn)密度,若 認(rèn)為g優(yōu)于h。運(yùn)用這種方法比較R的近似分布。 (C) 運(yùn)用(A)多求出幾個(gè)R的近似分布,f1,f2,…,fk,然后通過(guò)(B)求出最優(yōu)的f*。 運(yùn)用(A)、(B)和(C)所展示的方法,根據(jù)樣本{Rj},可以求出R的優(yōu)化近似解析分布;為了突出主題與節(jié)省篇幅,細(xì)節(jié)和具體計(jì)算在此從略。 注3: 1)在實(shí)踐中,可根據(jù)實(shí)際情況用適當(dāng)?shù)腶與b分別替換式(1)中的-∞與+∞;2)因?yàn)閒是分段函數(shù), 由此可通過(guò)計(jì)算機(jī)進(jìn)行相關(guān)計(jì)算。 本節(jié)展示基于上述已完成工作可進(jìn)一步研究的問(wèn)題。 1) 探索R的解析分布; 2) 尋求R的數(shù)字特征,如均值,方差,峰度和偏度等; 3) 討論R的半方差,VaR和TvaR等風(fēng)險(xiǎn)度量; 4) 考慮算法1中參數(shù)l和s,ε和δ的最優(yōu)值; 5) 研究相應(yīng)于不同股票的收益變量R之間的關(guān)系; 6) 研究R與其他技術(shù)指標(biāo),如滬市的綜合指數(shù)、K線(xiàn)等的關(guān)系; 7) 通過(guò)對(duì)于R的研究預(yù)測(cè)股市的走勢(shì); 8) 從機(jī)器學(xué)習(xí)的角度出發(fā),研究開(kāi)發(fā)能夠跟蹤股市行情,自動(dòng)生成R的當(dāng)前值,并經(jīng)過(guò)一定運(yùn)算,為股民提供有效參考建議的應(yīng)用軟件。 受以往股市研究,大數(shù)據(jù)與行為經(jīng)濟(jì)學(xué)熱潮的影響,本文建立了一個(gè)表現(xiàn)某種初級(jí)炒股行為收益狀況的隨機(jī)變量并給出了一種基于以往股價(jià)記錄獲取其樣本的方法,此外還提出了一些值得進(jìn)一步研究的問(wèn)題。 [ 1 ]KIMK-J,LEEWB.Stockmarketpredictionusingartificialneuralnetworkswithoptimalfeaturetransformation[J].NEURALCOMPUTAPPL, 2004,13(3):255-260. [ 2 ]FONSEKA C, LIYANAGE L. A data mining algorithm to analyse stock market data using lagged correlation[C]∥ICIAFS08, 2008:163-166. [ 3 ]李濤,郭杰. 風(fēng)險(xiǎn)態(tài)度與股票投資[J]. 經(jīng)濟(jì)研究, 2009(2):56-67. [ 4 ]徐新新. 基于ARIMA模型的股票價(jià)格變動(dòng)規(guī)律和預(yù)測(cè)的研究[J]. 經(jīng)濟(jì)研究導(dǎo)刊, 2016(19):77-78. [ 5 ]鄭薇,開(kāi)璇,謝心慶. 統(tǒng)計(jì)分析方法在股票最優(yōu)投資的應(yīng)用[J]. 貴州商業(yè)高等專(zhuān)科學(xué)校學(xué)報(bào), 2015,28(1):49-52. [ 6 ]張力. 股票市場(chǎng)投資組合策略構(gòu)造及模型檢驗(yàn)[J]. 海南熱帶海洋學(xué)院學(xué)報(bào), 2016,23(5):108-113. [ 7 ]FAN Jianqing, HAN Fang, LIU Han. Challenges of big data analysis[J]. National Science Review, 2014,1:293-314. Aug 2013. [ 8 ]FAN Wei, BIFET A. Mining big data: current status, and forecast to the future[J]. SIGKDD Explorations, 2013,14(2):1-5. [ 9 ]唐滔. 基于云計(jì)算的股票數(shù)據(jù)分析研究與實(shí)現(xiàn)[D]. 長(zhǎng)沙:湖南大學(xué), 2013. [10]王春峰,李嘉毅,房振明. 大數(shù)據(jù)下媒體關(guān)注度與股票關(guān)系研究[J]. 天津大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版), 2016,18(2):103-108. [11]李靜. 基于行為金融學(xué)的股票市場(chǎng)投資者行為研究[D]. 北京:中國(guó)社會(huì)科學(xué)院研究生院, 2012. [12]杜飛. 行為金融學(xué)視角下的股票市場(chǎng)動(dòng)量效應(yīng)和反轉(zhuǎn)效應(yīng)形成機(jī)制[J]. 時(shí)代金融, 2014(8):114-114. [13]李濤,張文韜.人格特征與股票投資[J]. 經(jīng)濟(jì)研究, 2015,6:103-116. [14]肖爭(zhēng)艷. 精算模型[M]. 2版. 北京: 中國(guó)人民大學(xué)出版社, 2015:154-164. [15]陳倩,李金林,鄒慶忠. 基于g-h分布的股票收益率風(fēng)險(xiǎn)價(jià)值研究[J]. 兵工學(xué)報(bào), 2009,30(增刊1):175-180. [16]鐘波,山宇. 基于隨機(jī)模擬與g-h分布的VaR計(jì)算方法[J]. 統(tǒng)計(jì)與決策, 2013(15):8-11. A random variable generated based on a behavior of investing in stocks and its estimation of distribution CHENG Congdian, MA Jingxin (College of Mathematics and Systems Science, Shenyang Normal University, Shenyang 110034, China ) From the perspective of big data, machine learning and behavioral finance, by designing an algorithm, which models the process that a person buys and sells a stock in a primary trading behavior, define a random variable R that represents the result of the process and make some related discussions. A sample ofRis made out with the designed algorithm basing on some discounted history data of the stock and further a empirical distribution ofRis made according to the sample. An order relation of the approximate analytical distribution ofRis defined according to the empirical distribution and further approach to obtain the approximate analytical distribution of optimization is proposed. Finally the significance of the defined random variable is demonstrated and some problems deserved to further research are revealed basing on the way by which we define the random variableRand the related discussions. What we done can provide some enlightenments for investing in stocks, and can also provide some ideas for scholars to study market of stocks from the perspective of big data, machine learning and behavioral finance. stock market; big data; behavioral finance; random variable; distribution; estimation 1673-5862(2017)02-0161-05 2016-10-02。 國(guó)家自然科學(xué)基金資助項(xiàng)目(11401393); 遼寧省科技廳自然科學(xué)基金資助項(xiàng)目(2014020120)。 程叢電(1960-),男,四川隆昌人,沈陽(yáng)師范大學(xué)教授,碩士。 O213; F832; F222 A 10.3969/ j.issn.1673-5862.2017.02.007 沈陽(yáng)師范大學(xué)學(xué)報(bào)(自然科學(xué)版)2017年2期3 展 望
4 結(jié) 語(yǔ)