(山西財(cái)經(jīng)大學(xué) 山西 太原 030000)
數(shù)據(jù)挖掘技術(shù)在股價(jià)分析中的應(yīng)用
張夢(mèng)嬌童盼
(山西財(cái)經(jīng)大學(xué)山西太原030000)
隨著我國(guó)經(jīng)濟(jì)體制改革的不斷深化,資產(chǎn)證券化的步伐不斷的加快,股票市場(chǎng)在資本市場(chǎng)中的重要性日益的突出,社會(huì)投資的模式也日益的增多,例如基金投資等等,人們的投資理念日益增強(qiáng)。從荷蘭誕生最早的股份有限公司開始,人們就沒有停止過對(duì)股票市場(chǎng)的探究,而探究的最終目的都是在降低風(fēng)險(xiǎn)的同時(shí)保證可觀的收益,因此股票數(shù)據(jù)的分析預(yù)測(cè)具有很大的現(xiàn)實(shí)意義。隨著經(jīng)濟(jì)理論以及數(shù)理模型的不斷改革,各種預(yù)測(cè)方式和分析模型應(yīng)運(yùn)而生,投資者可以有更多的選擇去運(yùn)用自己熟悉的分析手段。近年來,隨著數(shù)據(jù)挖掘理論的發(fā)展,大數(shù)據(jù)時(shí)代的爆發(fā),證券市場(chǎng)的交易行為開始逐漸被納入了大數(shù)據(jù)挖掘研究的領(lǐng)域。
數(shù)據(jù)挖掘;股價(jià)分析;決策樹
我國(guó)的股票市場(chǎng)起步較晚,但是發(fā)展迅速,電子信息化程度與國(guó)際接軌,積累了大量的金融數(shù)據(jù)。目前,我國(guó)股票市場(chǎng)發(fā)展良好,在三十多年的探索中不斷地成熟起來,不斷地改革,不斷地創(chuàng)新。為了解決高度發(fā)達(dá)的金融市場(chǎng)和滯后的數(shù)據(jù)處理能力,有必要把數(shù)據(jù)挖掘技術(shù)引入到證券市場(chǎng)上來,把證券市場(chǎng)做大做強(qiáng),使金融結(jié)構(gòu)更加合理,市場(chǎng)更加智能化。數(shù)據(jù)挖掘技術(shù)的飛速發(fā)展,能夠給股價(jià)的發(fā)展趨勢(shì)預(yù)測(cè)插上飛翔的翅膀,它足以應(yīng)付不斷發(fā)展,不斷產(chǎn)生大量數(shù)據(jù)的股市,能夠解決投資者在投資過程中所面臨的兩大問題:買賣什么股票以及何時(shí)買進(jìn)何時(shí)賣出。
從同花順炒股軟件中隨機(jī)選取20只股票,對(duì)它們從2015年11月19日到2015年12月30日這一段時(shí)間內(nèi)的34個(gè)交易日的數(shù)據(jù)進(jìn)行區(qū)間統(tǒng)計(jì)處理,作為樣本,進(jìn)行決策樹算法分析。
各個(gè)屬性取值為:成交總量為(大,小)、換手%為(高,低)、成交方向(買入,賣出)、凈大單量(多,少);股票價(jià)格的漲跌情況分為兩大類:上漲幅度大于10%(Up)、下跌幅度大于-10%(Dn),其余的漲跌幅介于[10%,-10%]的設(shè)置為震蕩類(Zd);成交總量分為兩類:成交總量資金占總股本市值大于20%的為成交量大,小于20%的為成交量??;換手%分為兩類:換手率大于50%的為高,小于50%的為低;成交方向分兩類:凈買入大于凈賣出的標(biāo)記為買入和凈賣出大于凈買入標(biāo)記為賣出;凈大單量分為兩類:凈大單總額占總市值大于20%的為多,少于20%的為少。隨機(jī)抽取的20只股票訓(xùn)練樣本集見下表1:
表1 訓(xùn)練樣本集
所以各分類對(duì)應(yīng)信息熵的值為:
I(Up,Dn,Zd)=I(4,3,13)=-(0.2×log20.2+0.15log20.15+0.65×log20.65)=1.279
如此遞歸下去,最終可以得到一棵決策樹,如圖1所示:
圖1 得到的決策樹
由生成的ID3決策樹來看,在某段時(shí)間,如果某只股票換手%比較高,同時(shí)主力成交方向?yàn)椤百I入”的話,那么這只股票的價(jià)格會(huì)上漲;反之,如果在換手%比較高,主力成交方向?yàn)椤百u出”,而且凈大單量小的話,這只股票的價(jià)格會(huì)下跌或者震蕩。
隨著經(jīng)濟(jì)的發(fā)展和人們投資意識(shí)的轉(zhuǎn)變,資產(chǎn)證券化將是未來投資的趨勢(shì),現(xiàn)如今股票投資己成為大部分人投資的一種重要手段,因此,股價(jià)走勢(shì)預(yù)測(cè)方法的研究具有重要價(jià)值和理論意義。證券市場(chǎng)是一個(gè)非常復(fù)雜的系統(tǒng),股票價(jià)格趨勢(shì)的分析是一個(gè)極具難度和挑戰(zhàn)性的課題。隨著信息技術(shù)和數(shù)據(jù)挖掘技術(shù)的發(fā)展,越來越多的新算法及模型被應(yīng)用于股市數(shù)據(jù)的分析,這些方法對(duì)降低股票投資分析的難度和增加股票投資的收益具有一定的參考價(jià)值。
[1]孫文高,劉劍橋.證券投資組合的風(fēng)險(xiǎn)與收益權(quán)衡[J].中國(guó)經(jīng)貿(mào),2014(14):131-131.
[2]王靜紅,李筆.基于決策樹的一種改進(jìn)算法[J].電訊技術(shù),2004,44(5):175-178.
[3]張璐璐.基于關(guān)聯(lián)規(guī)則的離群挖掘的研究[D].安徽大學(xué),2007.
[4]張勝權(quán).基于數(shù)據(jù)挖掘的股價(jià)走勢(shì)預(yù)測(cè)[D].華中科技大學(xué),2009.
[5]封俊國(guó),嚴(yán)蜻,劉洪生.“大金融”戰(zhàn)略下的金融學(xué)科建設(shè)研究[J].金融教學(xué)與研究,2013(5):62-64.
張夢(mèng)嬌,女,漢族,內(nèi)蒙古烏蘭察布市,碩士研究生在讀,山西財(cái)經(jīng)大學(xué),風(fēng)險(xiǎn)管理。