王都
【摘 要】隨著計算機和信息時代的到來,數(shù)據(jù)的收集、存儲和訪問量急劇增加,傳統(tǒng)的查詢技術不能解決目前面臨的信息爆炸問題,數(shù)據(jù)挖掘正是在這樣的應用需求下產生并迅速發(fā)展起來的一門技術。我國股票市場經歷了近三十年發(fā)展,隨著股票市場和股市制度的逐步完善,越來越多的投資者參與到股票投資中來。將數(shù)據(jù)挖掘技術運用到個股選擇中,可以有效地處理與證券投資決策相關的市場信息、經濟信息、財務信息、以及其他各種相關信息,從海量的數(shù)據(jù)中,為投資者挖掘出有用的相關數(shù)據(jù)和相關規(guī)則,并將其與其他證券投資決策方法相結合,探索出適合海量數(shù)據(jù)條件下的投資決策。
【關鍵詞】數(shù)據(jù)挖掘;股票選擇;價值投資
一、背景及意義
隨著計算機和信息時代的到來,人們收集、存儲和訪問的數(shù)據(jù)急劇增加,對這些快速增長的海量數(shù)據(jù)進行分析和知識理解已經遠遠超出了人的能力。大量的數(shù)據(jù)被描述為“數(shù)據(jù)豐富,但信息貧乏”。數(shù)據(jù)庫規(guī)模日益擴大,僅依靠數(shù)據(jù)庫管理系統(tǒng)的查詢檢索機制和統(tǒng)計分析方法,已經遠遠不能滿足現(xiàn)實的需要。而大量激增的數(shù)據(jù)中往往又隱藏著許多重要的信息,如果能把這些信息從數(shù)據(jù)庫中提取出來,就能為用戶創(chuàng)造很多潛在的利潤。因此,對大量歷史數(shù)據(jù)進行分析處理,挖掘出有用的知識就顯得非常迫切。
數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析(如查詢、報表、聯(lián)機應用分析)的本質區(qū)別是數(shù)據(jù)挖掘是在沒有明確假設的前提下去挖掘信息、發(fā)現(xiàn)知識。數(shù)據(jù)挖掘所得到的信息應具有先前未知,有效和可實用三個特征。先前未知的信息是指該信息是預先未曾預料到的,即數(shù)據(jù)挖掘是要發(fā)現(xiàn)那些不能靠直覺發(fā)現(xiàn)的信息或知識,甚至是違背直覺的信息或知識,挖掘出的信息越是出乎意料,就可能越有價值。
數(shù)據(jù)挖掘,首先要確定挖掘的任務或目的是什么,如數(shù)據(jù)總結、分類、聚類、關聯(lián)規(guī)則或序列模式發(fā)現(xiàn)等。確定了挖掘任務后,就要決定用什么樣的挖掘算法。選擇實現(xiàn)算法有兩個考慮因素:一是不同的數(shù)據(jù)有不同的特點,因此需要用與之相關的算法來挖掘;二是用戶或實際運行系統(tǒng)的要求。
數(shù)據(jù)挖掘發(fā)現(xiàn)出來的模式,經過用戶或機器的評價,可能存在冗余或無關的模式,這時需要將其剔除。另外,由于知識發(fā)現(xiàn)最終是面向人類用戶的,因此可能要對發(fā)現(xiàn)的模式進行可視化,或者把結果轉換為用戶易懂的另一種表示。
二、數(shù)據(jù)挖掘在股市選擇中的意義
從1990年上海證券交易所、深圳交易所成立,到《證券法》的實施,再到中小企業(yè)板塊、創(chuàng)業(yè)板推出,我國股票市場經歷了近三十年發(fā)展,隨著股票市場和股市制度的逐步完善,越來越多的投資者參與到股票投資中來。人民收入水平不斷提升,閑置資金增多,開始追求除銀行儲蓄之外更加多樣化的投資需求,投資意識和金融意識也日益增長,股票市場日益受投資者的關注。而由于股票市場風險髙、口檻高,對于普通投資者而言,尋找簡單易行的投資方式極為重要。如何對眾多的股票投資者進行投資指導,同時又不因投資金額較小而導致成本過高,是很多學者和創(chuàng)業(yè)公司共同研究的問題。
進行投資分析,并得出有價值的股票選擇,需要對海量的信息和數(shù)據(jù)進行分析。這些數(shù)據(jù)包括上市公司所處的行業(yè)數(shù)據(jù)、公司財務數(shù)據(jù)及非財務信息、中介機構評價信息,外部研巧機構分析等。專業(yè)的投資機構,如基金、保險資管等機構通過雇傭專業(yè)人員進行投資分析,目的是為了綜合多樣的信息和專業(yè)人士的專業(yè)判斷,以優(yōu)化投資決策,而長期以來,廣大投資者采取基本分析和技術分析投資的方式,其時間精力和專業(yè)水平有限,難以找到海量數(shù)據(jù)背后隱藏的信息,因此無法把握具體的選股巧選時的標準。因此,將數(shù)據(jù)挖掘技術運用到個股選擇中,可以有效地處理與證券投資決策相關的市場信息、經濟信息、財務信息、以及其他各種相關信息,從海量的數(shù)據(jù)中,為投資者挖掘出有用的相關數(shù)據(jù)和相關規(guī)則,并將其與其他證券投資決策方法相結合,探索出適合海量數(shù)據(jù)條件下的投資決策。
三、數(shù)據(jù)挖掘在股市選擇中指標的選取
本文選擇了反應股票基本面的財務指標、公司內部狀況指標、以及外部行業(yè)指標作為模型輸入變量,選擇公司股價漲跌幅相對于滬深300漲跌幅的差額作為模型目標變量。
(一)輸入變量
股票選擇有眾多策略,典型代表有價值投資與技術分析,其中股票價值投資由證券分析之父格雷厄姆提出,該理論通過衡量“內在價值”與“安全邊際”,從眾多股票中尋找市場價值低于內在價值的股票,尋找投資機會。本文采取價值投資的投資理念,價值投資需要考慮能全面反映公司基本面的指標體系。該指標體系需要將企業(yè)外部和內部環(huán)境相結合,反應影響股價的企業(yè)內部和外部活動。
(1)財務活動;財務指標為主要表現(xiàn)形式,反應企業(yè)的內部因素。財務指標是常規(guī)的反應公司基本面的指標,應用最為廣泛。在財務指標中,財務比率的指標非常多,我們將其分成盈利能為、償債能力、營運能力、成長能力、每股指標五個大類。
(2)內部環(huán)境:包括企業(yè)內部控制有效性,員工結構,控制權集中程度等問題,通過考察內部環(huán)境說明企業(yè)的內部控制情況。本文選取了一些指標作為公司內部狀況的代表因素:市盈率、市銷率、市凈率、大股東持股比例、主營業(yè)務收入占營北收入的比例、貝塔值等。
(3)外部環(huán)境;公司所處行業(yè)的經濟政策、法律制度、發(fā)展狀況等,從宏觀角度考察企業(yè)經營所面對的外部環(huán)境狀況。除內部因素外,股票投資價值受行業(yè)狀況的影響。行業(yè)發(fā)展通常經歷四個階段,即初創(chuàng)期、成長期、成熟期和衰退期,每個行業(yè)階段,行業(yè)內公司經營、盈利狀況大不相同。當行業(yè)處于快速成長期時,普遍業(yè)內公司有較好的經營業(yè)績,相反,行業(yè)處于衰退期時,公司問題逐步暴露,較差的公司退出行業(yè)舞臺。
(二)目標變量
價值投資將價格相對于其內在價值過低的股票作為投資對象,在股票價格低于其內在價值時買入,反之賣出,以此獲得超過市場表現(xiàn)的超額收益。由此看出,超過市場的表現(xiàn)是投資是否具有成果的衡量標準。本文選擇公司股價漲跌幅相對于滬深300漲跌幅的差額作為模型目標變量,對股價進行了如下處理:
計算股價、指數(shù)漲跌幅。股價、指數(shù)的大小本身不具備可比性和參考意義,而投資收益率反應投資者運用資金的機會成本和收益,具備可比性和參考價值。
計算股價相對于指數(shù)漲跌幅的大小差額。股票投資收益的好壞的一個重要參考標準是指數(shù)的收益,指數(shù)反應大盤的狀況,也反應投資者的機會成本,因此對胸買股票的投資者而言,超過大盤表現(xiàn)的公司才有投資價值。
四、數(shù)據(jù)挖掘實證分析及結論
在實證分析中發(fā)現(xiàn),在各種上市公司財務指標、公司內部狀況指標、外部行業(yè)指標中,對股票的投資價值影響較大的有銷售凈利率、現(xiàn)金流量利息保障倍數(shù)、營業(yè)總收入同比增長率、利澗總額同比増長率、關聯(lián)交易事項、貝塔值,這些指標應該是投資者判斷股票投資價值時應該重點考慮的因素。
股票的漲跌受到眾多不確定因素的影響,且該因素及其具體的影響效果、影響程度難以衡量,股價往往難以把握。隨著計算機技術的發(fā)展,使得人類行為的諸多數(shù)據(jù)得以沉淀,人們對數(shù)據(jù)的價值和作用越來越重視,數(shù)據(jù)挖掘技術在各行各業(yè)進行了廣泛的運用。從本文可以看出,在價值投資方面,數(shù)據(jù)挖掘技術有一定的作用,它可以應用于投資領域,為股票投資決策做出貢獻。
【參考文獻】
[1].韓慧,毛峰,王文淵.數(shù)據(jù)挖掘中決策樹算法的最新進展[J].計算機應用研究研究,2004,12:5-8.
[2].范明,孟小林等譯. 數(shù)據(jù)挖掘技術與概念[M].北京:機械工業(yè)出版社,2001.
[3].黃惠平,彭博.市場估值與價值投資策略——基于中國證券市場的經驗研究[J].會計研究,2010(10):40- 46.
[4].孫曉瑩,李曉靜.數(shù)據(jù)挖掘在股票價格組合預測中的應用[J].計算機仿真,2012(7):375- 378.