王 宏 劉 娜 王志一
(1.河北聯(lián)合大學(xué)理學(xué)院 河北 唐山 063009;2.中國(guó)冶金地質(zhì)總局地球物理勘察院研究所 河北 保定 071051)
在進(jìn)行證券交易時(shí),可能會(huì)獲得較高的投資收益,但同時(shí)也存在著較大的證券投資風(fēng)險(xiǎn)。 證券市場(chǎng)是一個(gè)風(fēng)險(xiǎn)無時(shí)不在的市場(chǎng),所以投資者應(yīng)當(dāng)充分深入的了解證券市場(chǎng)蘊(yùn)含的各項(xiàng)風(fēng)險(xiǎn)并謹(jǐn)慎行事,從各個(gè)方面,綜合考慮投資的利弊,理性投資。隨著股市發(fā)張投資手法和證券監(jiān)管方法的成熟,以及上市公司數(shù)量的不斷增多,如何科學(xué)合理的進(jìn)行股票的分析和選擇是每個(gè)投資者所要解決的首要問題。
傳統(tǒng)的聚類分析是一種硬劃分,即把每個(gè)待辨識(shí)的對(duì)象嚴(yán)格的劃分到某類中,此類劃分的界限是分明的。 而實(shí)際上大多數(shù)對(duì)象沒有嚴(yán)格的屬性,它們?cè)谛螒B(tài)和類屬方面具有“亦此亦彼”的性質(zhì)。 模糊聚類分析可以更好地解決這類問題,模糊聚類分析有多種方法,如傳遞閉包法、最大樹法、編網(wǎng)法等,廣泛應(yīng)用于許多領(lǐng)域。
本文討論了模糊聚類分析在證券投資中的應(yīng)用,抽取了河北省股票交易市場(chǎng)的41 家公司的股票數(shù)據(jù), 應(yīng)用模糊聚類分析的方法進(jìn)行分析研究,得出分類,并對(duì)分類結(jié)果給以解釋。應(yīng)用模糊聚類分析的方法進(jìn)行證券投資分析,使得投資更加理性,同時(shí)也豐富了證券投資理論。
模糊聚類是采用模糊數(shù)學(xué)方法,依據(jù)客觀事物間的特征、親疏程度和相似性,通過建立模糊相似關(guān)系,并在此基礎(chǔ)上根據(jù)一定的隸屬度來確定分類關(guān)系,用模糊數(shù)學(xué)的方法把樣本之間的模糊關(guān)系(相似性)加以定量確定,從而客觀且準(zhǔn)確地進(jìn)行分類。由于現(xiàn)實(shí)的分類過程往往伴隨著模糊性,所以用模糊數(shù)學(xué)的方法來進(jìn)行聚類分析會(huì)顯得更自然、更科學(xué)、更符合客觀實(shí)際。
模糊聚類分析的過程包括以下4 個(gè)步驟:
第一步,選擇統(tǒng)計(jì)指標(biāo)
根據(jù)實(shí)際問題,選擇那些具有明確的意義,有較強(qiáng)分辨力和代表性的屬性,作為分類事物的統(tǒng)計(jì)指標(biāo)。
第二步,數(shù)據(jù)標(biāo)準(zhǔn)化
第三步,標(biāo)定
所謂標(biāo)定,就是根據(jù)實(shí)際情況,按某個(gè)準(zhǔn)則或某種方法,給論域U(即待分類的集合)中的元素兩兩之間都賦以[0,1]內(nèi)的一個(gè)數(shù),叫做相似系數(shù)。 它的大小表征兩個(gè)元素彼此接近或相似的程度。
設(shè)U={u1,u2, …,un} 為待分類事物的全體,ui由一組數(shù)據(jù)xi1,xi2,…,xim來表征,用rij來表示元素ui與uj的相似關(guān)系,0≤rij≤1(i,j=1,2,…,n);rij=0 表示ui與uj截然不同, 毫無相似之處;rij=1 表示它們完全相似或等同;當(dāng)i=j 時(shí),rii就是ui自己與自己的相似程度,恒取為1。 rij可根據(jù)實(shí)際情況,選擇合適的方法來加以確定[1]。
第四步,聚類
選擇一種合適的聚類方法,得到聚類結(jié)果。 在應(yīng)用模糊聚類分析解決實(shí)際問題時(shí),根據(jù)具體情況選擇合適的方法進(jìn)行聚類。這里,我們采用基于模糊相似關(guān)系的直接聚類法通過最大生成樹來實(shí)現(xiàn)聚類[2-3]。
本文選取了河北41 家上市公司的股票,根據(jù)2011 年1 季度的信息數(shù)據(jù),采用傳遞閉包法對(duì)這些公司股票進(jìn)行分析歸類,為股票的分析和投資選擇提供依據(jù)。
選取每股收益、每股凈資產(chǎn)、主營(yíng)收入增長(zhǎng)率、主營(yíng)利潤(rùn)增長(zhǎng)率和毛利率共5 項(xiàng)指標(biāo),對(duì)股票樣本進(jìn)行綜合評(píng)價(jià)。
采用夾角余弦法對(duì)數(shù)據(jù)進(jìn)行標(biāo)定,令
模糊聚類分析有很多種,對(duì)于數(shù)據(jù)比較少時(shí)可以考慮用最大樹法和編網(wǎng)法。數(shù)據(jù)較多時(shí),采用最大樹法或編網(wǎng)法運(yùn)算起來非常困難,且難以利用計(jì)算機(jī)實(shí)現(xiàn)。 故本文采用傳遞閉包法,利用計(jì)算機(jī)程序?qū)δ:嗨凭仃囘M(jìn)行分類。
得到的傳遞閉包是41×41 的對(duì)稱矩陣, 一共包含有42 種不同的數(shù),綜合考慮,在這里我們?nèi)ˇ?0.857972,可將樣本分為如下3 類:
第一類:{3,5,6,10,11,12,19,25,26,32,34,35,37,38,39,40}
第二類:{1,2,4,7,9,15,16,17,18,21,22,23,24,27,28,29,30,31,36,41}
第三類:{8,13,14,20,33}
第一類:股票綜合指標(biāo)較高,發(fā)展較好,該類公司發(fā)展強(qiáng)勁,潛力比較大,盈利能力較高。 該類公司是較好的投資目標(biāo),但總體數(shù)量不多。
第二類:股票綜合指標(biāo)相對(duì)較低,在幾個(gè)方面表現(xiàn)一般。平均意義水平下,每股凈資產(chǎn)較高,說明該公司就有一定資金基礎(chǔ)。主營(yíng)利潤(rùn)增長(zhǎng)率較高,說明該類公司處于高速成長(zhǎng)其,具有較大的發(fā)展空間。但該類公司經(jīng)營(yíng)有待改善,具有一定的投資價(jià)值。
第三類:股票綜合指標(biāo)非常低,屬于低收益、低成長(zhǎng)的“績(jī)差股”。各個(gè)指標(biāo)都相對(duì)最低,與其他兩類有明顯的差異。 這類公司經(jīng)營(yíng)穩(wěn)定性差,發(fā)展不順利,不利于投資。 該類股票幾乎無投資價(jià)值。
表1 聚類結(jié)果
模糊聚類分析已經(jīng)成功應(yīng)用于許多領(lǐng)域,但在證券投資方面的研究還有很大的發(fā)掘空間。 國(guó)內(nèi)具有代表性的研究?jī)H使用硬聚類,選取的指標(biāo)也很單一,尚不能全面反映股票特征。將模糊聚類分析的模型應(yīng)用于證券投資能更科學(xué)地指導(dǎo)投資,適合作為長(zhǎng)遠(yuǎn)投資參考。
[1]LI An-gui.Fuzzy Mathematics and Its Applications[M].Beijing:Metallurgy Industry Press,2006.
[2]GAO Xin-bo.Fuzzy Cluster Analysis and Its Applications[M].Xian:Xidian University Press,2004.
[3]Jiawei Han, Micheline Kamber. Data Mining Concepts and techniques[M].Morgan Kaufmann Publishers. 2001.
[4]羅蘭星. 模糊聚類分析中傳遞閉包法及其應(yīng)用[J]. 四川省衛(wèi)生管理干部學(xué)院學(xué)報(bào), 2005.6,24(2):108-110.
[5]張賀.數(shù)據(jù)挖掘的聚類分析方法在證券投資中的應(yīng)用[J].SINCE & TECHNOL OGY INFORMATION, 2010.
[6]張勇昌.模糊聚類分析在網(wǎng)絡(luò)資源分析中的應(yīng)用[J].計(jì)算機(jī)時(shí)代,2009(7):36-37.