【摘要】 可變精度粗糙集VPRS是標(biāo)準(zhǔn)粗糙集RS的一種推廣。文章借鑒了VPRS模型具有噪聲數(shù)據(jù)的強(qiáng)適應(yīng)能力和強(qiáng)抗干擾能力的優(yōu)點(diǎn),提出了一類基于VPRS的信息產(chǎn)業(yè)上市公司財(cái)務(wù)預(yù)警方法,并用部分信息產(chǎn)業(yè)上市公司對(duì)其進(jìn)行實(shí)證檢驗(yàn)。檢驗(yàn)結(jié)果表明:該方法具有較好的識(shí)別能力,對(duì)信息產(chǎn)業(yè)上市公司財(cái)務(wù)危機(jī)的預(yù)測(cè)準(zhǔn)確率達(dá)到89.7%,具有良好的應(yīng)用前景。
【關(guān)鍵詞】 信息產(chǎn)業(yè); 財(cái)務(wù)預(yù)警; 可變精度粗糙集; R約簡(jiǎn); 決策樹
一、引言
改革開放以來,我國信息產(chǎn)業(yè)發(fā)展迅速,已逐步成為國民經(jīng)濟(jì)重要的支柱性、先導(dǎo)性、基礎(chǔ)性和戰(zhàn)略性產(chǎn)業(yè)。信息產(chǎn)業(yè)類企業(yè),包括致力于信息技術(shù)研發(fā)和服務(wù)的企業(yè),具有較強(qiáng)的擴(kuò)張性、滲透性,資金需求量大,但由于受到信息技術(shù)生命周期、研發(fā)成熟度、市場(chǎng)容量、經(jīng)營能力等因素的影響,其未來發(fā)展和經(jīng)營業(yè)績(jī)具有較大的不確定性,導(dǎo)致企業(yè)面臨較大的經(jīng)營風(fēng)險(xiǎn)和財(cái)務(wù)風(fēng)險(xiǎn)。其中,信息產(chǎn)業(yè)上市公司的財(cái)務(wù)信息對(duì)多方利益相關(guān)者都有著重要影響。因此,建立財(cái)務(wù)預(yù)警系統(tǒng)、強(qiáng)化財(cái)務(wù)管理、避免財(cái)務(wù)失敗和破產(chǎn),具有重要意義。
現(xiàn)有的企業(yè)財(cái)務(wù)預(yù)警方法可分為定性預(yù)警與定量預(yù)警兩類。定性分析主要包括:災(zāi)害理論、專家調(diào)查法、四階段癥狀等方法。定量分析主要包括:?jiǎn)巫兞颗卸P?、多變量線性判定模型、Logistic回歸模型、人工神經(jīng)網(wǎng)絡(luò)模型等方法。上述方法各有其特點(diǎn),但均存在不同程度的局限,難以滿足企業(yè)財(cái)務(wù)預(yù)警實(shí)踐發(fā)展的需要。粗糙集(RS)是一種刻畫不完整性和不確定性的數(shù)學(xué)工具,能有效分析不精確、不一致、不完整等各種不完備信息,還可以對(duì)數(shù)據(jù)進(jìn)行分析和推理,從中發(fā)現(xiàn)隱含的知識(shí),揭示潛在的規(guī)律,從而有效進(jìn)行知識(shí)庫的約簡(jiǎn)和規(guī)則的提取。
可變精度粗糙集(VPRS)是對(duì)RS理論的擴(kuò)充,它在標(biāo)準(zhǔn)粗糙集的基礎(chǔ)上引進(jìn)一個(gè)閾值β,并將其定義為錯(cuò)誤分類率(0≤β<0.5),即允許一定程度上錯(cuò)誤分類率的存在,由此,使VPRS具有較強(qiáng)的抗干擾能力。An等(1996)又將β定義為正確分類率(0.5≤β<1),并稱之為強(qiáng)化粗糙集。文獻(xiàn)[6]運(yùn)用VPRS模型對(duì)我國166家上市公司財(cái)務(wù)困境進(jìn)行預(yù)測(cè),取得了較高的預(yù)測(cè)精度。文獻(xiàn)[7]顯示VPRS模型在應(yīng)用過程中面臨參數(shù)β的選擇問題,不同的β值將產(chǎn)生不同的屬性約簡(jiǎn)結(jié)果。有鑒于此,本文將VPRS引入到信息產(chǎn)業(yè)上市公司財(cái)務(wù)預(yù)警分析中,提出一種基于VPRS的信息產(chǎn)業(yè)上市公司財(cái)務(wù)預(yù)警方法。首先,根據(jù)VPRS模型對(duì)屬性進(jìn)行R約簡(jiǎn)并生成識(shí)別規(guī)則,形成識(shí)別規(guī)則庫;然后,在識(shí)別規(guī)則庫的基礎(chǔ)上集成剪枝決策樹,構(gòu)建信息產(chǎn)業(yè)上市公司財(cái)務(wù)危機(jī)識(shí)別方法;最后,利用測(cè)試樣本對(duì)識(shí)別方法進(jìn)行檢驗(yàn)并獲取識(shí)別精度。結(jié)果顯示,該方法對(duì)信息產(chǎn)業(yè)上市公司財(cái)務(wù)危機(jī)的預(yù)測(cè)準(zhǔn)確率達(dá)到89.7%,具有良好的應(yīng)用前景。
二、基于VPRS的信息產(chǎn)業(yè)上市公司財(cái)務(wù)預(yù)警方法
步驟1:建立決策數(shù)據(jù)表,對(duì)原始數(shù)據(jù)進(jìn)行補(bǔ)缺。使用決策表來描述對(duì)象,即采用二維數(shù)據(jù)關(guān)系表的形式。表中每一行描述一個(gè)對(duì)象(即樣本企業(yè)),每一列描述對(duì)象的一種屬性。在實(shí)際收集數(shù)據(jù)的過程中,不可避免地會(huì)遇到數(shù)據(jù)缺失情況。為此,擬采用Mean/mode方法對(duì)數(shù)據(jù)進(jìn)行補(bǔ)缺。
步驟2:對(duì)樣本數(shù)據(jù)進(jìn)行劃分及離散化處理。按2∶1的比例將完備數(shù)據(jù)關(guān)系表劃分為兩個(gè)數(shù)據(jù)關(guān)系表,其中,總樣本的67%為訓(xùn)練樣本,用來導(dǎo)出識(shí)別規(guī)則,形成識(shí)別規(guī)則庫;剩余的33%為測(cè)試樣本,用來檢驗(yàn)識(shí)別方法,獲取識(shí)別精度。運(yùn)用VPRS模型處理數(shù)據(jù)關(guān)系表時(shí),要求表中的屬性值用離散數(shù)據(jù)表示,而大部分樣本企業(yè)的條件屬性均為連續(xù)值,因此,必須對(duì)樣本數(shù)據(jù)進(jìn)行離散化處理。擬采用等頻率劃分方法對(duì)數(shù)據(jù)進(jìn)行離散化處理。
步驟3:R約簡(jiǎn)與規(guī)則生成。VPRS模型常用的屬性約簡(jiǎn)算法有:R約簡(jiǎn)、上下分布約簡(jiǎn)等。其中,R約簡(jiǎn)是通過全局增益來度量決策信息系統(tǒng)的屬性重要程度,并以全局增益作為啟發(fā)式信息得出VPRS屬性約簡(jiǎn)的啟發(fā)式算法。本文擬采用R約簡(jiǎn),通過啟發(fā)式算法對(duì)訓(xùn)練樣本進(jìn)行屬性約簡(jiǎn)。根據(jù)約簡(jiǎn)結(jié)果,生成具有一定決策概率的不精確決策規(guī)則。通過設(shè)定相關(guān)的可信度、覆蓋率、支持?jǐn)?shù)閾值,對(duì)生成的規(guī)則進(jìn)行篩選,形成識(shí)別規(guī)則庫。
步驟4:集成剪枝決策樹,構(gòu)建信息產(chǎn)業(yè)上市公司財(cái)務(wù)危機(jī)識(shí)別方法,并對(duì)其進(jìn)行檢驗(yàn)。首先,在識(shí)別規(guī)則庫的基礎(chǔ)上,運(yùn)用基于VPRS的決策樹生成方法,建立基于識(shí)別規(guī)則的決策樹。即通過計(jì)算各規(guī)則的變精度明確區(qū),選取明確區(qū)最大的規(guī)則作為第1條規(guī)則,用第1條規(guī)則對(duì)待識(shí)別樣本進(jìn)行識(shí)別;其次用第2條規(guī)則對(duì)第1條規(guī)則不能識(shí)別的剩余樣本進(jìn)行識(shí)別,以此類推;再次,運(yùn)用基于RS的決策樹剪枝算法得到剪枝決策樹,從而構(gòu)建起信息產(chǎn)業(yè)上市公司財(cái)務(wù)危機(jī)識(shí)別方法;最后,利用測(cè)試樣本對(duì)識(shí)別方法進(jìn)行檢驗(yàn),獲取識(shí)別精度。
三、實(shí)證分析
(一)指標(biāo)體系和樣本數(shù)據(jù)
本文參考國內(nèi)外有關(guān)文獻(xiàn)提出的企業(yè)財(cái)務(wù)預(yù)警指標(biāo)體系,遵循指標(biāo)選取的系統(tǒng)性、科學(xué)性及可操作性等原則,從償債能力、營運(yùn)能力、盈利能力等五個(gè)方面,選取流動(dòng)比率、速動(dòng)比率、資產(chǎn)負(fù)債率、利潤(rùn)總額、財(cái)務(wù)費(fèi)用、已獲利息倍數(shù)、存貨周轉(zhuǎn)率、應(yīng)收賬款周轉(zhuǎn)率、凈資產(chǎn)收益率等21項(xiàng)財(cái)務(wù)指標(biāo)建立信息產(chǎn)業(yè)上市公司財(cái)務(wù)預(yù)警指標(biāo)體系。
選取滬、深股市中有代表性的信息產(chǎn)業(yè)上市公司作為實(shí)驗(yàn)樣本,數(shù)據(jù)來源于證券之星網(wǎng)站。將上市公司因財(cái)務(wù)狀況出現(xiàn)異常而被特別處理(ST)作為財(cái)務(wù)危機(jī)的標(biāo)志。對(duì)于ST公司,采用被ST的前兩年數(shù)據(jù)來進(jìn)行預(yù)測(cè)分析,以判斷其最終是否會(huì)陷入財(cái)務(wù)危機(jī),樣本區(qū)間設(shè)定為2004—2008年。對(duì)于非ST公司,則采用2008年的年報(bào)數(shù)據(jù)。在剔除異常數(shù)據(jù)樣本,并對(duì)原始數(shù)據(jù)進(jìn)行補(bǔ)缺后,最終獲得88家樣本公司,其中,定義0為財(cái)務(wù)危機(jī)公司,即ST公司,共28家;定義1為財(cái)務(wù)健康公司,即非ST公司,共60家。隨機(jī)抽取19家ST公司和40家非ST公司作為訓(xùn)練樣本,剩余的29家公司作為測(cè)試樣本。
?。ǘ㏑約簡(jiǎn)與規(guī)則生成
采用等頻率劃分方法對(duì)原始數(shù)據(jù)進(jìn)行離散化處理。運(yùn)用啟發(fā)式算法對(duì)屬性進(jìn)行R約簡(jiǎn),59個(gè)訓(xùn)練樣本共產(chǎn)生了36條約簡(jiǎn)。在這些約簡(jiǎn)中,存在部分冗余無效的約簡(jiǎn),為了提高約簡(jiǎn)的有效性,選取強(qiáng)度大于80的約簡(jiǎn),共計(jì)12個(gè)。從屬性約簡(jiǎn)結(jié)果可以看出:流動(dòng)比率、速動(dòng)比率、資產(chǎn)負(fù)債率、財(cái)務(wù)費(fèi)用、已獲利息倍數(shù)、存貨周轉(zhuǎn)率、應(yīng)收賬款周轉(zhuǎn)率、凈資產(chǎn)收益率、利潤(rùn)總額等9個(gè)指標(biāo)對(duì)信息產(chǎn)業(yè)上市公司的財(cái)務(wù)預(yù)警具有重要影響。
在上述約簡(jiǎn)的基礎(chǔ)上,利用Rosetta軟件生成規(guī)則,設(shè)定限制條件為可信度>70%、覆蓋率>5%,最終得到36條識(shí)別規(guī)則。限于篇幅,表1顯示了其中可信度>80%的6條識(shí)別規(guī)則。表1中每一行表示一條識(shí)別規(guī)則。例如,第一行表示:當(dāng)識(shí)別指標(biāo)中資產(chǎn)負(fù)債率在0.6439以上,已獲利息倍數(shù)在0.4291至1.5235之間,凈資產(chǎn)收益率在7.8326以上時(shí),樣本公司的財(cái)務(wù)狀況較好。該識(shí)別規(guī)則的支持?jǐn)?shù)為10,可信度為0.961,覆蓋率為0.31。
?。ㄈ┴?cái)務(wù)危機(jī)識(shí)別方法的構(gòu)建與檢驗(yàn)
決策樹又稱判定樹,是一種類似于二叉或多叉的樹結(jié)構(gòu),與其它分類模型相比,決策樹簡(jiǎn)潔易懂,容易轉(zhuǎn)換成規(guī)則,且具有與其它分類模型相同的,甚至是更好的分類準(zhǔn)確性。
VPRS在建立近似區(qū)間時(shí),允許等價(jià)類以小于某個(gè)錯(cuò)誤分配率(通常設(shè)β=0.2)的概率劃入近似區(qū)間。由此,引入變精度明確區(qū)與非明確區(qū)的定義,將誤差限內(nèi)的實(shí)例劃入VPRS的下近似中,成為能明確分類的實(shí)例,從而提高了分類的正確性和對(duì)未來數(shù)據(jù)的泛化能力。有鑒于此,本文運(yùn)用基于VPRS的決策樹生成方法,構(gòu)建基于識(shí)別規(guī)則的決策樹。決策樹由根節(jié)點(diǎn)、分支和葉節(jié)點(diǎn)組成,這里的根節(jié)點(diǎn)是待識(shí)別樣本,分支是待識(shí)別樣本能否被識(shí)別規(guī)則正確識(shí)別,葉節(jié)點(diǎn)被分為正確識(shí)別樣本和未能識(shí)別樣本兩類。為了在保證一定正確率的前提下得到盡可能簡(jiǎn)單的決策樹,本文還運(yùn)用基于RS的決策樹剪枝算法對(duì)規(guī)則進(jìn)行修剪。根據(jù)RS理論中近似空間的定義,首先給出明確度的概念來衡量數(shù)據(jù)被明確分類的程度,采用深度擬合率和錯(cuò)誤率作為剪枝標(biāo)準(zhǔn),同時(shí)考慮了樹的復(fù)雜度和樹的分類精度。剪枝過程自下而上持續(xù)進(jìn)行,直至不能再剪枝為止。
利用29個(gè)測(cè)試樣本對(duì)信息產(chǎn)業(yè)上市公司財(cái)務(wù)危機(jī)識(shí)別方法進(jìn)行檢驗(yàn)。每條規(guī)則可以將待識(shí)別樣本分為正確識(shí)別和未能識(shí)別兩類,設(shè)定誤差參數(shù)β=0.2,對(duì)每個(gè)規(guī)則,計(jì)算其變精度明確區(qū)的大小,得出規(guī)則3的變精度明確區(qū)最大,說明規(guī)則3相對(duì)其它規(guī)則而言,能夠提供更多的分類信息。選取規(guī)則3作為第1條規(guī)則,從根節(jié)點(diǎn)出發(fā)對(duì)29個(gè)測(cè)試樣本進(jìn)行判定,依次類推。運(yùn)用基于RS的決策樹剪枝算法,取閾值0.1及0.05,從決策樹的最低層開始進(jìn)行剪枝,得到剪枝決策樹,如圖1所示。圖1括號(hào)中以*標(biāo)識(shí)的數(shù)字X∶Y為到達(dá)此葉節(jié)點(diǎn)的多數(shù)例與反數(shù)例,X代表多數(shù)實(shí)例數(shù),Y代表反例數(shù),即有6個(gè)樣本被正確識(shí)別,3個(gè)樣本不能識(shí)別。圖1顯示:從29個(gè)測(cè)試樣本中可以準(zhǔn)確識(shí)別出26個(gè)樣本的財(cái)務(wù)狀況,只有3個(gè)樣本不能識(shí)別,預(yù)測(cè)準(zhǔn)確率達(dá)到89.7%。
四、結(jié)論
將VPRS引入到信息產(chǎn)業(yè)上市公司財(cái)務(wù)預(yù)警分析中,提出一種基于VPRS的信息產(chǎn)業(yè)上市公司財(cái)務(wù)預(yù)警方法。在對(duì)樣本數(shù)據(jù)進(jìn)行預(yù)處理后,首先,根據(jù)VPRS模型,對(duì)屬性進(jìn)行R約簡(jiǎn)并生成識(shí)別規(guī)則,形
/48I/c90y5A5R7J3UodWjQ==成識(shí)別規(guī)則庫;然后,在識(shí)別規(guī)則庫的基礎(chǔ)上,集成剪枝決策樹,構(gòu)建信息產(chǎn)業(yè)上市公司財(cái)務(wù)危機(jī)識(shí)別方法;最后,利用測(cè)試樣本對(duì)識(shí)別方法進(jìn)行檢驗(yàn),獲取識(shí)別精度。實(shí)證結(jié)果表明,本文提出的財(cái)務(wù)預(yù)警方法對(duì)信息產(chǎn)業(yè)上市公司財(cái)務(wù)危機(jī)的預(yù)測(cè)準(zhǔn)確率達(dá)到89.7%,具有良好的應(yīng)用前景。本文的研究為提高企業(yè)財(cái)務(wù)危機(jī)預(yù)測(cè)精度提供了新的方法和思路。但VPRS在引入誤差參數(shù)的同時(shí),也不排除向近似區(qū)間引入誤差或噪聲的可能性,如何合理選擇誤差參數(shù)β有待于進(jìn)一步研究。
【參考文獻(xiàn)】
?。?] 李志強(qiáng).上市公司財(cái)務(wù)預(yù)警研究述評(píng)[J].金融理論與實(shí)踐,2009(3):86-90.
[2] Pawlak Z.Rough Sets[J].Int.J.Coumput.Inf.Sci,1982(11):341-356.
?。?]王國胤.Rough集理論與知識(shí)獲?。跰].西安:西安交通大學(xué)出版社,2001:99-142.
?。?] Ziarko W.Variable Precicsion Rough
Set Model[J].Journal of Computer and System Sciences,1993,46(1):39-59.
[5] An A,Shan N,Chan C,et al.Discovering rules for water damand prediction:An enhanced rough-set approach[J].Engineering Application and Artifical Intelligence,1996,9(6):645-653.
[6] 胡援成,程建偉.基于可變精度粗糙集模型的上市公司財(cái)務(wù)困境預(yù)測(cè)[J].當(dāng)代財(cái)經(jīng),2007(5):32-36.
?。?] 庾慧英,劉文奇. 變精度粗糙集模型中取值范圍的確定[J].昆明理工大學(xué)學(xué)報(bào),2005(12):109-111.
?。?] 王加陽,陳松喬,等.可變精度粗糙集模型研究[J].計(jì)算機(jī)與數(shù)字工程,2005(8):53-54
?。?] 顧靖,周宗放.基于可變精度粗糙集的新興技術(shù)企業(yè)信用風(fēng)險(xiǎn)識(shí)別[J].管理工程學(xué)報(bào),2010(1):70-76.
?。?0] Vapnik V. Statistical Learning Theory[M].New York:John Wiley,1998:1-173.
?。?1] 桑妍麗.變精度粗糙集下基于信息熵的屬性約簡(jiǎn)算法[J].山西師范大學(xué)學(xué)報(bào),2005(3):27-30.
?。?2] 王名揚(yáng).基于粗糙集理論的決策樹生成與剪枝方法[D].東北師范大學(xué)碩士學(xué)位論文,2005:47-52.