吳旭東
摘 要:企業(yè)在發(fā)生破產(chǎn)之前,它的很多財(cái)務(wù)指標(biāo)會(huì)跟財(cái)務(wù)良好的企業(yè)之間有一定的區(qū)別。文章運(yùn)用多元統(tǒng)計(jì)分析中的判別分析,對(duì)21家破產(chǎn)企業(yè)和25家財(cái)務(wù)狀況良好的企業(yè)的幾項(xiàng)不同的指標(biāo)做了分析,用SPSS構(gòu)造了費(fèi)希爾線(xiàn)性判別函數(shù),并運(yùn)用此函數(shù)判定企業(yè)的財(cái)務(wù)狀況是否良好。
關(guān)鍵詞:判別分析;破產(chǎn)企業(yè);財(cái)務(wù)狀況
1 判別分析原理
在生產(chǎn)、科研和日常生活中,經(jīng)常遇到需要判別的問(wèn)題。判別分析本質(zhì)上具有探索性。作為一種分割方法,它通常在因果關(guān)系不甚明了的情況下被一次性地用來(lái)對(duì)所觀察到的差別進(jìn)行調(diào)查。例如,在地質(zhì)勘探中,我們?cè)谀车貐^(qū)采集到某種礦物標(biāo)本,需要判定它是哪種礦物;又如,在醫(yī)院對(duì)一名患者作各種化驗(yàn)檢查、獲得有關(guān)指標(biāo)和數(shù)據(jù)、要診斷患者得的是哪一種疾病,等等,這些都屬于判別問(wèn)題。
判別分析是應(yīng)用性很強(qiáng)的一種多元統(tǒng)計(jì)方法,已滲透到各個(gè)領(lǐng)域,但不管哪個(gè)領(lǐng)域,判別分析問(wèn)題都可以這樣描述:設(shè)有k個(gè)m維總體G1,G2, …,GK,其分布特征已知(如已知分布函數(shù),或知道來(lái)自各個(gè)總體的訓(xùn)練樣本)。對(duì)給定的新樣本,我們要判斷它來(lái)自哪個(gè)總體。
常用的判別方法主要有下列幾種:
(1)最大似然法
用于變量均為分類(lèi)變量的情況。該方法建立在獨(dú)立事件概率乘法原理的基礎(chǔ)上,根據(jù)訓(xùn)練樣本信息求得因變量各種組合情況下樣品被分為任何一類(lèi)的概率。當(dāng)新樣品進(jìn)入時(shí),則計(jì)算它被分到每一類(lèi)中的條件概率(似然值),概率最大的那一類(lèi)就是它最終評(píng)定的歸類(lèi)。
(2)距離判別
它的方法是由訓(xùn)練樣本得出每個(gè)分類(lèi)的重心(中心)坐標(biāo),然后對(duì)新樣品求出它們離各個(gè)類(lèi)別重心的距離遠(yuǎn)近,從而歸入離得最近的分類(lèi)。最常見(jiàn)的距離是馬氏距離,偶爾也采用歐氏距離。
距離判別的特點(diǎn)是直觀簡(jiǎn)單,適合于對(duì)因變量均為連續(xù)的情況進(jìn)行分類(lèi),且它對(duì)變量的分布類(lèi)型無(wú)嚴(yán)格要求。
(3)Fisher判別
亦稱(chēng)典型判別,該方法的基本方法是投影,即將原來(lái)在R維空間的因變量組合投影到維度較低的D維空間去,然后在D維空間中再進(jìn)行分類(lèi)。投影的原則是使得每一類(lèi)內(nèi)的方差盡可能小,而不同類(lèi)別之間的投影的方差盡可能大。
Fisher判別法的優(yōu)勢(shì)在于對(duì)分布、方差等都沒(méi)有什么限制,應(yīng)用范圍較廣。另外,用該判別方法建立的判別方程可以直接用手工計(jì)算的方法進(jìn)行新觀察對(duì)象的判別,這在許多時(shí)候是方便的。
(4)Bayes判別
許多時(shí)候?qū)Ω黝?lèi)別的比例分布情況有一定的先驗(yàn)信息,比如說(shuō)客戶(hù)對(duì)投遞廣告的反應(yīng)絕大多數(shù)都是無(wú)回音,如果進(jìn)行判別,自然也應(yīng)當(dāng)是無(wú)回音居多。Bayes判別就可以利用這種先驗(yàn)信息,它的基本方法是認(rèn)為所有P個(gè)類(lèi)別都是空間中互斥的子體,每個(gè)觀察都是空間中的一個(gè)點(diǎn)。在考慮先驗(yàn)概率的前提下,利用Bayes公式按照一定的準(zhǔn)則建構(gòu)一個(gè)判別函數(shù),分別計(jì)算該樣品落入各個(gè)子體的概率,所有概率中最大的一類(lèi)就是被認(rèn)為是該樣品所屬的類(lèi)別。
Bayes判別的強(qiáng)項(xiàng)是進(jìn)行多類(lèi)判別,但是它要求母體呈多元正態(tài)分布。
在下面的應(yīng)用中,主要使用SPSS軟件分析輸出以Fisher判別為主給出的結(jié)果。在指定選項(xiàng)后,也可以給出Bayes判別式的結(jié)果。
文章中主要運(yùn)用Fisher判別。Fisher的想法是將多元觀測(cè)值x變換成多元觀測(cè)值y,使得總體?仔1和?仔2導(dǎo)出的y盡可能地分離開(kāi)。Fisher建議用x的線(xiàn)性組合來(lái)建立y,因?yàn)樗鼈兪莤的非常簡(jiǎn)單的函數(shù),易于掌握。
Fisher的線(xiàn)性判別函數(shù)是在假定兩個(gè)總體有相同協(xié)方差的條件下得到的。因此,毫不奇怪Fisher方法與最小錯(cuò)分代價(jià)法則這種特殊情況相對(duì)應(yīng)。Fisher分類(lèi)法則等價(jià)于在相同先驗(yàn)概率和相同錯(cuò)分代價(jià)下的最小ECM法則。
為具有均值向量?滋i和協(xié)方差矩陣?撞i的正態(tài)密度函數(shù)的情形。若進(jìn)一步假定c(i|i)=0,c(k|i)=1,k≠i(或等價(jià)的,所有錯(cuò)分代價(jià)相同),則上述最小ECM分類(lèi)法則變成:
則將x分配到?仔k。
在上式中,常數(shù)(p/2)ln(2?仔)可以略去,因?yàn)閷?duì)所有的總體都相同,因此我們將第i個(gè)總體的二次判別得分定義為
實(shí)踐中?滋i和?撞i兼屬未知,但??色@得一組已經(jīng)正確分類(lèi)的訓(xùn)練樣本,因此可以用樣本均值xi來(lái)估計(jì)總體均值?滋i,以及用樣本協(xié)方差矩陣Si來(lái)估計(jì)總體協(xié)方差矩陣?撞i。此時(shí)二次于是基于樣本的分類(lèi)法則如下:
估計(jì)的最小TPM法則(對(duì)?撞i不同的多個(gè)正態(tài)總體)
若二次判別得分
則將x分配到?仔k。
若先驗(yàn)概率未知,通常的做法是令 。
2 多元判別分析法
2.1 判別分析的基本步驟
應(yīng)用SPSS進(jìn)行判別分析模型的構(gòu)建,其過(guò)程為:對(duì)于分為k組的研究對(duì)象,可建立(k-1)個(gè)典型判別函數(shù)(原始自變量的線(xiàn)性組合),和k個(gè)Fisher判別函數(shù),然后將各樣本的自變量回代到判別函數(shù)中,計(jì)算器判別分?jǐn)?shù)或?qū)儆诟鹘M的概率,根據(jù)數(shù)值的大小,判別樣品所屬組別,對(duì)樣品的原始組別給出錯(cuò)分率。具體步驟如下:
(1)選擇自變量和組變量。
(2)計(jì)算各組單變量描述統(tǒng)計(jì)量,包括組內(nèi)均值、組內(nèi)標(biāo)準(zhǔn)差、總均值、總標(biāo)準(zhǔn)差、各組協(xié)方差矩陣、組間相關(guān)矩陣、并對(duì)組間均值相等和協(xié)方差矩陣相等的零假設(shè)進(jìn)行檢驗(yàn)。
(3)推導(dǎo)判別系數(shù),給出標(biāo)準(zhǔn)或未標(biāo)準(zhǔn)化的典型判別函數(shù)系數(shù),并對(duì)函數(shù)顯著性進(jìn)行檢驗(yàn)。
(4)建立Fisher線(xiàn)性判別模型。
(5)按照一定的規(guī)則進(jìn)行分組。
(6)進(jìn)行樣本回判分析,計(jì)算錯(cuò)分率。
(7)輸出結(jié)果。
(8)結(jié)合實(shí)際情況進(jìn)行分析。
2.2 建立模型的數(shù)據(jù)假定和原始數(shù)據(jù)的選擇。
對(duì)破產(chǎn)的企業(yè)收集它們?cè)谄飘a(chǎn)兩年的年度財(cái)務(wù)數(shù)據(jù),對(duì)財(cái)務(wù)良好的企業(yè)也收集同一時(shí)期的數(shù)據(jù),數(shù)據(jù)涉及四個(gè)變量,X1=CF/TD(現(xiàn)金流量/總債務(wù)),X2=NI/TA(凈收益/總資產(chǎn)),X3=CA/CL(流動(dòng)資產(chǎn)/流動(dòng)債務(wù)),以及X4=CA/NS(流動(dòng)資產(chǎn)/凈銷(xiāo)售額),數(shù)據(jù)列于表1所示。
表2是獨(dú)立變量的全部和各組的均值和標(biāo)準(zhǔn)離差。
表3給出了合并類(lèi)內(nèi)協(xié)方差矩陣和相關(guān)矩陣,陣中個(gè)元素是各類(lèi)協(xié)方差或相關(guān)陣中對(duì)應(yīng)元素的均值。從表中可以看出,X1=CF/TD(現(xiàn)金流量/總債務(wù))和X2=NI/TA(凈收益/總資產(chǎn))的相關(guān)系數(shù)值(0.758)較大,說(shuō)明這兩個(gè)變量有較好的相關(guān)性,如果需要剔除這四個(gè)變量中的某個(gè)變量,通常采取剔除X1=CF/TD(現(xiàn)金流量/總債務(wù))和X2=NI/TA(凈收益/總資產(chǎn))這兩個(gè)變量中的一個(gè)比較好。
表4給出了各類(lèi)的協(xié)方差矩陣和總協(xié)方差矩陣。
表5給出了Fisher線(xiàn)性判別方程的系數(shù)。利用表中的數(shù)據(jù)可直接寫(xiě)出判別方程,有幾類(lèi)就有幾個(gè)分類(lèi)方程。將某個(gè)樣品代人方程計(jì)算其在各類(lèi)別上的得分,并根據(jù)分值多少判斷其所屬類(lèi)別,比較不同類(lèi)的判別分值,哪個(gè)大就屬于哪一類(lèi)。
破產(chǎn)企業(yè)的判別函數(shù)為:
未破產(chǎn)企業(yè)的判別函數(shù)為:
例如,第一行的原始數(shù)據(jù)為(-0.45,-0.41,1.09,0.45)代入上述式中,得
y1=7.40191,y2=2.00561,y1的數(shù)值比y2大,所以這個(gè)企業(yè)屬于破產(chǎn)企業(yè)。
表6給出了判別分析結(jié)果的統(tǒng)計(jì)評(píng)價(jià)。從表中可以看出,它給出了全部樣品建立判別方程的正確分類(lèi)的樣品數(shù),錯(cuò)分樣品數(shù)和錯(cuò)判率;交叉驗(yàn)證建立判別方程的正確分類(lèi)的樣品數(shù),錯(cuò)分樣品數(shù)和錯(cuò)分率。全部樣品建立判別方程的正確分類(lèi)結(jié)果為破產(chǎn)企業(yè)的錯(cuò)判率為9.5%,財(cái)務(wù)狀況良好的企業(yè)錯(cuò)判率為8%;交叉驗(yàn)證建立判別方程的正確分類(lèi)結(jié)果為破產(chǎn)企業(yè)的錯(cuò)判率為14.3%,財(cái)務(wù)狀況良好的企業(yè)錯(cuò)判率為16%。如果對(duì)判定的結(jié)果不滿(mǎn)意的話(huà),可以進(jìn)一步收集數(shù)據(jù),或者引入其他的財(cái)務(wù)指標(biāo)進(jìn)行分析。會(huì)提高判定的準(zhǔn)確性。
參考文獻(xiàn)
[1]RichardoA.Johnson、DeanW.Wichern.實(shí)用多元統(tǒng)計(jì)分析[M].陸璇,葉俊譯.北京:清華大學(xué)出版社,2008,11.
[2]張潤(rùn)楚.多元統(tǒng)計(jì)分析[M].北京:科學(xué)出版社,2006,9.
[3]章紅波,陳紅艷.實(shí)用數(shù)據(jù)統(tǒng)計(jì)分析及SPSS12.0應(yīng)用[M].北京:人民郵電出版社,2006,2.
[4]林杰斌等.統(tǒng)計(jì)建模與應(yīng)用實(shí)務(wù)[M].北京:中國(guó)鐵道出版社,2006,
2.
[5]劉晶等.基于多元判別分析的財(cái)務(wù)預(yù)警系統(tǒng)[M].北京:中國(guó)管理信息化,2010,2.
[6]衷克定.統(tǒng)計(jì)數(shù)據(jù)分析與實(shí)踐[M].北京:高等教育出版社,2005,4.
[7]周皓.統(tǒng)計(jì)基礎(chǔ)和SPSS入門(mén)與提高[M].北京:清華大學(xué)出版社,2005,10.
[8]何少華,文竹青,等.實(shí)驗(yàn)設(shè)計(jì)與數(shù)據(jù)處理[M].北京:國(guó)防科技大學(xué)出版社,2002,10.
[9]高惠璇.應(yīng)用多元統(tǒng)計(jì)分析[M].北京:北京大學(xué)出版社,2005,1.
[10]林震巖.多變量分析-SPSS的操作與應(yīng)用[M].北京:北京大學(xué)出版社,2007,8.