張中秋
(安徽大學(xué),安徽 合肥 230000)
一直以來(lái),商業(yè)銀行的經(jīng)營(yíng)都潛存著違約風(fēng)險(xiǎn)的發(fā)生,違約風(fēng)險(xiǎn)率的高低不僅會(huì)直接決定銀行的盈利水平與穩(wěn)健的經(jīng)營(yíng)能力,還會(huì)影響其對(duì)客戶和同業(yè)銀行的支付能力,造成整個(gè)金融系統(tǒng)的風(fēng)險(xiǎn)變化。李明[1]結(jié)合利率市場(chǎng)化條件下,討論了由中國(guó)銀行業(yè)經(jīng)營(yíng)所面臨的違約風(fēng)險(xiǎn)而帶來(lái)的一系列挑戰(zhàn)。隨著經(jīng)濟(jì)的快速發(fā)展,企業(yè)貸款的需求量不斷增加,商業(yè)銀行的風(fēng)險(xiǎn)評(píng)估技術(shù)也需要不斷的創(chuàng)新與發(fā)展,這就為商業(yè)銀行的風(fēng)險(xiǎn)管理技術(shù)提供了嚴(yán)峻的考驗(yàn)。因此,對(duì)上市企業(yè)的違約風(fēng)險(xiǎn)進(jìn)行評(píng)估一直被金融界所關(guān)注。眾多國(guó)內(nèi)外學(xué)者對(duì)企業(yè)的貸款違約風(fēng)險(xiǎn)的研究多采用判別分析或Logistic回歸模型進(jìn)行實(shí)證研究,主要以王春峰[2]為代表的部分學(xué)者分別運(yùn)用多元線性判別法,Logistic回歸法等對(duì)商業(yè)銀行面臨的違約風(fēng)險(xiǎn)進(jìn)行評(píng)估,并做出了實(shí)證對(duì)比分析。陳靜[3]以27家ST和27家非ST上市公司1995-1997年報(bào)數(shù)據(jù)建立線性判別模型進(jìn)行回判率的估計(jì)。李長(zhǎng)山[4]運(yùn)用Logistic回歸法構(gòu)建企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型,分析其判別效果達(dá)到了良好的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警機(jī)制。張初兵[5]等利用隨機(jī)模擬方法分別研究判別分析和Logistic回歸分類,并進(jìn)行回判準(zhǔn)確率的比較分析。
可以發(fā)現(xiàn)判別分析和Logistic回歸法為實(shí)際問(wèn)題提供了有價(jià)值的思考,而這兩種方法的理論基礎(chǔ)并不完全是相同的。本文關(guān)于上市企業(yè)違約風(fēng)險(xiǎn)的測(cè)定,需要將中小企業(yè)劃分為兩組:違約組和非違約組,這是屬于二分類問(wèn)題。判別分析與Logistic法在研究二分類問(wèn)題上都能夠較好的給出分類算法以及較優(yōu)的回判正確率,但都存在一些不可忽視的缺點(diǎn)。然而將兩種方法的優(yōu)勢(shì)融合在一起,構(gòu)造出一種組合模型對(duì)上市企業(yè)的貸款違約風(fēng)險(xiǎn)進(jìn)行實(shí)證研究的介紹還較少出現(xiàn)。因此,本文采用兩者組合的方法可以降低單一方法所帶來(lái)的弊端而集中兩者的優(yōu)勢(shì)大大降低了違約風(fēng)險(xiǎn)測(cè)定的誤判率,為商業(yè)銀行檢測(cè)企業(yè)的貸款違約風(fēng)險(xiǎn)提供了新思路。
接下來(lái)為了進(jìn)一步找出影響企業(yè)違約的關(guān)鍵性因素,我們采用了決策樹(shù)模型幫助我們更好的理解整個(gè)分類過(guò)程。季桂樹(shù),陳沛玲,宋航[6]基于各種決策樹(shù)分類算法的基本思想闡述了決策樹(shù)技術(shù)在分類過(guò)程中具有較高的分類精度、結(jié)構(gòu)簡(jiǎn)單、可理解性以及分類效率高等優(yōu)點(diǎn)。徐曉萍[7]分別運(yùn)用判別分析與決策樹(shù)模型對(duì)非上市中小企業(yè)違約風(fēng)險(xiǎn)進(jìn)行分析,并將兩種方法進(jìn)行對(duì)比。DaviS等利用決策樹(shù)算法成功的解決銀行信用卡違約問(wèn)題,并將幾種常見(jiàn)的算法進(jìn)行比較分析[8]。馮俊文[9]在文獻(xiàn)中提出了利用決策樹(shù)方法可以幫助我們對(duì)屬性進(jìn)行排序,能夠選擇出最優(yōu)屬性變量。因此,構(gòu)造決策樹(shù)模型可以使我們更加清楚地了解整個(gè)分類過(guò)程,找出重要性指標(biāo),指導(dǎo)商業(yè)銀行對(duì)關(guān)鍵性指標(biāo)進(jìn)行更詳細(xì)的調(diào)查,提高預(yù)測(cè)準(zhǔn)確度的同時(shí)提高了銀行風(fēng)險(xiǎn)管理的工作效率。
本文的主要思路可以分為以下四個(gè)部分:
第一部分:考慮選取經(jīng)營(yíng)現(xiàn)金流量/負(fù)債合計(jì)、總資產(chǎn)周轉(zhuǎn)率、總資產(chǎn)凈利潤(rùn)率、每股留存收益和總資產(chǎn)增長(zhǎng)率五項(xiàng)財(cái)務(wù)指標(biāo)數(shù)據(jù)作為公司是否具有違約風(fēng)險(xiǎn)的衡量指標(biāo)。
第二部分:計(jì)算出分別使用判別分析和Logistic回歸法對(duì)上市公司貸款違約風(fēng)險(xiǎn)進(jìn)行分類的回判正確率,其中分類結(jié)果正確的觀測(cè)點(diǎn)占所有觀測(cè)點(diǎn)的比例為回判正確率。對(duì)于相同的樣本,兩種方法之間的回判正確率是存在差異的。
第三部分:計(jì)算基于判別分析的Logistic回歸組合法的回判準(zhǔn)確率。將三種方法計(jì)算出的回判正確率進(jìn)行對(duì)比分析并利用檢驗(yàn)樣本組進(jìn)行回判檢驗(yàn)。
第四部分:利用決策樹(shù)算法將所有屬性的信息增益大小進(jìn)行排序,幫助我們更好的理解整個(gè)分類過(guò)程,為商業(yè)銀行的風(fēng)險(xiǎn)管理提供有價(jià)值的指標(biāo)參考。
本文選用滬深兩市的100家上市企業(yè)作為研究對(duì)象,其中*ST股票是指連續(xù)三年虧損或公司經(jīng)營(yíng)存在重大的不確定性,資不抵債,隨時(shí)可能被摘牌或破產(chǎn)。財(cái)務(wù)危機(jī)是指企業(yè)喪失支付能力、無(wú)力支付到期債務(wù)或費(fèi)用出現(xiàn)資不抵債的現(xiàn)象,包括商業(yè)破產(chǎn),運(yùn)營(yíng)失敗和資不抵債[10]。由信貸風(fēng)險(xiǎn)理論可知:我們可以將*ST公司作為貸款風(fēng)險(xiǎn)違約組處理,具有一定的理論依據(jù)。通過(guò)國(guó)泰安數(shù)據(jù)庫(kù)采集到標(biāo)有*ST的49家上市公司作為違約組樣本,選取的這些公司不僅被標(biāo)有特殊處理的記號(hào),而且長(zhǎng)期存在財(cái)務(wù)危機(jī)和負(fù)盈利的經(jīng)濟(jì)現(xiàn)象,因此作為違約組具有很好的代表性。根據(jù)滬深兩市于2017年報(bào)評(píng)選的前500強(qiáng)上市企業(yè)中選擇51家企業(yè)作為非違約組樣本,其中選擇的51家企業(yè)是起止2017年連續(xù)三年評(píng)選入圍前500強(qiáng),財(cái)務(wù)狀況一直保持良好的穩(wěn)定發(fā)展。確保了選擇的樣本可以準(zhǔn)確地劃分為違約組和非違約組。然后,隨機(jī)選取樣本數(shù)據(jù)的70%作為估計(jì)樣本組,剩下的30%作為檢驗(yàn)樣本組,即估計(jì)樣本組為70家公司,檢驗(yàn)樣本組為30家公司,我們所選的上市企業(yè)涉及的行業(yè)涵蓋范圍較廣,包括服裝、家具、百貨、食品、建筑、電器等方方面面,具有一定的代表性。
本文采用上市企業(yè)的財(cái)務(wù)指標(biāo)構(gòu)建違約風(fēng)險(xiǎn)模型的變量,財(cái)務(wù)指標(biāo)能力的高低直接反映了企業(yè)的經(jīng)營(yíng)能力和是否具有財(cái)務(wù)危機(jī)風(fēng)險(xiǎn),從而幫助我們判斷貸款企業(yè)是否可能發(fā)生違約風(fēng)險(xiǎn)。根據(jù)上市企業(yè)的財(cái)務(wù)特征可以細(xì)分為償債能力、經(jīng)營(yíng)能力、盈利能力、盈利質(zhì)量和可持續(xù)發(fā)展能力五個(gè)方向,本文初步從每個(gè)財(cái)務(wù)特征中篩選了2-3個(gè)財(cái)務(wù)比率,總計(jì)選取14個(gè)變量,但為了排除多重共線性的影響,最終從每個(gè)財(cái)務(wù)特征中篩選了一個(gè)具有代表性的財(cái)務(wù)比率,分別是經(jīng)營(yíng)現(xiàn)金流量/負(fù)債合計(jì)、總資產(chǎn)周轉(zhuǎn)率、總資產(chǎn)凈利潤(rùn)率、每股留存收益和總資產(chǎn)增長(zhǎng)率,分別記 X1、X2、X3、X4、X5,均可以從國(guó)泰安數(shù)據(jù)庫(kù)中進(jìn)行數(shù)據(jù)采集。綜合體現(xiàn)了企業(yè)的財(cái)務(wù)能力,可以幫助我們較好地劃分企業(yè)是否具有發(fā)生違約風(fēng)險(xiǎn)的可能性。
首先,利用SPSS軟件對(duì)這五個(gè)變量之間做相關(guān)性分析的統(tǒng)計(jì)描述,結(jié)果如表1所示:
表1 各指標(biāo)之間的相關(guān)性分析
由表1可知,各指標(biāo)之間的相關(guān)性均遠(yuǎn)小于0.5,不具有多重共線性,因此所選的五項(xiàng)財(cái)務(wù)指標(biāo)具有良好的代表性,能夠較好地衡量公司是否具有貸款違約的風(fēng)險(xiǎn)。
隨機(jī)選取的70個(gè)樣本量作為估計(jì)樣本組,分別有35家ST企業(yè)和35家非ST企業(yè)。因變量分為違約組和非違約組,分別記為Y=1和Y=0,而五個(gè)財(cái)務(wù)指標(biāo)作為自變量分別記為X1,X2,X3,X4,X5。
1.距離判別法。由于各變量在各組之間存在異方差,不滿足線性判別分析。繼而采用判別分析中的距離判別法建立的判別函數(shù),它是一種非線性函數(shù),其優(yōu)點(diǎn)對(duì)各類總體的分布沒(méi)有特殊要求,范圍較為寬松。
設(shè)兩個(gè)類別總體G1和G2,任取一個(gè)樣品,記為實(shí)測(cè)指標(biāo)值X=(x1,x2,x3,x4,x5),分別計(jì)算X到G1、G2總體的距離,記為D=(X,G1)和D=(X,G2),按照距離最近準(zhǔn)則判別歸類。
設(shè) u(1)、u(2)、E1、E2分別為 G1和G2均值和協(xié)方差陣,本文利用馬氏距離定義距離,公式如下:
其中W(X)作為判別函數(shù),它是二次函數(shù)。
按照距離最近準(zhǔn)則,可知當(dāng)W(X)>0時(shí),樣本歸為總體G1,當(dāng)W(X)<0時(shí),樣本歸為總體G2。
2.實(shí)驗(yàn)結(jié)果。利用R軟件對(duì)估計(jì)組數(shù)據(jù)做距離判別法,分類結(jié)果如表2所示:
表2 馬氏距離的分類結(jié)果
觀察可知利用判別分析得出的結(jié)果中違約組(Y=1)存在2個(gè)誤判,正確率為94.3%,非違約組(Y=0)存在7個(gè)誤判,正確率為80%。綜合而言,判別分析的回判正確率達(dá)到87.1%。
關(guān)于因變量是二分類的情況下,同方差、線性和正態(tài)性的假設(shè)都不能成立,OLS的估計(jì)是無(wú)效的,因此采用Logistic回歸的最大似然估計(jì)法可以解決這一問(wèn)題,即將Y(1、0)轉(zhuǎn)化成logit,這樣Logistic回歸模型可以表示為:
其中P是借款企業(yè)的違約風(fēng)險(xiǎn)率,β是待估系數(shù),X是自變量,Ui是隨機(jī)誤差項(xiàng)。
采用SPSS軟件進(jìn)行二項(xiàng)Logistic回歸分析,回歸分類的結(jié)果如表3所示:
表3 Logistic回歸分類的結(jié)果
從表3可以發(fā)現(xiàn),Logistic回歸分析的歸類結(jié)果相比于判別分析效果更佳,總體的回判正確率達(dá)到88.6%。
關(guān)于商業(yè)銀行信貸風(fēng)險(xiǎn)模型的發(fā)展,存在較多的分類方法是Logistic回歸模型與判別分析,相比而言,Logistic回歸法更加穩(wěn)健,但沒(méi)有理論證實(shí)該方法的回判正確率一定高于判別分析。為此,有學(xué)者提出了判別分析與Logistic回歸的組合模型,并通過(guò)大量實(shí)驗(yàn)證實(shí)了組合模型的優(yōu)越性,為本文利用組合模型嘗試對(duì)上市企業(yè)的違約風(fēng)險(xiǎn)進(jìn)行測(cè)定提供了思路。尹劍、陸程敏、楊貴軍[11]在文獻(xiàn)中提出了判別分析與Logistic回歸組合法的理論框架,通過(guò)隨機(jī)模擬實(shí)驗(yàn)證實(shí)了基于判別分析的Logistic回歸組合法相比于單個(gè)任何一種方法在二分類問(wèn)題方面都有較高的回判準(zhǔn)確率以及更高的穩(wěn)健性。張闊,李桂華,李燕飛[12]通過(guò)建立我國(guó)城市消費(fèi)者壽險(xiǎn)購(gòu)買行為的預(yù)測(cè)模型提出了將判別分析與Logistic回歸模型聯(lián)合應(yīng)用,能夠取得更好的預(yù)測(cè)效果。
1.基本原理。判別分析與Logistic回歸組合法主要依托于提高兩種模型在進(jìn)行歸類過(guò)程中的可信度,通過(guò)組合模型將兩種方法的優(yōu)勢(shì)集中在一起。針對(duì)判別分析進(jìn)行分類,W(X)的絕對(duì)值越大誤判的可能性會(huì)越小,而Logistic回歸則是要求條件概率值與0.5之間的差值絕對(duì)值越大可靠度越高,張初兵,高康,楊貴軍[5]指出判別函數(shù)值越大,條件概率與0.5之間的差值也就越大,反之亦然。因此可以利用判別分析的結(jié)果改進(jìn)Logistic回歸的分類結(jié)果?;舅悸贩譃槿糠郑旱谝徊糠郑肦軟件對(duì)樣本數(shù)據(jù)做距離判別分析,計(jì)算出判別函數(shù)值W(X)。第二部分,將W(X)從小到大進(jìn)行排序,計(jì)算出函數(shù)值的15%分位數(shù)和85%分位數(shù)。第三部分,針對(duì)W(X)大于85%或小于15%分位數(shù)的樣本數(shù)據(jù),判別函數(shù)的絕對(duì)值偏大,即兩者的分類結(jié)果相同且分類的正確率較高,因此不需要修正。定義函數(shù)為:
當(dāng)W(X)的值大于85%或小于15%分位數(shù)時(shí),不需要修正,因此d(x)記為0,同時(shí)還可以減少極端值對(duì)Logistic回歸的影響。對(duì)于在15%與85%分位數(shù)之間的樣本數(shù)據(jù),可以將d(x)=W(x)作為新增解釋變量對(duì)樣本數(shù)據(jù)進(jìn)行修正,然后建立Logistic回歸模型,最終得到判別分析與Logistic回歸組合模型。
2.實(shí)驗(yàn)結(jié)果。利用SPSS對(duì)估計(jì)組樣本進(jìn)行基于判別分析的Logistic回歸組合法的軟件操作,即對(duì)增設(shè)d(x)為解釋變量后,重新對(duì)70個(gè)樣本進(jìn)行二元Logistic回歸分析,其分類匯總結(jié)果如表4所示:
表4 組合法的分類結(jié)果
可以發(fā)現(xiàn)違約組(Y=1)存在2個(gè)誤判,正確率達(dá)到94.3%,非違約組(Y=0)存在5個(gè)誤判,正確率為85.7%,總體的回判正確率高達(dá)了90%。模型的預(yù)測(cè)精度分別提高了3.3%和1.6%,相比單一的判別分析或Logistic回歸法的預(yù)測(cè)結(jié)果都要好。同時(shí),無(wú)論單從非違約組還是違約組中的正確率大小的角度分析,這種組合模型也優(yōu)于單一任何一種方法的測(cè)定,由此可知通過(guò)組合法可以極大地提高關(guān)于二分類問(wèn)題中的回判正確率。
3.檢驗(yàn)樣本組的分類情況。為了進(jìn)一步檢驗(yàn)組合模型的適用性和有效性,接下來(lái)我們對(duì)剩余30%的樣本量作為檢驗(yàn)樣本組,進(jìn)行組合模型的回判檢驗(yàn)。判斷統(tǒng)計(jì)結(jié)果如表5所示:
表5 違約判斷統(tǒng)計(jì)結(jié)果(組合模型)
表5可以發(fā)現(xiàn),將判別分析與Logistic回歸組合法延伸對(duì)檢測(cè)樣本組進(jìn)行回判檢驗(yàn),其中違約組(Y=1)和非違約組(Y=0)均沒(méi)有判錯(cuò),回判正確率為100%。也就是說(shuō)明組合模型同樣達(dá)到了很好的預(yù)測(cè)結(jié)果,具有良好的延伸性與有效性。
決策樹(shù)是一種比較常用的分類方法。其基本思想是對(duì)預(yù)測(cè)變量進(jìn)行二元分離,從而構(gòu)造一棵可用于預(yù)測(cè)新樣本單元所屬類別的樹(shù)。同時(shí),決策樹(shù)還能夠按照屬性的最大信息增益對(duì)屬性進(jìn)行排序進(jìn)而生成決策樹(shù),直觀地了解整個(gè)分類過(guò)程以及找出影響分類的關(guān)鍵性因素。
同樣需要將100個(gè)樣本數(shù)據(jù)隨機(jī)劃分訓(xùn)練集與測(cè)試集,其中訓(xùn)練集樣本占70%,測(cè)試集樣本占30%。利用訓(xùn)練樣本集產(chǎn)生初步規(guī)則生成決策樹(shù),然后利用測(cè)試樣本集進(jìn)行剪枝,通過(guò)R軟件得到最終的測(cè)試樣本集的判斷結(jié)果如表6所示和決策樹(shù)圖形如圖1所示:
表6 違約判斷統(tǒng)計(jì)結(jié)果(決策樹(shù)模型)
表6可知:統(tǒng)計(jì)結(jié)果中違約組(Y=1)的判斷正確率為82.35%,非違約組(Y=0)的判斷正確率為76.92%,總的回判正確率為80%,判斷結(jié)果較優(yōu)。雖然相比上述的組合模型的統(tǒng)計(jì)判斷結(jié)果而言,決策樹(shù)模型判斷的效果不太理想,可能由于決策樹(shù)算法在產(chǎn)生規(guī)則時(shí)采用局部的貪婪法,無(wú)法保障全局最優(yōu),其次分類器過(guò)于復(fù)雜,會(huì)產(chǎn)生一定的噪聲,從而發(fā)生過(guò)度擬合的問(wèn)題等。但是它同時(shí)具有處理數(shù)據(jù)的速度快,能夠直接體現(xiàn)數(shù)據(jù)特點(diǎn)且易于理解與實(shí)現(xiàn)等優(yōu)點(diǎn),仍成為一種常見(jiàn)的分類方法。
圖1 決策樹(shù)圖形
從圖1可以看出,根據(jù)測(cè)試樣本集對(duì)決策樹(shù)進(jìn)行剪枝后降低了葉子節(jié)點(diǎn),得到了關(guān)于測(cè)試樣本集進(jìn)行預(yù)測(cè)的最佳決策樹(shù)模型??梢园l(fā)現(xiàn)經(jīng)過(guò)剪枝后決策樹(shù)中只存在三個(gè)關(guān)鍵性指標(biāo),分別是每股留存收益(X4)、總資產(chǎn)周轉(zhuǎn)率(X2)和總資產(chǎn)凈利潤(rùn)率(X3)。說(shuō)明這三個(gè)財(cái)務(wù)指標(biāo)對(duì)上市企業(yè)的貸款違約風(fēng)險(xiǎn)的測(cè)定是至關(guān)重要的。其中每股留存收益的信息增益最大,可以判斷該指標(biāo)相比其他指標(biāo)具有最高區(qū)分度屬性,無(wú)論是針對(duì)違約組還是非違約組,每股留存收益的財(cái)務(wù)指標(biāo)都可以很大程度的進(jìn)行準(zhǔn)確分類,是判斷企業(yè)是否可能違約的最關(guān)鍵性因素。該方法可以幫助商業(yè)銀行提高貸前審查效率,減少不必要資源的浪費(fèi),加強(qiáng)銀行對(duì)高風(fēng)險(xiǎn)企業(yè)的甄別能力。
關(guān)于上市企業(yè)貸款違約的測(cè)定,對(duì)于商業(yè)銀行來(lái)說(shuō)是一項(xiàng)復(fù)雜且重要的工作內(nèi)容。本文的研究?jī)?nèi)容摒棄了常用的判別分析法或者Logistic回歸模型進(jìn)行上市企業(yè)的違約風(fēng)險(xiǎn)測(cè)定,而嘗試采用一種基于判別分析的Logistic回歸組合法。關(guān)于判別分析與Logistic回歸組合模型測(cè)定上市企業(yè)貸款違約風(fēng)險(xiǎn)的方法可以極大地提高回判正確率,加強(qiáng)風(fēng)險(xiǎn)評(píng)估管理,為商業(yè)銀行違約風(fēng)險(xiǎn)的甄別提供一種新思路。
雖然相比而言,利用決策樹(shù)模型對(duì)上市企業(yè)的違約風(fēng)險(xiǎn)進(jìn)行甄別,得到的回判正確率較低,但是對(duì)于大量數(shù)據(jù)的前提下,決策樹(shù)仍然具有有效構(gòu)造模型的能力即可伸縮性較強(qiáng),還可以使決策者更清晰明了的看清整個(gè)分類過(guò)程以及找出影響上市企業(yè)違約的關(guān)鍵性指標(biāo),提高商業(yè)銀行貸前審查效率。尤其針對(duì)經(jīng)營(yíng)所涉及的覆蓋范圍較大的上市企業(yè),對(duì)其數(shù)據(jù)進(jìn)行審核時(shí)會(huì)造成數(shù)據(jù)采集量大而復(fù)雜,審核較為困難時(shí),決策樹(shù)可以很好的幫助商業(yè)銀行降低審查難度,提高工作效率的同時(shí)保證風(fēng)險(xiǎn)排查的準(zhǔn)確性。
如果商業(yè)銀行進(jìn)行風(fēng)險(xiǎn)審查時(shí),同時(shí)考慮兼用基于判別分析的Logistic回歸組合法模型和決策樹(shù)模型,進(jìn)行上市企業(yè)違約風(fēng)險(xiǎn)的測(cè)定,將保證較高的回判正確率的同時(shí)大大提高審查效率,降低審查難度,使優(yōu)良的中小企業(yè)及時(shí)得到貸款,促進(jìn)商業(yè)銀行的金融業(yè)發(fā)展,同時(shí)也可以為投資者、金融機(jī)構(gòu)和市場(chǎng)監(jiān)管層提供一種有效的財(cái)務(wù)預(yù)警分析工具。