吳建華 張穎 王新軍
(1.濟(jì)南大學(xué)數(shù)學(xué)科學(xué)學(xué)院,山東 濟(jì)南 250022;2.山東大學(xué)經(jīng)濟(jì)學(xué)院,山東 濟(jì)南 250100)
隨著我國宏觀經(jīng)濟(jì)低位運(yùn)行和供給側(cè)結(jié)構(gòu)性改革步入深水區(qū),各個行業(yè)企業(yè)被迫轉(zhuǎn)型發(fā)展,這導(dǎo)致了國內(nèi)商業(yè)銀行不良資產(chǎn)余額和不良率持續(xù)上升。公開數(shù)據(jù)1顯示,截至2017年第一季度,國內(nèi)商業(yè)銀行不良貸款規(guī)模約1.58萬億元,不良貸款率為1.74%,不良貸款規(guī)模保持穩(wěn)步上升趨勢。分機(jī)構(gòu)看,我國各類銀行機(jī)構(gòu)的不良貸款余額的絕對數(shù)在不斷增加,農(nóng)村商業(yè)銀行不良貸款率在五類機(jī)構(gòu)中最高,截至一季度為2.55%,然而同期的外資銀行不良率則明顯較低為0.89%。以上數(shù)據(jù)表明相比外資銀行,國內(nèi)商業(yè)銀行在信用風(fēng)險量化和控制能力方面有待進(jìn)一步提高。在這種背景下,研究銀行貸款的違約損失率及其影響因素,對進(jìn)一步防范出現(xiàn)和處置不良貸款有重要的現(xiàn)實(shí)意義。根據(jù)Basel II/III對信用風(fēng)險的經(jīng)濟(jì)資本的要求,實(shí)施內(nèi)部評級高級法的商業(yè)銀行需違約概率和違約損失率等重要的參數(shù)。中國銀監(jiān)會也于2012年6月在Basel Ⅲ的基礎(chǔ)上公布了《商業(yè)銀行資本管理辦法(試行)》,辦法規(guī)定采用內(nèi)部評級法計(jì)量信用風(fēng)險加權(quán)資產(chǎn)的商業(yè)銀行需要估計(jì)違約概率(PD)、違約損失率(LGD)、違約風(fēng)險暴露(EAD)、相關(guān)性(Cor)和有效期限(M)。其中最關(guān)鍵也是最難估計(jì)的兩個參數(shù)就是PD和LGD。實(shí)際上,除了資本監(jiān)管要求之外,PD和LGD的準(zhǔn)確預(yù)測也是商業(yè)銀行進(jìn)行貸款風(fēng)險調(diào)整定價、經(jīng)濟(jì)資本計(jì)算和資產(chǎn)支持證券或者信用衍生品定價的基礎(chǔ)。
然而,從早期的相關(guān)研究來看,學(xué)界主要關(guān)注違約概率PD的估計(jì),較少關(guān)注違約損失LGD的估計(jì),隨著2004年Basel II協(xié)議的推出,學(xué)界和業(yè)界對于LGD的研究開始大量增長。從理論研究層面來看,國外對LGD的研究最早始于1990s年代中期,隨后陸續(xù)出現(xiàn)了一些關(guān)于LGD的理論和實(shí)證的研究。從現(xiàn)有的研究來看,基本思路主要是采用某種統(tǒng)計(jì)方法分析LGD的影響因素和對LGD進(jìn)行擬合和預(yù)測。
在分析LGD的影響因素方面,比如Hibbeln and Gürtler(2011)[5]等研究發(fā)現(xiàn),債務(wù)結(jié)構(gòu)(抵押/保證及清償優(yōu)先級別)、債務(wù)人的信用質(zhì)量或者違約概率、清償過程、債務(wù)人所屬行業(yè)和宏觀經(jīng)濟(jì)狀況對LGD的影響較為顯著,但對于企業(yè)規(guī)模、貸款規(guī)模和貸款期限等因素對LGD的影響的結(jié)論并不一致。國內(nèi)的相關(guān)研究可以參考陳光忠等(2010)[15]、曹萍(2015)[14]和吳建華等(2016)[18]等代表性文獻(xiàn)。
從LGD擬合和預(yù)測中所采用的統(tǒng)計(jì)學(xué)方法來看,由于LGD數(shù)據(jù)具有典型的非正態(tài)性和雙峰的U型分布,而標(biāo)準(zhǔn)的線性回歸無法有效的對LGD擬合和預(yù)測,為此需要利用其他的回歸技術(shù)進(jìn)行處理。Cribarineto(2004)[4]利用了貝塔分布擬合LGD的分布,它不需要正態(tài)性假設(shè)和同方差假設(shè),所以適用范圍廣泛。Bellotti and Crook(2007)[1]利用比例響應(yīng)回歸FRR對LGD進(jìn)行擬合。Yashkir and Yashkir(2013)[13]對比研究了幾個最為流行的LGD模型(LSM,Tobit,三層Tobit,貝塔回歸,膨脹貝塔回歸,截?cái)噘ゑR回歸)的預(yù)測績效。最近陳暮紫等(2015)[16]基于預(yù)期效用分布理論框架下,構(gòu)建了違約回收率的貝塔分布修正模型。
縱觀以上已有的LGD研究,無論是采用參數(shù)方法還是采用非參數(shù)方法,本文發(fā)現(xiàn)其中的分析基本結(jié)果大都是對LGD的均值預(yù)測,要么直接進(jìn)行均值回歸,要么最終的結(jié)果以均值的形式體現(xiàn)。眾所周知,均值只是對概率分布的基本特征的描述,它無法刻畫完整的概率分布,尤其是對于LGD的非正態(tài)、偏斜和雙峰分布特征來說,問題更嚴(yán)重。然而,無論是從資本監(jiān)管要求和信用風(fēng)險量化,還是從各種信用產(chǎn)品的定價來看,都需要對LGD的完整分布的估計(jì)和預(yù)測。
實(shí)際上,在統(tǒng)計(jì)學(xué)理論研究的領(lǐng)域,針對均值回歸不能完整描述響應(yīng)變量的分布這一缺點(diǎn),Koenker and Bassett(1978)[7]提出了分位數(shù)回歸(QR)模型。自從分位數(shù)回歸被提出以來,分位數(shù)回歸得到了大量的研究,并獲得了廣泛的應(yīng)用,其應(yīng)用領(lǐng)域包括醫(yī)學(xué)、環(huán)境科學(xué)、生物學(xué)、經(jīng)濟(jì)和金融領(lǐng)域等。特別是在金融風(fēng)險量化研究中,分位數(shù)回歸被廣泛用于估計(jì)市場風(fēng)險中的在險價值,比如Wong and Ting(2016)[12]等將分位數(shù)回歸技術(shù)應(yīng)用于市場風(fēng)險中的各種在險價值模型,發(fā)現(xiàn)分位數(shù)回歸具有顯著的優(yōu)勢。
不過,以上這些研究大都集中于利用QR來量化市場風(fēng)險。在信用風(fēng)險量化中,尤其是在LGD估計(jì)中運(yùn)用QR的研究非常少,比如Sopitpongstorn et al.(2016)[10]提出了利用非參數(shù)分位數(shù)回歸和部分線性附加分位數(shù)回歸來模型化平均違約回收率RR的思路。然而,從國內(nèi)的相關(guān)研究來看,在這方面的研究幾乎是個空白。
不同于以上的研究,本文不是利用QR估計(jì)最終的平均LGD,而是直接模型化LGD的整個分布?;诓煌姆治粩?shù),區(qū)分了協(xié)變量對極低、適中和極高LGD的影響。利用HMI和HWMI兩個指標(biāo)來進(jìn)行模型對比,然后通過樣本內(nèi)和樣本外的對比分析以評估LGD的整個分布的擬合性。這樣,本文就從一個全新的視角量化了協(xié)變量對LGD的全面的影響。
本文首先簡要介紹分位數(shù)回歸方法,通過模擬試驗(yàn)驗(yàn)證分位數(shù)回歸刻畫具有非正態(tài)、偏斜和雙峰分布的適用性。然后,對實(shí)證分析的數(shù)據(jù)進(jìn)行描述統(tǒng)計(jì),并根據(jù)分位數(shù)回歸模型實(shí)證分析的結(jié)果,對比其他幾個不同模型的樣本內(nèi)和樣本外的預(yù)測績效,最后得出結(jié)論。
根據(jù)上述文獻(xiàn)綜述可知,LGD具有非正態(tài)性、極端偏斜和雙峰U型分布的特征,而且在信用風(fēng)險資本監(jiān)管中計(jì)算非預(yù)期損失時,需要完整的損失分布。而現(xiàn)有的關(guān)于LGD的估計(jì)的方法中大都是均值回歸,均值只能刻畫分布的平均特征,而不能完整的描述LGD的分布,尤其是對于LGD的具有U型分布設(shè)定來說問題更嚴(yán)重。本文試圖利用分位數(shù)回歸解決以上的問題。
下面首先給出分位數(shù)回歸的簡要概述,然后通過隨機(jī)模擬驗(yàn)證分位數(shù)回歸在刻畫非正態(tài)、極端偏斜和雙峰分布設(shè)定中的適用性。
沿用Koenker(2005)[7]提出的分位數(shù)回歸思路,假設(shè)隨機(jī)變量Y的分布函數(shù)為
Y的第τ分位數(shù)的定義為滿足F(y)≥τ的最小的y值,即
回歸分析的基本思想是使樣本值與擬合值之間的距離最短,那么樣本分位數(shù)回歸就是使加權(quán)誤差絕對值之和最小。具體來說,對于Y的一組樣本{y1,…,yn},需要求出滿足下式的ξ
其中τ為分位數(shù)權(quán)重,ξ為目標(biāo)擬合值。上式可以等價的表示為:
其中,ρτ(u)=(τ-I(u<0))u,I(z)為指示函數(shù),z是條件關(guān)系式,當(dāng)z為真時,I(z)=1;當(dāng)z為假時,I(z)=0。以上基于Y的一組樣本{y1,…,yn},估計(jì)ξ的過程就被稱為是分位數(shù)回歸。
假設(shè)因變量Y可以由k個自變量組成的矩陣X線性表示。
其中誤差u滿足非自相關(guān)假設(shè)。設(shè)(X,Y)的一組隨機(jī)樣本為{(x1, y1),…,(xn ,yn)},那么,Y的第τ分位數(shù)的樣本條件分位數(shù)函數(shù)為
其中x,βτ都是k×1階列向量。那么,估計(jì)Y的第τ分位數(shù)回歸方程系數(shù)βτ的方法是,使得下面的目標(biāo)函數(shù)或者說加權(quán)誤差絕對值之和最小的系數(shù),即
以上基于(X,Y)的一組樣本{(x1, y1),…,(xn ,yn)}估計(jì)βτ的過程被稱為是條件分位數(shù)回歸。為了表達(dá)的方便,在不引起歧義的情況下,本文不區(qū)分“分位數(shù)回歸”和“條件分位數(shù)回歸”,而是統(tǒng)一稱為分位數(shù)回歸。
由于目標(biāo)函數(shù)(7)是不可微的,傳統(tǒng)的對目標(biāo)函數(shù)求導(dǎo)的方法不再適用,因此需要采用線性規(guī)劃方法來估計(jì)分位數(shù)回歸方程參數(shù)比如單純形算法、內(nèi)點(diǎn)算法和平滑算法等。許多常見的計(jì)量經(jīng)濟(jì)和統(tǒng)計(jì)軟件都可以實(shí)現(xiàn)對分位數(shù)回歸模型的估計(jì)和假設(shè)檢驗(yàn)。本文在分位數(shù)回歸模型分析中主要采用統(tǒng)計(jì)軟件R語言進(jìn)行處理。
值得一提的是,在分位數(shù)回歸模型設(shè)定中,對于誤差u來說,除了非自相關(guān)假設(shè)外,沒有更多的模型假設(shè),因此可以處理較高水平的誤差異質(zhì)性。相對于最小二乘法,加權(quán)最小絕對離差和法的假設(shè)條件更為寬松。顯然,對于LGD分布的非正態(tài)性、偏斜和雙峰特征,都可以利用分位數(shù)回歸容易處理。
下面通過數(shù)值模擬試驗(yàn)檢驗(yàn)分位數(shù)回歸QR在處理LGD分布的非正態(tài)性、偏斜和雙峰特征方面的適用性。
為了生成LGD分布所具有的非正態(tài)、偏斜和雙峰特征,給定如下的數(shù)據(jù)生成過程,yi=β1τi+β2τixi+ui,其中自變量xi來自N(0,0.01)中的隨機(jī)抽樣,為了模擬數(shù)據(jù)的雙峰特征,令β1τi=zτi,β2τi=zτi-0.5,zτi=B(0.2),設(shè)誤差項(xiàng)u是高斯分布,即u~N(0,0.04)。重復(fù)以上的模擬過程5000次,可以得到5000模擬個樣本點(diǎn)。圖1給出了模擬的結(jié)果的散點(diǎn)圖和直方圖。
下面利用QR估計(jì)數(shù)據(jù)生成模型的參數(shù)。圖2給出了模擬數(shù)據(jù)的QR參數(shù)估計(jì),同時也給出了OLS估計(jì)作為對比,其中的置信區(qū)間是基于95%的置信水平給出的。
圖1 模擬數(shù)據(jù)
圖2 模擬數(shù)據(jù)的參數(shù)估計(jì)
從圖2中可以看出,對于截距項(xiàng)和斜率系數(shù)來說,普通最小二乘估計(jì)估計(jì)給出了常數(shù)估計(jì),而分位數(shù)給出的截距項(xiàng)和斜率系數(shù)估計(jì)是變動的,它隨著不同的分位數(shù)而變化,它全面的反應(yīng)了隨機(jī)變動的截距和偏斜的信息。顯然,普通最小二乘估計(jì)既不能捕獲非常數(shù)的截距項(xiàng),也不能捕獲協(xié)變量的顯著的作用。這會導(dǎo)致對截距項(xiàng)和斜率的錯誤估計(jì)。相反,分位數(shù)能夠捕獲較低和較高分位數(shù)的差異。對于水平和正態(tài)分布誤差項(xiàng)來說,截距項(xiàng)包含了兩個顯著不同的取值。我們所估計(jì)得到的斜率,是具有可變影響的統(tǒng)計(jì)顯著的協(xié)方差。
圖3 OLS和QR的樣本內(nèi)預(yù)測
對于數(shù)據(jù)生成過程來說,圖3展示了基于5000個獨(dú)立模擬的觀測值的分位數(shù)回歸(實(shí)線)和普通最小二乘估計(jì)(虛線)的樣本內(nèi)預(yù)測直線,顯然,從圖3可知,普通最小二乘法回歸只能生成一條擬合曲線,顯然完全不能擬合具有雙峰特征的數(shù)據(jù),而分位數(shù)回歸用多條分位數(shù)直線,能夠更好的擬合雙峰數(shù)據(jù)。
綜上所述,上面的模擬試驗(yàn)表明,對于非正態(tài),偏斜和雙峰特征的數(shù)據(jù)來說,分位數(shù)回歸可以有效的進(jìn)行參數(shù)估計(jì)和擬合。實(shí)際上,由于不同分位數(shù)下的回歸系數(shù)估計(jì)量通常是不同的,即解釋變量對不同水平被解釋變量的影響不同,所以分位數(shù)回歸能夠更加全面的描述被解釋變量條件分布的全貌。而且與最小二乘估計(jì)相比,“加權(quán)最小絕對離差和法”的估計(jì)結(jié)果對離群值則表現(xiàn)的更加穩(wěn)健。此外,分位數(shù)回歸對誤差項(xiàng)沒有很強(qiáng)的假設(shè),因此分位數(shù)回歸估計(jì)更適合于估計(jì)非正態(tài)分布假設(shè)下的模型。顯然,對于LGD分布的非正態(tài)性、偏斜和雙峰特征,都可以利用分位數(shù)回歸容易處理。
傳統(tǒng)的LGD模型和校驗(yàn)方法重點(diǎn)關(guān)注均值的預(yù)測。已有的文獻(xiàn)中使用了標(biāo)準(zhǔn)的可決系數(shù)R2和平均絕對值MAE或者根均方誤差RMSE。這些測度指標(biāo)側(cè)重于檢驗(yàn)依賴變量的均值的績效,而無法捕獲依賴變量的完整分布的行為。為此,在評估整個分布的擬合度時,我們采用了其他的測度。沿用Wagenvoort(2006)[11]的思路,下面給出Harmonic Mass Index(HMI)和Harmonic Weighted Mass Index(HWMI)兩個指標(biāo)作為均值絕對和均值平方差,如下:
另一個績效測度指標(biāo)是Kolmogorov-Smirnov (KS)檢驗(yàn),原假設(shè)是數(shù)據(jù)服從回歸方法對應(yīng)的被估計(jì)的分布。檢驗(yàn)統(tǒng)計(jì)量D、關(guān)鍵值c和顯著性水平α,如下給出
KS的取值越高,表明擬合效果越差。KS檢驗(yàn)校驗(yàn)了最大偏差,但是不是整個的擬合優(yōu)度。結(jié)果應(yīng)該被謹(jǐn)慎的對待。
在后面的估計(jì)檢驗(yàn)中,我們將利用擬合優(yōu)度R2、HMI、HWMI和KS這四個測度指標(biāo),從樣本內(nèi)和樣本外兩個角度,對比QR與其他的4個模型。
本文所使用的數(shù)據(jù)為山東省某城市商業(yè)銀行在2009年7月~2015年8月處置完畢的全部不良貸款數(shù)據(jù)。針對可能存在的數(shù)據(jù)異常點(diǎn)問題,參照Betz et al.(2016)[2]提出的選擇準(zhǔn)則以確保數(shù)據(jù)的一致性??紤]了所有的現(xiàn)金流之和為未結(jié)清的違約暴露的90~110%之間的貸款,貸款的支付為未結(jié)清的處理暴露的-10%到120%之間。通過對數(shù)據(jù)進(jìn)行篩選和清洗,最終得到信息比較完整的貸款7155筆及其違約之后2年的清收處置資料。數(shù)據(jù)指標(biāo)包括:貸款期限、信用評級、保證、抵押和企業(yè)所屬行業(yè)。在債務(wù)追償方面,通過數(shù)據(jù)實(shí)錄,獲得了債務(wù)違約時間、核銷金額、追償金額、追償持續(xù)時間、追償成本等。其中追償成本包括基本追償費(fèi)用(短信、電話和信函等方式)和專項(xiàng)追償費(fèi)用(登門追償、司法追償、處理抵押物等方式)。有關(guān)違約暴露及追償費(fèi)用的描述統(tǒng)計(jì)如表1所示。
本文采用銀行業(yè)實(shí)踐中常用的清收違約損失率公式計(jì)算實(shí)際發(fā)生的LGD,計(jì)算公式如下∶
其中,f為衡量單位回收金額所支付的費(fèi)用,Rij(r)為第i筆貸款以貼現(xiàn)率rj計(jì)算的第j期貸款回收額的現(xiàn)值,EADi為為第i筆違約貸款的風(fēng)險暴露(包括違約貸款余額和欠息金額),N為貸款的總筆數(shù),T為自違約起直到清償終結(jié)時的時間跨度。
顯然,實(shí)際LGD計(jì)算中的一個困難是清收過程中形成的各種成本f的確定。比如與特定資產(chǎn)相聯(lián)系的各種抵押品的評估費(fèi)用等,在貸款清收過程中需要支付的清償部門的各種管理費(fèi)用等。此外,在我國銀行業(yè)實(shí)踐當(dāng)中,不良貸款的清收往往需要多個部門相互協(xié)調(diào)才能完成,這就加大了成本核算和分?jǐn)偟碾y度,造成難以測算回收違約債項(xiàng)的直接與間接成本。本文對相關(guān)清收費(fèi)用進(jìn)行了實(shí)際統(tǒng)計(jì),并以此為基礎(chǔ)測算了單位回收金額所花費(fèi)的平均成本作為f的代替。
表1 違約暴露及追償費(fèi)用的描述統(tǒng)計(jì) (單位:萬元)
對于回收金額Rij的構(gòu)成。本文使用貸款余額差額法來確定主要回收金額,即計(jì)算違約時點(diǎn)與T年后相同時點(diǎn)貸款余額之差作為現(xiàn)金回收部分,再加上以物抵債、債務(wù)轉(zhuǎn)移回收部分,并減去新發(fā)放貸款部分。
對于貼現(xiàn)率rj的設(shè)定。采用在回收期限上與違約貸款相對應(yīng)的貸款利率作為貼現(xiàn)率比較合理。因此在后面的實(shí)證分析中,本文采用中國人民銀行公布的不同期限的貸款基準(zhǔn)利率作為相應(yīng)的貼現(xiàn)率。
對于的貸款的清償持續(xù)時間T的設(shè)定。根據(jù)貸款回收的歷年數(shù)據(jù)統(tǒng)計(jì)分析確定清償持續(xù)時間T的取值是一個比較合理的方法。本文利用獲取的貸款回收的歷年數(shù)據(jù)統(tǒng)計(jì)分析可知,貸款回收額在違約后1年內(nèi)占全部回收額的65%,2年內(nèi)占比達(dá)到83%,第三年僅占8%,因此,將違約后2年作為清收的終結(jié)時間是一個較好的近似。
通過(9)式,我們可以計(jì)算得到所有的7155筆貸款的實(shí)際LGD。圖4給出了最終LGD數(shù)據(jù)的頻率分布直方圖。
圖4 實(shí)際LGD的分布
從圖4可以看出,大多數(shù)LGD幾乎分布在0和1的附近。整體上看,它具有雙峰特征,違約損失率較低(5%左右)或違約損失率較高(90%左右)的債項(xiàng)較多,大多數(shù)違約損失率較低的債項(xiàng)位于這兩者之間。從兩個典型的位置統(tǒng)計(jì)指標(biāo)來看,均值為0.41,中位數(shù)為0.11,即LGD是高度偏斜的。顯然,大多數(shù)標(biāo)準(zhǔn)的統(tǒng)計(jì)回歸方法都不能充分的捕獲雙峰和偏斜的特征分布的這些性質(zhì),因此本文嘗試?yán)梅治粩?shù)回歸來處理這些數(shù)據(jù)。另外,值得一提的是,本文結(jié)果與楊軍等(2009)[29]和陳榮達(dá)等(2014)[26]的研究結(jié)果有某些相似之處,這表明,國內(nèi)商業(yè)銀行LGD分布大都是近似的“U”型分布。不過值得一提的是,本文測算的實(shí)際LGD的最大值超過了1,這說明,在債務(wù)清收過程中所存在的各種管理成本、法律成本、清算費(fèi)用或者手續(xù)費(fèi)和傭金以及較高的擔(dān)?;厥粘杀臼遣荒芎雎缘?。
已有的研究文獻(xiàn)表明影響LGD的因素大致包括三類:債務(wù)人因素、債項(xiàng)因素和宏觀經(jīng)濟(jì)因素。對于債務(wù)人來說,所處的行業(yè)和信用等級等因素會直接影響后期的債務(wù)償還。從債項(xiàng)因素來看,期限、擔(dān)保和逾期時間對后期的違約損失都具有顯著的影響。此外,逾期時間顯然會直接影響到債務(wù)回收的結(jié)果,追償過程持續(xù)的時間越長,債務(wù)的LGD越大。
結(jié)合以上的討論,選擇了七類指標(biāo):違約暴露、貸款期限、信用、擔(dān)保、抵押、行業(yè)和宏觀金融變量作為分位數(shù)回歸中的協(xié)變量。表2給出了五個分類變量的實(shí)際LGD的均值和分位數(shù)以及相應(yīng)的樣本容量。
在表2中,我們根據(jù)貸款是否在1年以內(nèi),區(qū)分了短期和其他期限,相比短期債項(xiàng),其他期限的債項(xiàng)隱含著更高的LGD。例如,短期項(xiàng)的實(shí)際平均LGD是0.22,而其他期限的債項(xiàng)的實(shí)際LGD的均值為0.34。高級的債項(xiàng)對于損失起著重要的作用。平均來說,AAA級信用貸款的LGD為0.17,A,AA級信用貸款的LGD為0.27,而其他級別的信用貸款的LGD為0.51。我們也區(qū)分了有無保證的貸款,即是否對貸款有額外的保證。從均值來看,對于是否有保證的貸款來說,LGD的差距較小。然而,從中位數(shù)來看,有保證的貸款為0.16,沒有保證的貸款為0.07。這種反常的現(xiàn)象可以被解釋為,雖然保證可能會降低未來的損失,但是它給出了非對稱的信息問題,比如道德風(fēng)險,這會導(dǎo)致更高的損失。此外,我們區(qū)分了城市房產(chǎn)抵押、非城市房產(chǎn)抵押、機(jī)器設(shè)備抵押和其他抵押的貸款。具有城市房產(chǎn)抵押和非城市房產(chǎn)抵押的貸款的平均LGD差距不大,分別為0.17和0.19,而機(jī)器設(shè)備抵押的貸款的平均LGD較高為0.44,其他的非實(shí)物抵押具有更高的平均LGD為0.52。對于大多數(shù)行業(yè)來說,平均LGD大都分布在0.15~0.45之間。最大值對應(yīng)著農(nóng)林牧漁為0.46,最小值對應(yīng)著建筑行業(yè)為0.16。建筑行業(yè)較低的平均LGD也能解釋目前我國商業(yè)銀行的貸款很大一部分流向房地產(chǎn)行業(yè)的現(xiàn)象,商業(yè)銀行更愿意把貸款發(fā)放到違約損失率較低的行業(yè)。
表2 各種變量下LGD的均值和分位數(shù) (單位 :%/筆)
已有的研究也表明,宏觀經(jīng)濟(jì)和金融狀況對LGD也有顯著的影響。本文選擇GDP的年度增長率作為宏觀經(jīng)濟(jì)狀況的代理變量。Chava et al.(2011)[3]研究發(fā)現(xiàn)10年和3個月的國庫券收益率之間的絕對期限價差可以作為驅(qū)動LGD的顯著變量。沿著這個思路,本文利用基于3個月期的國庫券收益率的期限價差刻畫未來金融和貨幣狀況的預(yù)期的顯著的變量。
1.參數(shù)估計(jì)結(jié)果
由于上面所分析的影響LGD因素中,除了兩個宏觀金融變量GDP增速和期限價差之外,其他的都是定性因素,為了在回歸分析中反映這些定性因素對LGD產(chǎn)生的影響,本文通過設(shè)置虛擬變量來反映定性因素中所包含的信息:貸款期限(其他期限)、信用(其他級別)、保證(無保證)、抵押(無抵押)和行業(yè)(金融保險),然后引入到分位數(shù)回歸模型中。這些虛擬變量的設(shè)置規(guī)則如下:
松嫩平原是一個潛水普遍分布的大型蓄水盆地,東部高平原和西側(cè)的大興安嶺山前傾斜平原,既是山區(qū)基巖裂隙水的排泄區(qū),又是中部承壓水盆地的主要補(bǔ)給區(qū)。
(1)貸款期限(其他期限)。貸款的期限會顯著影響到違約以及違約損失率。期限越長違約概率越大,反之亦然??紤]到處理的方便,本文區(qū)分了短期和其他期限的兩類貸款期限。本文以1年期為參照設(shè)置了虛擬變量“貸款期限”:如果期限在1年及以內(nèi),則貸款期限取值為1,否則取值為0。
(2)信用(其他級別)。對于企業(yè)來說,信用評級通常包括A類級(AAA級、AA級、A級),B類級(BBB級、BB級、B級),C類級(CCC級、CC級、C級)和D類級。從實(shí)際的違約狀況來考慮,本文以B類級及其以下為參照,設(shè)置了兩個虛擬變量“信用”:。如果貸款企業(yè)屬于“AAA級”或者“A,AA級”則信用相應(yīng)的取值為1,否則取值為0。
(3)保證(無保證)。根據(jù)貸款有無保證,貸款可以分為有保證貸款和無保證貸款。本文以無保證為參照,設(shè)置了一個虛擬變量“保證”:如果有房產(chǎn)抵押,則保證取值為1,否則取值為0。
表3 分位數(shù)回歸模型和OLS的參數(shù)估計(jì)結(jié)果
(4)抵押(無抵押)。根據(jù)貸款的抵押品類型大致包括:城市房產(chǎn),非城市房產(chǎn),機(jī)器設(shè)備,非實(shí)物抵押和無抵押??紤]到抵押的金額的大小和處理的方便,本文以房產(chǎn)抵押為參照,設(shè)置了一個虛擬變量“抵押”:如果有房產(chǎn)抵押,則抵押取值為1,否則取值為0。
(5)行業(yè)(金融保險)。根據(jù)行業(yè)實(shí)踐來看,相比其他的行業(yè),金融保險行業(yè)是一個特殊的行業(yè),其違約率相對較低。本文以金融保險為參照,設(shè)置了八個虛擬變量“行業(yè)”:如果行業(yè)屬于農(nóng)林牧漁、煤炭礦產(chǎn)、建筑房產(chǎn)、機(jī)械制造、交通通訊、批發(fā)零售、醫(yī)藥衛(wèi)生和電力油氣中的任何一個,則信用相應(yīng)的取值為1,否則取值為0。
表3給出了針對以上的變量進(jìn)行的第0.05, 0.25, 0.50,0.75和0.95分位數(shù)的估計(jì)結(jié)果和相應(yīng)的OLS估計(jì)結(jié)果。括號中的標(biāo)準(zhǔn)誤是利用核估計(jì)方法計(jì)算的。
從表3的結(jié)果可以看到,參數(shù)估計(jì)的水平和顯著性依賴于各種的分位數(shù)。截距項(xiàng)表示了協(xié)變量為零時的LGD的演變方式。對于較低的分位數(shù)來說,截距項(xiàng)幾乎是完全收斂到零,而且在中位數(shù)之前呈現(xiàn)單調(diào)遞增的趨勢,直到在更高的分位數(shù)上達(dá)到總損失的最大值。
在分布的左尾部分(即0.05和0.25分位數(shù)),只有如下的較小的影響可以被觀測到:短期債務(wù)影響系數(shù)為-2.3%和-2.4%。AAA級信用貸款的LGD影響較小會降低4.7~5.9個百分點(diǎn)。有趣的是,保證的存在會提高損失2.3到3.1個百分點(diǎn),這或許是有額外的管理成本導(dǎo)致的,因?yàn)榇藭r保證人會變得很積極。在中位數(shù)的情形中,該影響會更大,會上升5.7個百分點(diǎn)。
大多數(shù)的控制變量在中位數(shù)和第三分位數(shù)上表現(xiàn)出了顯著的影響。這里,短期債務(wù)給出的最低的LGD影響,其他貸款具有最高的LGD影響。根據(jù)0.75分位數(shù),債務(wù)類型會導(dǎo)致8個百分點(diǎn)的波動。AAA級貸款在很大程度上決定了中位數(shù)。A、AA級的貸款可能會創(chuàng)造出61個百分點(diǎn),與同等級別的其他債務(wù)相比,它是在中位數(shù)情形中的更高的損失。在第三個四分位點(diǎn),相比同等級別的其他債務(wù),AAA級貸款會降低損失18.6個百分點(diǎn)。
關(guān)于信用質(zhì)量因素,這里可以看到QR的優(yōu)勢:OLS提供了24.5個百分點(diǎn)的變動,它沒有區(qū)分分位數(shù)的高級別。相反,QR所表現(xiàn)出的變動范圍是56.5個百分點(diǎn),事實(shí)上,在第50個分位數(shù)上,有7.5 (AAA級)+49.0(A,AA級)=56.5。
另外,我們證實(shí)了抵押是影響可違約貸款的回收的重要的因素。房產(chǎn)抵押會降低LGD高達(dá)51.7個百分點(diǎn)。其他的抵押類型會降低26.8個百分點(diǎn)。OLS會有超過50個百分點(diǎn)的低估影響,為13.5和23個百分點(diǎn)。
本文觀測到了主要在第三個四分位數(shù)處的行業(yè)的影響。不同的行業(yè)之間的影響程度的差距最高可達(dá)40.8的百分點(diǎn),其中煤炭礦產(chǎn)行業(yè)具有最低的LGD影響系數(shù)為-0.1902,批發(fā)零售和服務(wù)行業(yè)具有最高的LGD影響系數(shù)為0.2177。相反,OLS會得到錯誤的結(jié)論,因?yàn)槊禾康V產(chǎn)行業(yè)的行為沒有被識別為統(tǒng)計(jì)學(xué)顯著的不同于金融保險行業(yè)。
對于宏觀經(jīng)濟(jì)變量,在中位數(shù)情形有一個GDP增長率的降低,系數(shù)為-0.0818,即表明經(jīng)濟(jì)增長的較差的發(fā)展,損失顯著的上升。對于第三個四分位數(shù),只有期限價差影響是顯著的系數(shù)為0.0724,更高的期限價差也生成了較高的損失。再一次,OLS低估了宏觀金融協(xié)變量的影響,系數(shù)分別為-0.0463和0.0131。而對于極端的分位數(shù),模型沒有識別任何宏觀經(jīng)濟(jì)的影響。
總之,QR的參數(shù)估計(jì)會因分位數(shù)的不同而不同,并且估計(jì)結(jié)果與OLS十分的不同。顯然,從更為綜合的視角來看,分位數(shù)回歸QR拓展了標(biāo)準(zhǔn)的回歸的結(jié)果。協(xié)變量的影響會在分位數(shù)之間顯著的變化,這是對控制變量經(jīng)濟(jì)學(xué)影響的新啟示。
2.模型結(jié)果檢驗(yàn)
為了檢驗(yàn)分位數(shù)回歸在估計(jì)LGD方面的優(yōu)勢,本文在對分位數(shù)回歸模型進(jìn)行檢驗(yàn)的同時,也將在同樣的檢驗(yàn)測度指標(biāo)下,對比分位數(shù)回歸模型與其他四個模型的績效,即標(biāo)準(zhǔn)的OLS模型、Beta回歸模型(BRM)、分?jǐn)?shù)響應(yīng)模型(FRM)和有限混合模型(FMM)。
由于Beta回歸模型(BR)和分?jǐn)?shù)響應(yīng)模型(FRM)都有一個潛在的假設(shè):依賴變量是一個比率,即位于0和1之間。而對于實(shí)際的LGD,由于存在管理費(fèi)用,法律成本和清償費(fèi)用或者財(cái)務(wù)費(fèi)用(費(fèi)用和傭金)以及較高的抵押回收,因此實(shí)際LGD通常要超出0和1范圍。為了在對比中運(yùn)用模型BRM和FRM,我們將實(shí)際的LGD變換到了0和1區(qū)間中,具體的變換公式為如下
實(shí)際的LGD經(jīng)過轉(zhuǎn)換之后,LGD[0,1]近似服從正態(tài)分布。實(shí)際上這種轉(zhuǎn)換類似Perraudinand Hu(2006)[9]所采用的逆正態(tài)回歸轉(zhuǎn)換,其中利用正態(tài)分布的逆累積密度函數(shù)對LGD進(jìn)行了轉(zhuǎn)換。
利用模型BRM和FRM基于LGD[0,1]實(shí)施估計(jì)之后,我們將會對被預(yù)測的估計(jì)值重新進(jìn)行再變換,使之回到實(shí)際LGD的刻度上來。
對于標(biāo)準(zhǔn)的OLS模型和有限混合模型(FMM)來說,我們沒有對實(shí)際的LGD進(jìn)行轉(zhuǎn)換,而是使用了原始的數(shù)據(jù)來實(shí)施估計(jì)和對比。事實(shí)上,這兩類模型沒有依賴變量屬于[0, 1]的假設(shè),它們可以直接模型化取值確切為0或者1的數(shù)據(jù),此時數(shù)據(jù)變換反而會降低模型的擬合優(yōu)度。
下面在擬合優(yōu)度R2、HMI、HWMI和KS這四個測度指標(biāo)下,從樣本內(nèi)和樣本外兩個角度,對比QR與其他的4個模型。我們沒有僅僅局限于分析均值,而是分析了整個分布的擬合狀況。
(1)樣本內(nèi)對比檢驗(yàn)
首先,我們檢驗(yàn)了全樣本的擬合優(yōu)度。基于整個時期的全樣本數(shù)據(jù),我們估計(jì)了所有模型的樣本內(nèi)取值。表4給出了所有模型的樣本內(nèi)擬合度的四個測度指標(biāo)值。此外,表4也報(bào)告了所有模型的p-值,如果p-值較低,則表明對分布充分?jǐn)M合的原假設(shè)的拒絕。
從表4可知,所有的模型的R2取值都較低,介于0.077和0.101之間,這是由于LGD的雙峰特征所決定的。
在所有的模型中,只有QR給出的HMI和HWMI的取值最低,其中HMI=0.0030,而HWMI=0,兩個指標(biāo)都低于0.001的顯著性水平,而其他的模型的兩個指標(biāo)的取值分別為0.0480~0.1644和0.0020~0.0179都超過了0.001。
根據(jù)KS檢驗(yàn),在0.05顯著性水平下,除了QR之外,基于全樣本計(jì)算的KS檢驗(yàn)拒絕了其他的四個模型的原假設(shè),這表明分位數(shù)回歸QR的擬合效果最好。
表4 模型樣本內(nèi)檢驗(yàn)的結(jié)果
另外,也可以利用Michael(1983)[8]提出的P-P圖直觀的展示分布擬合的精確水平,它可以對比理論分位數(shù)和經(jīng)驗(yàn)分位數(shù),PP曲線越靠近對角線表明理論分位數(shù)同經(jīng)驗(yàn)分位數(shù)相匹配程度越高。圖5給出了五個模型的P-P圖。
從圖5的各個模型的PP曲線與對角線的靠近程度可以看出,分位數(shù)回歸QR估計(jì)的LGD的理論分位數(shù)和實(shí)際LGD的經(jīng)驗(yàn)分位數(shù)幾乎是完全擬合的,而其他的四個模型的PP曲線,都表現(xiàn)出了在尾部或中部的系統(tǒng)性的偏倚。顯然,根據(jù)PP圖給出的信息,模型幾乎擬合了每一個分位數(shù)的樣本內(nèi)的數(shù)據(jù),所以說分位數(shù)回歸QR的樣本內(nèi)擬合幾乎是完美的,這正是分位數(shù)回歸模型相比其他的均值回歸模型的優(yōu)勢所在。
綜上所述,從對LGD的均值擬合來說,分位數(shù)回歸QR會導(dǎo)致一個相對適中的樣本內(nèi)擬合。然而,如果考慮到LGD所服從的整個分布,分位數(shù)回歸QR則表現(xiàn)出了顯著的優(yōu)勢,因?yàn)闃颖緝?nèi)擬合優(yōu)度表明,每一個分位數(shù)都幾乎被確切的擬合了。
(2)樣本外對比檢驗(yàn)
為了實(shí)施樣本外檢驗(yàn),我們把所有的數(shù)據(jù)劃分成用于估計(jì)的訓(xùn)練樣本和用于預(yù)測的檢驗(yàn)樣本。訓(xùn)練樣本包括2000~2009年的子樣本數(shù)據(jù),該子樣本大約是全部數(shù)據(jù)的60%。檢驗(yàn)樣本是從剩余的2010~2013年的數(shù)據(jù)中隨機(jī)抽取了10000次,所構(gòu)成的子樣本組合,其中每一步中都包含300個可違約貸款,它在我們的數(shù)據(jù)集合中近似為每年違約的平均次數(shù)。
首先基于訓(xùn)練樣本我們估計(jì)了所有的模型,然后基于檢驗(yàn)樣本計(jì)算了每個子組合的擬合優(yōu)度,并且匯報(bào)了所有10000次步驟的數(shù)據(jù)的均值,見表5。
圖5 樣本內(nèi)擬合的P-P
表5 模型樣本外檢驗(yàn)的結(jié)果
表5所示,QR給出了均值的較為適中的擬合,其可決系數(shù)R2為0.0344,而基于其他四個模型計(jì)算得到的R2取值介于0.0241和0.0512之間。對于測度指標(biāo)HMI和HWMI來說,QR的取值是分別為0.0965和0.0056,而對于其他的方法來說,取值位于0.1516~0.18748和0.0175~0.0220。顯然,分位數(shù)回歸QR的取值是最佳的。對于KS檢驗(yàn)來說,除了FMM和QR大于5%之外,其他的三個方法的平均p值都要低于1%。事實(shí)上,在KS檢驗(yàn)中,基于三種顯著性水平10%,5%和1%,對于FMM的拒絕率為55.7%,41.4%和18.8%,對于QR的拒絕率為89.0%,81.6%和57.3%。
3.違約損失率分布預(yù)測
在理論上,應(yīng)估計(jì)每一筆貸款的模型并進(jìn)行預(yù)測,但因?yàn)閰f(xié)變量的特定選擇會影響到貸款LGD的分布,所以本文僅選擇其中某個行業(yè)的典型的短期貸款,債務(wù)人全部來自煤炭行業(yè)。宏觀經(jīng)濟(jì)和金融狀況被選為中間性的場景,即GDP增長率假設(shè)為6%,期限價差為2.63個百分點(diǎn)。其他的協(xié)變量是從煤炭行業(yè)的典型情形中選擇的。
圖6 實(shí)際LGD與預(yù)測LGD的分布
首先利用全樣本數(shù)據(jù)進(jìn)行了模型的參數(shù)估計(jì),然后針對該典型貸款的相應(yīng)的協(xié)變量,對LGD進(jìn)行了預(yù)測。圖6(a)給出了該典型貸款的實(shí)際LGD的頻率直方圖,圖6(b)給出了該典型貸款的LGD的概率分布密度曲線的預(yù)測。
從圖6可以看出,標(biāo)準(zhǔn)的OLS模型和分?jǐn)?shù)響應(yīng)模型FRM都不能捕獲LGD的非正態(tài)性。雖然這兩個方法預(yù)測到了分布的中部和尾部的較多的概率,但是對于總的損失來說過小。貝塔回歸模型BRM雖然捕獲了非正態(tài)性,但是也不能捕獲已實(shí)現(xiàn)的極端的雙峰形狀。
有限混合模型FMM給出了較為靈活的密度形狀。它捕獲了雙峰特征,并且預(yù)測到了在零和1附近的極端值的情形。不過,對于較為稀少的中間部分卻給予了太多的概率。
分位數(shù)回歸QR看起來給出了最佳的預(yù)測。較好的擬合了左右兩個尾部和中間部分的形狀。最小值和最大值意味著較為準(zhǔn)確的分布密度的估計(jì)。0和1附近的尾部擬合的較好,非常極端的值較少,相比尾部,中間部分的預(yù)測也是較為充分的。
已有的各種損失模型主要關(guān)注均值預(yù)測。然而貸款損失數(shù)據(jù)表明違約損失率LGD具有強(qiáng)烈的變異特征,而且損失分布具有極端的偏斜和雙峰特征。但是,大多數(shù)現(xiàn)存的模型和均值預(yù)測的校驗(yàn)都沒有解釋這種行為。為此,本文提出了基于分位數(shù)回歸的LGD建模方法。它考慮了協(xié)變量對LGD的影響隨著LGD的整個分布的不同范圍而變化,并且反映了損失的較強(qiáng)的不確定性。我們的結(jié)論表明,較低的LGD對具有信用級別、保證和抵押個具有較高的敏感性。在中位數(shù)情形下,LGD會額外的受到抵押類型,財(cái)務(wù)類型,還有行業(yè)和宏觀經(jīng)濟(jì)環(huán)境的影響。而較高的LGD則沒有受到任何協(xié)變量的影響。這表明總損失的剩余的尾部風(fēng)險不能被銀行實(shí)踐或者監(jiān)管者所控制。此外,我們也使用了校驗(yàn)?zāi)P皖A(yù)測績效測度的新的測度指標(biāo)。樣本內(nèi)和樣本外的分析表明,同大多數(shù)現(xiàn)有的模型方法相比,QR優(yōu)于其他信用風(fēng)險模型。另外,研究發(fā)現(xiàn)宏觀經(jīng)濟(jì)和金融狀況的影響會隨著LGD分位數(shù)的不同而變化。
基于本文提出的量化LGD的分位數(shù)回歸模型,可以構(gòu)建一套完整的貸款違約損失率估計(jì)和違約風(fēng)險預(yù)測體系,為商業(yè)銀行進(jìn)行貸款風(fēng)險調(diào)整定價、經(jīng)濟(jì)資本計(jì)算和資產(chǎn)支持證券或者信用衍生品的定價提供重要的借鑒。從而提高我國商業(yè)銀行在貸款的違約損失率的計(jì)量科學(xué)性,有助于防范和處置不良貸款問題。另外,本文的模型也有助于金融監(jiān)管部門在制定信用風(fēng)險加權(quán)資產(chǎn)等規(guī)則方面提供新的方法啟示。
本文的不足之處在于,限于數(shù)據(jù)可得性,只是使用了某家城市商業(yè)銀行的部分?jǐn)?shù)據(jù),而沒有對更大范圍的數(shù)據(jù)驗(yàn)證本文模型的有效性,從而無法校驗(yàn)“區(qū)域性特征”對LGD的影響程度,而“區(qū)域性特征”可能是中國銀行業(yè)在貸款發(fā)放時經(jīng)常考慮的一個重要因素。因此下一步研究思路就是利用更大范圍的數(shù)據(jù)樣本檢驗(yàn)?zāi)P偷倪m用性。
注釋