陸一
摘 要:農(nóng)村商業(yè)銀行控制運(yùn)營成本、提升經(jīng)濟(jì)效益的重要手段是信貸風(fēng)險(xiǎn)管理,但是銀行每天都需要處理大量的信貸業(yè)務(wù)。本文針對(duì)農(nóng)村商業(yè)銀行信貸業(yè)務(wù)中風(fēng)險(xiǎn)較高等問題,設(shè)計(jì)了一種基于決策樹算法的信貸風(fēng)險(xiǎn)評(píng)估模型。該模型具有較高的準(zhǔn)確率,為銀行信貸風(fēng)險(xiǎn)評(píng)估提供重要決策依據(jù)。
關(guān)鍵詞:決策樹 銀行信貸 風(fēng)險(xiǎn)評(píng)估
中圖分類號(hào):F304.4 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2018)12(c)-0018-02
隨著近年來國家對(duì)中小金融企業(yè)發(fā)展的支持,農(nóng)村商業(yè)銀行的信貸業(yè)務(wù)的種類也日益豐富,信貸業(yè)務(wù)更加復(fù)雜,信貸風(fēng)險(xiǎn)管理系統(tǒng)有了更高的要求,因此只有通過先進(jìn)的管理工具和途徑、統(tǒng)一的信息化管理技術(shù),這樣才能對(duì)信貸業(yè)務(wù)實(shí)行科學(xué)、規(guī)范化的管理,進(jìn)一步實(shí)現(xiàn)對(duì)信貸資產(chǎn)的有效的風(fēng)險(xiǎn)控制和有效監(jiān)管。
就浙江省來看,日前浙江省農(nóng)村信用社下的各農(nóng)村商業(yè)銀行(或正處于改革下的農(nóng)村合作銀行和農(nóng)村信用社)都是改革的攻堅(jiān)階段,隨著經(jīng)營規(guī)模的不斷擴(kuò)大及其信貸業(yè)務(wù)種類的增加,信貸風(fēng)險(xiǎn)管理的難度也必然會(huì)加大,這更要依賴先進(jìn)的管理工具、統(tǒng)一的信息化技術(shù),這樣才能科學(xué)規(guī)范化地管理信貸業(yè)務(wù)的過程。為了最大化地實(shí)現(xiàn)信息的共享,加強(qiáng)農(nóng)村商業(yè)銀行系統(tǒng)內(nèi)的信息規(guī)范化和數(shù)據(jù)的管理,構(gòu)建更為安全、有效、規(guī)范的信貸風(fēng)險(xiǎn)管理系統(tǒng)成為必然趨勢(shì),這樣才能滿足新形勢(shì)下應(yīng)對(duì)農(nóng)村商業(yè)銀行經(jīng)營的風(fēng)險(xiǎn)并且不斷擴(kuò)大業(yè)務(wù)規(guī)模,才能可持續(xù)地發(fā)展農(nóng)村商業(yè)銀行。
1 決策樹算法介紹
C4.5算法是決策樹生成的一種十分經(jīng)典的算法,這個(gè)算法是對(duì)ID3算法的優(yōu)化。針對(duì)ID3算法C4.5做的主要改進(jìn)有以下幾點(diǎn):(1)通過信息增益來決定屬性分裂的值。(2)能夠處理處理連續(xù)性還有離散型數(shù)據(jù)。(3)把決策樹構(gòu)造完成后能夠進(jìn)行剪枝,簡化決策樹。(4)能夠處理有缺失的樣本數(shù)據(jù)。
在C4.5算法中,只通過屬性的信息增長率選擇分裂屬性的。如公示(1)所示,判斷屬性的分裂值即split information:
2 信貸風(fēng)險(xiǎn)評(píng)估模型
2.1 決策屬性選擇
以桐鄉(xiāng)市農(nóng)村信用合作社個(gè)人貸款客戶歷史數(shù)據(jù)中,取一小部分?jǐn)?shù)據(jù)作為訓(xùn)練集生成決策樹,并生成客戶信用等級(jí)評(píng)定模型。指標(biāo)的合理選取對(duì)于模型的有效性有著的影響,為了指標(biāo)的全面性以及準(zhǔn)確性,個(gè)人貸款客戶信用評(píng)估指標(biāo)體系共分為若干項(xiàng),經(jīng)過仔細(xì)的調(diào)查研究,可以分為年齡、貸款與收入的比值,學(xué)歷、還貸與收入的比值,是否有違約記錄等5個(gè)屬性值,具體如表1所示?,F(xiàn)隨機(jī)抽取兩萬名客戶的信息進(jìn)行訓(xùn)練以生成決策樹。
年齡屬性:是從數(shù)據(jù)庫中的記錄的數(shù)據(jù)獲取。
學(xué)歷屬性:也是和年齡屬性一樣,都是通過數(shù)據(jù)庫的原始數(shù)據(jù)獲取。
貸款金額比:貸款金額比是貸款總金額和年收入的比值,通過該屬性可以判斷該客戶貸款的金額是否超出能力范圍。其計(jì)算公式:X3=貸款總金額/年收入。
還款金額比:還款金額比是月還款金額與月收入的比值,這個(gè)屬性可以判斷客戶的還款能力。計(jì)算公式:X4=月還款金額/(年收入/12)。
是否有違約記錄:該屬性是判斷用戶是否有違約記錄,具有一票否決權(quán),即表示有任何違約記錄,就拒絕貸款。
2.2 決策樹剪枝
由于決策樹的建立完全是依賴于訓(xùn)練樣本,因此該決策樹對(duì)訓(xùn)練樣本能夠產(chǎn)生完美的擬合效果。但這樣的決策樹對(duì)于測(cè)試樣本來說過于龐大而復(fù)雜,可能產(chǎn)生較高的分類錯(cuò)誤率。這種現(xiàn)象就稱為過擬合。因此需要將復(fù)雜的決策樹進(jìn)行簡化,即去掉一些節(jié)點(diǎn)解決過擬合問題,這個(gè)過程稱為剪枝。
剪枝方法分為預(yù)剪枝和后剪枝兩大類。預(yù)剪枝是在構(gòu)建決策樹的過程中,提前終止決策樹的生長,從而避免過多的節(jié)點(diǎn)產(chǎn)生。預(yù)剪枝方法雖然簡單但實(shí)用性不強(qiáng),因?yàn)楹茈y精確的判斷何時(shí)終止樹的生長。后剪枝是在決策樹構(gòu)建完成之后,對(duì)那些置信度不達(dá)標(biāo)的節(jié)點(diǎn)子樹用葉子結(jié)點(diǎn)代替,該葉子結(jié)點(diǎn)的類標(biāo)號(hào)用該節(jié)點(diǎn)子樹中頻率最高的類標(biāo)記。對(duì)于一個(gè)葉子節(jié)點(diǎn),這個(gè)節(jié)點(diǎn)覆蓋了N個(gè)樣本,其中有e個(gè)是錯(cuò)誤的分類,那么整棵樹的錯(cuò)誤判斷值為,其中0.5為懲罰因子,通過經(jīng)驗(yàn)判斷,懲罰因子一般設(shè)定為0.5.那么對(duì)于一整顆樹的誤判率就為:
式(4)中,l為所有節(jié)點(diǎn)的個(gè)數(shù)表示該節(jié)點(diǎn)中的所有樣本,表示節(jié)點(diǎn)錯(cuò)誤的樣本。一旦求得的整個(gè)數(shù)的誤判錯(cuò)誤率的均值加上標(biāo)準(zhǔn)差,小于節(jié)點(diǎn)的均值誤差,那么就可以將子樹替換葉子節(jié)點(diǎn),即表示為剪枝。
3 規(guī)則描述
根據(jù)C4.5決策樹模型,對(duì)給定的5個(gè)屬性構(gòu)建了一顆決策樹,其決策樹如圖1所示,為了更為清晰地了解決策模型,將決策樹轉(zhuǎn)變?yōu)橄铝幸?guī)則。決策樹將信用等級(jí)分為A、B、C、D這4個(gè)等級(jí),其中信用等級(jí)為A的表示還款能力強(qiáng),貸款風(fēng)險(xiǎn)低。D則表示信用等級(jí)最低,風(fēng)險(xiǎn)最高。根據(jù)決策樹模型來看,年齡較小,學(xué)歷越高則風(fēng)險(xiǎn)越低。年齡較大,學(xué)歷越低,并且貸款金額和收入比越高風(fēng)險(xiǎn)越大。
4 結(jié)語
本文針對(duì)農(nóng)村商業(yè)銀行信貸業(yè)務(wù)中風(fēng)險(xiǎn)較高等問題,設(shè)計(jì)了一種基于決策樹算法的信貸風(fēng)險(xiǎn)評(píng)估模型。通過決策樹模型發(fā)現(xiàn),在農(nóng)村商業(yè)銀行信貸業(yè)務(wù)中,年齡較小,學(xué)歷越高則風(fēng)險(xiǎn)越低。年齡較大,學(xué)歷越低,并且貸款金額和收入比越高風(fēng)險(xiǎn)越大。該模型對(duì)輔助信貸決策有著重要的作用。
參考文獻(xiàn)
[1] 侯斌甲.基于B/S架構(gòu)的個(gè)人信貸系統(tǒng)的研究與實(shí)現(xiàn)[D].蘭州大學(xué),2016.
[2] 張韶峰.大數(shù)據(jù)在信貸和保險(xiǎn)領(lǐng)域的實(shí)踐[J].新經(jīng)濟(jì),2016(19):48-50.
[3] 張彥.河南農(nóng)信社信貸管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].天津大學(xué),2016.
[4] 曹可雲(yún)荻.基于B/S結(jié)構(gòu)的商業(yè)銀行信貸管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].吉林大學(xué),2016.
[5] 王宣強(qiáng).基于REST的銀行信貸系統(tǒng)API體系研究[J].金融電子化,2016(3):79-80.
[6] 嚴(yán)曄瑋.建設(shè)銀行宜春分行小企業(yè)信貸管理系統(tǒng)的研究與分析[D].云南大學(xué),2016.