張潤(rùn)馳 杜亞斌 荊偉 孫明明
摘要:基于江蘇北部某地區(qū)2007—2015年18萬條真實(shí)農(nóng)戶大樣本小額貸款記錄,結(jié)合當(dāng)?shù)丶叭珖?guó)CPI、GDP、第一產(chǎn)業(yè)產(chǎn)值、地區(qū)農(nóng)業(yè)生產(chǎn)資料價(jià)格指數(shù)等宏觀經(jīng)濟(jì)指標(biāo),采用基于最大似然估計(jì)逐步進(jìn)入法的Logistic模型,篩選對(duì)農(nóng)戶違約概率影響較為顯著的指標(biāo),之后對(duì)各指標(biāo)經(jīng)濟(jì)含義進(jìn)行了解釋并對(duì)模型進(jìn)行穩(wěn)健性分析。研究發(fā)現(xiàn):信用水平指標(biāo)與農(nóng)戶的真實(shí)違約情況關(guān)聯(lián)不顯著,意味著當(dāng)?shù)匦刨J機(jī)構(gòu)對(duì)貸款農(nóng)戶的貸前內(nèi)部信用評(píng)級(jí)不能有效地預(yù)測(cè)農(nóng)戶的信用風(fēng)險(xiǎn);利率、性別、婚姻狀況、職業(yè)、教育等微觀指標(biāo)對(duì)信用風(fēng)險(xiǎn)有較大影響;全國(guó)范圍的GDP和CPI、江蘇農(nóng)業(yè)生產(chǎn)資料價(jià)格指數(shù)、滯后一期的當(dāng)?shù)氐谝划a(chǎn)業(yè)GDP等宏觀指標(biāo)也對(duì)信用風(fēng)險(xiǎn)具有預(yù)測(cè)作用; Logistic模型在不平衡數(shù)據(jù)集上,依然能保持較好的分類精度。
關(guān)鍵詞:農(nóng)戶小額貸款;Logistic模型;違約影響因素;信用風(fēng)險(xiǎn)
中圖分類號(hào):F323.9文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-9107(2017)03-0067-09
引言
隨著我國(guó)經(jīng)濟(jì)的不斷發(fā)展以及一系列支農(nóng)、惠農(nóng)政策的扶持,農(nóng)戶的收入及生活水平不斷提高,擴(kuò)大生產(chǎn)的積極性與消費(fèi)需求日益增長(zhǎng)。然而,盡管當(dāng)前農(nóng)戶對(duì)資金的需求在不斷提高,農(nóng)戶信貸市場(chǎng)上卻存在著嚴(yán)重的資金供求不平衡問題:大量農(nóng)戶希望通過貸款實(shí)現(xiàn)擴(kuò)大生產(chǎn)或者消費(fèi),但農(nóng)村地區(qū)的信貸機(jī)構(gòu)由于難以識(shí)別借款農(nóng)戶的真實(shí)還款能力與還款意愿,一般出于謹(jǐn)慎,采取“惜貸”策略,僅僅向資信水平十分優(yōu)越的農(nóng)戶發(fā)放貸款。由此,一方面導(dǎo)致有貸款需求的農(nóng)戶無法得到資金,不能進(jìn)一步擴(kuò)大生產(chǎn)或進(jìn)行消費(fèi);另一方面也使得信貸機(jī)構(gòu)積余了大量的閑置資金,資金利用率較低。存在這一現(xiàn)狀歸根結(jié)底的原因,在于農(nóng)戶信貸過程中的信用風(fēng)險(xiǎn)難以衡量。
信用風(fēng)險(xiǎn)是指獲得信用支持的債務(wù)人不能遵照合約按時(shí)足額償還本金和利息的可能性。為降低信用風(fēng)險(xiǎn)管理成本提高貸款決策效率,現(xiàn)代信貸機(jī)構(gòu)一般選擇以信用評(píng)估技術(shù)[12]對(duì)貸款人的信用風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè)與管理。最初,信用評(píng)估模型往往由外部評(píng)估機(jī)構(gòu)開發(fā),之后隨著現(xiàn)代商業(yè)銀行的不斷發(fā)展與壯大,各銀行構(gòu)建自己內(nèi)部的信用評(píng)估模型漸成為常態(tài)。巴塞爾協(xié)議II明確提出:在滿足某些最低條件和披露要求的前提下,有資格采用內(nèi)部評(píng)級(jí)(IRB)法的銀行可以根據(jù)自己對(duì)風(fēng)險(xiǎn)要素的估計(jì)值決定對(duì)特定暴露的資本要求[3]。
就問題性質(zhì)而言,信用評(píng)估在本質(zhì)上是一種分類問題:根據(jù)待評(píng)估樣本的多維度屬性指標(biāo),設(shè)計(jì)合適的模型將樣本分為若干類。影響模型性能的因素主要有兩個(gè):一是核心分類器的選擇,二是模型構(gòu)建時(shí)的指標(biāo)選取。現(xiàn)有較為成熟的分類器根據(jù)原理不同,大體可以分為基于傳統(tǒng)統(tǒng)計(jì)理論的分類器與基于數(shù)據(jù)挖掘技術(shù)的分類器兩類。前者主要包括線性回歸模型、Logistic模型、樸素貝葉斯(NB)、判別分析(DA)等[47],后者有代表性的主要是人工神經(jīng)網(wǎng)絡(luò)(ANN)、支持向量機(jī)(SVM)、決策樹、K最近鄰(K-NN)等[811]。
近年來,隨著上述分類器的漸漸成熟與流行,更多學(xué)者將研究重點(diǎn)轉(zhuǎn)移到我國(guó)農(nóng)戶信貸發(fā)展現(xiàn)狀及其違約影響因素方面。王定祥等以全國(guó)15個(gè)省份較貧困地區(qū)的1 156戶暫時(shí)性貧困型農(nóng)戶為研究對(duì)象,對(duì)貧困型農(nóng)戶信貸需求和信貸行為進(jìn)行了調(diào)查分析,發(fā)現(xiàn)當(dāng)前農(nóng)戶金融需求滿足率極低[12];黃祖輝等以問卷調(diào)查的方式對(duì)820戶農(nóng)戶的借貸行為進(jìn)行考察,研究發(fā)現(xiàn)樣本地區(qū)大部分農(nóng)戶對(duì)正規(guī)和非正規(guī)信貸的需求均以消費(fèi)性為主[13]。楊勝剛等結(jié)合我國(guó)農(nóng)戶信貸市場(chǎng)的實(shí)際情況,通過調(diào)查某農(nóng)村信用社713個(gè)農(nóng)戶的貸款記錄,挖掘出違約與否的影響因素,并進(jìn)一步運(yùn)用層次分析法(AHP)設(shè)計(jì)了一套包含5個(gè)準(zhǔn)則層、17項(xiàng)指標(biāo)的農(nóng)戶信用評(píng)估體系[14];楊宏玲等發(fā)現(xiàn)當(dāng)前農(nóng)村信貸機(jī)構(gòu)在選擇農(nóng)戶信用評(píng)價(jià)指標(biāo)時(shí),主要以傳統(tǒng)的“5C”或“4C”分析法為主,方法比較單一[15]。胡愈等從我國(guó)小額信貸的實(shí)踐理論出發(fā),建立農(nóng)戶信用等級(jí)評(píng)價(jià)的指標(biāo)體系[16],李巖等則基于山東省573戶農(nóng)戶6年的貸款數(shù)據(jù),全面系統(tǒng)地研究了農(nóng)戶貸款行為的發(fā)展規(guī)律及其影響因素。結(jié)果表明:農(nóng)戶性質(zhì)、性別、區(qū)域、年齡、教育、家庭人口、家庭勞動(dòng)力、家庭田地畝數(shù)均對(duì)農(nóng)戶貸款行為有不同程度的影響[17]。魏嵐等以遼寧省300戶農(nóng)戶的入戶調(diào)查資料為樣本數(shù)據(jù),基于Logit模型建立了含10個(gè)指標(biāo)的小額信貸風(fēng)險(xiǎn)評(píng)價(jià)模型,并對(duì)模型的擬合結(jié)果進(jìn)行了檢驗(yàn)[18]。
研究農(nóng)戶小額貸款違約的影響因素,一方面,能夠幫助農(nóng)村商業(yè)銀行、信用合作社等信貸機(jī)構(gòu)進(jìn)一步提升信用風(fēng)險(xiǎn)管理能力,降低不良貸款率,維持我國(guó)以銀行業(yè)為主的金融體系穩(wěn)定;另一方面,通過提升信貸機(jī)構(gòu)對(duì)優(yōu)良借款農(nóng)戶的甄別率,鼓勵(lì)信貸機(jī)構(gòu)發(fā)放貸款,能夠緩解當(dāng)前我國(guó)農(nóng)戶融資難的問題,幫助并引導(dǎo)農(nóng)戶擴(kuò)大生產(chǎn)或增加消費(fèi),進(jìn)一步提升農(nóng)戶的生活水平,在提高農(nóng)業(yè)產(chǎn)值之余,亦能擴(kuò)大消費(fèi)市場(chǎng)需求,緩解我國(guó)當(dāng)前的產(chǎn)能過剩問題。因此,具有重要的研究意義。然而,上述現(xiàn)有的研究,要么單從理論角度出發(fā),缺乏基于真實(shí)樣本的實(shí)證證據(jù);要么僅根據(jù)單一農(nóng)村商業(yè)銀行、信用合作社或調(diào)查問卷的小樣本農(nóng)戶信貸數(shù)據(jù)展開研究,其結(jié)論的代表性及指導(dǎo)意義有待商榷。相比之下,本研究基于江蘇北部某農(nóng)村地區(qū)2007-2015年18萬條真實(shí)農(nóng)戶大樣本信貸記錄展開研究,相比于現(xiàn)有研究文獻(xiàn)所用的單一信貸機(jī)構(gòu)在短期內(nèi)的農(nóng)戶信貸數(shù)據(jù),本研究所選數(shù)據(jù)規(guī)模大、時(shí)間跨度長(zhǎng),因此研究結(jié)果更具可信性與現(xiàn)實(shí)指導(dǎo)意義。
一、研究數(shù)據(jù)
本文的研究數(shù)據(jù)來自直接隸屬于國(guó)務(wù)院的某金融監(jiān)管機(jī)構(gòu)在江蘇北部某地區(qū)的農(nóng)戶信貸數(shù)據(jù)庫(kù)。數(shù)據(jù)庫(kù)搜集了該地區(qū)自1997年1月至2016年3月共292 837條轄區(qū)內(nèi)各農(nóng)村商業(yè)銀行網(wǎng)點(diǎn)、信用合作社等貸款機(jī)構(gòu)面向農(nóng)戶發(fā)放貸款的歷史記錄。從數(shù)據(jù)集的規(guī)模、來源權(quán)威性、樣本完整性等角度而言,其研究?jī)r(jià)值均較大。此外,該地區(qū)在江蘇省內(nèi)所占GDP比重較低,同時(shí)第一產(chǎn)業(yè)在該地區(qū)GDP中所占比重較高,因此比較適合針對(duì)農(nóng)戶的相關(guān)研究。
我們首先對(duì)原始數(shù)據(jù)集進(jìn)行樣本清洗,刪除存在缺失值的樣本。其次,由于1997—2006年、2016年到期的信貸記錄樣本數(shù)較少,且到期當(dāng)年均不存在違約樣本,故我們進(jìn)一步剔除上述期間到期的信貸記錄。另外,由于數(shù)據(jù)庫(kù)中存在部分農(nóng)村、鄉(xiāng)鎮(zhèn)企業(yè)的貸款記錄,這些記錄的貸款數(shù)額一般較大,而我們無法根據(jù)脫敏后的數(shù)據(jù)庫(kù)樣本信息將普通農(nóng)戶小額貸款與農(nóng)村、鄉(xiāng)鎮(zhèn)企業(yè)貸款主體予以明確的區(qū)分。鑒于2010年財(cái)政部、稅務(wù)總局在《關(guān)于農(nóng)村金融有關(guān)稅收政策的通知》中將農(nóng)村小額貸款明確定義為借款金額為5萬元以下的農(nóng)村地區(qū)貸款,本文將數(shù)據(jù)庫(kù)中實(shí)際貸款金額小于等于5萬元人民幣的貸款,劃分定義為普通農(nóng)戶小額貸款,以便下文的研究。最后,對(duì)于教育程度、是否有手機(jī)或電話、婚姻狀況等非數(shù)值變量,我們根據(jù)該監(jiān)管機(jī)構(gòu)提供的數(shù)據(jù)映射字典,分別對(duì)其進(jìn)行數(shù)值化映射以便后續(xù)操作。經(jīng)上述各項(xiàng)篩選、刪減、映射操作后,數(shù)據(jù)集中含有貸款到期日自2007年1月至2015年12月共180 008份樣本,其中違約樣本數(shù)135份。各樣本指標(biāo)的含義及統(tǒng)計(jì)描述見表1。
此外,現(xiàn)有研究農(nóng)戶貸款影響因素的相關(guān)文獻(xiàn),大多僅基于單一農(nóng)村商業(yè)銀行或信用合作社短期內(nèi)的信貸樣本數(shù)據(jù),在微觀層面展開研究,模型中一般并不加入宏觀經(jīng)濟(jì)指標(biāo),因此也難以分析宏觀經(jīng)濟(jì)因素對(duì)不同時(shí)期信用風(fēng)險(xiǎn)的影響??紤]到本文的研究數(shù)據(jù)具有描述地區(qū)信貸總體特征、跨期長(zhǎng)、數(shù)量大等特征,我們同時(shí)搜集了該地區(qū)2005—2015年,在借款年及還款年當(dāng)年、滯后1期(1年)、2期(2年)、3期(3年)的地區(qū)GDP、地區(qū)第一產(chǎn)業(yè)GDP、地區(qū)CPI、地區(qū)農(nóng)業(yè)生產(chǎn)資料價(jià)格指數(shù)以及全國(guó)GDP、全國(guó)第一產(chǎn)業(yè)GDP、全國(guó)CPI、M2等共計(jì)64(8×2×4)個(gè)宏觀經(jīng)濟(jì)指標(biāo)相關(guān)數(shù)據(jù)來自wind資訊,從而進(jìn)一步研究相應(yīng)的宏觀經(jīng)濟(jì)因素與農(nóng)戶小額貸款的違約狀況是否存在顯著的相關(guān)關(guān)系。
二、研究模型的構(gòu)建及穩(wěn)健性分析
(一)模型構(gòu)建
在研究信用評(píng)估問題時(shí),一般以違約概率作為因變量展開研究,而考慮到普通的線性回歸模型不能保證因變量一定在[0,1]間分布,現(xiàn)有文獻(xiàn)一般采用Logistic模型。Logistic模型作為信用評(píng)估領(lǐng)域最經(jīng)典的模型之一,相比于當(dāng)前流行的各類基于人工智能、機(jī)器學(xué)習(xí)技術(shù)的分類模型,擁有適應(yīng)性強(qiáng)、迭代迅速等優(yōu)勢(shì),同時(shí)也兼具對(duì)樣本屬性指標(biāo)的解釋性,故文本選擇基于Logistic模型展開實(shí)證研究。
設(shè)信用評(píng)估數(shù)據(jù)集共有n個(gè)樣本xi (i∈{1,2,…,n}),各樣本包含m個(gè)指標(biāo)Aj (j∈{1,2,…,m}),則第i個(gè)樣本在第j個(gè)指標(biāo)上的取值可表示為xij (i∈{1,2,…,n},j∈{1,2,…,m})。各樣本的類別標(biāo)簽yi∈{0,1}(i∈{1,2,…,n}).若yi=0,則表示其對(duì)應(yīng)的xi 為信用較好的負(fù)類(negative)樣本;若yi=1,則表示其對(duì)應(yīng)的xi為信用較差的正類(positive)樣本。在二分類問題中,Logistic方程的基本形式為:
之后以最小化分類誤差為目標(biāo),通過估計(jì)參數(shù)b0,b1,L,bm 完成模型構(gòu)建。Logistic方程本質(zhì)上衡量了各指標(biāo)與信用水平的半線性函數(shù)關(guān)系。
使用SPSS 20.0統(tǒng)計(jì)軟件進(jìn)行Logistic回歸分析??紤]到備選指標(biāo)中可能存在共線程度較高,或與違約概率相關(guān)性不強(qiáng)的變量,本文選擇基于最大似然估計(jì)(LR)的逐步進(jìn)入法篩選變量,最終收斂步驟為18步,18步迭代后的模型分類結(jié)果如表2所示。模型中剩余的各顯著變量、其系數(shù)及顯著性檢驗(yàn)結(jié)果見表3。
(二)穩(wěn)健性分析
進(jìn)一步分析模型的穩(wěn)健性。一個(gè)首先值得注意的問題是:在本文研究所用數(shù)據(jù)集中,存在兩類樣本的數(shù)量極度不平衡的現(xiàn)象(即未違約的負(fù)類樣本數(shù)遠(yuǎn)遠(yuǎn)大于違約的正類樣本數(shù)),現(xiàn)有的相關(guān)研究表明:一些分類模型在面對(duì)不平衡樣本時(shí),往往會(huì)更多地將正類樣本誤識(shí)別為負(fù)類樣本,從而導(dǎo)致模型的分類能力存在“多數(shù)類偏倚”[19]。現(xiàn)有文獻(xiàn)提出了一些較為成熟的解決樣本不平衡問題的方法,從原理上而言,這些方法大體可以分為兩類:一類是根據(jù)少數(shù)類樣本和與其相似多數(shù)類樣本的多維指標(biāo)分布特征,以一定算法生成新的少數(shù)類樣本,從而實(shí)現(xiàn)兩類樣本數(shù)量的均衡,這類方法具有代表性的主要有Oversamping[20]、SMOTE[21]、RAMBoost[22]、ADASYN[23]等;另一類方法則以現(xiàn)有少數(shù)類樣本的數(shù)量為基礎(chǔ),在多數(shù)類樣本中根據(jù)一定算法抽取有代表性的樣本,實(shí)現(xiàn)兩類樣本的平衡,這類方法具有代表性的主要包括Subsamping[20]、CNNR[24]等。為驗(yàn)證本文所用數(shù)據(jù)集的不平衡是否會(huì)影響模型的分類結(jié)果,我們用MATLAB分別編程實(shí)現(xiàn)上述各樣本不平衡處理算法,之后對(duì)比在使用上述各樣本不平衡處理算法按兩類樣本1∶1平衡化處理后,構(gòu)建出的不同模型在分類性能上是否有顯著差異。
表4展示了經(jīng)上述6種算法分別處理后,Logistic模型分類能力的差異。從表4中可以明顯看出:在使用Oversampling算法之后,Logistic模型的分類性能急劇下降,總計(jì)分類正確百分比僅有50%,相當(dāng)于隨機(jī)分類方法。SMOTE、CNNR、RAMOBoost、ADASYN、Subsampling5種算法,在總計(jì)百分比上不能比表2中直接使用Logistic模型情況下的分類性能更優(yōu),兩類樣本獨(dú)立分類正確率差異并不大。此外,考慮到任何對(duì)原始樣本數(shù)據(jù)的壓縮、增添過程都是對(duì)原始樣本集所含信息的一種抽樣與扭曲,從挖掘客觀、真實(shí)數(shù)據(jù)集特征的角度出發(fā),本文選擇不對(duì)不平衡樣本進(jìn)行任何處理是有理有據(jù)的。
此外,最終被選中的各項(xiàng)顯著性指標(biāo),是否敏感于我們使用的LR逐步進(jìn)入法?我們同時(shí)也對(duì)相同的樣本數(shù)據(jù),分別采用基于條件參數(shù)估計(jì)、基于Wald方法的逐步進(jìn)入法重新構(gòu)建模型,發(fā)現(xiàn)在這兩種方法下,選擇的顯著性指標(biāo)與表3的結(jié)果完全相同,從而表明本文構(gòu)建的模型并不敏感于指標(biāo)的逐步進(jìn)入選擇方法,穩(wěn)健性較好。
三、實(shí)證結(jié)果分析
1.基準(zhǔn)利率、浮動(dòng)利率、實(shí)際利率指標(biāo)。在Logistic模型中,因變量為各樣本的違約概率,事實(shí)上度量的亦是各樣本的信用風(fēng)險(xiǎn)。根據(jù)表3,我們首先發(fā)現(xiàn)基準(zhǔn)利率、浮動(dòng)利率、實(shí)際利率三個(gè)指標(biāo)與信用風(fēng)險(xiǎn)呈較為顯著的相關(guān)關(guān)系。具體而言,基準(zhǔn)利率指標(biāo)與因變量的回歸系數(shù)為4.512,表明信用風(fēng)險(xiǎn)受借款時(shí)的基準(zhǔn)貸款利率影響較大,當(dāng)基準(zhǔn)貸款利率較高時(shí),借款人實(shí)際上面臨著相對(duì)更重的未來還款負(fù)擔(dān),從而導(dǎo)致違約概率上升。而浮動(dòng)利率則衡量了放貸機(jī)構(gòu)在基準(zhǔn)利率基礎(chǔ)上可調(diào)的利率區(qū)間,當(dāng)浮動(dòng)利率較高時(shí),放貸機(jī)構(gòu)有一定沖動(dòng)通過提高利率浮動(dòng)水平以獲得超額利潤(rùn),但事實(shí)上這一行為也增強(qiáng)了借款人的違約可能性。我們也發(fā)現(xiàn)實(shí)際利率與信用風(fēng)險(xiǎn)亦呈顯著的負(fù)相關(guān)關(guān)系,系數(shù)約為-0.216,這與常識(shí)及現(xiàn)有研究的一些結(jié)論相悖:違約概率應(yīng)當(dāng)與貸款利率正相關(guān)。對(duì)此筆者認(rèn)為:對(duì)當(dāng)前大多數(shù)農(nóng)村信貸機(jī)構(gòu)而言,由于貸款定價(jià)機(jī)制不健全,大多數(shù)貸款可能主要依據(jù)金融當(dāng)局的基準(zhǔn)利率附加一定比例的風(fēng)險(xiǎn)成本進(jìn)行定價(jià),因此實(shí)際利率可能與基準(zhǔn)利率有較高的相關(guān)性。經(jīng)計(jì)算,實(shí)際利率與基準(zhǔn)利率的相關(guān)系數(shù)為0.43。我們同時(shí)嘗試在模型中不加入基準(zhǔn)利率與浮動(dòng)利率兩個(gè)指標(biāo),此時(shí)實(shí)際利率的回歸系數(shù)為0.057,對(duì)應(yīng)的p值為0.006,依然保持顯著。正的系數(shù)與常識(shí)相符:實(shí)際利率越高,借款人的還款壓力越大,從而更易出現(xiàn)違約。
2.5級(jí)分類、信用水平指標(biāo)。5級(jí)分類指標(biāo)與信用風(fēng)險(xiǎn)在1%的顯著水平上顯著正相關(guān),由此可以看出,該地區(qū)的農(nóng)村商業(yè)銀行、信用合作社等信貸機(jī)構(gòu),已具備了一定的貸后信用風(fēng)險(xiǎn)管理能力。但信用水平這一貸前信用風(fēng)險(xiǎn)預(yù)測(cè)指標(biāo)并未進(jìn)入模型,我們同時(shí)計(jì)算出信用水平指標(biāo)與是否違約的因變量間的Pearson相關(guān)系數(shù)為-0.008,其相關(guān)性較弱,表明當(dāng)?shù)匦刨J機(jī)構(gòu)在貸前信用風(fēng)險(xiǎn)的管控上有待加強(qiáng),其目前的貸前信用評(píng)估模型,并不能從貸款申請(qǐng)者之中有效識(shí)別出潛在的違約者。
3.性別、婚姻狀況、職業(yè)指標(biāo)。就性別因素而言,男性借款人的信用風(fēng)險(xiǎn)普遍高于女性,且差異較為顯著。婚姻狀況及穩(wěn)定性也對(duì)違約概率有較大程度的影響。具體來說,導(dǎo)致離異借款人離異的原因,可能是好逸惡勞、家庭責(zé)任感不強(qiáng)等因素,由此可合理推測(cè)其還款能力或還款意愿也較弱,而有子女的借款者,可能因自身需要履行撫養(yǎng)義務(wù)導(dǎo)致還款能力較差,從而更易違約。對(duì)于借款人具體的身份或技能而言,退伍軍人一般具有較強(qiáng)的責(zé)任感與使命感,生產(chǎn)、服務(wù)、技術(shù)人員相比于一般農(nóng)戶,可能更加注重自身的聲譽(yù),因而違約風(fēng)險(xiǎn)相比于普通農(nóng)民更低。
4.教育指標(biāo)。值得注意的是,教育因素與信用風(fēng)險(xiǎn)是顯著正相關(guān)的,表面上看,接受教育的層次越高,則信用風(fēng)險(xiǎn)反而越大,這與我們預(yù)先的猜測(cè)相悖。然而,根據(jù)表1的描述性統(tǒng)計(jì),該地區(qū)借款農(nóng)戶的平均受教育水平均值為1.45,介于小學(xué)文化與初中文化之間,因此事實(shí)上整體樣本的受教育水平依然處于一個(gè)較低的水平。僅根據(jù)實(shí)證結(jié)果來看,小學(xué)文化水平的借款者違約概率反而低于初中文化水平的借款者,對(duì)此我們認(rèn)為:在過去農(nóng)村地區(qū)低層次的教育環(huán)境下,僅有小學(xué)文化的農(nóng)戶相比接受了更高層次教育的農(nóng)戶,可能更具鄉(xiāng)村環(huán)境中與生俱來的淳樸、踏實(shí)、勤勞、講信用等優(yōu)良精神,在貸款時(shí)量力而為,在貸款后勤勉奮斗,從而還款能力較高;還款時(shí),在淳樸信用觀念的驅(qū)動(dòng)下,恪守貸款合約義務(wù),從而還款意愿較強(qiáng),綜合使得低學(xué)歷的借款者違約概率較低。
5.擔(dān)保情況指標(biāo)。未解決結(jié)清擔(dān)保債務(wù)這一指標(biāo)也與信用風(fēng)險(xiǎn)負(fù)相關(guān)。然而傳統(tǒng)的信貸理論一般認(rèn)為:擔(dān)保是一種或有債務(wù),債務(wù)水平越高的借款人,違約的可能性越大。從農(nóng)村信用借貸的微觀視角出發(fā),我們猜測(cè):首先,尋求擔(dān)保的借款人,往往偏好于選擇那些財(cái)力較強(qiáng),且能被信貸機(jī)構(gòu)認(rèn)可的農(nóng)戶作為擔(dān)保人。因此事實(shí)上,成為被信貸機(jī)構(gòu)認(rèn)可的擔(dān)保人,本身就是資信水平的一種象征;其次,擔(dān)保人一般在當(dāng)?shù)鼐哂休^好的聲譽(yù),從維護(hù)自身聲譽(yù)角度出發(fā),擔(dān)保人一般也會(huì)選擇履行其擔(dān)保債務(wù)責(zé)任;最后,在現(xiàn)實(shí)操作中,擔(dān)保人與借款人之間一般可能存在親戚或鄰里關(guān)系,構(gòu)成一種隱蔽的“貸款團(tuán)體”。在貸款時(shí),團(tuán)體成員間通過相互擔(dān)保的方式,提高貸款的成功率。而一旦某一成員出現(xiàn)還款困難,擔(dān)保人可以通過先墊付還款的方式,將該團(tuán)體與信貸機(jī)構(gòu)間的債務(wù)關(guān)系轉(zhuǎn)換為團(tuán)體內(nèi)部成員間的債務(wù)關(guān)系,從而同時(shí)保證了借款人與擔(dān)保人在信貸機(jī)構(gòu)中的信用記錄不會(huì)惡化。
6.宏觀經(jīng)濟(jì)指標(biāo)。另外,我們關(guān)注選擇的宏觀經(jīng)濟(jì)指標(biāo)是否對(duì)當(dāng)?shù)乜傮w信貸違約概率具有顯著影響。從表3可以看出,借款年全國(guó)GDP、借款年全國(guó)CPI、借款年江蘇農(nóng)業(yè)生產(chǎn)資料價(jià)格指數(shù)、滯后一期的借款年當(dāng)?shù)氐谝划a(chǎn)業(yè)GDP四個(gè)指標(biāo)與當(dāng)?shù)仄骄`約概率顯著相關(guān),四個(gè)指標(biāo)項(xiàng)系數(shù)分別為-0.000 34、-0.21、0.716與1.101。
對(duì)于系數(shù)為負(fù)的借款年全國(guó)GDP、借款年全國(guó)CPI兩個(gè)指標(biāo),本文嘗試從農(nóng)戶的生產(chǎn)收入角度予以分析。首先根據(jù)表1中“借款期限”一項(xiàng),我們發(fā)現(xiàn)當(dāng)?shù)剞r(nóng)戶借款期限一般較短,平均在1年左右(369.62天)。根據(jù)古典經(jīng)濟(jì)學(xué)理論,當(dāng)借款期間整體經(jīng)濟(jì)形勢(shì)較好時(shí),一般直接體現(xiàn)為生產(chǎn)擴(kuò)大,GDP上升,進(jìn)一步導(dǎo)致勞動(dòng)者收入增加,消費(fèi)需求增加。在農(nóng)產(chǎn)品供應(yīng)量增量不大的條件下(考慮到農(nóng)產(chǎn)品與一般商品的生產(chǎn)過程不同,其生產(chǎn)周期一般較長(zhǎng),因此農(nóng)產(chǎn)品供應(yīng)量增量不大的假設(shè)是合理的),均衡價(jià)格上升,一般也伴隨著總體物價(jià)水平(CPI)上升,農(nóng)戶因銷售農(nóng)產(chǎn)品獲得的收入增加,從而在借款期內(nèi)現(xiàn)金流較高,還款能力提升。
對(duì)于系數(shù)為正的借款年江蘇農(nóng)業(yè)生產(chǎn)資料價(jià)格指數(shù)、滯后一期的借款年當(dāng)?shù)氐谝划a(chǎn)業(yè)GDP兩個(gè)指標(biāo),我們嘗試從農(nóng)戶生產(chǎn)決策的角度出發(fā)展開探討。對(duì)于借款年江蘇農(nóng)業(yè)生產(chǎn)資料價(jià)格指數(shù)指標(biāo),由于農(nóng)戶對(duì)生產(chǎn)資料(如種子、魚苗、化肥、除蟲除草藥劑等)的購(gòu)買大多是剛性需求,而農(nóng)產(chǎn)品銷售的收入一般有限,當(dāng)借款年當(dāng)?shù)剞r(nóng)業(yè)生產(chǎn)資料價(jià)格普遍上升時(shí),農(nóng)戶很可能因此被迫選擇貸款購(gòu)買,從而維持生計(jì)。由于這一貸款行為完全是由剛性需求主導(dǎo)的,貸款動(dòng)機(jī)背后并無預(yù)期收入增加作為還款資金支持,因此信用風(fēng)險(xiǎn)相比較大。對(duì)于借款年當(dāng)?shù)氐谝划a(chǎn)業(yè)GDP這一指標(biāo),我們認(rèn)為農(nóng)戶在生產(chǎn)決策中,信息來源一般比較狹窄,決策主要依據(jù)自身經(jīng)驗(yàn)、他人建議及對(duì)當(dāng)?shù)亍俺晒φ摺钡挠^察。當(dāng)借款年當(dāng)?shù)氐谝划a(chǎn)業(yè)產(chǎn)值較高時(shí),農(nóng)戶可能通過多種渠道認(rèn)知了“今年形勢(shì)較好”這一事實(shí),進(jìn)而根據(jù)適應(yīng)性預(yù)期理論,可能認(rèn)為當(dāng)前的良好形勢(shì)能在來年延續(xù),從而決定貸款跟風(fēng)擴(kuò)大生產(chǎn),由此因生產(chǎn)經(jīng)營(yíng)決策風(fēng)險(xiǎn)引致出信用風(fēng)險(xiǎn)。
7.未進(jìn)入模型指標(biāo)。最后,我們也注意到貸款申請(qǐng)額度、實(shí)際貸款額度、擔(dān)保方式、年齡、是否有手機(jī)或電話、健康狀況、年收入、信用水平、借款期限等微觀指標(biāo)由于顯著性不強(qiáng),并未被納入模型??赡艿脑蚴牵涸谵r(nóng)戶小額貸款過程中,貸款的申請(qǐng)額度與實(shí)際貸款額度等指標(biāo)不同個(gè)體間差異并不明顯,而健康狀況、年收入等指標(biāo)由于信貸機(jī)構(gòu)難以核實(shí),因此其區(qū)分信用風(fēng)險(xiǎn)的作用有限。隨著電子通訊產(chǎn)品及通信費(fèi)用的逐年降低,手機(jī)或電話已成為使用成本低廉的大眾化通訊工具,該指標(biāo)的意義不再明顯。另外,還款年的各項(xiàng)宏觀經(jīng)濟(jì)指標(biāo)也未被納入模型,借款年的該地區(qū)的GDP、CPI、同期全國(guó)第一產(chǎn)業(yè)GDP、M2等指標(biāo)及其滯后項(xiàng)也未納入模型。一般認(rèn)為:還款年的經(jīng)濟(jì)形勢(shì)、物價(jià)水平等因素可能會(huì)對(duì)借款人的還款意愿與還款能力造成影響,但本文的研究并未證實(shí)這一點(diǎn),原因可能在于:借款農(nóng)戶出于謹(jǐn)慎,往往未雨綢繆,在還款期之前一段時(shí)間即準(zhǔn)備好了相應(yīng)的應(yīng)還賬款,從而受還款期整體經(jīng)濟(jì)形勢(shì)的影響并不大。
四、結(jié)論及政策建議
本文基于江蘇北部某地區(qū)2007—2015年18萬條真實(shí)農(nóng)戶大樣本信貸記錄,對(duì)影響當(dāng)?shù)剞r(nóng)戶小額貸款違約與否的宏微觀因素展開研究。研究首先發(fā)現(xiàn)“信用水平”指標(biāo)與農(nóng)戶的真實(shí)違約情況關(guān)聯(lián)不顯著,意味著當(dāng)?shù)匦刨J機(jī)構(gòu)對(duì)貸款農(nóng)戶的內(nèi)部信用評(píng)級(jí)不能有效地預(yù)測(cè)農(nóng)戶的信用風(fēng)險(xiǎn)。之后,挖掘出利率、五級(jí)分類、性別、婚姻狀況、職業(yè)、教育、未解決結(jié)清擔(dān)保債務(wù)、借款年全國(guó)GDP、借款年全國(guó)CPI、借款年江蘇農(nóng)業(yè)生產(chǎn)資料價(jià)格指數(shù)、滯后一期的借款年當(dāng)?shù)氐谝划a(chǎn)業(yè)GDP等指標(biāo)與農(nóng)戶小額貸款信用風(fēng)險(xiǎn)有較為顯著的關(guān)聯(lián)性,可以作為當(dāng)?shù)匦刨J機(jī)構(gòu)農(nóng)戶小額貸款信用評(píng)估模型的指標(biāo)。此外,驗(yàn)證發(fā)現(xiàn)基于LR逐步進(jìn)入法的Logistic模型,在兩類樣本不平衡性較大的數(shù)據(jù)集上,依然能保持較好的分類精度,具有較高的魯棒性。
最后,結(jié)合對(duì)實(shí)證結(jié)果的分析,我們?yōu)楫?dāng)?shù)剞r(nóng)村信貸機(jī)構(gòu)及金融監(jiān)管當(dāng)局如何更好地管理信用風(fēng)險(xiǎn)提出如下幾點(diǎn)建議:
1.研究發(fā)現(xiàn)當(dāng)?shù)匦刨J機(jī)構(gòu)的貸前信用評(píng)估模型并不能有效預(yù)測(cè)貸款申請(qǐng)農(nóng)戶的真實(shí)信用風(fēng)險(xiǎn)。因此,當(dāng)?shù)匦刨J機(jī)構(gòu)需要強(qiáng)化貸前內(nèi)部信用評(píng)估體系的研發(fā),構(gòu)建性能較強(qiáng)的、符合當(dāng)?shù)貙?shí)際信貸現(xiàn)狀的內(nèi)部信用評(píng)估模型,同時(shí)加強(qiáng)傳統(tǒng)的非模型化信用評(píng)估方法和貸后管理。
2.在構(gòu)建內(nèi)部信用評(píng)估模型時(shí),可以考慮在模型中加入全國(guó)GDP、全國(guó)CPI、江蘇農(nóng)業(yè)生產(chǎn)資料價(jià)格指數(shù)、滯后一期的當(dāng)?shù)氐谝划a(chǎn)業(yè)GDP等指標(biāo),結(jié)合現(xiàn)有的諸如微觀評(píng)估指標(biāo),從更全面的視角對(duì)貸款農(nóng)戶信用水平進(jìn)行深度評(píng)估。對(duì)金融監(jiān)管當(dāng)局來說,亦可嘗試基于相應(yīng)的宏觀經(jīng)濟(jì)指標(biāo),對(duì)當(dāng)?shù)剞r(nóng)戶信貸風(fēng)險(xiǎn)進(jìn)行恰當(dāng)?shù)念A(yù)測(cè),從而及時(shí)向當(dāng)?shù)匦刨J機(jī)構(gòu)提供預(yù)警。
3.鑒于農(nóng)戶違約概率與借款時(shí)的基準(zhǔn)貸款利率、浮動(dòng)利率、實(shí)際利率關(guān)聯(lián)性較強(qiáng),金融當(dāng)局應(yīng)當(dāng)進(jìn)一步推進(jìn)利率市場(chǎng)化工作,逐漸放開利率市場(chǎng)管制,避免因過高的基準(zhǔn)貸款利率限制,變相提升農(nóng)戶貸款成本,因農(nóng)戶還款能力下降導(dǎo)致違約概率上升。對(duì)于貸款機(jī)構(gòu),亦應(yīng)從長(zhǎng)遠(yuǎn)角度出發(fā),對(duì)不同信用水平的貸款農(nóng)戶實(shí)施差別化貸款定價(jià),對(duì)資信較好的農(nóng)戶提供較低的實(shí)際貸款利率,構(gòu)建長(zhǎng)期的客戶合作關(guān)系,而不可“揠苗助長(zhǎng)”,片面追求短期的利潤(rùn),以較高的貸款利率將真實(shí)信用水平較高的農(nóng)戶拒之門外,反而吸引了信用風(fēng)險(xiǎn)較大的借款人,引致道德風(fēng)險(xiǎn)與逆向選擇問題。
4.考慮到金融知識(shí)對(duì)信用風(fēng)險(xiǎn)的顯著影響,建議當(dāng)?shù)亟鹑诒O(jiān)管當(dāng)局應(yīng)積極與貸款機(jī)構(gòu)合作開展農(nóng)戶信用意識(shí)科普活動(dòng),讓更多有資金需求的農(nóng)戶在了解小額貸款相關(guān)的金融知識(shí)之余,提高借款農(nóng)戶的還款意愿。同時(shí),可以結(jié)合大數(shù)據(jù)技術(shù),構(gòu)建當(dāng)?shù)剞r(nóng)戶信用信息庫(kù),一方面,為后續(xù)的信用評(píng)估模型構(gòu)建提供數(shù)據(jù)樣本支持,另一方面,通過記錄歷史違約信息,構(gòu)建違約懲戒機(jī)制,提高違約成本,激勵(lì)借款農(nóng)戶提高自身的還款動(dòng)力。此外,當(dāng)?shù)卣畱?yīng)當(dāng)積極引導(dǎo)當(dāng)?shù)剞r(nóng)戶科學(xué)進(jìn)行生產(chǎn)決策,避免因扎堆跟風(fēng)、盲目擴(kuò)大生產(chǎn)導(dǎo)致農(nóng)戶進(jìn)行非理性貸款,從而降低信用風(fēng)險(xiǎn)。
參考文獻(xiàn):
[1] Lessmann S,Baesens B,Seow H V,et al.Benchmarking Stateoftheart Classification Algorithms for Credit Scoring:An Update of Research[J].European Journal of Operational Research,2015,247(1):132.
[2]Thomas L C,Edelman D B,Crook J N. Credit Scoring and its Applications[M].Philadelphia :Siam,2002.
[3]Decamps J P,Rochet J C,Roger B. The Three Pillars of Basel II: Optimizing the Mix[J].Journal of Financial Intermediation,2004,13(2):132155.
[4]Orgler Y E.A Credit Scoring Model for Commercial Loans[J].Journal of Money,Credit and Banking,1970,2(4):435445.
[5]Steenackers A,Goovaerts M J.A Credit Scoring Model for Personal Loans[J].Insurance:Mathematics and Economics,1989,8(1):3134.
[6]Leonard K J.Empirical Bayes Analysis of the Commercial Loan Evaluation Process[J].Statistics & Probability Letters,1993,18(4):289296.
[7]Lessmanna S,Seowb H,Baesenscd B,et al. Benchmarking Stateoftheart Classification Algorithms for Credit Scoring:A Tenyear Update[C]//Credit Research Centre,Conference Archive,2013.
[8]Chuang C L,Huang S T.A Hybrid Neural Network Approach for Credit Scoring[J].Expert Systems,2011,28(2):185196.
[9]Bellotti T,Crook J.Support Vector Machines for Credit Scoring and Discovery of Significant Features[J].Expert Systems With Applications,2009,36(2):3 3023 308.
[10]龐素琳,鞏吉璋.C5.0分類算法及在銀行個(gè)人信用評(píng)級(jí)中的應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,2009,29(12):94104.
[11]Henley W E.Construction of a Knearestneighbour Creditscoring System[J].IMA Journal of Management Mathematics,1997,8(4):305321.
[12]王定祥,田慶剛,李伶俐,等.貧困型農(nóng)戶信貸需求與信貸行為實(shí)證研究[J].金融研究,2011(5):124138.
[13]黃祖輝, 劉西川, 程恩江. 中國(guó)農(nóng)戶的信貸需求:生產(chǎn)性抑或消費(fèi)性——方法比較與實(shí)證分析[J].管理世界, 2007(3):139148.
[14]楊勝剛,夏唯,張磊,等.信用缺失環(huán)境下的農(nóng)戶信用評(píng)估指標(biāo)體系構(gòu)建研究[J].財(cái)經(jīng)理論與實(shí)踐,2012,33(6):712.
[15]楊宏玲,郭高玲.基于BBC與價(jià)值鏈風(fēng)險(xiǎn)分析的農(nóng)戶信用評(píng)價(jià)指標(biāo)體系探析[J].科技管理研究,2011,31(6):6366.
[16]胡愈,許紅蓮,王雄.農(nóng)戶小額信用貸款信用評(píng)級(jí)探究[J].財(cái)經(jīng)理論與實(shí)踐,2007,28(1):3033.
[17]李巖,蘭慶高,趙翠霞.農(nóng)戶貸款行為的發(fā)展規(guī)律及其影響因素——基于山東省573戶農(nóng)戶6年追蹤數(shù)據(jù)[J].南開經(jīng)濟(jì)研究,2014(1):134145.
[18]魏嵐.農(nóng)戶小額信貸風(fēng)險(xiǎn)評(píng)價(jià)體系研究[J].財(cái)經(jīng)問題研究,2013(8):125128.
[19]Batista G E,Prati R C,Monard M C.A Study of the Behavior of Several Methods for Balancing Machine Learning Training Data[J].ACM Sigkdd Explorations Newsletter,2004,6(1):2029.
[20]Yap B W,Rani K A,Rahman H A A,et al.An Application of Oversampling,Undersampling, Bagging and Boosting in Handling Imbalanced Datasets[C]//Proceedings of the First International Conference on Advanced Data and Information Engineering (DaEng2013).Springer Singapore,2014:1322.
[21]Chawla N V,Bowyer K W,Hall L O,et al.SMOTE:Synthetic Minority Oversampling Technique[J].Journal of Artificial Intelligence Research,2002,16(1):321357.
[22]Chen S,He H,Garcia E A.RAMOBoost: Ranked Minority Oversampling in Boosting[J].IEEE Transactions on Neural Networks,2010,21(10):1 6241 642.
[23]He H,Bai Y,Garcia E A,et al.ADASYN:Adaptive Synthetic Sampling Approach for Imbalanced Learning[C]//2008 IEEE International Joint Conference on Neural Networks (IEEE World Congress on Computational Intelligence).IEEE,2008:1 3221 328.
[24]Gowda K C,Krishna G.The Condensed Nearest Neighbor Rule Using the Concept of Mutual Nearest Neighborhood[J].IEEE Transactions on Information Theory,1979,25(4):488490.