石澄賢,陳雪交
?
P2P網(wǎng)貸個(gè)人信用?
評(píng)價(jià)指標(biāo)體系的構(gòu)建
石澄賢,陳雪交
摘 要:為增加P2P網(wǎng)貸平臺(tái)信用評(píng)價(jià)的可信性,改善因信息不對(duì)稱而導(dǎo)致的企業(yè)信用風(fēng)險(xiǎn)問(wèn)題,結(jié)合實(shí)際業(yè)務(wù)需求從表征信息、行為信息及狀態(tài)信息三個(gè)方面選擇個(gè)人信用評(píng)價(jià)指標(biāo)變量。通過(guò)計(jì)算變量的WOE(Weight of Evidence)、IV(Information Value)值初步觀測(cè)變量對(duì)目標(biāo)的顯著程度,再用SAS軟件對(duì)整體變量進(jìn)行邏輯回歸。以IV和邏輯回歸相結(jié)合的方式篩選指標(biāo),遴選出22個(gè)指標(biāo)作為P2P網(wǎng)貸平臺(tái)信用評(píng)價(jià)體系指標(biāo)。這種個(gè)人信用評(píng)估指標(biāo)的遴選結(jié)果保留了信息量大,對(duì)信用評(píng)價(jià)貢獻(xiàn)概率大的指標(biāo)。
關(guān)鍵詞:P2P網(wǎng)貸平臺(tái);個(gè)人信用評(píng)價(jià);指標(biāo)體系;邏輯回歸
P2P網(wǎng)絡(luò)借貸是互聯(lián)網(wǎng)技術(shù)與民間借貸相結(jié)合的一種金融創(chuàng)新模式,是出借人通過(guò)網(wǎng)絡(luò)借貸平臺(tái)將資金貸給借款人的一種民間借款方式,屬于無(wú)抵押貸款[1]。由于借貸雙方信息不對(duì)稱,使得P2P網(wǎng)貸過(guò)程中的個(gè)人信用評(píng)價(jià)成為影響借貸交易的重要因素。然而中國(guó)缺少高度透明的個(gè)人信用體系,借款人的信用評(píng)價(jià)完全由P2P網(wǎng)絡(luò)借貸平臺(tái)的信用認(rèn)證機(jī)制做出[2]。而信用認(rèn)證機(jī)制中最重要的一個(gè)環(huán)節(jié)就是評(píng)價(jià)指標(biāo)的選取,如果評(píng)價(jià)指標(biāo)過(guò)于單一,那么評(píng)價(jià)模型對(duì)其風(fēng)險(xiǎn)揭示作用就會(huì)存在局限性。為了進(jìn)一步發(fā)揮信用認(rèn)證機(jī)制的風(fēng)險(xiǎn)揭示作用并降低借貸雙方信息不對(duì)稱問(wèn)題,應(yīng)豐富和完善多層次認(rèn)證指標(biāo)體系并構(gòu)建合理的信用指標(biāo)。
關(guān)于個(gè)人信用評(píng)估指標(biāo)體系,我國(guó)已有許多學(xué)者進(jìn)行了深入研究。就信用評(píng)估指標(biāo)考察的內(nèi)容而言,主要涉及還款能力與還款意愿兩個(gè)方面,當(dāng)然也有學(xué)者在此基礎(chǔ)上提出了一些新的觀點(diǎn),如郭昱等[3]156在還款意愿和還款能力的基礎(chǔ)上增加了考察成長(zhǎng)潛力的信用評(píng)價(jià)指標(biāo)體系;賴輝等[4]提出了“個(gè)人信用行為狀態(tài)”概念,從信用行為和信用狀態(tài)以及行為狀態(tài)的關(guān)聯(lián)上構(gòu)建個(gè)人信用評(píng)估指標(biāo);蔣小兔等[5]主要從小額信貸的實(shí)際開(kāi)展情況和市場(chǎng)特征上選取評(píng)價(jià)指標(biāo);就評(píng)估方法而言,主要涉及邏輯回歸、決策樹(shù)及支持向量機(jī)等,如張國(guó)政等[6]通過(guò)邏輯回歸測(cè)得影響個(gè)人信用風(fēng)險(xiǎn)的關(guān)鍵因素是借款人的年齡、婚姻情況、受教育程度等六項(xiàng)指標(biāo);孫同陽(yáng)等[7]通過(guò)決策樹(shù)模型對(duì)信用風(fēng)險(xiǎn)進(jìn)行評(píng)價(jià);夏晗[8]通過(guò)主成分分析和支持向量機(jī)相結(jié)合的方法對(duì)信用風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè)。
縱覽眾多文獻(xiàn)發(fā)現(xiàn),雖然目前評(píng)估指標(biāo)在內(nèi)容上開(kāi)始偏向還款意愿及行為狀態(tài)方面,但整體考察的力度并不是那么大,在信用指標(biāo)的選取上多數(shù)還是更強(qiáng)調(diào)還款能力而很少涉及還款意愿及個(gè)人的行為狀態(tài)信息。然而當(dāng)具有還款能力時(shí),借款人是否違約就取決于其還款意愿的強(qiáng)弱[9-10]及個(gè)人的行為狀態(tài)。因此對(duì)還款意愿及行為狀態(tài)的考察是極其重要的。此外,在評(píng)估的方法上,更多文獻(xiàn)采用單一的評(píng)估方法,由于評(píng)估方法本身的局限性可能導(dǎo)致選出的指標(biāo)存在一些不合理性問(wèn)題。因此結(jié)合以上分析,本文在評(píng)估內(nèi)容上從表征信息、行為信息及狀態(tài)信息三個(gè)方面構(gòu)建個(gè)人信用評(píng)價(jià)指標(biāo)體系,使還款能力與還款意愿相結(jié)合,行為信息與狀態(tài)信息相結(jié)合,更加全面細(xì)致地考察信用評(píng)估指標(biāo);在評(píng)估方法上采用IV與邏輯回歸相結(jié)合的方法選取指標(biāo),從而使選出的指標(biāo)體系無(wú)論是在內(nèi)容上還是在方法上都更加合理可信。
個(gè)人信用評(píng)價(jià)指標(biāo)體系的構(gòu)建不僅要全面客觀,還要充分考慮所選指標(biāo)是否符合P2P網(wǎng)貸的特點(diǎn)[3]157。通過(guò)借鑒當(dāng)今P2P網(wǎng)貸平臺(tái)信用評(píng)價(jià)指標(biāo)體系的研究結(jié)果和考慮P2P網(wǎng)貸平臺(tái)自身的特點(diǎn)及實(shí)際業(yè)務(wù)需求,從表征信息、行為信息以及狀態(tài)信息三個(gè)方面,構(gòu)建了涵蓋定性與定量指標(biāo)相結(jié)合的P2P網(wǎng)貸平臺(tái)個(gè)人信用評(píng)價(jià)指標(biāo)體系。
本文中的表征信息主要涉及最基本的性別、年齡等信息,這些指標(biāo)對(duì)客戶的行為預(yù)測(cè)并不具有因果關(guān)系,但是根據(jù)歷史數(shù)據(jù)統(tǒng)計(jì)可得到一定的規(guī)律。行為信息主要涉及產(chǎn)品類型、申請(qǐng)頻次、申請(qǐng)金額等,行為是內(nèi)部需求在外部特定環(huán)境下的一種表現(xiàn),是內(nèi)部需求的結(jié)果,對(duì)客戶的行為預(yù)測(cè)可以表現(xiàn)出相關(guān)性。而狀態(tài)信息是指客戶的社會(huì)經(jīng)濟(jì)狀態(tài)和社會(huì)網(wǎng)絡(luò)關(guān)系,對(duì)預(yù)測(cè)客戶行為具有一定的因果關(guān)系[11]。
本文數(shù)據(jù)來(lái)源于融360金融數(shù)據(jù)分析大賽,根據(jù)以上指標(biāo)設(shè)計(jì)原則,結(jié)合實(shí)際業(yè)務(wù)需求,首先從135個(gè)變量中初步篩選了39個(gè)評(píng)價(jià)指標(biāo)構(gòu)成該指標(biāo)體系,如表1所示;然后通過(guò)計(jì)算WOE,IV值及對(duì)變量進(jìn)行邏輯回歸顯著性檢驗(yàn)后對(duì)指標(biāo)進(jìn)一步篩選。
表1 初選信用指標(biāo)體系
續(xù)表1
本文主要通過(guò)IV與邏輯回歸相結(jié)合的方法確定指標(biāo)顯著性,再結(jié)合實(shí)際業(yè)務(wù)需求選取最終指標(biāo)。涉及到的關(guān)鍵理論知識(shí)如下所示:
(一)WOE計(jì)算方法
由于樣本數(shù)據(jù)中連續(xù)變量較多,為降低變量屬性的個(gè)數(shù),并且平滑變量的變化趨勢(shì),通常會(huì)先對(duì)變量的取值進(jìn)行分箱并計(jì)算每個(gè)變量屬性的WOE(Weight of Evidence)值[12]。WOE主要是通過(guò)比較不同變量屬性之間的差異度來(lái)反映自變量對(duì)因變量的影響程度,原理是如果同一變量的不同屬性得出的WOE差異度越大,那么說(shuō)明不同的變量取值對(duì)目標(biāo)變量的區(qū)分度越大,進(jìn)而說(shuō)明該變量對(duì)目標(biāo)變量的作用越顯著。計(jì)算公式如下:
式(1)中的woei是某變量第i個(gè)屬性對(duì)應(yīng)的WOE值;gi是某變量第i個(gè)屬性對(duì)應(yīng)的好客戶數(shù);bi是某變量第i個(gè)屬性對(duì)應(yīng)的壞客戶數(shù);g是樣本中的總的好客戶數(shù);b是樣本中總的壞客戶數(shù)。
(二)IV計(jì)算方法
如果說(shuō)WOE是自變量取某一個(gè)值時(shí)對(duì)目標(biāo)變量的影響,那么IV(Information Value)則衡量的是某一個(gè)變量的信息量,從公式來(lái)看的話,相當(dāng)于是自變量WOE值的一個(gè)加權(quán)求和,其值的大小決定了自變量對(duì)于目標(biāo)變量的影響程度;這種影響程度可以從另一個(gè)角度來(lái)理解,式(2)中的gi/g與bi/b可以理解為某個(gè)自變量關(guān)于目標(biāo)變量的條件密度,當(dāng)這兩個(gè)條件密度距離越遠(yuǎn)時(shí),說(shuō)明這個(gè)自變量對(duì)目標(biāo)變量的辨識(shí)度越好。因此,只要IV值大就說(shuō)明對(duì)目標(biāo)變量影響顯著。計(jì)算公式如下:
式(2)中的woei是某變量第i個(gè)屬性對(duì)應(yīng)的WOE值;gi是某變量第i個(gè)屬性對(duì)應(yīng)的好客戶數(shù);bi是某變量第i個(gè)屬性對(duì)應(yīng)的壞客戶數(shù);g是樣本中的總的好客戶數(shù);b是樣本中總的壞客戶數(shù)。
(三)邏輯回歸模型及變量篩選
邏輯回歸模型主要針對(duì)目標(biāo)變量是分類變量構(gòu)建的回歸模型,其數(shù)學(xué)模型如下:
假設(shè)在自變量x1,x2,…,xn作用下,以Y=1表示某事件發(fā)生,概率為p,Y=0表示該事件不發(fā)生,概率為(1-p),p/(1-p)為發(fā)生概率和不發(fā)生概率之比,記做“優(yōu)勢(shì)”(odds),若對(duì)odds取自然對(duì)數(shù),得到:logit(Y)=ln(odds)=ln(p/1-p)稱為Y的logit變換[13]233-234,則logistic回歸模型為:
式(3)中,x1,x2,…,xn是自變量,b1,b2,…,bn是自變量對(duì)應(yīng)的回歸系數(shù),b0為常數(shù)項(xiàng)。
以x1,x2,…,x35分別表示表1中35個(gè)指標(biāo),以Y=1表示個(gè)人信用好,Y=0表示個(gè)人信用壞,利用式(3)可以構(gòu)建個(gè)人信用好壞的logistic回歸模型式。對(duì)于logistic回歸模型式(3)是否要包含或刪除某預(yù)測(cè)變量xi,即為變量篩選問(wèn)題。目前主要的變量篩選方法有向前回歸法、向后回歸法、逐步回歸法和全模型回歸法。本文主要采用逐步回歸法進(jìn)行變量篩選。將變量逐個(gè)引入模型,每引入一個(gè)解釋變量后都要進(jìn)行F檢驗(yàn),并對(duì)已經(jīng)選入的解釋變量逐個(gè)進(jìn)行t檢驗(yàn)。當(dāng)原來(lái)引入的解釋變量由于后面解釋變量的引入變得不再顯著時(shí),則將其刪除,以確保每次引入新的變量之前回歸方程中只包含先主動(dòng)變量[13]238。
首先根據(jù)公式(1)、(2)將所有數(shù)據(jù)用SAS軟件計(jì)算其對(duì)應(yīng)的IV值(如表1所示),并用逐步進(jìn)入的方法對(duì)所有變量進(jìn)行邏輯回歸,得出最終的變量顯著性結(jié)果如表2所示:
表2 邏輯回歸最終確定的變量
通過(guò)對(duì)比表1和表2結(jié)果可知,除cash_receipts(現(xiàn)金收入)、pv_credit(信用卡總點(diǎn)擊量)、qid133(性別)和user_h(yuǎn)as_carI(用戶是否有車)這四個(gè)變量在IV表中的排名稍微靠后一些外,其余變量基本上在IV中排序都比較靠前,說(shuō)明IV結(jié)果和邏輯回歸得出的結(jié)果具有一致性,而根據(jù)實(shí)際業(yè)務(wù)理解,“現(xiàn)金收入”“信用卡總點(diǎn)擊量”和“用戶是否有車”對(duì)是否批貸是有顯著影響的。此外參考其他學(xué)者大量實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),“性別”對(duì)是否批貸也是有顯著影響的。邏輯回歸中加入這4個(gè)變量是很符合實(shí)際的,另外,limit(申請(qǐng)金額)、qid122(婚姻狀況)、qid139(居住類型)在IV中的排名比較靠前,而在邏輯回歸中并沒(méi)有把其加入模型中。根據(jù)實(shí)際業(yè)務(wù)分析,“申請(qǐng)金額”對(duì)是否批貸具有顯著作用,“婚姻狀況”和“居住類型”通常也會(huì)對(duì)是否批貸產(chǎn)生一定影響,因此我們最終從39個(gè)變量中選出以下22個(gè)變量作為個(gè)人信用評(píng)價(jià)指標(biāo)體系的最終指標(biāo),結(jié)果如表3所示。
表3 個(gè)人信用評(píng)價(jià)最終指標(biāo)體系
續(xù)表3
目前P2P行業(yè)處于快速發(fā)展階段,借款需求相對(duì)旺盛,但對(duì)信用風(fēng)險(xiǎn)防控的要求也逐漸提高。如何構(gòu)建合理可信的信用風(fēng)險(xiǎn)評(píng)估模型,選取全面客觀的信用指標(biāo)體系,從而降低個(gè)人信用風(fēng)險(xiǎn)并減少P2P行業(yè)損失,成為擺在人們面前的一道難題。此外,由于我國(guó)的金融監(jiān)管機(jī)構(gòu)并未出臺(tái)對(duì)P2P的監(jiān)管細(xì)則,P2P行業(yè)仍處于無(wú)準(zhǔn)入門檻、無(wú)行業(yè)標(biāo)準(zhǔn)、無(wú)主管機(jī)構(gòu)的三無(wú)狀態(tài)[14]。加之,個(gè)人信用機(jī)制的不健全以及一些借款人為了獲得借款提供虛假的信用材料,無(wú)形中增加了P2P行業(yè)信用風(fēng)險(xiǎn)評(píng)估及評(píng)價(jià)指標(biāo)選取的難度。為了在某種程度上解決這一難題,也為了能給更多工作者在選取指標(biāo)時(shí)提供一定參考,本文在借鑒諸多學(xué)者研究成果的基礎(chǔ)上進(jìn)一步提出了P2P信用評(píng)價(jià)指標(biāo)選取的方法。
從文中表1的IV值結(jié)果來(lái)看,對(duì)目標(biāo)變量影響程度比較大的幾個(gè)指標(biāo)基本上是行為信息或狀態(tài)信息中的指標(biāo)。以往人們對(duì)個(gè)人信用指標(biāo)的研究主要集中在表征信息這類基本信息的考察,對(duì)行為信息和狀態(tài)信息的考察并不太重視,但由以上結(jié)果可以看出,行為信息和狀態(tài)信息對(duì)個(gè)人信用評(píng)價(jià)有著至關(guān)重要的作用,有些指標(biāo)的顯著程度比表征信息中的指標(biāo)還要顯著。因此,本文建議在對(duì)個(gè)人信用指標(biāo)進(jìn)行篩選時(shí)加大對(duì)行為信息和狀態(tài)信息的考察。最后,本文P2P網(wǎng)貸平臺(tái)信用評(píng)價(jià)體系指標(biāo)遴選以信息量大,logistic回歸模型分析對(duì)信用評(píng)價(jià)貢獻(xiàn)概率大為原則。這樣選取的個(gè)人信用評(píng)估指標(biāo)保留了重要和核心指標(biāo)??梢员3种笜?biāo)選取的客觀全面,確保評(píng)估方法的合理可信性。這種通過(guò)對(duì)指標(biāo)的實(shí)際數(shù)據(jù)進(jìn)行分析,盡量做到不重不漏、科學(xué)合理的方法為評(píng)估關(guān)鍵指標(biāo)的選取提供了有用的標(biāo)準(zhǔn)。這種在許多指標(biāo)中遴選重要指標(biāo)的辦法希望能夠給實(shí)際工作者提供有益的參考。
參考文獻(xiàn):
[1]Mingfeng Lin,N R Prabhala,Siva Viswanathan.Judging borrowers by the company they keep:social networks and adverse selection in online Peer-to-Peer lending[J].Journal of Women's Health,2009
[2]王會(huì)娟,廖理.中國(guó)P2P網(wǎng)絡(luò)借貸平臺(tái)信用認(rèn)證機(jī)制研究——來(lái)自“人人貸”的經(jīng)驗(yàn)證據(jù)[J].中國(guó)工業(yè)經(jīng)濟(jì),2014,28(4):137.
[3]郭昱,馬翻翻,鄭超文.我國(guó)小微企業(yè)信用評(píng)價(jià)指標(biāo)體系的構(gòu)建[J].金融經(jīng)濟(jì),2015,22(2).
[4]賴輝,帥理,周宗放.個(gè)人信貸客戶信用評(píng)估的一種新方法[J].技術(shù)經(jīng)濟(jì),2014,33(9):97-103.
[5]蔣小兔,査奇芬.常州市小額信貸信用風(fēng)險(xiǎn)評(píng)價(jià)研究[J].中國(guó)集體經(jīng)濟(jì),2014,30(16):84-85.
[6]張國(guó)政,陳維煌,劉呈輝.基于Logistic模型的商業(yè)銀行個(gè)人消費(fèi)信貸風(fēng)險(xiǎn)評(píng)估研究[J].金融理論與實(shí)踐,2015,34(3):53-57.
[7]孫同陽(yáng),謝朝陽(yáng).基于決策樹(shù)的P2P網(wǎng)貸信用風(fēng)險(xiǎn)評(píng)價(jià)[J].商業(yè)經(jīng)濟(jì)研究,2015,34(2):81.
[8]夏晗.基于主成分分析和支持向量回歸機(jī)組合模型的電子商務(wù)信用風(fēng)險(xiǎn)度預(yù)測(cè)研究[J].現(xiàn)代情報(bào),2015,35(1):76-79.
[9]彭紅楓,葉永剛.基于資本監(jiān)管要求和還款意愿的貸款定價(jià)研究[J].中國(guó)管理科學(xué),2009,17(2):8-14.
[10]彭紅楓,葉永剛.基于還款能力和還款意愿的貸款定價(jià)研究[J].中國(guó)管理科學(xué),2011,19(6):41-47.
[11]常國(guó)珍.胸有成竹!數(shù)據(jù)分析的SASEG進(jìn)階[M].北京:電子工業(yè)出版社,2015:136-137.
[12]楊池然.SAS開(kāi)發(fā)經(jīng)典案例解析[M].北京:機(jī)械工業(yè)出版社,2013:315.
[13]姚志勇.SAS編程與數(shù)據(jù)挖掘商業(yè)案例[M].北京:機(jī)械工業(yè)出版社,2013.
[14]潘莊晨,邢博.我國(guó)P2P網(wǎng)絡(luò)借貸模式的發(fā)展現(xiàn)狀及風(fēng)險(xiǎn)揭示研究[J].未來(lái)與發(fā)展,2014,38(6):86-89.
The Constr?uction of P2PNetwork Lending Personal Credit Evaluation Index System
Shi Chengxian,Chen Xuejiao
Abstract:In order to increase the credibility of P2Pnetwork lending platform and solve the problem of enterprise credit risks caused by information asymmetry,personal credit evaluation index variables are selected in three aspects,namely,representation information,behavior information and status information combined with actual business needs.By calculating WOE and IV of variables,the significance of variables to targets in the preliminary observation is showed.The logistic regression of all variables is presented by use of SAS software.Combing IV and logistic regression,22variables are selected as P2P network lending platform credit evaluation indexes.Through the selection,indexes which contain a large amount of information and make a lot of contribution to credit evaluation are reserved.
Key words:P2Pnetwork lending platform;personal credit evaluation;index system;logistic regression
收稿日期:(2015-10-21;責(zé)任編輯:沈秀)
中圖分類號(hào):F832.479
文獻(xiàn)標(biāo)識(shí)碼:A
Doi:10.3969/j.issn.2095-042X.2016.01.012
作者簡(jiǎn)介:石澄賢,常州大學(xué)數(shù)理學(xué)院教授,碩士生導(dǎo)師;陳雪交,常州大學(xué)數(shù)理學(xué)院碩士研究生。