陳雪蓮 潘美芹
摘 要: 針對(duì)P2P網(wǎng)絡(luò)信貸平臺(tái)信用風(fēng)險(xiǎn)特點(diǎn),以借款人違約情況為被解釋變量,運(yùn)用Logistic回歸方法建立借款人信用違約風(fēng)險(xiǎn)評(píng)估模型。原始數(shù)據(jù)從人人貸網(wǎng)站抓取獲得,選取的原始評(píng)估變量有24個(gè),通過(guò)信息增益進(jìn)行指標(biāo)降維,得到19個(gè)解釋變量,并以此建立了Logistic回歸模型。通過(guò)五步逐次回歸得出,性別、逾期次數(shù)、逾期金額、身份認(rèn)證和學(xué)歷認(rèn)證等5個(gè)因素作為評(píng)價(jià)個(gè)人信用風(fēng)險(xiǎn)的主要依據(jù),并建立了Logistic回歸模型?;貧w模型的判別準(zhǔn)確率表明所構(gòu)建的借款人信用風(fēng)險(xiǎn)評(píng)估模型預(yù)測(cè)效果較好。
關(guān)鍵詞: P2P網(wǎng)絡(luò)借貸;信用違約風(fēng)險(xiǎn); Logistic回歸模型;信息增益
中圖分類號(hào): F 224
文獻(xiàn)標(biāo)志碼: A
Abstract: Based on the credit risk characteristics of P2P network credit platform, this paper uses Logistic regression method to establish a credit default risk assessment model for borrowers when taking the borrower default situation as the explanatory variable. Raw data is obtained from the crawl of the Renren loan website. There are 24 original evaluation variables selected. Through the information gain, the explanatory variables are reduced to 19. Through five steps of regression, the five factors including gender,overdue number, overdue amount, identity certification and academic qualifications should be used as the main basis for evaluating personal credit risk, and the logistic regression model is established. The discriminative accuracy of the regression model indicates that the constructed credit risk assessment model of the borrower has a better prediction effect.
Key words: P2P lending; credit default risk; Logistic regression model; information gain
P2P網(wǎng)絡(luò)借貸全稱是“Online Peer to Peer Lending”,指的是個(gè)體與個(gè)體之間通過(guò)網(wǎng)絡(luò)實(shí)現(xiàn)的直接借貸。出借方和借款方既可以是自然人,也可以是企業(yè)。2005年,世界上第一家網(wǎng)絡(luò)貸款平臺(tái)Zopa在英國(guó)成立,次年網(wǎng)絡(luò)貸款平臺(tái)Prosper在美國(guó)成立,隨后,日本、西班牙、韓國(guó)等國(guó)家也紛紛成立了自己的網(wǎng)絡(luò)貸款平臺(tái)。2007年,中國(guó)最早的網(wǎng)絡(luò)貸款平臺(tái)——拍拍貸成立,此后,其他網(wǎng)絡(luò)借款平臺(tái)陸續(xù)出現(xiàn)。2010—2012年,我國(guó)的P2P網(wǎng)絡(luò)借貸平臺(tái)由10家增長(zhǎng)到200家,網(wǎng)絡(luò)借貸成交額由15億元增至212億元。隨著社會(huì)經(jīng)濟(jì)的不斷發(fā)展以及大眾融資需求的增加,2012年后我國(guó)P2P網(wǎng)絡(luò)借貸得到快速發(fā)展。2013年,我國(guó)網(wǎng)貸平臺(tái)數(shù)達(dá)到800家,成交額達(dá)到1058億元;2015年,網(wǎng)貸平臺(tái)數(shù)達(dá)到2595家,成交額達(dá)到9823億元。 2017年,我國(guó)網(wǎng)貸平臺(tái)數(shù)量達(dá)到了6363家,全年網(wǎng)貸行業(yè)成交量達(dá)到了28048.49億元,相比2016年全年網(wǎng)貸成交量(20638.72億元)增長(zhǎng)了35.9%;預(yù)計(jì)2018年上半年網(wǎng)貸行業(yè)成交規(guī)模將趨于穩(wěn)定,下半年或迎來(lái)成交量新高,全年P(guān)2P網(wǎng)貸成交量大概率突破3萬(wàn)億元。
2018年上半年P(guān)2P行業(yè)成交額小幅下降,這一現(xiàn)狀暴露了P2P網(wǎng)貸行業(yè)目前存在的各種問(wèn)題。平臺(tái)層面,包括平臺(tái)跑路、平臺(tái)關(guān)閉等;借款人層面以借款人的信用違約行為最為突出,信用違約不僅會(huì)給網(wǎng)貸平臺(tái)造成運(yùn)營(yíng)風(fēng)險(xiǎn),而且也會(huì)對(duì)整個(gè)網(wǎng)貸行業(yè)造成不良影響。目前,借款人違約行為頻發(fā)的原因在于網(wǎng)絡(luò)借貸信息的不對(duì)稱和道德風(fēng)險(xiǎn)引發(fā)的借款人騙款行為。解決P2P網(wǎng)貸中借款人的違約風(fēng)險(xiǎn)問(wèn)題、加強(qiáng)平臺(tái)對(duì)借款人的風(fēng)險(xiǎn)評(píng)估對(duì)P2P行業(yè)健康穩(wěn)定、可持續(xù)發(fā)展十分重要。因此,本文將實(shí)證分析借款人的信用違約行為,研究造成借款人信用違約的影響因素,為投資人、政府監(jiān)管部門、網(wǎng)貸平臺(tái)提供參考。
本文將選用Logistic回歸模型,定量研究P2P借款人信用違約風(fēng)險(xiǎn)的影響因素。
1 數(shù)據(jù)預(yù)處理與備選指標(biāo)選取
1.1 數(shù)據(jù)來(lái)源
本文通過(guò)八爪魚(yú)軟件從人人貸網(wǎng)站上抓取2017年3月至2017年7月的1189條“散標(biāo)投資”及“債權(quán)轉(zhuǎn)讓”中真實(shí)借款標(biāo)作為源數(shù)據(jù)。源數(shù)據(jù)包括876條正常數(shù)據(jù)和313條違約數(shù)據(jù),相關(guān)研究經(jīng)驗(yàn)表明,正常客戶是違約客戶的3~5倍時(shí),評(píng)估模型更加有效。因此,按照通行的建立個(gè)人信用評(píng)估模型時(shí)的取樣比例,再?gòu)?76個(gè)正常數(shù)據(jù)中抽取履約客戶414個(gè)、違約客戶115個(gè)構(gòu)成建模樣本。初步收集到的客戶信息有用戶名、年齡、性別、受教育程度、婚姻狀況、工作城市、公司行業(yè)、工作時(shí)間、崗位職位、平均月收入、房產(chǎn)、房貸、車產(chǎn)、車貸、借款用途、借款年利率、借款金額、還款期限、逾期次數(shù)、逾期金額、身份認(rèn)證、學(xué)歷認(rèn)證、信用認(rèn)證、收入認(rèn)證和工作認(rèn)證。
1.2 數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理包括數(shù)據(jù)清理和數(shù)據(jù)轉(zhuǎn)換兩個(gè)步驟。數(shù)據(jù)清理處理數(shù)據(jù)的不一致、不完整,刪除對(duì)信用風(fēng)險(xiǎn)評(píng)估無(wú)意義的變量,提高運(yùn)算效率。文中選取的“人人貸”散標(biāo)投資數(shù)據(jù)對(duì)借款人信息審核比較嚴(yán)格,數(shù)據(jù)完整性較好,因此不需要填補(bǔ)某些空白值,只需刪除用戶名、注冊(cè)時(shí)間等無(wú)關(guān)變量。
數(shù)據(jù)轉(zhuǎn)換是對(duì)于干凈數(shù)據(jù)進(jìn)行增強(qiáng)處理的過(guò)程,這種增強(qiáng)過(guò)程主要是對(duì)樣本數(shù)據(jù)中的變量類型進(jìn)行數(shù)據(jù)規(guī)范化、數(shù)據(jù)離散化、數(shù)據(jù)規(guī)約,以及創(chuàng)建新變量處理。
1.3 解釋變量分組
經(jīng)過(guò)數(shù)據(jù)清洗和數(shù)據(jù)轉(zhuǎn)換,得到相對(duì)干凈的建模樣本,然后對(duì)年齡、性別等解釋變量進(jìn)行分組。分組時(shí)應(yīng)在考慮經(jīng)濟(jì)含義的基礎(chǔ)上,將定性指標(biāo)定量化,便于后續(xù)的數(shù)據(jù)分析。具體指標(biāo)分組見(jiàn)表1。
分類表給出的是回歸模型對(duì)履約(Y=0)和違約(Y=1)兩類借款人的分類準(zhǔn)確率,可以看出,回歸方程對(duì)414個(gè)觀測(cè)值為0(好客戶)的正確預(yù)測(cè)407個(gè),失敗7個(gè),預(yù)測(cè)準(zhǔn)確率為98.3%;回歸方程對(duì)115個(gè)觀測(cè)值為1(好客戶)的正確預(yù)測(cè)109個(gè),失敗6個(gè),預(yù)測(cè)準(zhǔn)確率為94.8%。綜合以上分析,回歸模型對(duì)建模數(shù)據(jù)的總回歸判別準(zhǔn)確率為97.5%。根據(jù)樣本回歸判別準(zhǔn)確率,可以認(rèn)為,所構(gòu)建的借款人信用風(fēng)險(xiǎn)評(píng)估模型預(yù)測(cè)效果較好。
3 結(jié)論與展望
本文選取人人貸平臺(tái)借款人信用風(fēng)險(xiǎn)相關(guān)信息為指標(biāo),利用Logistic回歸模型,得到預(yù)測(cè)效果較好的信用風(fēng)險(xiǎn)評(píng)估模型,最后得到的回歸模型中僅保留了性別、逾期次數(shù)、逾期金額、身份認(rèn)證和學(xué)歷認(rèn)證5個(gè)指標(biāo)。
本文的研究結(jié)論具有較強(qiáng)的現(xiàn)實(shí)意義。在P2P網(wǎng)貸平臺(tái)層面,必須健全借款人和投資人身份認(rèn)證和信息審核機(jī)制;個(gè)人層面,在日常借貸行為中,一定要重視個(gè)人誠(chéng)信和信譽(yù),遵守網(wǎng)貸平臺(tái)規(guī)范,在網(wǎng)貸平臺(tái)中填寫(xiě)真實(shí)、有效的個(gè)人信息;政府層面,亟須建立健全個(gè)人征信系統(tǒng)和P2P網(wǎng)貸平臺(tái)監(jiān)管的法律法規(guī),創(chuàng)造優(yōu)良的投融資環(huán)境。
本文還存在一定的不足。本文中樣本數(shù)據(jù)僅局限于人人貸平臺(tái),未來(lái)可以選用拍拍貸等多個(gè)平臺(tái)數(shù)據(jù)進(jìn)一步研究算法的通用性。
參考文獻(xiàn):
[1] 網(wǎng)貸之家.2017P2P行業(yè)年報(bào)簡(jiǎn)報(bào):?jiǎn)栴}平臺(tái)持續(xù)降低[R].2018.
[2] 陳霄,丁曉裕,王貝芬.民間借貸逾期行為研究——基于P2P網(wǎng)絡(luò)借貸的實(shí)證分析[J].金融論壇,2013,18(11):65-72.
[3] DINH T H T, KLEIMEIER S. A credit scoring model for Vietnam′s retail banking market[J]. International Review of Financial Analysis, 2007, 16(5):471-495.
[4] BARASINSKA N. Does gender affect investors′ appetite for risk? Evidence from peer-to-peer lending[J]. Social Science Electronic Publishing, 2011:112-119.
[5] WANG H, GREINER M, ARONSON J E. People-to-people lending: The emerging e-commerce transformation of a financial market[M]. Berlin: Springer, 2009:182-195.
[6] BAKLOUTI S. Judging borrowers by the company they keep: Friendship networks and information asymmetry in online peer-to-peer lending[J]. Social Science Electronic Publishing, 2013, 59(1):17-35.
[7] 李廣明,諸唯君,周歡.P2P網(wǎng)絡(luò)融資中貸款者欠款特征提取實(shí)證研究[J].商業(yè)時(shí)代,2011(1):41-42,58.
[8] KUMAR S. Bank of One: Empirical Analysis of Peer-to-Peer Financial Marketplaces[C]// Reaching New Heights. Americas Conference on Information Systems, Amcis 2007, Keystone, Colorado, Usa, August. DBLP, 2007:305.