国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

借款描述對(duì)互聯(lián)網(wǎng)金融信用風(fēng)險(xiǎn)的影響研究

2022-11-28 13:14陳為民楊澤俊
關(guān)鍵詞:信用度位數(shù)借款人

陳為民,楊澤俊,陳 依

(湖南科技大學(xué) 商學(xué)院,湖南 湘潭 411201)

一、引言及文獻(xiàn)綜述

隨著互聯(lián)網(wǎng)技術(shù)與金融交易模式的不斷發(fā)展與融合,互聯(lián)網(wǎng)金融因其交易方式便利、準(zhǔn)入門檻低以及無(wú)擔(dān)保抵押等優(yōu)勢(shì)和特點(diǎn)吸引了廣大中小企業(yè)和中低收入群體參與。同時(shí),由于它的投資收益回報(bào)較高,也受到了大量普通投資者的追捧[1]。雖然互聯(lián)網(wǎng)金融發(fā)展迅速,但是問(wèn)題日益增多。

目前國(guó)家正大力加強(qiáng)對(duì)互聯(lián)網(wǎng)金融市場(chǎng)的監(jiān)管和整改,至2020年助貸業(yè)務(wù)的監(jiān)管法規(guī)已落地。面對(duì)日趨嚴(yán)格的金融監(jiān)管、股市波動(dòng)以及市場(chǎng)流動(dòng)資金緊張的環(huán)境,平臺(tái)運(yùn)營(yíng)開銷與合規(guī)成本持續(xù)上升,借款人的逾期率不斷上升,造成很多平臺(tái)運(yùn)營(yíng)不良,相繼倒閉。顯然國(guó)內(nèi)互聯(lián)網(wǎng)金融的運(yùn)營(yíng)在信用風(fēng)險(xiǎn)內(nèi)控方面有著不可忽視的漏洞。

在借貸平臺(tái)交易過(guò)程中,借貸雙方信息不對(duì)稱的現(xiàn)象十分明顯。貸款人的交易操作是十分透明的,而借款人可以通過(guò)編造虛假的借款描述來(lái)迷惑貸款人,使得貸款人對(duì)其進(jìn)行投資,且貸款人只能看到一個(gè)經(jīng)過(guò)平臺(tái)加工處理后的綜合指標(biāo)——信用評(píng)級(jí)[2]。正是這種信息不對(duì)稱導(dǎo)致了貸款人面臨極高的風(fēng)險(xiǎn)。平臺(tái)及投資人會(huì)偏向于非客觀的、未經(jīng)信用機(jī)構(gòu)證實(shí)的自述文本表露材料[3],即使網(wǎng)絡(luò)借貸中的借款描述難以驗(yàn)證其真?zhèn)蝃4]。因此深入研究分析借款描述對(duì)網(wǎng)貸信用風(fēng)險(xiǎn)的影響,對(duì)于減少信息不對(duì)稱、降低貸款人貸款風(fēng)險(xiǎn)及完善借貸平臺(tái)的建設(shè)有著重要的意義。由此,如何采取有效的方法來(lái)判別借款描述的真實(shí)性及文本信息怎樣影響借款人的信用風(fēng)險(xiǎn),有著極大的研究?jī)r(jià)值。

對(duì)于借款描述的研究,大多數(shù)學(xué)者認(rèn)為借款描述是一種主觀性強(qiáng)的非結(jié)構(gòu)化數(shù)據(jù),對(duì)借貸成功率有著極大的影響[5],特別是自身的“硬信息”難以助力個(gè)人的交易活動(dòng)進(jìn)行開展時(shí)[6],借款人通過(guò)借款描述展現(xiàn)出自我認(rèn)知水平和其社會(huì)地位[7,8]。有些學(xué)者認(rèn)為信用風(fēng)險(xiǎn)是網(wǎng)絡(luò)借貸中貸款人最擔(dān)心的風(fēng)險(xiǎn)[9]。網(wǎng)絡(luò)借貸平臺(tái)內(nèi)的部分借款人自發(fā)披露的個(gè)體特征信息有限。由于信息不對(duì)稱,投資者仍然會(huì)通過(guò)審查借款描述來(lái)獲得更有效的信息[10],盡管人們認(rèn)為未經(jīng)證實(shí)的信息是不可信的[11]。但是已有研究對(duì)互聯(lián)網(wǎng)金融信用風(fēng)險(xiǎn)的探討主要集中于借款描述本身,較難全面反映借款描述中的不同主題潛在的含義對(duì)違約帶來(lái)的不同影響,通過(guò)潛在語(yǔ)義分析(LSA)挖掘借款描述潛在的信息,無(wú)須人為操作,即可消除同義詞、多義詞的影響,確定適當(dāng)主題及主題個(gè)數(shù),能夠更準(zhǔn)確、全面地對(duì)借款違約率的影響因素進(jìn)行研究。同時(shí),對(duì)互聯(lián)網(wǎng)金融信用風(fēng)險(xiǎn)的研究主要側(cè)重于對(duì)借款違約率的均值回歸,較難反映在不同水平下借款描述中的不同主題給違約帶來(lái)的不同影響,而分位數(shù)回歸能夠表示解釋變量對(duì)不同分位數(shù)下的被解釋變量的不同影響[12],且分位數(shù)回歸的方法在所有的分位點(diǎn)條件下都能體現(xiàn)出較好的擬合性,得出的結(jié)果更加穩(wěn)健[13]。因此本文選擇分位數(shù)回歸的方法,以借款人的違約狀況為因變量,分析不同信用度的人群在進(jìn)行借款描述時(shí)更偏好哪種描述。

二、研究方法

(一)研究思路

現(xiàn)有的研究表明,投資者在選擇大量信息時(shí),集中力和判斷力都有限,再加上對(duì)詞語(yǔ)十分敏感,而且時(shí)常僅側(cè)重于“關(guān)鍵詞”。經(jīng)過(guò)闡述借款描述在網(wǎng)貸行為里怎樣起到相應(yīng)的影響效用,不僅能夠降低借貸行為雙方間的信息不對(duì)稱性,提升借貸的成交量和成功還款量,而且能夠防范信用評(píng)級(jí)處于高層次的不良借款人群,以便提升該平臺(tái)的風(fēng)險(xiǎn)管控能力水平,最終提高該平臺(tái)的收益率。

利用Python爬蟲程序獲取網(wǎng)絡(luò)借貸平臺(tái)的成交記錄以及借款人個(gè)人信息。采用 Python 工具對(duì)借貸平臺(tái)借款描述中的內(nèi)容進(jìn)行大量文本機(jī)器分析,先對(duì)借款描述進(jìn)行文本分詞,再利用主題模型應(yīng)用包Gensim對(duì)借款描述進(jìn)行LSA文本內(nèi)容歸類,提取文本中包含的因素,分析哪些因素會(huì)影響借款人最后的違約率,并研究借款描述中的主題分布情況,根據(jù)研究結(jié)果幫助平臺(tái)識(shí)別基于文本描述的借款人的信用風(fēng)險(xiǎn)。

利用分位數(shù)回歸分析借款描述中包含的幾個(gè)主題分別對(duì)違約情況有何影響,分析借款人的信用風(fēng)險(xiǎn),明確有哪些文本因素能夠影響借款人信用風(fēng)險(xiǎn),基于文本挖掘剖析借貸信用風(fēng)險(xiǎn),提前判斷借款人按時(shí)還款的概率,最大限度地維護(hù)投資人的利益,也為平臺(tái)后續(xù)的良好發(fā)展?fàn)I造一個(gè)良好的信用環(huán)境。

(二)潛在語(yǔ)義分析

傳統(tǒng)的基于關(guān)鍵字的文本處理方法難以辨別自然語(yǔ)言的語(yǔ)義模糊性,其主要依據(jù)詞頻信息來(lái)判斷兩個(gè)文檔是否相似,相似度主要取決于兩個(gè)文檔中包含的共同詞匯量。而潛在語(yǔ)義分析(LSA)能夠利用統(tǒng)計(jì)方法,提取并且量化這些潛在的語(yǔ)義結(jié)構(gòu),從而消除同義詞、多義詞的影響,提高文本表示的準(zhǔn)確性[14]。

潛在語(yǔ)義分析的目的是整理文本語(yǔ)句,其利用“矢量語(yǔ)義空間”來(lái)歸納文檔和詞中的“概念”,從而歸納詞句和文檔的包含關(guān)系[15]。

LSA主題模型的首要作用是效仿文本的導(dǎo)出步驟,通過(guò)前驗(yàn)分布與多次迭代來(lái)計(jì)算得到主題的系數(shù)及后驗(yàn)概率,推導(dǎo)得出長(zhǎng)文本的潛在文本內(nèi)容歸類[16]。運(yùn)用LSA模型對(duì)借款描述中的文本進(jìn)行主題聚類。

LSA的實(shí)施步驟:(1)導(dǎo)出詞匯庫(kù),(2)導(dǎo)出詞語(yǔ)——文檔矩陣,(3)奇異值分解。

(三)分位數(shù)回歸

為研究網(wǎng)絡(luò)借款描述信息在不同分位數(shù)下違約情況的變化,以確定文本信息在借貸過(guò)程中的信用風(fēng)險(xiǎn)影響,為P2P網(wǎng)絡(luò)借貸平臺(tái)以及投資者進(jìn)行理性決策提供參考。由于研究的因變量為二元變量,因此利用二元分位數(shù)回歸研究借款描述信息對(duì)借款人的信用風(fēng)險(xiǎn)相關(guān)性。

設(shè)第i個(gè)樣本的觀測(cè)值為(x1i,x2i,…,xki,yi),i=1,2,…,n,其中xi=(x1i,x2i,…,xki)T,當(dāng)因變量為0,1時(shí),二元分位數(shù)回歸模型表示為

(1)

(2)

三、實(shí)證分析

(一)研究樣本

在人人貸平臺(tái),借貸雙方需要對(duì)一些信息進(jìn)行填寫,如表1所示。首先,借款人在借貸平臺(tái)官方網(wǎng)站注冊(cè)賬號(hào)后,必須完善個(gè)人基本信息,借款人要補(bǔ)充好“個(gè)人資料”“工作資料”“身份證資料”“收入資料”“信用評(píng)分”等資料。在個(gè)人資料表欄中,“借款描述”是極其特殊的部分。在P2P網(wǎng)貸行為過(guò)程中,借貸平臺(tái)為了促進(jìn)借款人和投資者雙方產(chǎn)生借貸關(guān)系,給借款人提供了在發(fā)布貸款申請(qǐng)時(shí)展示更多額外信息的一個(gè)渠道——借款描述。借款人可以通過(guò)借款描述披露任何自己想展示給投資者的信息。

表1 借貸平臺(tái)信用認(rèn)證體系

先利用爬蟲軟件分析了借貸平臺(tái)2016年6月至2018年8月共323190位申請(qǐng)貸款者的個(gè)人信息。再篩選出 2016年6月至2018年8月時(shí)間段中借貸平臺(tái)官網(wǎng)給出的所有借款人的借款信息為初始數(shù)據(jù),初始數(shù)據(jù)總共包括259622個(gè)觀測(cè)對(duì)象,篩選出的樣本其借款狀態(tài)都是已完成的。然后對(duì)初始數(shù)據(jù)采取以下四個(gè)處理步驟:

(1)刪除資料不完整 (例如房車認(rèn)證、信用報(bào)告等信息) 的 31621個(gè)樣本數(shù)據(jù)。

(2)刪除無(wú)實(shí)際內(nèi)容的數(shù)據(jù)(如文本信息為“阿阿阿阿阿”“無(wú)”或未填寫等)的98368個(gè)樣本數(shù)據(jù)。

(3)由于經(jīng)過(guò)實(shí)地?fù)?dān)保與機(jī)構(gòu)認(rèn)證的借款人的違約率幾乎為0,故將這部分樣本刪除。此處刪除63271個(gè)樣本數(shù)據(jù)。

(4)有一部分借款人為了提高自己的借款可能性,會(huì)在同一期間在借款平臺(tái)上申請(qǐng)多個(gè)借款,而這些數(shù)據(jù)都是完全相同的。在對(duì)比時(shí)發(fā)現(xiàn)其借款描述也大多都是完全相同的,共刪掉65980個(gè)對(duì)象值。

綜上,研究對(duì)象篩選得到382個(gè)包含有效文本的交易樣本量。其中包括191條違約數(shù)據(jù),191條未違約數(shù)據(jù)。研究變量定義見表2。

表2 變量定義表

(二)詞云圖

通過(guò)Python語(yǔ)言內(nèi)的漢語(yǔ)拆句分詞——“Jieba”插件包,機(jī)器過(guò)濾借款描述內(nèi)的標(biāo)點(diǎn)符號(hào),并過(guò)濾掉無(wú)意義的詞語(yǔ),對(duì)文本信息進(jìn)行關(guān)鍵詞調(diào)取、漢語(yǔ)分詞,最后篩選掉網(wǎng)絡(luò)上常用的停用詞,把常用次數(shù)較多的排名靠前的60個(gè)主題詞導(dǎo)出生成詞云圖,如圖1所示。

由圖1可以看出,使用頻率最高、最具有代表性的詞是“借款”“工作”“裝修”等,表明其為文本中使用次數(shù)最多的詞語(yǔ);“經(jīng)營(yíng)”“收入”,表明借款是與經(jīng)營(yíng)有關(guān)的活動(dòng);“收入”“穩(wěn)定”“每月”等詞體現(xiàn)了文本中同時(shí)傾向于重點(diǎn)突出借款人個(gè)人的財(cái)產(chǎn)狀況及營(yíng)收的穩(wěn)定來(lái)源。與此同時(shí),在出現(xiàn)次數(shù)較多的前50個(gè)高頻詞語(yǔ)中,還涉及了許多文本主題,例如借款目的(“裝修”“購(gòu)車”“消費(fèi)”等)、情感表達(dá)(“謝謝”“希望”等)、從事行業(yè)(“事業(yè)單位”“在編”“教師”等)、擁有資產(chǎn)(“自建房”“房屋”等)。

圖1 借款描述詞云圖

(三)確定文本主題個(gè)數(shù)

通過(guò)LSA主題模型,從全部文檔的文本數(shù)據(jù)中提取出k個(gè)適當(dāng)?shù)闹黝},連貫性得分值如圖2所示。

圖2 連貫性得分值

圖2中,橫軸表示不同的主題數(shù),縱軸表示連貫性得分。可以看出,當(dāng)主題數(shù)為7時(shí),其連貫性得分值最高,效果最顯著,因此選取最佳主題數(shù)是7。

根據(jù)文本挖掘結(jié)果,借款描述可歸納為“借款目的”“情感表達(dá)”“個(gè)人信用”“家庭背景”“財(cái)務(wù)情況”“從事行業(yè)”“表述模糊”七大類。其中第七類比較特殊,這類借款描述大多沒有具體突出主題且含義模糊,原因可能是借款人在填寫時(shí)并未認(rèn)真對(duì)待,借款人僅僅表述了“有借有還”“打卡”“試一試”等,甚至為了湊字?jǐn)?shù)填寫了無(wú)含義的文字,所以將此類借款描述歸為“表述模糊”,不進(jìn)一步研究。

例如文本為“在借貸平臺(tái)借過(guò)兩次款了,無(wú)逾期,本人在國(guó)企工作,收入穩(wěn)定,此次借款用于參加在職研究生培訓(xùn)及考試”,其中涉及X1(從事行業(yè))和X3(借款目的)以及X6(個(gè)人信用),取X1=1,X2=0,X3=1,X4=0,X5=0,X6=1。

(四)各類主題對(duì)違約率的影響

利用R語(yǔ)言中的bayesQR包實(shí)現(xiàn)二元分位數(shù)回歸模型,將上文遴選出的七類指標(biāo)作為自變量,深入分析不同文本指標(biāo)對(duì)借款人的違約狀況在不同分位點(diǎn)上的影響差異。為更加直觀和全面地反映出違約情況不同的借款人,其影響因素之間的差異及變化過(guò)程,本文將選取0.1~0.9之間,間隔0.05共17個(gè)分位點(diǎn)進(jìn)行實(shí)證分析。二元分位數(shù)回歸部分結(jié)果如表3所示。由于因變量為違約情況,當(dāng)違約時(shí),分位數(shù)系數(shù)為正,說(shuō)明自變量與違約情況具有正相關(guān)性,即此類借款人信用評(píng)估較差。當(dāng)未違約時(shí),分位數(shù)系數(shù)為負(fù),說(shuō)明自變量與違約情況具有負(fù)相關(guān)性,即此類借款人風(fēng)險(xiǎn)信用評(píng)估較好。

由表3可知,當(dāng)分位點(diǎn)水平取0.1~0.9時(shí),所有X1~X6的系數(shù)值均產(chǎn)生了十分明顯的波動(dòng),因此結(jié)合數(shù)據(jù)做出如下分析。

表3 二元分位數(shù)回歸結(jié)果

X1變量指代從事行業(yè),如圖3(a)所示,在分位數(shù)為0.1的水平下,可以計(jì)算得出其與違約情況呈負(fù)相關(guān),即說(shuō)明信用最好的前10%的人群,在文本描述中,會(huì)表明自己所從事的行業(yè)。原因在于信用最好的前10%部分借款人,通過(guò)詳細(xì)地介紹自己所從事的行業(yè),向平臺(tái)及投資者展示一個(gè)工作特征明顯的個(gè)人形象,以此來(lái)完善自己的個(gè)人信息。而一般傾向于描述個(gè)人從事行業(yè)的借款人,大多有較好的工作單位。這也說(shuō)明了這類人具有可以按時(shí)還款的個(gè)人能力,從而有助于取得投資人的信任。因此文本描述中的從事行業(yè)對(duì)于信用度最好的前10%人群,具有信用風(fēng)險(xiǎn)參考作用。

X2變量指代情感表達(dá),如圖3(b)所示,分位數(shù)系數(shù)均小于0,說(shuō)明情感表達(dá)與違約情況為負(fù)相關(guān),即表明當(dāng)文本中涵蓋情感表達(dá)這一變量時(shí),借款人的信用度相較更好。盡管在兩端分位數(shù)處系數(shù)并不顯著,但在分位點(diǎn)取中間部分0.3~0.8時(shí),即信用度處于中間段位的借款人中,描述情感表達(dá)的力度相比于其他分位點(diǎn)來(lái)說(shuō)更大,因此,處于這段區(qū)間的借款人更值得相信,其違約率更低、信用度更好。造成這種現(xiàn)象的原因可能是處于信用度中間段位的人沒有很高的信用評(píng)分來(lái)幫助自己獲取貸款,也沒有很低的信用評(píng)分來(lái)阻礙借款行為,因而采用真誠(chéng)的語(yǔ)言來(lái)打動(dòng)平臺(tái)。而對(duì)于在困難時(shí)期被施予援手的人,會(huì)維持自己良好的信用,從而按時(shí)還款??梢钥闯銮楦袘B(tài)度積極且真誠(chéng)的借款人,其誠(chéng)信度更良好。借款人表達(dá)情感態(tài)度更能說(shuō)明他態(tài)度誠(chéng)懇,急需幫助。綜合來(lái)說(shuō),情感表達(dá)整體與信用評(píng)估呈正相關(guān)關(guān)系。

圖3 從事行業(yè)、情感表達(dá)系數(shù)變化趨勢(shì)圖

X3變量指代借款目的,如圖4(a) 所示,在分位點(diǎn)取0.1時(shí),其系數(shù)絕對(duì)值達(dá)到最大,說(shuō)明在信用度為前10%的人群中,借款目的對(duì)此類借款人影響力度最大,原因可能是這部分信用度處于10%的借款人,描述借款目的可說(shuō)明其對(duì)個(gè)人借貸行為有明顯的規(guī)劃性,從而體現(xiàn)其是具有一定還款能力的社會(huì)工作者。借款目的中大部分是用于資金周轉(zhuǎn)、創(chuàng)業(yè)、投資等,此類借款人自身?yè)碛幸欢ㄎ镔|(zhì)財(cái)富基礎(chǔ)。與此同時(shí),借款用來(lái)投資創(chuàng)業(yè)的這類借款人往往都有長(zhǎng)期性資金需要,他們需要及時(shí)還款以維持自己的高信用度,持續(xù)性的及時(shí)還款也會(huì)增加該類借款人對(duì)網(wǎng)貸平臺(tái)的信譽(yù)評(píng)分,因而也促使平臺(tái)能夠長(zhǎng)久地認(rèn)可這類交易。然而從整體上來(lái)看,隨著分位點(diǎn)增大,其分位數(shù)系數(shù)呈增大的趨勢(shì),其顯著效果并不明顯,可能原因是借款目的中除了大部分為資金周轉(zhuǎn)、投資,等等,也有小部分目的是消費(fèi)等,描述此類借款目的的借款人可能還款能力弱,從而拉低了借款目的對(duì)信用風(fēng)險(xiǎn)的影響力度。

X4變量指代家庭背景,如圖4(b) 所示,不同分位點(diǎn)下對(duì)借款違約的影響系數(shù)總體類似“U”形,體現(xiàn)出明顯的異質(zhì)性。家庭背景指標(biāo)對(duì)應(yīng)的各個(gè)分位點(diǎn)上的回歸系數(shù)先減小后增加,這意味著在違約率較高和較低的人群中,描述家庭背景的文本會(huì)增大個(gè)人的違約率。盡管在中間段位的分位數(shù)處系數(shù)并不顯著,但在兩端的分位點(diǎn)處,尤其在分位數(shù)取0.1及0.9時(shí),分別是前半部分和后半部分的最大值,參數(shù)估計(jì)表明家庭背景描述在信用評(píng)估最好和最差的借款人中,會(huì)顯著增大違約率。原因可能在于信用最好的人群,不會(huì)提及自己的家庭情況,而信用最差的部分人群更偏好講述自己的父母、愛人的收入職業(yè)等情況,來(lái)贏得平臺(tái)的信任。在描述家庭背景時(shí),相當(dāng)一部分是講述自己親人的良好工作單位及收入,來(lái)塑造一個(gè)可以按時(shí)還貸的形象,然而這一信息很難得到確認(rèn),因此,信用最差的人群利用這一點(diǎn)來(lái)提升自己借款成功率,并給平臺(tái)造成違約損失。綜上,可以得出家庭背景對(duì)于信用處于最好和最差水平的人群影響力度最大,平臺(tái)應(yīng)該加強(qiáng)處于該部分信用層次的借款人的家庭背景審核。

圖4 借款目的、家庭背景系數(shù)變化趨勢(shì)圖

如圖5(a)所示,對(duì)于X5這一反映財(cái)務(wù)情況的自變量中,不同分位點(diǎn)下對(duì)借款違約的影響系數(shù)總體類似“U”形。由圖中分位數(shù)回歸系數(shù)變化可以知道X5與違約情況呈現(xiàn)兩端高中間趨于平緩的特點(diǎn),這說(shuō)明財(cái)務(wù)情況在信用最差的人群中相關(guān)性特征最明顯,其次是在信用最好的人群中相關(guān)性特征次明顯。對(duì)于信用最好的人群,他們?cè)谖谋久枋鲋胁粫?huì)提及個(gè)人財(cái)務(wù)情況,原因可能是在硬信息中,財(cái)務(wù)情況屬于必填寫項(xiàng),并且必填寫項(xiàng)需要得到平臺(tái)的審核,必須如實(shí)填寫,信用最好的借款人因此并未再次提及財(cái)務(wù)情況。而信用最差的部分人群,同樣已經(jīng)在平臺(tái)上填寫了財(cái)務(wù)狀況,但從心理學(xué)的過(guò)度補(bǔ)償機(jī)制來(lái)看,很可能會(huì)在文本描述里刻意描述平臺(tái)難以核實(shí)的財(cái)務(wù)狀況。一方面可能有作假的嫌疑,另一方面有特意強(qiáng)調(diào)的可能,這說(shuō)明借款人想要刻意增加自己的信任度,來(lái)獲得貸款,從而導(dǎo)致其違約率也更高。平臺(tái)可以重點(diǎn)關(guān)注文本描述中財(cái)務(wù)情況這一特征變量。當(dāng)分位點(diǎn)為0.9時(shí),分位數(shù)系數(shù)最大,為0.1時(shí)次之,即信用度為前10%的借款人不會(huì)描述自己的財(cái)務(wù)情況,在0.9分位點(diǎn)上的信用度差的人群中,也會(huì)隨著財(cái)務(wù)情況的描述越多,其違約率越大,在較高分位點(diǎn)上則增加了其違約可能性。

X6為個(gè)人信用變量,其分位數(shù)系數(shù)如圖5(b)所示,呈現(xiàn)出倒“U”形的特點(diǎn),在分位數(shù)兩端系數(shù)取極值,在分位點(diǎn)為0.1以及0.9左右時(shí)最小,系數(shù)值為負(fù)且呈先增大后減小的趨勢(shì),分位數(shù)系數(shù)在后半段,顯著性最明顯,表明個(gè)人信用對(duì)違約率低、信用度為前10%以及信用度為后10%的借款人,影響力度最大,即當(dāng)信用度為前10%的借款人的文本描述中包含個(gè)人信用時(shí),會(huì)增加其信用評(píng)分;當(dāng)信用度為后10%的借款人的文本描述中不包含個(gè)人信用時(shí),會(huì)增加其信用評(píng)分。由圖5(b)中折線的變化可以看出,隨著分位點(diǎn)不斷增大,其回歸系數(shù)先增大后減小,可能是信用度高的借款人,會(huì)表明自己的信用良好,易獲得平臺(tái)的信任,而信用度低的借款人擾亂了互聯(lián)網(wǎng)金融市場(chǎng)的有序運(yùn)轉(zhuǎn),嚴(yán)重阻礙了信貸市場(chǎng)的發(fā)展。因此,當(dāng)文本中涉及“本人信譽(yù)良好”“無(wú)不良記錄”此類關(guān)鍵詞句時(shí),可以增強(qiáng)該借款人的誠(chéng)信可靠度。平臺(tái)可以重點(diǎn)關(guān)注文本描述中個(gè)人信用這一特征變量。

圖5 財(cái)務(wù)情況、個(gè)人信用變量系數(shù)變化趨勢(shì)圖

四、結(jié)論與建議

通過(guò)分析借款描述的文本信息和分位數(shù)回歸,主要的研究結(jié)論有:

(1)借款描述能夠?yàn)樵u(píng)判網(wǎng)貸信用風(fēng)險(xiǎn)提供一定程度的貢獻(xiàn)。借款描述中有關(guān)情感表達(dá)、個(gè)人信用和借款目的的描述與違約情況負(fù)相關(guān),其信用評(píng)估良好。有關(guān)財(cái)務(wù)情況的描述與違約情況正相關(guān),此類人信用評(píng)估較差。

(2)通過(guò)二元分位數(shù)回歸實(shí)證分析,得出不同分位數(shù)下借款描述對(duì)P2P網(wǎng)貸信用風(fēng)險(xiǎn)具有不同的影響效果。研究得出,網(wǎng)貸平臺(tái)中信用度為前10%人群,傾向于在文本中描述其從事行業(yè)、個(gè)人信用及借款目的并且不涉及其家庭背景和財(cái)務(wù)情況因素。

根據(jù)研究結(jié)果,建議借款人和平臺(tái)方在已有信用評(píng)估指標(biāo)的基礎(chǔ)上關(guān)注借款描述,尤其是關(guān)于財(cái)務(wù)狀況和家庭背景的描述,平臺(tái)方應(yīng)加強(qiáng)對(duì)描述內(nèi)容的審核。借款描述是一種信息披露形式,監(jiān)管方可以要求平臺(tái)盡可能披露這些非結(jié)構(gòu)化數(shù)據(jù),供投資者參考。

猜你喜歡
信用度位數(shù)借款人
分 析
五次完全冪的少位數(shù)三進(jìn)制展開
鄉(xiāng)城流動(dòng)借款人信用風(fēng)險(xiǎn)與空間收入差異決定
基于AHP和k-means算法的電力用戶信用度評(píng)價(jià)
小微企業(yè)借款人
基于聲譽(yù)的C2C電子商務(wù)信用評(píng)價(jià)模型研究
商業(yè)銀行對(duì)借貸人貸后監(jiān)控與風(fēng)險(xiǎn)治理
影響P2P借貸成功率的借款人信息要素研究
遙感衛(wèi)星CCD相機(jī)量化位數(shù)的選擇
“判斷整數(shù)的位數(shù)”的算法分析
德州市| 盐津县| 长子县| 东阿县| 珲春市| 怀来县| 云南省| 扬中市| 甘孜| 颍上县| 余庆县| 怀仁县| 宁都县| 湖口县| 荥经县| 西畴县| 广宗县| 定州市| 和硕县| 宝坻区| 达拉特旗| 白银市| 苗栗市| 咸宁市| 尚志市| 韩城市| 永州市| 许昌县| 芜湖市| 白水县| 寻乌县| 西贡区| 咸丰县| 久治县| 根河市| 清新县| 舟曲县| 新竹县| 玉龙| 思茅市| 南陵县|