国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

互聯(lián)網(wǎng)征信的影響因素分析

2020-04-23 13:10林翠波李偉強(qiáng)
福建茶葉 2020年2期
關(guān)鍵詞:指標(biāo)值閾值曲線

林翠波,李偉強(qiáng)

(廣西師范大學(xué)數(shù)學(xué)與統(tǒng)計學(xué)院,廣西桂林 541006)

1 引言

近年來,隨著互聯(lián)網(wǎng)的發(fā)展,互聯(lián)網(wǎng)金融的個人消費信貸的領(lǐng)域得到快速發(fā)展,這不僅給金融機(jī)構(gòu)帶來利益,同時也增加了貸款風(fēng)險。因此,如何根據(jù)用戶的信息進(jìn)行分析,為金融機(jī)構(gòu)提供決策和建議,更加有效地應(yīng)對風(fēng)險,是非常具有價值的。但是,目前征信采集對象占總?cè)丝诒戎剌^小,且數(shù)據(jù)難以共享,引發(fā)了一系列的問題,只有成立百行征信才能更好解決。據(jù)統(tǒng)計,我國個人消費信貸的增長率每年高達(dá)20%,預(yù)估2019年個人消費信貸規(guī)模將突破41.1萬億元[1]。同時,金融機(jī)構(gòu)面臨的個人信用風(fēng)險將隨之增加,信用評分模型顯得更重要。

國內(nèi)對征信的研究很多,陳純等人基于螞蟻花唄消費信貸產(chǎn)品對大學(xué)生進(jìn)行調(diào)查,為提高大學(xué)生風(fēng)險防范等提供建議[2]。王夢佳基于Logistic回歸對P2P網(wǎng)貸平臺借款人信用的風(fēng)險進(jìn)行評估[3]。本文計劃用Logistic回歸模型嘗試對互聯(lián)網(wǎng)征信的影響因素進(jìn)行分析。

2 理論知識

Logistic回歸函數(shù)應(yīng)限制在[0,1]區(qū)間,所以要進(jìn)行變換。Logistic分布函數(shù):行邏輯變換得到模型

3 實證分析

3.1 數(shù)據(jù)說明

本文所使用的數(shù)據(jù)為用戶征信相關(guān)的數(shù)據(jù),共1000條記錄。數(shù)據(jù)一共包含9個變量。其中,因變量為“是否按期還款”,且0表示“違約”,1表示“未違約”,其余的均為自變量,為了初步探究自變量對因變量的影響,下面對自變量進(jìn)行分析:

基本信息包括性別、婚姻情況和生育情況。其中,女性違約占比31.8%,男性違約占比34.8%,性別對是否違約無顯著影響;已婚用戶違約率29.2%較低,而未婚用戶37.4%較高;已育用戶違約率29.5%較低,而未育用戶36.9%較高。

學(xué)習(xí)能力包括教育水平和英語水平。其中,教育水平劃分為“高中及以下”“大?;虮究啤薄按T士研究生”“博士研究生及以上”,其違約率分別為39.6%、39.4%、28.8%、15.2%,顯然學(xué)歷高的違約率最低,而學(xué)歷低的違約率最高,這與我們的推測一致;英語等級劃分為“四級以下”“四級”“六級”“六級以上”,其違約率分別為43.3%、37.4%、27.2%、21.1%,英語等級較高的違約率較低,等級低的違約率較高??傊瑢W(xué)習(xí)能力對客戶違約率的影響較為顯著。

其他方面有社交人脈、收入水平和消費理念。其中,社交人脈用微博好友數(shù)度量,均值較高的違約率也高,而均值較低的違約率也低。未違約的用戶收入均值為24309.27較高,相比之下,違約用戶的收入均值為16019.68較低??梢?,收入水平對客戶的違約率有顯著的影響,收入水平越高,違約率越低;消費理念=信用卡消費/總消費,消費理念整體呈右偏分布,大多數(shù)用戶的消費理念在0.125左右,當(dāng)客戶越傾向于超前負(fù)債消費時指標(biāo)值越高,違約群體的消費理念指標(biāo)值明顯高于履約群體。

3.2 統(tǒng)計模型

3.2.1 回歸結(jié)果

本文以“是否按期還款”作為因變量,其他變量作為自變量,建立logistic回歸模型。首先對模型進(jìn)行顯著性檢驗,結(jié)果顯示,Pr(>Chi)值為2.2e-16,即該模型在,0.00的顯著性水平下高度顯著,而且擬合程度較好。然后,建立AIC、BIC回歸模型,如表3-1所示。

表3-1 AIC回歸模型和BIC回歸模型結(jié)果

由表3-1知:在α=0.05下,AIC模型保留8個變量,而BIC模型只保留5個變量。AIC模型和BIC模型在變量選擇和回歸系數(shù)的估計上都存在差異,該保留哪一個模型?下面分析。

3.2.2 模型選擇

為比較全模型,AIC模型和BIC模型,分別繪制其ROC曲線。

圖3-1 三個模型的ROC曲線

如圖3-1所示,全模型和AIC模型的ROC曲線很接近,而BIC模型的ROC曲線靠下。綜合考慮后,選擇AIC模型。

3.2.3 模型解讀

由表3-1知,在固定其它量,α=0.05下對模型解讀:

(1)收入、女性、已婚、已育的回歸系數(shù)為正,表明這些用戶按期還款率大;

(2)微博好友數(shù)、消費理念的回歸系數(shù)為負(fù),表明這些用戶的相應(yīng)指標(biāo)越大按期還款率越??;

(3)用戶按期還款率隨著學(xué)歷、英語水平遞增而遞增。

3.2.4 模型預(yù)測與精度評價

使用0-1回歸模型可以預(yù)測違約率,進(jìn)而判斷是否會違約。當(dāng)預(yù)測概率大于等于最佳閾值時,預(yù)測為違約,小于最佳閾值時,預(yù)測為未違約。對于不同的閾值,預(yù)測的準(zhǔn)確率也不同,因此需要選取一個最佳的閾值。

圖3-2 AIC模型的ROC曲線及最佳閾值

圖3-2給出了AIC模型的ROC曲線及最佳閾值,其橫縱軸分別為特異度和靈敏度。同時我們得到的AUC取值為0.679,即最佳的閾值為0.679。

3.3 商業(yè)化結(jié)果

圖3-3為全部樣本預(yù)測的按期還款率,據(jù)預(yù)測值將用戶分為5個等級,計算每一級用戶的平均按期還款率,第一列為前20%的用戶預(yù)測為88%,其余以此類推。

圖3-3 不同客戶的實際還款概率

4 結(jié)論與建議

本文對征信數(shù)據(jù)進(jìn)行分析,得到以下結(jié)論:

用戶的基本信息、收入水平、學(xué)歷、社交人脈和消費理念這5個方面都會對是否按期還款有顯著的影響。金融機(jī)構(gòu)可以通過分析客戶的這些指標(biāo)值將客戶進(jìn)行分類,進(jìn)而考慮是否為其提供借貸服務(wù)。為了進(jìn)一步分析客戶履約的影響因素,還可以加入更多指標(biāo)。比如用戶的職業(yè)、固定資產(chǎn)等。

猜你喜歡
指標(biāo)值閾值曲線
未來訪談:出版的第二增長曲線在哪里?
土石壩壩體失穩(wěn)破壞降水閾值的確定方法
基于小波變換閾值去噪算法的改進(jìn)
寧波北侖第三集裝箱碼頭有限公司平衡計分卡績效管理探索與實踐
采用紅細(xì)胞沉降率和C-反應(yīng)蛋白作為假體周圍感染的閾值
幸福曲線
財政支出績效評價指標(biāo)體系構(gòu)建及應(yīng)用研究
淺談食品中大腸菌群檢測方法以及指標(biāo)值的對應(yīng)關(guān)系
遼寧強(qiáng)對流天氣物理量閾值探索統(tǒng)計分析
夢寐以求的S曲線
巩义市| 贡山| 元氏县| 福清市| 高邑县| 钦州市| 绥滨县| 岚皋县| 南安市| 赤壁市| 望都县| 乳山市| 那坡县| 堆龙德庆县| 进贤县| 雷州市| 德昌县| 科尔| 弥渡县| 北碚区| 鄯善县| 乾安县| 鄂托克前旗| 巩义市| 讷河市| 军事| 南丹县| 石台县| 澎湖县| 忻城县| 柯坪县| 余姚市| 华宁县| 金湖县| 县级市| 南召县| 盐津县| 芒康县| 大理市| 新丰县| 井研县|