国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)發(fā)現(xiàn)銀行貸款風(fēng)險(xiǎn)

2015-03-17 02:10:24曾偉,孔新川,陳威
大數(shù)據(jù) 2015年2期
關(guān)鍵詞:貸款客戶

大數(shù)據(jù)發(fā)現(xiàn)銀行貸款風(fēng)險(xiǎn)

Uncovering the Risk in Bank Loans by Big Data

曾偉,男,電子科技大學(xué)副教授,研究內(nèi)容包括機(jī)器學(xué)習(xí)、推薦系統(tǒng)、鏈路預(yù)測、國家進(jìn)出口貿(mào)易等。發(fā)表學(xué)術(shù)論文14篇,以第一作者發(fā)表學(xué)術(shù)論文10篇,其中6篇SCI檢索論文和4篇國際會議論文。主持兩項(xiàng)國際項(xiàng)目(Sino Swiss Science and Technology Cooperation No.EG57-092011和No.TE-70382)和一項(xiàng)國內(nèi)項(xiàng)目(優(yōu)秀博士生學(xué)術(shù)支持計(jì)劃No.YBXSZC2013029),參與多個(gè)國家科學(xué)自然基金項(xiàng)目。

孔新川,男,浙江大學(xué)經(jīng)濟(jì)學(xué)碩士,杭州邁寧數(shù)據(jù)科技有限公司創(chuàng)始人、CEO,擁有多年的企業(yè)管理及TMT領(lǐng)域投資經(jīng)驗(yàn),對傳統(tǒng)金融機(jī)構(gòu)貸后管理有深刻的理解和認(rèn)識。

陳威,男,電子科技大學(xué)互聯(lián)網(wǎng)科學(xué)中心碩士生,主要研究方向?yàn)橥扑]系統(tǒng)、數(shù)據(jù)挖掘及流行性預(yù)測等。

周濤,男,電子科技大學(xué)大數(shù)據(jù)研究中心主任、教授、博士生導(dǎo)師,主要關(guān)注統(tǒng)計(jì)物理與信息科學(xué)、社會學(xué)、經(jīng)濟(jì)學(xué)等領(lǐng)域的交叉科學(xué)問題,發(fā)表SCI論文200余篇,引用10 000余次,H指數(shù)超過50。

最近幾年,大數(shù)據(jù)的商業(yè)化應(yīng)用開始逐步落地[1],其中,金融方面的大數(shù)據(jù)應(yīng)用是被投資人最看好的大數(shù)據(jù)產(chǎn)業(yè)化方向,在個(gè)人征信、企業(yè)征信、客戶畫像與精準(zhǔn)營銷等方面都有成熟的應(yīng)用。例如花旗銀行通過挖掘信用卡數(shù)據(jù),實(shí)現(xiàn)交叉營銷。當(dāng)客戶每次刷卡時(shí),銀行根據(jù)時(shí)間、地點(diǎn)以及過往的購物記錄,篩選并推送給客戶周邊商店、餐廳的折扣優(yōu)惠,從而獲得第二次交易價(jià)值。富國銀行運(yùn)用大數(shù)據(jù)識別欺詐行為,通過研究客戶之間發(fā)生的歷史交易,檢測是否存在背離常規(guī)操作模式的資金異動,通過綜合觀察多個(gè)數(shù)據(jù)來源,總結(jié)出用戶典型的交易習(xí)慣,實(shí)現(xiàn)實(shí)時(shí)的可疑交易甄別。在國內(nèi),許多商業(yè)銀行也在大數(shù)據(jù)領(lǐng)域不斷地探索和嘗試,例如中國銀行的“中銀沃金融”利用大數(shù)據(jù)技術(shù),整合電商平臺共享數(shù)據(jù)、征信數(shù)據(jù)以及客戶經(jīng)理面談獲取的信息,利用授信審批模型實(shí)現(xiàn)自動審批。本文介紹大數(shù)據(jù)在金融風(fēng)險(xiǎn)管理方面的實(shí)際案例。對于以銀行為代表的金融機(jī)構(gòu)而言,風(fēng)險(xiǎn)管理貫穿它們的全業(yè)務(wù)過程,越早發(fā)現(xiàn)風(fēng)險(xiǎn)越早采取措施,風(fēng)險(xiǎn)管理的成本越低,給金融機(jī)構(gòu)帶來的損失越小。

貸款的風(fēng)險(xiǎn)管理對于傳統(tǒng)銀行業(yè)和新興的互聯(lián)網(wǎng)金融行業(yè)都起著至關(guān)重要的作用。不良資產(chǎn)問題長期困擾著國有銀行,成為國有銀行面臨的主要金融風(fēng)險(xiǎn),直接威脅國有銀行的生存和發(fā)展。根據(jù)銀監(jiān)會對外公開報(bào)告,為改善資產(chǎn)質(zhì)量,我國政府于1999年和2000年為四大國有商業(yè)銀行分別成立資產(chǎn)管理公司,剝離不良資產(chǎn)1.3萬億元,使其不良貸款比率平均下降10個(gè)百分點(diǎn)。但是,進(jìn)行資產(chǎn)剝離只能緩解已有不良貸款帶來的沖擊,剝離后的不良貸款比率仍然遠(yuǎn)高于中國人民銀行的監(jiān)管水平。對于互聯(lián)網(wǎng)金融企業(yè),尤其是通過P2P或者分期付款等方式,以高息貸款為實(shí)質(zhì)性業(yè)務(wù)的企業(yè),風(fēng)險(xiǎn)的控制是成敗的關(guān)鍵。無論線上有多大流量,每月有多少流水,風(fēng)險(xiǎn)投資有多大規(guī)模,如果貸款違約率控制不了,最終都必然走向失敗[2]。因此,建立和完善風(fēng)險(xiǎn)管理體系,提高自身的風(fēng)險(xiǎn)管理水平和管理效率,是商業(yè)銀行和互聯(lián)網(wǎng)金融企業(yè)持續(xù)發(fā)展的重要基礎(chǔ)。

一方面隨著貸款客戶數(shù)量的增多(來源于個(gè)人信用貸款和中小微企業(yè)貸款數(shù)量的增長),傳統(tǒng)的人工管理手段(如業(yè)務(wù)經(jīng)理管理自己的客戶)已經(jīng)無法滿足目前風(fēng)險(xiǎn)管理在成本和效率上的需求;另一方面,銀行系統(tǒng)(數(shù)據(jù)庫)中包含了大量的客戶交易轉(zhuǎn)賬、存款取款、信用卡消費(fèi)等多個(gè)維度的數(shù)據(jù),同時(shí)隨著互聯(lián)網(wǎng)的普及,客戶在互聯(lián)網(wǎng)(如微信、QQ等)上會產(chǎn)生大量的外部數(shù)據(jù),這為大數(shù)據(jù)在貸款風(fēng)險(xiǎn)管理方面發(fā)揮作用提供了基礎(chǔ)。目前,越來越多的銀行和互聯(lián)網(wǎng)金融機(jī)構(gòu)開始探索如何利用大數(shù)據(jù)的方法進(jìn)行風(fēng)險(xiǎn)預(yù)警的工作,并希望建立一個(gè)高度自動化、智能化與銀行其他系統(tǒng)密切配合的風(fēng)險(xiǎn)預(yù)警系統(tǒng)。

電子科技大學(xué)和杭州邁寧數(shù)據(jù)科技有限公司的聯(lián)合研究小組,基于銀行系統(tǒng)中客戶的貸款協(xié)議信息、交易流水信息等內(nèi)部信息以及工商局、法院等外部信息來設(shè)計(jì)風(fēng)險(xiǎn)預(yù)警模型。這里主要針對已放貸款進(jìn)行貸后風(fēng)險(xiǎn)的管理和預(yù)警。對于每筆已放貸款,銀行會要求客戶在每月或者每個(gè)季度(視貸款規(guī)定的還款間隔而定)規(guī)定的還款日期之前還款,若客戶在還款日期前沒有還款,則該客戶為逾期客戶(計(jì)算入違約率),否則為正??蛻簟Q芯啃〗M希望能夠利用客戶的當(dāng)前數(shù)據(jù),預(yù)測其下個(gè)月或者下個(gè)季度是否為逾期客戶。

客戶的貸款協(xié)議信息包含了每個(gè)客戶的基本信息,其中包括貸款筆數(shù)、貸款金額、還款卡號余額、本月應(yīng)還金額等;另外,貸款協(xié)議信息還包含客戶所在的行業(yè)類別、注冊公司的規(guī)模等信息??蛻舻慕灰琢魉畔總€(gè)客戶的交易對手、交易金額和交易時(shí)間等基本信息。另外,筆者團(tuán)隊(duì)也計(jì)算了每個(gè)客戶每月交易金額的平均值、方差和交易時(shí)間間隔、收入和支出比例等,并將這些信息作為客戶的特征。

進(jìn)一步地,通過網(wǎng)絡(luò)爬蟲爬取客戶的工商數(shù)據(jù)、法院訴訟和房產(chǎn)抵押等外部數(shù)據(jù)。工商數(shù)據(jù)包含了客戶實(shí)體企業(yè)的注冊資金、企業(yè)規(guī)模、法人代表等信息。法院訴訟數(shù)據(jù)包含了最近客戶是否存在訴訟記錄,房產(chǎn)抵押數(shù)據(jù)包含了客戶及配偶的房產(chǎn)信息。將這些外部數(shù)據(jù)也作為客戶的特征。

基于以上數(shù)據(jù),利用機(jī)器學(xué)習(xí)的方法對客戶進(jìn)行初篩選。采用了線性回歸、Logistic回歸、SVM、神經(jīng)網(wǎng)絡(luò)、決策樹等分類器,將每一個(gè)單模型都看作一個(gè)弱分類器,然后再進(jìn)行融合[3,4]。通過集成學(xué)習(xí),獲得更好的分類效果。進(jìn)一步地,利用復(fù)雜網(wǎng)絡(luò)方法和時(shí)間序列分析技術(shù)篩選剩下的客戶。不斷地迭代以上兩個(gè)步驟,直到算法達(dá)到最優(yōu),其整體思路如圖1所示。

圖1 貸后風(fēng)險(xiǎn)預(yù)警模型

以復(fù)雜網(wǎng)絡(luò)方法為例[5],如果有N個(gè)違約客戶,完全隨機(jī)抽樣N個(gè)節(jié)點(diǎn)所形成的網(wǎng)絡(luò)幾乎全都是孤立節(jié)點(diǎn)或者非常小的連通片,客戶之間基本沒有資金往來關(guān)系。但是所有違約客戶形成的網(wǎng)絡(luò)卻要比同規(guī)模的隨機(jī)抽樣網(wǎng)絡(luò)連邊密集得多。這說明違約是有網(wǎng)絡(luò)效應(yīng)的:一方面金融風(fēng)險(xiǎn)本身具有傳遞性,客戶A如果資金出現(xiàn)問題,無法按時(shí)還款,則客戶A對應(yīng)的應(yīng)付客戶有可能因?yàn)闆]有收到A的錢,導(dǎo)致資金鏈出現(xiàn)問題,從這個(gè)意義上講,如果上一個(gè)月A向B流入了資金,且上個(gè)月A出現(xiàn)了違約或者這個(gè)月預(yù)測A違約風(fēng)險(xiǎn)很高,都會提高B的預(yù)測風(fēng)險(xiǎn);另一方面,違約還具有社會效應(yīng),譬如A違約之后,因?yàn)檫`約額度不高,銀行沒有及時(shí)處理,A就有可能將此消息傳播給自己的商業(yè)伙伴,從而使得其他人也出現(xiàn)違約的行為。從這個(gè)意義上講,只要A和B有資金關(guān)系,不管是流入或者流出,鑒于A的違約行為或者高違約風(fēng)險(xiǎn),也會提高對B的風(fēng)險(xiǎn)預(yù)測。把“因?yàn)榫W(wǎng)絡(luò)效應(yīng)而產(chǎn)生的違約風(fēng)險(xiǎn)”做成若干個(gè)特征,也放入了客戶特征庫中進(jìn)行迭代學(xué)習(xí)。

主要通過兩個(gè)指標(biāo)來刻畫預(yù)測的效果。一是用召回率(recall,可參考參考文獻(xiàn)[6])來度量準(zhǔn)確性,即預(yù)測出來的高風(fēng)險(xiǎn)客戶能夠包含銀行真實(shí)違約客戶的比例,這個(gè)比例越高越好,最高是100%。二是用查找范圍,即預(yù)測的高風(fēng)險(xiǎn)客戶占整個(gè)客戶總量的比例,在相同準(zhǔn)確性的情況下,查找范圍越小越好。如圖2所示,與合作銀行原有的方法相比(基于Logistic回歸和其他單一模型的機(jī)器學(xué)習(xí)方法,未進(jìn)行特征挖掘和特征學(xué)習(xí)),研究小組采用的方法使準(zhǔn)確性從46.7%上升到88.0%。而銀行原來的方法把大約20%的客戶判斷為高風(fēng)險(xiǎn)客戶,研究小組采用的方法則只需要篩查11.2%的客戶,相比銀行傳統(tǒng)的方法有了跨越性的提高。

圖2 風(fēng)險(xiǎn)模型預(yù)測能力對比結(jié)果

在中央大力建設(shè)信用社會的過程中,中國仍然有很大一段時(shí)間是一個(gè)信用成本很低的國家,大家不以違約為恥,反以違約不被追究為榮!在這種情況下,以信用為“擔(dān)保”的針對個(gè)人和中小微企業(yè)的貸款風(fēng)險(xiǎn)格外大——而這恰好是很多互聯(lián)網(wǎng)金融企業(yè)的主營業(yè)務(wù)。大數(shù)據(jù)的方法通過整合內(nèi)外數(shù)據(jù),并引入深度的特征挖掘和大規(guī)模的集成學(xué)習(xí),有望在信用機(jī)制尚未健全的時(shí)候,為金融機(jī)構(gòu)的風(fēng)險(xiǎn)管理提供一架高效的“預(yù)警機(jī)”。

[1] Schoenberg V M, Cukier K. 大數(shù)據(jù)時(shí)代:生活、工作、思維的大變革. 盛楊燕, 周濤譯.杭州: 浙江人民出版社, 2013 Schoenberg V M, Cukier K. Big Data: A Revolution that Will Transform How We Live, Work, and Think. Translated by Sheng Y Y, Zhou T. Hangzhou: Zhejiang People’s Publishing House, 2013

[2] 李平, 陳林, 李強(qiáng)等.互聯(lián)網(wǎng)金融的發(fā)展與研究綜述. 電子科技大學(xué)學(xué)報(bào), 2015, 44(2): 245~253 Li P, Chen L, Li Q,et al. Review of research and industry development of internet finance. Journal of University of Electronic Science and Technology of China, 2015, 44(2): 245~253

[3] Friedman J. Greedy function approximation: agradient boosting machine.The Annals of Statistics, 2001, 29(5): 1189~1232

[4] Ridgeway G. Generalized Boosted Models: A Guide to The GBMPackage, http:// cran. r-project.org/web/packages/gbm/ vignettes/gbm.pdf,2007

[5] 汪小帆, 李翔, 陳關(guān)榮. 網(wǎng)絡(luò)科學(xué)導(dǎo)論. 北京:高等教育出版社, 2012 Wang X F, Li X, Chen G R. Network Science: An Introduction. Beijing: Higher Education Press, 2012

[6] Lü L, Zhou T. Link prediction in complex networks: a survey. Physica A Statistical Mechanics & Its Applications, 2011, 390(6): 1150~1170 □

猜你喜歡
貸款客戶
客戶都愛“菱角湖”
迎來境外貸款業(yè)務(wù)機(jī)遇期
中國外匯(2019年11期)2019-08-27 02:06:28
致學(xué)生家長的一封信(客戶告知書)
My Huckleberry Friends:Even if the Whole World Stand against me,I Will always Stand by You
Wang Yuan: the Brilliant Boy
為什么你總是被客戶拒絕?
如何有效跟進(jìn)客戶?
舊信封
故事會(2017年9期)2017-05-08 10:46:19
貸款為何背上黑鍋?
做個(gè)不打擾客戶的保鏢
山東青年(2016年2期)2016-02-28 14:25:41
临澧县| 哈密市| 手游| 桃园市| 礼泉县| 万源市| 安福县| 靖州| 永安市| 开阳县| 健康| 安达市| 田东县| 安多县| 阜新| 建德市| 桦南县| 柏乡县| 巨鹿县| 左权县| 阿巴嘎旗| 大石桥市| 北宁市| 醴陵市| 武陟县| 海兴县| 渝中区| 清新县| 甘南县| 洱源县| 邮箱| 宝应县| 安康市| 浦东新区| 理塘县| 寻甸| 民县| 曲靖市| 遵义市| 彭山县| 双峰县|