殷浩倫 宋澤昊
〔內(nèi)容提要〕隨著銀行的數(shù)字化轉(zhuǎn)型不斷深入,零售信貸風控由傳統(tǒng)的線下人工審核逐步轉(zhuǎn)為批量線上智能化管理。本文首先分析了大數(shù)據(jù)風控在銀行零售信貸業(yè)務貸前、貸中、貸后等業(yè)務流程中的應用表現(xiàn),然后指出了大數(shù)據(jù)風控應用過程中在數(shù)據(jù)來源、IT基礎設施、人才建設等方面存在的問題,最后針對以上問題給出了相關建議,期待銀行業(yè)的發(fā)展更加精準化、差異化、智能化。
〔關鍵詞〕大數(shù)據(jù)風控 零售信貸 評分模型 風控策略
近年來受經(jīng)濟增速放緩、監(jiān)管政策趨嚴以及新冠疫情等因素影響,銀行業(yè)的發(fā)展受到了巨大挑戰(zhàn),但是隨著人工智能、云計算與區(qū)塊鏈技術的快速發(fā)展,銀行加快了數(shù)字化轉(zhuǎn)型的步伐,顯著增強了在長尾客戶的盈利能力,極大豐富了信貸業(yè)務的產(chǎn)品體系和應用場景,逐步實現(xiàn)了業(yè)務驅(qū)動與風險管控的智能升級。目前,具備一定科技實力的國有銀行以及一些積極布局科技創(chuàng)新領域的中小銀行,在大數(shù)據(jù)風控方面已經(jīng)做了一些積極探索,這些舉措雖然在銀行數(shù)字化轉(zhuǎn)型中還存在諸多問題,但依然促進了我國銀行業(yè)的數(shù)字化轉(zhuǎn)型。
信貸業(yè)務是銀行最核心的資產(chǎn)業(yè)務,也是銀行最主要的利潤來源,將大數(shù)據(jù)風控技術應用在零售信貸領域主要是指銀行通過采集行內(nèi)客戶數(shù)據(jù)、人民銀行征信數(shù)據(jù)以及其他外部機構(gòu)數(shù)據(jù),利用邏輯回歸、決策樹、神經(jīng)網(wǎng)絡等算法,生成應用于貸前、貸中、貸后等場景的一系列評分模型,結(jié)合風控目標制定客戶準入、額度管理、價格制定等管理策略,最終實現(xiàn)客戶從準入到退出的全生命周期管理的線上化、精準化和智能化。從數(shù)據(jù)分析到模型設計、再到策略制定,都是圍繞業(yè)務目標展開的。
數(shù)據(jù)是大數(shù)據(jù)風控的基石,銀行信貸業(yè)涉及的數(shù)據(jù)可以分為行內(nèi)數(shù)據(jù)和外部數(shù)據(jù)兩類,行內(nèi)數(shù)據(jù)包括客戶在本行的基本信息、交易數(shù)據(jù)、還款數(shù)據(jù)、逾期數(shù)據(jù)等,外部數(shù)據(jù)包括人行征信數(shù)據(jù)以及銀行從其他第三方獲取的包括但不限于社保、納稅、消費、資產(chǎn)等信息。
模型是大數(shù)據(jù)風控的核心,銀行在數(shù)據(jù)分析的基礎上根據(jù)業(yè)務目標,通過分析各種風險要素對違約率的影響程度,運用合適的模型算法,最終形成風險評分。評分模型在建立時可選用線性回歸法、邏輯回歸法、決策樹和神經(jīng)網(wǎng)絡等多種方法,但實務中應用最廣泛的是邏輯回歸法。這是因為邏輯回歸算法對數(shù)據(jù)量要求較低、操作相對簡單,模型效果較好,同時其具備的可解釋性還能滿足監(jiān)管機構(gòu)關于內(nèi)部評級模型的透明度要求。
策略是大數(shù)據(jù)風控的關鍵,銀行為了實現(xiàn)業(yè)務目標,可以根據(jù)評分模型區(qū)分貸款業(yè)務的風險程度并設置相應的管理規(guī)則,包括客戶準入、額度調(diào)整、風險預警等內(nèi)容,減少了人工干預帶來的誤差,從而實現(xiàn)對客戶的自動化管理。
(一)大數(shù)據(jù)風控在貸前管理的應用
大數(shù)據(jù)風控貸前管理是指銀行通過客戶申請數(shù)據(jù)、征信數(shù)據(jù)以及外部數(shù)據(jù),對申請貸款的客戶進行分析,在此基礎上建立申請評分模型,識別出存在較大信用風險的客戶并拒絕其貸款申請,同時對審批通過客戶進行授信管理和風險定價的管理過程。
1.貸前數(shù)據(jù)
零售信貸業(yè)務放貸前銀行所能收集到的客戶信息包括申請信息、登錄信息、渠道信息、人行征信信息以及從其他渠道獲取的黑名單等信息,其中對建模來說具有重要意義的主要是人行征信信息,銀行通過查詢個人征信報告對客戶的每一項數(shù)據(jù)進行清洗、加工和處理,并建立專門的數(shù)據(jù)庫將有效信息保存下來供建模使用。
2.申請評分模型
評分卡是以分數(shù)的形式來衡量風險幾率的一種手段,是對未來一段時間內(nèi)違約/逾期/失聯(lián)概率的預測?;诮y(tǒng)計模型建立的評分卡可以更準確地預測風險,并減少因非客觀判斷造成失誤的風險。根據(jù)零售信貸生命周期的不同階段,最常見的評分卡包括申請、行為、催收等評分卡,他們分別應用于貸前、貸中和貸后等業(yè)務場景。
申請評分模型是銀行基于申請客戶數(shù)據(jù)樣本專門建立的模型,通過分析各種風險要素對違約率的影響程度,最終形成風險評分。評分模型的建立過程中,首先要對采集到的原始數(shù)據(jù)進行分析,然后再對經(jīng)過篩選的變量采用一定的方法進行建模,之后對模型的準確性、穩(wěn)定性和可解釋性進行驗證評估,并不斷優(yōu)化。
3.貸前策略
由評分模型建立的評分卡技術可廣泛應用于銀行零售業(yè)務的貸前申請審批、授信額度確定、利率定價等環(huán)節(jié),根據(jù)風險策略的不同,銀行可以在評分卡系統(tǒng)中設定不同的臨界值,根據(jù)評分所處的臨界值區(qū)間自動作出審批決策。同時,如果行內(nèi)針對黑名單設置規(guī)則,則直接拒絕;如果針對優(yōu)質(zhì)客戶設置綠色通道,則直接通過審批。
對于審核通過的客戶,銀行會制定相應的額度策略和利率定價策略。通常情況下,銀行會綜合考慮客戶的信用狀況、收益預期、對銀行的貢獻等因素,原則上客戶評分越低,風險越高,授信額度越低,定價越高;客戶評分越高,風險越低,授信額度越高,定價越低,整個策略制定過程堅持風險與收益對等原則。
(二)大數(shù)據(jù)風控在貸中管理的應用
大數(shù)據(jù)風控貸中管理是根據(jù)現(xiàn)有客戶的行為數(shù)據(jù),如消費、交易、還款、逾期等信息,利用合適的算法模型,對客戶風險進行精準把控,最終實現(xiàn)貸中客戶風險實時、動態(tài)管理的目標。
1.貸中數(shù)據(jù)
零售信貸業(yè)務貸中管理銀行需要收集的數(shù)據(jù)主要是客戶行為類數(shù)據(jù),可以從行內(nèi)和行外兩種渠道進行收集。行內(nèi)數(shù)據(jù)側(cè)重于客戶在本行的行為數(shù)據(jù),例如客戶的消費、交易、還款、逾期等行為積累的數(shù)據(jù),但這些數(shù)據(jù)并不能完整反映客戶的實際風險,這時候就需要引入外部數(shù)據(jù),如客戶在其他機構(gòu)的消費數(shù)據(jù)、借貸數(shù)據(jù)、資產(chǎn)數(shù)據(jù)等,這些信息綜合起來可以較好地刻畫出客戶的行為風險,為貸中風險策略的制定提供數(shù)據(jù)支撐。
2.行為評分模型
行為評分模型是銀行基于客戶行為數(shù)據(jù)樣本專門建立的模型,其建模流程同申請評分模型一致。在數(shù)據(jù)分析階段,首先對行內(nèi)及外部數(shù)據(jù)進行提取,對數(shù)據(jù)分布進行初步分析,篩選出可供使用的有效數(shù)據(jù);然后進行模型設計,比如排除哪些行內(nèi)客戶,對好/壞客戶進行定義,對觀察期和表現(xiàn)期進行界定等;下一步進行特征分析,在現(xiàn)有初級行為數(shù)據(jù)的基礎上進行衍生設計,由此增加數(shù)據(jù)的表現(xiàn)力,比如對客戶逾期金額取最大值、最小值、均值、中位數(shù)等以判斷逾期的嚴重性,再結(jié)合衍生特征的分布情況、有效性進行篩選;接下來進行模型開發(fā),通過抽取合適的建模樣本利用邏輯回歸、決策樹、神經(jīng)網(wǎng)絡等算法進行模型訓練,對參數(shù)進行優(yōu)化直至模型區(qū)分好壞客戶的能力達到相應水平;最后對模型有效性進行驗證,為防止模型發(fā)生偏移,最好使用時間外樣本進行驗證,也可以利用之前建立的相關模型進行交叉驗證,以評價模型的適用性。
3.貸中策略
信貸業(yè)務貸中風險管理應用最廣泛的是信用卡業(yè)務使用場景,銀行根據(jù)客戶行為評分及其他風險收益狀況,制定相應的額度調(diào)整策略和利率調(diào)整策略,使得客戶的授信額度和利率定價能夠精準匹配客戶的風險狀況。
此外,銀行可以根據(jù)客戶的行為變化,結(jié)合不同場景,制定相應的預警規(guī)則,如根據(jù)客戶頻繁更換手機號、住址及工作等信息預測客戶穩(wěn)定性,根據(jù)客戶逾期信息判斷客戶還款能力是否惡化等,風險預警規(guī)則的設置有助于銀行盡早發(fā)現(xiàn)風險客戶并及時采取相應的管控措施。
(三)大數(shù)據(jù)風控在貸后管理的應用
借款人到期不能或不愿償還借款而形成的逾期貸款是影響銀行經(jīng)營業(yè)績和風險管控的重要因素,因此銀行必須采用一些措施來有效催收逾期貸款。將大數(shù)據(jù)技術應用在貸后管理,可以構(gòu)建催收模型,根據(jù)模型評分設置不同規(guī)則將催收模式精細化,對客戶實施差異化催收策略。
1.貸后數(shù)據(jù)
零售信貸業(yè)務貸后管理所需要的數(shù)據(jù)主要是還款及逾期數(shù)據(jù),如逾期狀態(tài)、金額、次數(shù)、還款率等,這些數(shù)據(jù)真實反映了客戶的信用狀態(tài),利用這些數(shù)據(jù)構(gòu)建模型可以幫助銀行實現(xiàn)催收管理的標準化與精細化。
2.催收評分模型
催收評分模型通過評估客戶催收難度、逾期金額、賬齡等多維度信息建立評分系統(tǒng),對債務還款可能性進行綜合評估。催收評分模型的構(gòu)建流程與申請評分卡和行為評分卡的構(gòu)建流程基本一致,需要注意的是,針對催收客戶建立的催收評分模型是系統(tǒng)按月自動采集評分指標進行評分,然后給出評分結(jié)果,而申請評分模型是在申請時采集信息,行為評分是定期采集信息,但是采集周期比催收評分要長,這是因為進入催收階段的客戶風險較高,需要加大監(jiān)控頻率來反映風險的變化。
3.貸后策略
以大數(shù)據(jù)為驅(qū)動構(gòu)建的智能催收策略,可以根據(jù)催收評分系統(tǒng)結(jié)合催收人員能力制定合理的分單策略,實現(xiàn)對案件的合理化分配,提升催收效果。通過設置友好自動撥號,對于高頻、簡單的催收案件,采用試觸式輪循撥打,減少人工操作,縮短撥打間隔,有效提升催收效率。
任何事物的發(fā)展都有兩面性,大數(shù)據(jù)風控在為銀行精細化管理帶來便利的同時,也帶來了一些挑戰(zhàn),主要體現(xiàn)在以下方面。
(一)數(shù)據(jù)來源問題
數(shù)據(jù)是模型建立的原材料,是大數(shù)據(jù)風控的基礎,但是面對14億人口的龐大群體,首先很難做到全面覆蓋,其次難以保證數(shù)據(jù)質(zhì)量,再者涉及到個人隱私,同時可能存在非法交易。
1.數(shù)據(jù)不全面
從覆蓋面來說,我國人口眾多,存在大量征信空白人口,這些人群首次申請貸款時,因為數(shù)據(jù)缺失很難對其風險進行判定;從數(shù)據(jù)結(jié)構(gòu)來說,部分人群的部分數(shù)據(jù)項存在缺失,在建模時可能導致具有較強區(qū)分能力的特征無法入模,從而降低模型的準確性。
2.隱私受侵犯
在數(shù)據(jù)采集過程中,會涉及客戶的聯(lián)系方式、學歷信息、資產(chǎn)信息、職業(yè)信息等,這些數(shù)據(jù)通常要進行脫敏處理,但是由于客戶數(shù)據(jù)廣泛存在于各類客戶端上,數(shù)據(jù)來源眾多,一些不當操作可能會暴露客戶隱私。
3.質(zhì)量難保證
隨著互聯(lián)網(wǎng)的發(fā)展,大量客戶端可能記載了客戶的消費、行為、資產(chǎn)等各種信息,由于外部數(shù)據(jù)渠道范圍廣,各類信息可能存在不一致甚至沖突的情況,數(shù)據(jù)質(zhì)量良莠不齊可能會嚴重影響建模效果。
4.可能存在非法交易
由于數(shù)據(jù)安全管理不到位,市場上出現(xiàn)了高價買賣個人信息的行為,造成了暴力催收事件,給當事人和社會帶來了嚴重的負面影響,2018年以來,國家加大了對數(shù)據(jù)安全的管控,一定程度上降低了非法交易個人數(shù)據(jù)帶來的惡劣影響。
(二)銀行業(yè)IT基礎設施不完善
一套嚴謹?shù)娘L控體系運行依賴于完善的IT系統(tǒng)支持,目前我國國有大型及股份制銀行IT架構(gòu)相對成熟,但是地方性中小銀行及農(nóng)商行IT基礎薄弱,數(shù)據(jù)治理水平有待提高,難以實現(xiàn)數(shù)字化獨立管理。具體表現(xiàn)為,沒有全行范圍內(nèi)的統(tǒng)一產(chǎn)品目錄;不同系統(tǒng)間客戶標識、客戶分類存在不一致的情況;客戶劃分不統(tǒng)一,存在錯誤的分類結(jié)果,導致分類結(jié)果不可靠,無法用于準確地監(jiān)管資本計量;上報數(shù)據(jù)缺失和不完整情況較為嚴重,依靠手工補錄的方式完成,操作風險極大。
客戶數(shù)據(jù)不一致會導致無法實現(xiàn)真正的客戶統(tǒng)一視圖,嚴重影響以客戶為中心的戰(zhàn)略目標得以落實;內(nèi)部經(jīng)營管理數(shù)據(jù)不完整導致無法實現(xiàn)精細化管理的需求,甚至使暗箱操作成為可能,給銀行穩(wěn)定運營帶來極大隱患;風險類數(shù)據(jù)分類不準確導致監(jiān)管資本、經(jīng)濟資產(chǎn)計算結(jié)果不可靠,甚至多占資本,影響資本精細化管理水平。
(三)模型更迭依賴更多專業(yè)化人才
模型的建立不是一成不變的,隨著時間的推移,客戶的行為習慣會發(fā)生變化,依托于歷史數(shù)據(jù)構(gòu)建的模型將會發(fā)生偏移,這就需要定期對模型的有效性進行驗證,一旦發(fā)現(xiàn)模型效果出現(xiàn)下降就意味著模型區(qū)分好壞客戶的能力在降低,可能會拒絕好客戶的授信申請而提高壞客戶的審批通過率,這將給銀行帶來巨大損失,因此應當在模型能力下降時對模型進行更迭,例如,某些特征對好壞客戶的區(qū)分能力下降就需要更換更具區(qū)分度的變量,模型算法的局限性導致海量數(shù)據(jù)處理效果不佳則應嘗試改變更優(yōu)的算法。模型區(qū)分能力降低的原因是多種多樣的,它依賴于專業(yè)人員的專業(yè)判斷及解決方案,但是銀行目前專業(yè)的建模人員并不多,模型建立大多依靠外包第三方來解決,導致模型后期更迭維護可能會出現(xiàn)問題。
(一)建立完善的征信體系
針對數(shù)據(jù)不完整、隱私受侵犯、質(zhì)量難保證等難題,央行已搭建二代征信系統(tǒng),在原有征信數(shù)據(jù)的基礎上積極引入社會安全管理部門、公共事業(yè)單位等更多主體,這些主體的參與豐富了二代征信內(nèi)容,建立起國家級信用信息共享機制,緩解了金融交易中信息不對稱問題。
在此基礎上,央行應該積極引入更多市場化主體,如非銀金融機構(gòu),將更多信貸數(shù)據(jù)納入征信體系,完善個人信貸信息,全面反映個人完整借貸情況;同時,應當適當降低征信數(shù)據(jù)使用成本,對于中小銀行來說,由于自身數(shù)據(jù)較為匱乏,風控數(shù)據(jù)非常依賴人民銀行征信數(shù)據(jù),而對于貸中貸后風險管理來說,需要頻繁使用征信數(shù)據(jù),如果查詢成本過高會增加銀行成本。
(二)完善銀行IT基礎設施建設,加強數(shù)據(jù)治理
穩(wěn)定的IT基礎設施是保障大數(shù)據(jù)風控模型和策略實施的基礎,針對數(shù)據(jù)標準不一致問題,應當建立統(tǒng)一的數(shù)據(jù)標準,確保相關數(shù)據(jù)的分類與執(zhí)行保持一致,需要注意的是,數(shù)據(jù)治理應當覆蓋數(shù)據(jù)的整個生命周期,同時與管理模式、風險狀況和業(yè)務規(guī)模相適應,推動數(shù)據(jù)真實、準確、客觀地反映出資產(chǎn)的真實風險。
(三)引進大數(shù)據(jù)人才,建立數(shù)據(jù)化管理團隊
當前銀行的大數(shù)據(jù)風險管理主要依賴于外部第三方機構(gòu),僅有部分人員牽頭負責具體項目的實施。銀行數(shù)字化轉(zhuǎn)型離不開數(shù)字化人才,首先銀行應當在管理層建立起數(shù)字化管理的先進理念,在實施層面,銀行一方面可以通過外部引進大數(shù)據(jù)相關人才,也可以從當前業(yè)務團隊挑選合適的人員進行轉(zhuǎn)型培養(yǎng),建立起覆蓋數(shù)據(jù)分析、模型建立、策略實施等板塊,貫通貸前、貸中、貸后等業(yè)務流程的數(shù)字化人才團隊。
雖然我國銀行業(yè)的數(shù)字化發(fā)展目前還存在一些問題,但在隨著市場的逐步成熟、監(jiān)管機制的不斷完善以及銀行自主轉(zhuǎn)型不斷深化,銀行業(yè)的發(fā)展將會更精準化、差異化、智能化。
(作者單位:1.河南財經(jīng)政法大學統(tǒng)計與大數(shù)據(jù)學院;2.河南財經(jīng)政法大學統(tǒng)計與大數(shù)據(jù)學院)