馮梅秀
(江蘇蘇寧銀行股份有限公司,南京 210000)
近年來,隨著社會經(jīng)濟(jì)的發(fā)展,小微企業(yè)也發(fā)展迅速,不僅促進(jìn)了經(jīng)濟(jì)發(fā)展,還對就業(yè)、國家稅收發(fā)揮了重要作用。與此同時,小微企業(yè)在發(fā)展過程中面臨著技術(shù)滯后、信息阻隔、人力缺失等制約因素。在融資過程中,由于規(guī)模、資質(zhì)、場地等受限,融資難是貫穿小微企業(yè)生命周期的一大難題。隨著互聯(lián)網(wǎng)經(jīng)濟(jì)快速發(fā)展,運(yùn)用線上平臺進(jìn)行融資以及靈活的網(wǎng)絡(luò)借貸方式被越來越多的小微企業(yè)接受。
根據(jù)2019 年的統(tǒng)計數(shù)據(jù),我國小微企業(yè)融資90.3%用于日常經(jīng)營,73.1%用于擴(kuò)大規(guī)模,46.2%用于開發(fā)新產(chǎn)品和新技術(shù)。在小型或個體工商戶中,63.1%的資金用于擴(kuò)大規(guī)模,53.1%用于日常運(yùn)營,17.5%用于開發(fā)新產(chǎn)品和新技術(shù)。可以看出,小微企業(yè)融資主要是為了進(jìn)行生產(chǎn)運(yùn)營、維持日常經(jīng)營和提高生產(chǎn)效率,這些貸款資金大都流入了實體生產(chǎn)[1]。
目前,我國小微企業(yè)已達(dá)10 140 萬戶,其中,企業(yè)2 640 萬戶、個體工商戶7 500 萬戶。這占據(jù)目前實體經(jīng)濟(jì)市場主體的90%,為全國80%的就業(yè)、70%的專利發(fā)明和60%的國民生產(chǎn)總值作出了巨大貢獻(xiàn)[2]。
但相關(guān)資料顯示,截至2018 年,貸款戶數(shù)中小微企業(yè)有1 723.23萬戶,80%以上的企業(yè)未能獲得融資服務(wù)[3]。近年來,隨著國家政策的支持和科技金融水平的提升,各家銀行在鞏固既定核心客戶的基礎(chǔ)上,開始關(guān)注線上小微業(yè)務(wù)風(fēng)控技術(shù)的開發(fā)和運(yùn)用。各家銀行主推的幾款基于小微企業(yè)大數(shù)據(jù)風(fēng)控的產(chǎn)品主要包括以下幾類:以政府部門數(shù)據(jù)為主的江蘇銀行的“稅E融”產(chǎn)品、以行內(nèi)積累的客戶數(shù)據(jù)為主的小微“快e 貸”產(chǎn)品,以及以大數(shù)據(jù)風(fēng)控為主的微眾銀行的“微業(yè)貸”產(chǎn)品等。
線上產(chǎn)品的落地需要大量的數(shù)據(jù)支持,小微企業(yè)線上數(shù)據(jù)主要包括以下幾類:①基于政府部門的數(shù)據(jù),如在稅務(wù)局繳納的稅務(wù)數(shù)據(jù)、在工商局注冊的工商數(shù)據(jù)、在國家電網(wǎng)部門繳納的電費(fèi)數(shù)據(jù);②政府部門名下公司加工的數(shù)據(jù),如發(fā)票數(shù)據(jù)(發(fā)票數(shù)據(jù)是由航信和小望科技兩個企業(yè)開發(fā)的,主要體現(xiàn)在航信科技和小望科技方面)、司法數(shù)據(jù)(主要體現(xiàn)在企查查數(shù)據(jù)中);③特定場景下的數(shù)據(jù),如美團(tuán)等;④外部黑名單數(shù)據(jù),主要是各數(shù)據(jù)公司搜集的各項數(shù)據(jù),如冰鑒、融慧、百融等[4]。
下文以某一特定場景中的小微企業(yè)數(shù)據(jù)為例,運(yùn)用機(jī)器學(xué)習(xí)①機(jī)器學(xué)習(xí)是一類算法的總稱,這些算法企圖從大量歷史數(shù)據(jù)中挖掘出其中隱含的規(guī)律,并用于預(yù)測或者分類。更具體地說,機(jī)器學(xué)習(xí)可以看作尋找一個函數(shù),輸入的是樣本數(shù)據(jù),輸出的是期望的結(jié)果,只是這個函數(shù)過于復(fù)雜,以至于不太方便形式化表達(dá)。需要注意的是,機(jī)器學(xué)習(xí)的目標(biāo)是使學(xué)到的函數(shù)很好地適用于“新樣本”,而不僅僅是在訓(xùn)練樣本上表現(xiàn)很好。學(xué)到的函數(shù)適用于新樣本的能力,稱為泛化能力。模型模擬特定場景下小微企業(yè)風(fēng)控模型的算法并得出風(fēng)控評分模型。
在具有發(fā)票數(shù)據(jù)的場景模式下,選取10 000 戶表現(xiàn)樣本數(shù)據(jù),以違約率(PD)大于等于90 天以上的客戶為壞樣本,選取了300 個壞樣本,以超樣本模式進(jìn)行違約率計算,計算結(jié)束后再還原至正常情況下的違約率數(shù)據(jù)。在數(shù)據(jù)樣本選擇過程中,需注意避免季節(jié)性因素影響,擁有足夠長的表現(xiàn)期,時間段的選擇可以代表未來所有正常申請人。
建模流程如圖1 所示。邏輯回歸是機(jī)器學(xué)習(xí)模型中最基礎(chǔ)也最實用的一種方法,其原理主要是根據(jù)一個二分類或多分類問題而得到的函數(shù)公式。在多元回歸基礎(chǔ)上,對似然函數(shù)取對數(shù)后,對β求導(dǎo)數(shù),列方程求β值,從而得出最終模型計算公式:
圖1 建模流程
根據(jù)上述10 000 個樣本數(shù)據(jù),按照不同行業(yè)的標(biāo)簽分類,選取了3 個行業(yè)大類分別建模,包括批發(fā)零售業(yè)、制造業(yè)和其他行業(yè),以批發(fā)與零售業(yè)為例,該行業(yè)好壞樣本對比結(jié)果如表1所示。
表1 批發(fā)與零售業(yè)好壞樣本對比
不同行業(yè)的好壞客戶占比及分?jǐn)?shù)區(qū)分呈現(xiàn)不同的特征,這說明以行業(yè)為標(biāo)準(zhǔn)篩選的數(shù)據(jù)符合要求,接下來筆者又對不同行業(yè)的模型結(jié)果表現(xiàn)進(jìn)行了分析,3 個不同行業(yè)的KS(經(jīng)分布檢驗)、AUC(曲線下面積檢驗)均達(dá)到了模型表現(xiàn)的要求,結(jié)果如表2 所示。
表2 不同行業(yè)數(shù)據(jù)對比
從整體的KS 表現(xiàn)(見圖2)來看,整體KS 達(dá)到了0.453,滿足數(shù)據(jù)統(tǒng)計的要求,該模型結(jié)果可以采用。
圖2 整體KS 表現(xiàn)
根據(jù)上述機(jī)器學(xué)習(xí)模型結(jié)果,我們得出了不同行業(yè)的客戶表現(xiàn)數(shù)據(jù)及評分模型結(jié)果,以此模型結(jié)果為核心,計算不同行業(yè)項下客戶的準(zhǔn)入分值,并在區(qū)分各行業(yè)不同周轉(zhuǎn)率的情況下測算額度模型公式。不同行業(yè)準(zhǔn)入分?jǐn)?shù)及資金周轉(zhuǎn)額度需求情況如表3 所示。
表3 不同行業(yè)準(zhǔn)入分?jǐn)?shù)及資金周轉(zhuǎn)額度需求
風(fēng)控模型的搭建是線上產(chǎn)品的核心和基礎(chǔ),但同時需配備產(chǎn)品流程設(shè)計、資金運(yùn)營流程設(shè)計、反欺詐甄別、貸前貸中貸后管理等多渠道、多維度手段,本文僅以風(fēng)控模型搭建為源頭,暫不展開論述。
商業(yè)銀行在開發(fā)線上產(chǎn)品的過程中,主要希望運(yùn)用線上模式突破線下網(wǎng)點(diǎn)的限制,但由于模型專業(yè)人員不足且穩(wěn)定性不強(qiáng),從而采取服務(wù)外包或者階段產(chǎn)品合同制模式,交由外部機(jī)構(gòu)承接模型方面的各項工作,包括模型開發(fā)設(shè)計和迭代,但存在以下幾個方面的問題:①服務(wù)外包模式僅為某個階段的工作代辦,一旦工作結(jié)束后,仍需要相關(guān)人員進(jìn)行產(chǎn)品維護(hù)和迭代,而外包機(jī)構(gòu)已撤出工作,無法及時跟進(jìn)產(chǎn)品上線過程中出現(xiàn)的各項問題,也不能及時解決,若產(chǎn)品上線過程中的問題不能及時解決,則存在上線后逾期率過高或者其他意外事項,這不僅在時間上拖延了項目的開展進(jìn)度,還增加了項目的開發(fā)成本;②外包機(jī)構(gòu)一般為乙方服務(wù)類公司,所開發(fā)的產(chǎn)品并不能很好地與各家商業(yè)銀行的產(chǎn)品定位和風(fēng)險容忍度掛鉤,與市面上同類型的產(chǎn)品存在很大的同質(zhì)性,而線上產(chǎn)品的開發(fā)過程需要結(jié)合長期歷史數(shù)據(jù)和各項產(chǎn)品定位進(jìn)行開發(fā),這在一定程度上無法實現(xiàn)各家銀行的不同業(yè)務(wù)目標(biāo);③目前在監(jiān)管上對第三方服務(wù)機(jī)構(gòu)的權(quán)責(zé)機(jī)制并不完善,一旦外包模式產(chǎn)生風(fēng)險,大都由各家銀行自行承擔(dān),這在一定程度上加大了各家銀行的風(fēng)險。綜上,各家銀行應(yīng)結(jié)合自身情況建立自有獨(dú)立的模型團(tuán)隊,培養(yǎng)自有專業(yè)技術(shù)開發(fā)人員,這樣不僅能保證產(chǎn)品順利上線,還能提高產(chǎn)品的市場競爭力,防范外包風(fēng)險。
目前,各家銀行的數(shù)字化轉(zhuǎn)型工作正在開展過程中,存在的問題包括數(shù)據(jù)資源的收集不足、數(shù)據(jù)的加工和使用需進(jìn)一步完善、數(shù)據(jù)的積累和保管需加強(qiáng)支持。建議其做好以下幾點(diǎn):①做好數(shù)據(jù)的采集工作。數(shù)據(jù)采集是開發(fā)線上產(chǎn)品的第一步,也是關(guān)鍵的一步,各家銀行開發(fā)線上融資產(chǎn)品不僅需要掌握模型所需的企業(yè)、企業(yè)主數(shù)據(jù)以及三方驗證的數(shù)據(jù)源,還需要人行征信等數(shù)據(jù),在引入數(shù)據(jù)的過程中,大數(shù)據(jù)部門需切實做好數(shù)據(jù)的落地存儲工作,確保數(shù)據(jù)的真實性和有效性,以便客戶在申請過程中能真實調(diào)用外部數(shù)據(jù)源,做好企業(yè)或企業(yè)主的身份識別和驗證工作。②做好數(shù)據(jù)存儲和加工。目前,各家銀行均建立了大數(shù)據(jù)部門,對于數(shù)據(jù)存儲工作越發(fā)重視,但在實際操作過程中仍存在基礎(chǔ)工作不扎實、海量數(shù)據(jù)存儲空間小、批量數(shù)據(jù)獲取功能弱的問題,這主要是由于各銀行的資源匹配不及時、數(shù)據(jù)處理更新慢等,因此需加強(qiáng)資源的匹配,確保大數(shù)據(jù)的質(zhì)量可控有效。③做好數(shù)據(jù)挖掘、處理等工作。鑒于線上產(chǎn)品的特殊性,銀行面臨欺詐、攻擊等風(fēng)險,因此對更新迭代的要求很高,產(chǎn)品上線后需及時更新迭代,結(jié)合市場風(fēng)險和申請人群特征及時更新產(chǎn)品性能,不斷打磨數(shù)據(jù),做好模型的更新迭代工作[5]。
小微線上產(chǎn)品對市場的變化要反應(yīng)迅速,并能更好地貼近申請客群的變化,這就要求模型上線后進(jìn)一步加強(qiáng)模型管理工作。①模型工作需要梳理一整套管理流程,包括模型開發(fā)、上線、迭代、監(jiān)控等流程管理,設(shè)置管理目標(biāo)和監(jiān)控指標(biāo)。根據(jù)行業(yè)內(nèi)的監(jiān)控標(biāo)準(zhǔn)和業(yè)務(wù)目標(biāo),一般來說,設(shè)置模型上線的標(biāo)準(zhǔn)為AUC 檢驗達(dá)到75、KS 檢驗達(dá)到40(根據(jù)實際情況可調(diào)整),上線后的監(jiān)控指標(biāo)選擇逾期率和不良率等指標(biāo)進(jìn)行篩選。②模型人員必須與指定項目掛鉤,針對不同的項目配備專業(yè)的模型監(jiān)控和迭代人員,定期披露業(yè)務(wù)目標(biāo)和風(fēng)險數(shù)據(jù),確保項目風(fēng)險在可控范圍內(nèi),如果風(fēng)險數(shù)據(jù)超出預(yù)警值或存在其他不可控風(fēng)險,應(yīng)及時上報管理層。③做好模型監(jiān)測工作。產(chǎn)品上線過程中,需滿足必要的測試條件方可上線,上線后需及時監(jiān)測,確保各項監(jiān)控指標(biāo)合理合規(guī),評價不同產(chǎn)品有效的指標(biāo)主要是上線后的逾期率和不良率,根據(jù)逾期不良數(shù)據(jù)定期通報產(chǎn)品風(fēng)險,并根據(jù)不良數(shù)據(jù)及時更新模型,確保產(chǎn)品上線后的風(fēng)險可控。