劉小莉
近年來,大數(shù)據(jù)、云計算、人工智能、區(qū)塊鏈等新技術的應用促進商業(yè)銀行向數(shù)字化轉型發(fā)展,金融科技手段在拓展客戶、改進服務、防控風險、增強競爭力等方面發(fā)揮著積極作用。風控領域傳統(tǒng)手段存在效率低、精度差、成本高等問題,難以滿足商業(yè)銀行業(yè)務創(chuàng)新發(fā)展的要求,智能風控作為金融科技在金融領域最主要的應用之一,在銀行業(yè)受到廣泛重視。智能風控平臺以大數(shù)據(jù)為基礎資源,以云計算和人工智能為技術依托,運用于授信審批、反欺詐等風控場景,可以提升風控效率和精度,降低風控成本,是集數(shù)據(jù)、模型、規(guī)則為一體的風控中樞。目前,國內大多數(shù)商業(yè)銀行正在積極探索搭建智能風控平臺,為智能風控的模型開發(fā)、決策分析和場景落地提供系統(tǒng)支持,推動風險防控走向智能化時代。
智能風控平臺的建設目標
智能風控平臺的建設以構建智能化的風險管控能力為核心目標,運用大數(shù)據(jù)計算處理技術和機器學習、深度學習模型,實現(xiàn)“數(shù)據(jù)采集和整合->數(shù)據(jù)加工處理->數(shù)據(jù)挖掘與分析->模型部署上線->持續(xù)優(yōu)化迭代”的智能風控閉環(huán)管理。
實現(xiàn)風險數(shù)據(jù)整合和可視化管理。大部分商業(yè)銀行在IT建設的歷史過程中,由于前期缺乏數(shù)據(jù)治理和系統(tǒng)建設科學規(guī)劃,曾形成多個煙囪式系統(tǒng),大量數(shù)據(jù)分散在不同系統(tǒng)中,雖然商業(yè)銀行通過建設數(shù)據(jù)倉庫、數(shù)據(jù)集市等基于關系型數(shù)據(jù)庫的系統(tǒng),一定程度解決了風險數(shù)據(jù)分散的問題,但受關系型數(shù)據(jù)庫存儲成本高、運算能力低、支持數(shù)據(jù)類型少等方面的限制,仍有大量風險數(shù)據(jù)尚未集中存儲。同時,通過數(shù)據(jù)倉庫、數(shù)據(jù)集市提取數(shù)據(jù)流程較長、加工運算能力較低,缺乏便捷、有效的數(shù)據(jù)管理工具,導致風險數(shù)據(jù)利用效率不高,對風控決策支持造成制約。因此智能風控平臺需要基于大數(shù)據(jù)技術對內、外部風險數(shù)據(jù)進一步整合,并實現(xiàn)數(shù)據(jù)的可視化管理,以便開展便捷、高效的數(shù)據(jù)處理,為智能風控提供數(shù)據(jù)支撐。
支持基于人工智能技術的機器學習建模。人工智能模型作為智能風控的“靈魂”,是商業(yè)銀行應掌握的核心風控能力。人工智能模型構建往往需要復雜的機器學習算法,傳統(tǒng)建模工具通常缺少對機器學習算法的直接支持,并且需要大量的人工編碼,對于大部分銀行建模人員來說使用門檻高。因此智能風控平臺需支持基于人工智能技術的機器學習建模,以便銀行建模人員實現(xiàn)智能風控模型的便捷開發(fā)。
支持風控模型快速、靈活的迭代和部署。真正發(fā)揮智能風控的作用需要依靠風控模型及時迭代優(yōu)化,并進行快速部署運行。商業(yè)銀行以往使用傳統(tǒng)建模工具建模往往效率較低、模型迭代周期較長,同時模型部署通常需要預先部署決策引擎,再使用人工方式進行參數(shù)配置,操作繁瑣、耗時較長且模型部署的位置不靈活,難以適應新形勢下風控模型迅速迭代、快速部署的需要。為保證模型的時效性,快速適應客群風險特征的變化,智能風控平臺需具備支持模型及時優(yōu)化更新的能力,并可以將模型快速、靈活部署到模型運行環(huán)境。
智能風控平臺建設的困難和挑戰(zhàn)
系統(tǒng)架構和技術較為復雜。智能風控平臺包括風險數(shù)據(jù)整合、數(shù)據(jù)可視化管理、機器學習建模、模型發(fā)布和模型應用等多個模塊,需要對各模塊進行橫向、縱向銜接以及技術的融合運用。從縱向看,從底層數(shù)據(jù)源到上層的風控應用,需要根據(jù)數(shù)據(jù)依賴關系及業(yè)務邏輯對系統(tǒng)進行分層設計。從橫向看,不同功能模塊之間,需要根據(jù)相互調用關系進行有效銜接。同時建設過程中還要考慮分布式計算、機器學習、知識圖譜、圖計算等新技術以及ETL、關系型數(shù)據(jù)庫等傳統(tǒng)技術的綜合運用和技術兼容問題,這些都對平臺建設構成了挑戰(zhàn)。
數(shù)據(jù)處理和數(shù)據(jù)安全管理難度大。數(shù)據(jù)問題既是平臺建設要解決的問題,也是要面臨的難點。通過智能風控平臺進行建模的基礎條件是所整合的風險數(shù)據(jù)質量有保障,但商業(yè)銀行現(xiàn)有數(shù)據(jù)存在不同程度的數(shù)據(jù)標準不一、數(shù)據(jù)定義不明、數(shù)據(jù)口徑不清以及數(shù)據(jù)缺失等問題,使得智能風控平臺建設過程中的數(shù)據(jù)梳理、口徑統(tǒng)一、數(shù)據(jù)清洗等工作耗時長、難度大。同時,平臺整合行內外大量可視化風險數(shù)據(jù),為提高數(shù)據(jù)的利用價值,更多數(shù)據(jù)需要向用戶開放,增加了數(shù)據(jù)安全管理的復雜性。
自主建設能力存在不足。智能風控平臺作為金融科技應用的創(chuàng)新實踐方興未艾,大部分商業(yè)銀行由于前期缺乏技術積累,專業(yè)人才較為匱乏,同類項目建設經(jīng)驗不足等原因,在探索建設過程中對平臺的功能邊界、風控規(guī)則等難免有認知局限。同時,平臺建設涉及多種風控應用落地,較難一次性完成,自主實施也存在一定難度。
華夏銀行智能風控平臺的建設實踐
華夏銀行智能風控平臺通過外部引智和借鑒業(yè)內先進經(jīng)驗,克服了架構、技術、數(shù)據(jù)、應用等多方面的困難,共歷時一年多,分兩批投產上線,具備了客戶風險畫像、風控建模、智能風險分析等功能。第一批2019年3月投產,完成了行內多個數(shù)據(jù)源重要風險數(shù)據(jù)的整合,并引入工商數(shù)據(jù)與行內客戶數(shù)據(jù)融合,第二批2019年10月投產,形成了“天機星”企業(yè)客戶風險畫像系統(tǒng)和“天算星”風控建模系統(tǒng)兩大核心功能。
建設“天機星”企業(yè)客戶風險畫像系統(tǒng),建立客戶風險全景視圖。針對企業(yè)客戶關聯(lián)關系存在真實情景復雜、客戶刻意隱瞞從而難以充分準確識別等問題,“天機星”系統(tǒng)優(yōu)先著力解決集團客戶風險捕捉不全面、過度授信等業(yè)務痛點,力圖識別每條客戶關聯(lián)關系的“天機”。一是構建客戶譜系。進行關系挖掘分析聚合,從投資、擔保、控制人關系等多維度構建關系圖譜,網(wǎng)狀呈現(xiàn)客戶在關系圖譜中所處的位置及角色,區(qū)分強經(jīng)濟圈、最終受益人圈、最終控制人圈、集團圈,識別企業(yè)的實際控制人,有效識別關聯(lián)風險,預防外源性風險傳導。二是生成客戶風險畫像。以客戶為中心整合內外部風險信息,深度刻畫剖析企業(yè)的內外部風險,形成多維立體的客戶風險畫像,實現(xiàn)從“人找信息”到“信息找人”的轉變。三是提供智能分析報告。基于客戶風險畫像,引入智能評價策略,構建客戶、集團、行業(yè)、地域等不同統(tǒng)計維度上的風險分析報告體系。
建設“天算星”風控建模系統(tǒng),賦能智能風控模型敏捷開發(fā)。“天算星”集成了風險數(shù)據(jù)整合、數(shù)據(jù)可視化管理和機器學習建模等功能,為開發(fā)建設智能化風控模型提供建模平臺,可極大地提高算力。一是對內外部風險數(shù)據(jù)進行整合。涉及內外部多個信息系統(tǒng)數(shù)據(jù)源,涵蓋了客戶、業(yè)務、擔保、財務、征信、工商及銀保監(jiān)會客戶風險信息等多種數(shù)據(jù)。二是實現(xiàn)風險數(shù)據(jù)分類管理和權限管理。既支持數(shù)據(jù)資源的可視化訪問,提供多種格式的數(shù)據(jù)導入,大大提高數(shù)據(jù)提取和數(shù)據(jù)利用的便利性,也支持數(shù)據(jù)分類管理,實現(xiàn)精細化的數(shù)據(jù)分類和不同數(shù)據(jù)庫之間的數(shù)據(jù)相互調用。同時支持靈活的數(shù)據(jù)權限管理,對不同用戶設置差異化的數(shù)據(jù)讀、寫權限控制,采用樹狀結構配置數(shù)據(jù)庫和表、用戶組和用戶之間的權限,實現(xiàn)了數(shù)據(jù)權限的靈活管理以保障數(shù)據(jù)安全。三是提供了豐富的數(shù)據(jù)處理功能。既支持數(shù)據(jù)統(tǒng)計、數(shù)據(jù)拆分、數(shù)據(jù)清洗等預處理功能以及特征抽取、特征組合等自動化的特征工程,也支持數(shù)據(jù)定制化加工,并同時提供菜單式和編碼式的數(shù)據(jù)處理功能,從而大大降低數(shù)據(jù)處理的難度。四是支持機器學習建模。引入多種高精度的機器學習算法,支持自動、智能、精準、快速的模型開發(fā),同時具有模型直接發(fā)布部署和模型翻譯功能,大大提高模型開發(fā)、優(yōu)化和部署的效率與靈活性。
采用先進架構和技術,提高智能風控處理能力與效率。一是采用高內聚低耦合的三層系統(tǒng)架構,便于平臺管理和擴展。高內聚低耦合系統(tǒng)架構下,每個模塊只聚焦特定的獨立子功能,模塊與模塊之間的聯(lián)系盡量少且接口簡單,相比低內聚高耦合的系統(tǒng)架構,顯著提高了系統(tǒng)穩(wěn)定性和獨立性,更便于平臺管理和擴展。平臺的數(shù)據(jù)整合層專注于構建大容量Hadoop數(shù)據(jù)集群,整合和存儲內外部數(shù)據(jù),供“天機星”和“天算星”共享。模型構建層專注于大數(shù)據(jù)的清洗、加工以及模型構建。模型應用層專注于通過模型運算輸出模型結果。各層級功能相對獨立,降低了系統(tǒng)各層級間的相互影響,同時又實現(xiàn)了數(shù)據(jù)共享。二是采用大數(shù)據(jù)處理技術提升運算性能。采用當今業(yè)界前沿的大數(shù)據(jù)處理技術,在分布式框架下將Hive和MapReduce相結合,用于支撐TB、乃至PB級的大規(guī)模數(shù)據(jù)集并行運算,實現(xiàn)傳統(tǒng)技術難以支撐的海量數(shù)據(jù)批處理運算。前臺數(shù)據(jù)查詢采用Redis內存數(shù)據(jù)庫,搜索引擎采用ElasticSearch,大大提升大數(shù)據(jù)搜索查詢和計算速度。三是利用知識圖譜技術,提升客戶風險全景視圖的挖掘探查能力。采用業(yè)界領先的Neo4j圖數(shù)據(jù)庫和Spark GraphX分布式圖處理技術,以圖的結構形式存儲關聯(lián)數(shù)據(jù),無需全局搜索,僅遍歷查詢有限的局部數(shù)據(jù)就可以得到查詢結果,并且基于簡潔易用、豐富的圖計算和圖挖掘接口,更加方便地實現(xiàn)對千萬級企業(yè)客戶的關聯(lián)譜系構建和疑似實際控制人識別,較傳統(tǒng)技術大規(guī)模關聯(lián)數(shù)據(jù)的查詢和運算速度可提高數(shù)倍乃至數(shù)十倍,并提高開發(fā)效率。
總結和展望
智能風控平臺的建設和運用為商業(yè)銀行開展智能風控提供了更多的工具和手段。但智能風控并非無所不能,它無法取代數(shù)據(jù)治理等基礎工作,也無法完全脫離建模人員的專家經(jīng)驗,其在金融領域的應用仍處于探索階段,金融場景的復雜多變也使智能風控面臨更多的考驗。同時外部數(shù)據(jù)獲取的穩(wěn)定性、可用性等問題,機器學習算法本身的過擬合問題以及外部“黑產”和團伙欺詐手段的不斷升級等因素都可能對智能風控實施產生挑戰(zhàn)。未來在合規(guī)運營的前提下,商業(yè)銀行應繼續(xù)加強數(shù)據(jù)價值的挖掘,加大風控建模專業(yè)隊伍的培養(yǎng),充分利用新技術的優(yōu)勢,因勢利導,不斷加強智能風控應用的廣度和深度,從而完成智能風控“將數(shù)據(jù)轉化成信息,將信息轉化成知識,將知識轉化成能力”的增值過程。
(作者系華夏銀行授信審批部總經(jīng)理)