洪蕾
關(guān)注、探索并嘗試駕馭大數(shù)據(jù)技術(shù)及應(yīng)用,一直是國內(nèi)金融機構(gòu)信息科技工作的重點和目標。
而如何從海量數(shù)據(jù)挖掘出具有價值的信息,并將其應(yīng)用于業(yè)務(wù)經(jīng)營和管理,更成為金融機構(gòu)的戰(zhàn)略重點。
“但多年來,銀行積累的大量高價值數(shù)據(jù)往往受限于多種因素,實際利用率并不高?!边@是中國民生銀行科技開發(fā)部總經(jīng)理牛新莊的顧慮,也是當前銀行業(yè)大數(shù)據(jù)應(yīng)用構(gòu)想面臨的現(xiàn)實困境。
新一代數(shù)據(jù)分析體系
大數(shù)據(jù)變革反映的是新的分布式技術(shù)體系的日趨成熟,并在很多領(lǐng)域已全面超越傳統(tǒng)技術(shù)體系。
分析銀行系統(tǒng)特點可以看到,銀行交易系統(tǒng)大多構(gòu)建在關(guān)系型數(shù)據(jù)庫技術(shù)之上,對性能擴展通常采用垂直擴張方式,當用戶數(shù)量增加后,服務(wù)器對應(yīng)的CPU、內(nèi)存等配置也相應(yīng)增加,通過資源擴展?jié)M足業(yè)務(wù)性能需求;銀行非交易系統(tǒng)(如營銷體系、客戶管理體系、風險控制體系等)早期也大都基于關(guān)系型數(shù)據(jù)庫構(gòu)建數(shù)據(jù)分析體系。
隨著開源技術(shù)體系快速發(fā)展、成熟,銀行業(yè)傾向構(gòu)建效率更高、成本更低的新一代數(shù)據(jù)分析體系。
牛新莊認為,大數(shù)據(jù)在營銷、運營和風險控制領(lǐng)域更有用武之地,尤其在風控領(lǐng)域的應(yīng)用更具想象空間,這是因為大數(shù)據(jù)分析的本質(zhì)是在可接受的成本下解決數(shù)據(jù)使用效率和決策智能自動化的問題。
對民生銀行而言,構(gòu)建新一代數(shù)據(jù)分析體系重點希望解決兩個問題。
一是效率。移動互聯(lián)和大數(shù)據(jù)的發(fā)展使得信息單元越來越小,傳遞越來越快,數(shù)據(jù)時效性越來越高。同樣的數(shù)據(jù)分析結(jié)果,用時一周和用時一小時對商業(yè)應(yīng)用產(chǎn)生的影響截然不同。對銀行而言,從業(yè)務(wù)需求角度,所有的非交易系統(tǒng)正經(jīng)歷著從批量到準實時、從準實時到實時的轉(zhuǎn)變。
二是智能自動化。用戶和銀行的接觸渠道已從線下廳堂柜臺逐步向線上遷移。
據(jù)統(tǒng)計,當前超過90% 的銀行業(yè)務(wù)來自于線上渠道。業(yè)務(wù)流程自動化和智能化的本質(zhì)是讓信息系統(tǒng)有能力像人一樣做出決策,而這需要一整套大數(shù)據(jù)技術(shù)體系支持模型計算,以及一整套大數(shù)據(jù)發(fā)展規(guī)劃給予支撐。
四維大數(shù)據(jù)發(fā)展戰(zhàn)略
民生銀行希望借助挖掘分析算法、機器學習算法等,發(fā)揮數(shù)據(jù)效用,創(chuàng)造商業(yè)價值。“我們構(gòu)建大數(shù)據(jù)基礎(chǔ)技術(shù)平臺,目的在于構(gòu)建盤活銀行內(nèi)外數(shù)據(jù)資源的能力?!眹@這一目標,民生銀行大數(shù)據(jù)發(fā)展規(guī)劃可概括為人才、平臺、數(shù)據(jù)和應(yīng)用四個方面。
儲備人才
大數(shù)據(jù)人才儲備是重中之重。民生銀行大數(shù)據(jù)平臺主要基于Hadoop 技術(shù),選擇這一技術(shù)是由于該技術(shù)已在互聯(lián)網(wǎng)環(huán)境中經(jīng)受上萬臺集群規(guī)模驗證,應(yīng)用廣泛,技術(shù)體系也較為成熟。但對商業(yè)銀行而言,新技術(shù)應(yīng)用需要新型專業(yè)技術(shù)人才。為此,民生銀行從2013 年開始就有意識地從互聯(lián)網(wǎng)企業(yè)引入經(jīng)驗豐富的Hadoop 技術(shù)團隊。
專業(yè)的人才隊伍為民生銀行大數(shù)據(jù)構(gòu)想落地實施奠定了重要基礎(chǔ),也為大數(shù)據(jù)新技術(shù)體系和數(shù)據(jù)驅(qū)動業(yè)務(wù)發(fā)展的思想向更多員工傳遞創(chuàng)造了一個通路。
據(jù)了解,民生銀行信息科技部組織了大量有針對性的培訓(xùn)活動,邀請行內(nèi)外專家開展專場講座,全面提升團隊分析能力,為大數(shù)據(jù)項目接入做了充分準備。
建設(shè)平臺
經(jīng)過謹慎論證,民生銀行確定基于Hadoop構(gòu)建新一代大數(shù)據(jù)平臺。“這是因為我們更關(guān)注平臺的靈活性、兼容性和現(xiàn)場支持力度??紤]到Hadoop平臺自身的技術(shù)問題以及響應(yīng)監(jiān)管部門支持國產(chǎn)廠商的號召,我們最終選擇與國內(nèi)Hadoop廠商合作開發(fā)構(gòu)建新平臺。”牛新莊表示。
基于業(yè)務(wù)發(fā)展和機房現(xiàn)狀,民生銀行在生產(chǎn)環(huán)境構(gòu)建了三套Hadoop集群,對不同集群按照應(yīng)用特點進行分工定位,包括在線存儲集群(提供在線查詢?nèi)珉娮踊貑?、歷史數(shù)據(jù)等查詢)、計算集群(提供批量加工計算)和災(zāi)備集群(兩地三中心,對重要數(shù)據(jù)進行災(zāi)備)。
實施中,針對諸如基礎(chǔ)網(wǎng)絡(luò)環(huán)境的支撐狀況、計算與存儲集群機型的標準化、集群的管理應(yīng)用等問題,民生銀行科技開發(fā)部進行了細致研究和分析。同時,基于大數(shù)據(jù)分析平臺,引入可視化挖掘工具,提升平臺的易用性。
積累數(shù)據(jù)
多年的信息化建設(shè)歷程為銀行積累了大量歷史數(shù)據(jù),這些數(shù)據(jù)包括客戶基本信息、資產(chǎn)信息、交易信息等結(jié)構(gòu)化數(shù)據(jù)以及語音、圖片、文檔等非結(jié)構(gòu)數(shù)據(jù)。而這些種類繁多的數(shù)據(jù)一直存儲在銀行各個系統(tǒng)中。
為此,民生銀行大數(shù)據(jù)平臺建設(shè)要解決的首要問題是數(shù)據(jù)的集中管理,在此基礎(chǔ)上,要將用戶行為數(shù)據(jù)、第三方數(shù)據(jù)逐步集中,并基于大數(shù)據(jù)平臺的數(shù)據(jù)種類不斷擴展。
實施應(yīng)用
牛新莊認為,營銷、運營和風險控制是大數(shù)據(jù)的典型應(yīng)用場景,能帶來更多創(chuàng)新。
而大數(shù)據(jù)對應(yīng)用創(chuàng)新的支撐也可以簡單歸納為兩個方向:一是解決當前數(shù)據(jù)“存不下”和“算不了”的問題。如民生銀行成立20 年來積累了大量的用戶數(shù)據(jù)。這些數(shù)據(jù)存儲在磁帶庫上,查詢難度非常大,在處理部分監(jiān)管或者糾察事件時,經(jīng)常需要追查歷史磁帶庫的數(shù)據(jù),在傳統(tǒng)存儲體系下,需耗費很長時間,而新的大數(shù)據(jù)技術(shù)體系就能解決上述問題。
二是進行新技術(shù)的引入和探索,推動決策自動化、智能化發(fā)展。未來,大部分決策工作可交給計算機完成,就算法原理而言,目前的算法和十年前的并沒有太大變化,但大數(shù)據(jù)技術(shù)的出現(xiàn),加快了計算速度。2016年,Google AlphaGo戰(zhàn)勝圍棋冠軍李世石的消息讓人工智能瞬間進入公眾視野。盡管當前人工智能還達不到像人類一樣思考,但在某些固定場景下,人工智能可以通過對海量歷史數(shù)據(jù)的學習、分析,達到甚至超越專家的知識水平。如在銀行風險控制領(lǐng)域,依據(jù)專家知識對數(shù)據(jù)指標做出加工規(guī)則和決策判斷,如果銀行積累了足夠多的歷史數(shù)據(jù),完全可以嘗試讓計算機進行決策。
據(jù)了解,民生銀行已在非交易型系統(tǒng)中大量使用了大數(shù)據(jù)技術(shù),投產(chǎn)上線的系統(tǒng)達到10 套。
相關(guān)鏈接
民生銀行大數(shù)據(jù)“攻略”
據(jù)了解,民生銀行大數(shù)據(jù)平臺項目主要分為兩類:簡單計算查詢類和高級分析挖掘類。
簡單計算查詢類項目解決從技術(shù)角度出發(fā)“存不下”和“算不了”的問題,這類項目大部分是通用平臺系統(tǒng)。
高級分析挖掘類平臺主要實現(xiàn)數(shù)據(jù)分析。
比如移動運營數(shù)據(jù)平臺對民生銀行所有的移動端的用戶行為數(shù)據(jù)、地理位置數(shù)據(jù)等進行完整采集和分析,通過移動運營數(shù)據(jù)平臺,民生銀行可以及時了解移動客戶端使用狀況,開展用戶行為分析,進行產(chǎn)品迭代更新和移動端產(chǎn)品運營。
再如手機銀行資產(chǎn)匯集及查詢平臺,該平臺是完全基于大數(shù)據(jù)強大計算和查詢能力而開發(fā)的應(yīng)用模塊,用于實現(xiàn)手機銀行客戶畫像、風險評分、理財產(chǎn)品推薦等功能。
民生銀行大數(shù)據(jù)應(yīng)用既要著手解決當前數(shù)據(jù)存儲和計算問題,也要著眼未來,堅持“思想統(tǒng)一,人才建設(shè),平臺構(gòu)建,數(shù)據(jù)完善,人工智能”的指導(dǎo)方針,致力于實現(xiàn)建設(shè)更快更智能的大數(shù)據(jù)平臺的科技新構(gòu)想。