周晶平
(中南民族大學(xué) 計(jì)算機(jī)科學(xué)學(xué)院,湖北 武漢 430074)
商業(yè)銀行在經(jīng)營過程中,獲得了大量的業(yè)務(wù)數(shù)據(jù)和客戶信息,如何利用數(shù)據(jù)挖掘技術(shù)在這些海量數(shù)據(jù)中進(jìn)行高層次的數(shù)據(jù)分析,為銀行經(jīng)營提供科學(xué)的決策依據(jù)是每個(gè)商業(yè)銀行面臨的問題.對于我國的金融機(jī)構(gòu)而言,數(shù)據(jù)挖掘項(xiàng)目不是一個(gè)新鮮的話題,卻是一個(gè)缺少成功答卷的命題.文中在分析銀行客戶關(guān)系管理系統(tǒng)的基礎(chǔ)上,研究銀行分析型CRM的體系結(jié)構(gòu)、主要功能,數(shù)據(jù)挖掘過程和挖掘方法.探討數(shù)據(jù)挖掘在銀行分析型CRM應(yīng)用中存在的問題和解決辦法.
圖1 銀行CRM系統(tǒng)結(jié)構(gòu)
我國商業(yè)銀行采用計(jì)算機(jī)化管理已有多年,多種業(yè)務(wù)系統(tǒng)遍及省、市、縣各級業(yè)務(wù)部門,數(shù)據(jù)信息在物理上較為分散,歷史數(shù)據(jù)也極為龐大.因此,銀行CRM系統(tǒng)可以采用分布式數(shù)據(jù)倉庫環(huán)境,即所有分行均擁有自己的CRM系統(tǒng),并與本地綜合業(yè)務(wù)系統(tǒng)及呼叫中心連接.在總行建有CRM中心數(shù)據(jù)倉庫,提供面向全行的分析決策功能,并為網(wǎng)上銀行業(yè)務(wù)提供數(shù)據(jù)查詢支持.網(wǎng)上銀行的客戶信息直接在總行的CRM數(shù)據(jù)倉庫中集成,各分支機(jī)構(gòu)可以調(diào)用總行數(shù)據(jù)倉庫中的客戶信息,銀行CRM系統(tǒng)結(jié)構(gòu)如圖1所示.
銀行CRM系統(tǒng)由業(yè)務(wù)處理、客戶聯(lián)系和客戶關(guān)系分析中心三部分組成.客戶關(guān)系分析中心則以CRM中心數(shù)據(jù)倉庫為核心,數(shù)據(jù)集成系統(tǒng)與業(yè)務(wù)處理部分連接,同時(shí)為銀行的管理層和業(yè)務(wù)分析人員提供客戶分析服務(wù).
圖2 系統(tǒng)體系結(jié)構(gòu)
2.1系統(tǒng)的體系結(jié)構(gòu)分析型CRM系統(tǒng)的設(shè)計(jì)主要利用數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、聯(lián)機(jī)分析等技術(shù),其主要原理是將交易所累積的大量數(shù)據(jù)過濾,抽取到數(shù)據(jù)倉庫,再利用數(shù)據(jù)挖掘技術(shù)建立各種行為預(yù)測模型,最后利用圖表、曲線等對企業(yè)各種關(guān)鍵運(yùn)行指標(biāo)以及客戶市場分割情況向操作型應(yīng)用發(fā)布,達(dá)到成功決策的目的[1].銀行分析型CRM系統(tǒng)體系結(jié)構(gòu)如圖2所示.
2.2系統(tǒng)功能分析分析型CRM的目的是幫助銀行了解自身經(jīng)營情況,準(zhǔn)確地發(fā)現(xiàn)贏利客戶和具有贏利潛力的客戶,分析客戶的消費(fèi)傾向,幫助銀行開發(fā)適應(yīng)消費(fèi)者需求的新產(chǎn)品,為銀行贏得客戶提供有力的保障[2].其主要功能包括:(1)對客戶進(jìn)行評價(jià).分析誰是銀行的客戶,誰對銀行貢獻(xiàn)度大,根據(jù)風(fēng)險(xiǎn)收益對應(yīng)理論,嚴(yán)格控制風(fēng)險(xiǎn),爭取最大收益.(2)客戶流失分析.挽留一個(gè)已有客戶的成本要遠(yuǎn)遠(yuǎn)低于爭取一個(gè)新客戶.銀行通過CRM系統(tǒng)分析客戶的嗜好、興趣和注意力,根據(jù)客戶的愛好調(diào)整自己的產(chǎn)品和服務(wù),通過分析客戶的抱怨、建議、咨詢等信息不斷改進(jìn)自己的服務(wù)水平,贏得客戶的滿意,防止客戶流失.通過分析客戶對產(chǎn)品的應(yīng)用頻率、持續(xù)性等指標(biāo)判斷客戶的忠誠度,從而對忠誠客戶提供優(yōu)惠服務(wù).(3)防范金融風(fēng)險(xiǎn),提高經(jīng)營效益.通過CRM對不斷發(fā)展的客戶市場進(jìn)行研究和評價(jià),找出潛在的大客戶和風(fēng)險(xiǎn)較大的客戶,適時(shí)地選擇恰當(dāng)?shù)氖袌鰷?zhǔn)入和退出策略,及時(shí)做出積極主動響應(yīng),控制金融風(fēng)險(xiǎn),使經(jīng)濟(jì)效益最大化.(4)為銀行創(chuàng)新產(chǎn)品提供依據(jù).通過CRM研究銀行的發(fā)展趨勢和市場的發(fā)展變化,創(chuàng)新金融產(chǎn)品和服務(wù),爭取在競爭中立于不敗之地.
圖3 數(shù)據(jù)挖掘基本步驟
3.1數(shù)據(jù)挖掘過程在銀行分析型CRM中,數(shù)據(jù)挖掘是從大量的有關(guān)客戶數(shù)據(jù)中挖掘出隱含的、先前未知的、對金融企業(yè)決策有潛在價(jià)值的知識和規(guī)則.數(shù)據(jù)挖掘的實(shí)施并不能一蹴而就,是一個(gè)循序漸進(jìn)、循環(huán)反復(fù)、不斷調(diào)整的過程.一般來說,銀行CRM中的數(shù)據(jù)挖掘主要包括[3](如圖3):(1)確定分析和預(yù)測目標(biāo).CRM在進(jìn)行數(shù)據(jù)挖掘時(shí),首先需要明確商業(yè)目標(biāo),即你想通過數(shù)據(jù)挖掘解決的問題,達(dá)到的目的.還要將準(zhǔn)備解決的問題轉(zhuǎn)化為可以測量的目標(biāo),即數(shù)據(jù)挖掘的成功準(zhǔn)則.(2)數(shù)據(jù)選擇.對基礎(chǔ)數(shù)據(jù)進(jìn)行了解和選擇.比如,數(shù)據(jù)從哪里獲得?數(shù)據(jù)倉庫是否建立?內(nèi)部數(shù)據(jù)是否可直接使用?數(shù)據(jù)哪些字段是必要的?通過數(shù)據(jù)選擇可以對基礎(chǔ)數(shù)據(jù)建立基本的可信度.(3)數(shù)據(jù)準(zhǔn)備.對選擇的數(shù)據(jù)進(jìn)行必要的預(yù)處理、轉(zhuǎn)換,以消除數(shù)據(jù)噪音,提高數(shù)據(jù)的完整性、準(zhǔn)確性和可信度.(4)模型構(gòu)造.這是數(shù)據(jù)挖掘的關(guān)鍵階段,這一階段的主要工作有:根據(jù)挖掘的商業(yè)目標(biāo),選擇相應(yīng)的數(shù)據(jù)挖掘技術(shù),建立培訓(xùn)數(shù)據(jù)和測試數(shù)據(jù),利用培訓(xùn)數(shù)據(jù)采用相應(yīng)算法建立模型和模型解釋.(5)模型評估和校驗(yàn).使用測試數(shù)據(jù)對建立的模型進(jìn)行測試,計(jì)算誤差率,如未達(dá)到預(yù)期目標(biāo),則根據(jù)誤差原因,重新回到模型構(gòu)造或數(shù)據(jù)選擇階段,重復(fù)相關(guān)過程,直至找到滿意的模型.(6)部署和應(yīng)用.建立滿意的模型后,就可以在整個(gè)企業(yè)內(nèi)部署和應(yīng)用模型.另外,在應(yīng)用的過程中還要不斷的測試模型的成功概率,從而完善模型.
3.2數(shù)據(jù)挖掘的常用分析方法在銀行分析型CRM中,金融客戶數(shù)據(jù)挖掘中的常用分析方法包括:關(guān)聯(lián)規(guī)則挖掘方法、分類方法、聚類分析聚類方法[4]以及神經(jīng)網(wǎng)絡(luò)分析方法等.
(1)關(guān)聯(lián)規(guī)則挖掘方法.關(guān)聯(lián)規(guī)則挖掘方法主要用于發(fā)現(xiàn)不同事件之間的關(guān)聯(lián)性,即一個(gè)事件發(fā)生的同時(shí),另一個(gè)事件也經(jīng)常發(fā)生.關(guān)聯(lián)分析的重點(diǎn)在于快速發(fā)現(xiàn)那些有實(shí)用價(jià)值的關(guān)聯(lián)發(fā)生的事件.其主要依據(jù)是事件發(fā)生的概率和條件概率應(yīng)該符合一定的統(tǒng)計(jì)意義.(2)分類方法.分類在數(shù)據(jù)挖掘中是一項(xiàng)非常重要的任務(wù).類分析就是通過分析樣本客戶數(shù)據(jù)庫中的數(shù)據(jù),為每個(gè)類別做出準(zhǔn)確的描述,或建立分類模型,或挖掘出分類規(guī)則,然后用這個(gè)分類規(guī)則對其他客戶記錄進(jìn)行分類.分類模型也可用于預(yù)測.預(yù)測的目的是利用客戶的歷史數(shù)據(jù)紀(jì)錄中自動推導(dǎo)出對給定數(shù)據(jù)的推廣描述,從而對未來的客戶數(shù)據(jù)進(jìn)行預(yù)測.(3)聚類方法.聚類是把一組個(gè)體按照相似性歸成若干類別,即“物以類聚”.聚類將沒有分類的記錄,在不知道應(yīng)分成幾類時(shí),按數(shù)據(jù)內(nèi)在的差異性,合理地劃分成幾類,并確定每個(gè)記錄所屬類別.它的目的是使得屬于同一類別的個(gè)體之間的距離盡可能地小,而不同類別上的個(gè)體間的距離盡可能地大.(4)神經(jīng)網(wǎng)絡(luò)的分析方法.神經(jīng)網(wǎng)絡(luò)具有良好的魯棒性、自組織自適應(yīng)性、并行處理、分布存儲和高度容錯(cuò)等特性,非常適合解決數(shù)據(jù)挖掘的問題,能產(chǎn)生較好的預(yù)測效果.
對于我國的金融機(jī)構(gòu)而言,數(shù)據(jù)挖掘項(xiàng)目不是一個(gè)新鮮的話題,卻是一個(gè)缺少成功答卷的命題.數(shù)據(jù)控掘技術(shù)在銀行分析型CRM應(yīng)用過程中存在一些問題,影響了系統(tǒng)的運(yùn)用:一是銀行花了很大精力建設(shè)的數(shù)據(jù)挖掘系統(tǒng),沒有用戶或很少有人使用,二是數(shù)據(jù)挖掘的結(jié)果不能讓人滿意;三是系統(tǒng)靈活性不夠.數(shù)據(jù)挖掘作為非平凡的發(fā)現(xiàn)和探索過程,其需求具有很強(qiáng)的不確定性,需求變更相對頻繁.需求變更會涉及數(shù)據(jù)準(zhǔn)備、模型算法及前端應(yīng)用的一系列調(diào)整,使系統(tǒng)陷入疲于應(yīng)付的狀態(tài)等.
為實(shí)現(xiàn)數(shù)據(jù)挖掘在銀行分析型CRM中的成功應(yīng)用,應(yīng)從以下兩個(gè)方面入手.
4.1應(yīng)用層面(1)加強(qiáng)業(yè)務(wù)部門與技術(shù)部門的聯(lián)系與協(xié)調(diào).CRM是一項(xiàng)業(yè)務(wù)管理戰(zhàn)略,但這一戰(zhàn)略的實(shí)施離不開技術(shù)的支撐,這就意味著技術(shù)部門與業(yè)務(wù)部門間必須密切合作,共同確定滿足業(yè)務(wù)發(fā)展戰(zhàn)略需要的技術(shù)與架構(gòu).對現(xiàn)有業(yè)務(wù)的理解往往決定著項(xiàng)目建設(shè)的成敗,所以信息技術(shù)部門在部署相關(guān)技術(shù)架構(gòu)時(shí),還需要明確業(yè)務(wù)部門的需求及業(yè)務(wù)處理的優(yōu)先級.因此,如果雙方缺乏必要的合作,勢必會導(dǎo)致CRM系統(tǒng)不能很好地滿足企業(yè)整體業(yè)務(wù)的需求,影響CRM應(yīng)用的效益.在項(xiàng)目實(shí)施過程中,組建一個(gè)由技術(shù)部門與業(yè)務(wù)部門共同參與的項(xiàng)目小組非常必要,這樣更有利于實(shí)現(xiàn)業(yè)務(wù)與技術(shù)的雙向溝通.
(2)注重挖掘過程.在數(shù)據(jù)挖掘課題中,大部分時(shí)間都是對問題的理解及數(shù)據(jù)的收集、處理和整理,對數(shù)據(jù)挖掘過程的掌握很重要.因此,數(shù)據(jù)挖掘技術(shù)應(yīng)用于銀行CRM系統(tǒng)的實(shí)踐中,應(yīng)注意本3個(gè)方面問題. ①要有明確的挖掘目標(biāo).數(shù)據(jù)挖掘并非是萬能的,它必須在確定的主題下才能發(fā)揮好的效果.銀行首先應(yīng)該對涉及CRM系統(tǒng)的各類商業(yè)問題進(jìn)行分類,選定合適的商業(yè)問題來分別進(jìn)行挖掘處理;其次根據(jù)商業(yè)問題,從大量的銀行業(yè)務(wù)數(shù)據(jù)中選擇和識別這些數(shù)據(jù),便于對數(shù)據(jù)進(jìn)行有效處理,使之更加適應(yīng)挖掘工具. ②前期準(zhǔn)備工作至關(guān)重要.在數(shù)據(jù)挖掘的過程中,大部分時(shí)間都花在對問題的理解及數(shù)據(jù)的收集、處理和整理過程中.數(shù)據(jù)的質(zhì)量決定挖掘結(jié)果的正確與否,在采集數(shù)據(jù)時(shí)應(yīng)特別注意數(shù)據(jù)的準(zhǔn)確性.③挖掘結(jié)果及時(shí)試用并反饋修整模型.挖掘結(jié)果的解釋十分重要,結(jié)果要及時(shí)反饋到?jīng)Q策人,為銀行的科學(xué)決策提供支持.同時(shí),結(jié)果使用后要及時(shí)反饋給分析人員,以便對模型進(jìn)行修正,為今后的數(shù)據(jù)挖掘提供資料.
4.2技術(shù)層面在銀行分析型CRM中,數(shù)據(jù)倉庫是數(shù)據(jù)挖掘的基礎(chǔ),如果數(shù)據(jù)倉庫的數(shù)據(jù)質(zhì)量不能得到保證,會嚴(yán)重降低數(shù)據(jù)挖掘的使用率和可信度,還可能給決策分析帶來災(zāi)難的后果.如果數(shù)據(jù)挖掘能力不強(qiáng),則系統(tǒng)不能滿足用戶要求.數(shù)據(jù)倉庫和數(shù)據(jù)挖掘是銀行分析型CRM應(yīng)用中的兩個(gè)方面.
(1)數(shù)據(jù)倉庫.數(shù)據(jù)倉庫是企業(yè)信息系統(tǒng)中最為復(fù)雜的部分,特別是銀行、保險(xiǎn)等金融企業(yè),數(shù)據(jù)倉庫系統(tǒng)必須匯集來自眾多業(yè)務(wù)系統(tǒng)的數(shù)據(jù),支持紛繁的業(yè)務(wù)分析,而且它還必須隨著業(yè)務(wù)需求的變化而不斷調(diào)整.因此,在數(shù)據(jù)倉庫建設(shè)中,要注意的方面有:①數(shù)據(jù)倉庫規(guī)劃.數(shù)據(jù)倉庫工程是為了滿足對經(jīng)營管理決策支持的需要,在整個(gè)企業(yè)范圍內(nèi),建立統(tǒng)一協(xié)調(diào)的全局信息環(huán)境的龐大工程,是一項(xiàng)復(fù)雜的信息集成工程.在數(shù)據(jù)倉庫工程中,涉及的業(yè)務(wù)和技術(shù)面都比較廣,參加的業(yè)務(wù)部門多,頭緒繁雜.如果沒有一個(gè)統(tǒng)一的規(guī)劃,很難保證項(xiàng)目的成功實(shí)施.規(guī)劃應(yīng)體現(xiàn)超前性,具有超前性的系統(tǒng)才會長久,才會更容易體現(xiàn)技術(shù)的先進(jìn)性和業(yè)務(wù)的預(yù)見性.②元數(shù)據(jù)管理.數(shù)據(jù)質(zhì)量直接影響數(shù)據(jù)倉庫系統(tǒng)的生命力.在數(shù)據(jù)倉庫系統(tǒng)中,元數(shù)據(jù)機(jī)制監(jiān)測每次從數(shù)據(jù)源抽取數(shù)據(jù)的過程中,記錄有關(guān)錯(cuò)誤的統(tǒng)計(jì)信息,從而為系統(tǒng)管理人員提供數(shù)據(jù)質(zhì)量的信息,因此,必須重視元數(shù)據(jù)的管理[5].對元數(shù)據(jù)的管理,比較完備的方式是利用現(xiàn)成的產(chǎn)品工具進(jìn)行管理.沒有工具時(shí),元數(shù)據(jù)的管理體現(xiàn)為文檔管理,文檔的內(nèi)容就是元數(shù)據(jù),文檔應(yīng)做到多樣、齊全,才能應(yīng)付后續(xù)不可預(yù)見的風(fēng)險(xiǎn).③ETCL(抽取、轉(zhuǎn)換、清洗和加載)過程,后臺處理系統(tǒng)是數(shù)據(jù)倉庫系統(tǒng)成功的基礎(chǔ),在金融數(shù)據(jù)倉庫系統(tǒng)中,它從其他各個(gè)業(yè)務(wù)系統(tǒng)中抽取數(shù)據(jù)進(jìn)行轉(zhuǎn)換、清洗、匯總和聚合,并加載到數(shù)據(jù)倉庫中,時(shí)間和速度在數(shù)據(jù)倉庫的ETCL過程中非常重要[6].如果技巧和方法不當(dāng),則加載效率不高.對銀行這樣的企業(yè),可用于加載的時(shí)間非常短,每天的后續(xù)加載壓力會很大.因此,數(shù)據(jù)倉庫設(shè)計(jì)就應(yīng)充分考慮這個(gè)問題.另外,數(shù)據(jù)倉庫無論從有儲方式,組織形式還是數(shù)據(jù)類型,與源系統(tǒng)都是不一致的.在ETCL過程中,一方面,ETCL過程本身可能帶來數(shù)據(jù)質(zhì)量問題,要通過加強(qiáng)ETL階段的測試工作進(jìn)行排除;另一方面,ETL人員通過對源數(shù)據(jù)的詳細(xì)查看,可以發(fā)現(xiàn)非常全面而細(xì)節(jié)的源數(shù)據(jù)質(zhì)量問題.
(2)數(shù)據(jù)挖掘.數(shù)據(jù)挖掘是根據(jù)企業(yè)的既定業(yè)務(wù)目標(biāo)和對大量的企業(yè)數(shù)據(jù)進(jìn)行探索和分析、揭示隱藏的、未知的、規(guī)律性,或驗(yàn)證已知的規(guī)律,并將其模型化的一種先進(jìn)有效的方法.在銀行分析型CRM中,客戶數(shù)據(jù)挖掘能力是CRM系統(tǒng)的主要技術(shù)要求之一,對數(shù)據(jù)挖掘,關(guān)鍵在于對數(shù)據(jù)挖掘的算法、分法和應(yīng)用的理解和掌握.由于每一個(gè)問題常常有幾種不同的算法可以解決,每種算法也都可以用來解決不同的問題[7].因此,對每種算法和應(yīng)用的理解至關(guān)重要,需要非常熟悉,才能多方法融合,有機(jī)組合互補(bǔ).
基于數(shù)據(jù)挖掘的銀行分析型CRM的應(yīng)用是一項(xiàng)復(fù)雜的系統(tǒng)工程,在應(yīng)用過程中獲得高層領(lǐng)導(dǎo)和管理層的支持及銀行員工的理解、協(xié)作和共同認(rèn)可極為重要.同時(shí),還需加強(qiáng)員工培訓(xùn)和對最終用戶的支持,使他們能夠成功地應(yīng)用這一系統(tǒng),從而提升競爭力.
參考文獻(xiàn):
[1] 何榮勤.CRM原理設(shè)計(jì)實(shí)踐[M].北京:電子工業(yè)出版社,2006.
[2] 張永虎.CRM系統(tǒng)及其在我國銀行業(yè)的應(yīng)用分析[J].中國金融電腦,2002(3):67-70.
[3] 董寧.數(shù)據(jù)挖掘技術(shù)在CRM中的應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2007(6):1429-1431.
[4] 劉同明.數(shù)據(jù)挖掘技術(shù)及其應(yīng)用[M].北京:國防工業(yè)出版社,2001.
[5] 聶茹.數(shù)據(jù)倉庫元數(shù)據(jù)建設(shè)思考[J].計(jì)算機(jī)應(yīng)用研究,2005(2):57-57.
[6] 王克龍.數(shù)據(jù)倉庫中ETL技術(shù)的探討與實(shí)踐[J].計(jì)算機(jī)應(yīng)用與軟件,2005(11):30-32.
[7] 鄒志文.數(shù)據(jù)挖掘算法研究與綜述[J].計(jì)算機(jī)工程與設(shè)計(jì),2005(9):2304-2308.