范建華 張肖
摘要:本文的研究的主要目的是將數(shù)據(jù)挖掘技術(shù)作為一種信息保護(hù)手段引入到信息安全體系之中,從全新的視角來找到一種信息保護(hù)方法。數(shù)據(jù)挖掘在當(dāng)代信息爆炸時代可以說是一種的信息價值增值手段,但是同時它也是一種必要的信息保護(hù)方法。信息的泄露或者對所存在的有價值信息視而不見被競爭者利用就會是造成一定的損失甚至是災(zāi)難性的后果。特別是對于銀行業(yè),其信息具有真實(shí)性、實(shí)時性等特點(diǎn),對于信息安全有特別高的要求,因此不能無視隱性風(fēng)險(xiǎn)隱患的存在,應(yīng)該積極開發(fā)和利用數(shù)據(jù)挖掘技術(shù)來進(jìn)一步完善信息安全風(fēng)險(xiǎn)防控體系。
關(guān)鍵詞:信息安全數(shù)據(jù)挖掘流程
1.引言
從上世紀(jì)90年代中后期,我國各大商業(yè)銀行都進(jìn)入了數(shù)據(jù)化大集中的時代,數(shù)據(jù)集中是銀行界對技術(shù)支持系統(tǒng)的一個改造,同時也是對傳統(tǒng)銀行業(yè)的整體管理理念的徹底再造。銀行業(yè)經(jīng)歷了金融電子化時代,幾乎各項(xiàng)業(yè)務(wù)都實(shí)現(xiàn)了數(shù)字化。多數(shù)的數(shù)據(jù)我們無法處理,因此可以說它是垃圾信息,但是并不能肯定它是沒有價值的信息。那么許多有用的信息就被我們忽視或者丟棄在那些我們所認(rèn)為的垃圾數(shù)據(jù)之中,這就給信息保護(hù)埋下了安全隱患。要保護(hù)大型數(shù)據(jù)和信息就有必要將數(shù)據(jù)挖掘作為信息安全策略的一個方面來進(jìn)一步維護(hù)信息安全。
2.銀行業(yè)需要重視和保護(hù)的信息內(nèi)容
銀行業(yè)信息可以認(rèn)為是在銀行的一系列業(yè)務(wù)發(fā)展過程中產(chǎn)生、應(yīng)用和搜集的各類信息,這些信息是銀行業(yè)經(jīng)營和發(fā)展的基礎(chǔ)。在銀行業(yè)發(fā)展過程中信息安全情況決定其生存和發(fā)展的命脈,因此信息保護(hù)就成為各類銀行發(fā)展中所必須重視的一項(xiàng)內(nèi)容更。銀行業(yè)信息可以劃分為兩大類:
2.1顯性信息
顯性數(shù)據(jù)主要包括由各類存儲媒介保存的數(shù)據(jù),包括軟盤、硬盤、紙質(zhì)等保存的文件,這部分資料可以占道銀行信息的20%。這類是數(shù)據(jù)是業(yè)務(wù)發(fā)展所產(chǎn)生和存儲的數(shù)據(jù),包括賬戶的開立信息、個人儲蓄記錄、對公存款記錄、貸款資料、貸款合同、還款記錄等等。這些信息是可以隨時調(diào)閱和查找使用的信息。
2.2隱性信息
隱性數(shù)據(jù)是相對于顯性數(shù)據(jù)而言的,它沒有具體的存儲介質(zhì),比較抽象的但是實(shí)在存在的數(shù)據(jù)。這一類數(shù)據(jù)主要是柜員、客戶經(jīng)理、中層領(lǐng)導(dǎo)在日常工作中所掌握的隱性的沒有量化的信息,這部分資料根據(jù)二八原則可占到銀行信息的80%。柜員在儲蓄柜臺辦理日常的業(yè)務(wù)過程中會直接接觸到客戶,柜員能夠掌握經(jīng)常辦理業(yè)務(wù)的客戶對不同產(chǎn)品的青睞和喜好,這也是一類重要的信息。
3.海量數(shù)據(jù)所造成的信息安全隱患
金融數(shù)據(jù)大集中之后,數(shù)據(jù)量增幅很大,以人民銀行2009年對銀行業(yè)務(wù)量統(tǒng)計(jì)作數(shù)據(jù)參考:
存儲和保護(hù)所有數(shù)據(jù),因此會有所刪減和側(cè)重。數(shù)據(jù)和信息的概念是不同的,數(shù)據(jù)是無規(guī)則、全描述性的、無具體指向的;而信息是有內(nèi)容的可為做出經(jīng)營決策提供參考的資源。銀行業(yè)擁有的數(shù)據(jù)資源非常龐大,但是并不都是有用的信息,因此在處理和保存過程中就不會也不可能特別的保護(hù)所有的數(shù)據(jù),大量的數(shù)據(jù)就會造成信息安全保護(hù)障礙。
3.1數(shù)據(jù)銷毀不完全造成信息泄露
由于銀行業(yè)的業(yè)務(wù)量非常大,同時每個工作日結(jié)束都會產(chǎn)生大量的垃圾文件及影印資料,在處理這些資料時就會有不同的處理方式,但多數(shù)是不會集中銷毀。紙質(zhì)資料是銀行業(yè)務(wù)中必然會使用和產(chǎn)生的資料,在這些丟棄的廢品中包含著大量的信息,有客戶的存款賬號以及存款金額、廢棄客戶資料、銀行廢棄報(bào)表資料等等。這些資料多數(shù)并不是錯誤的信息,相反這些是一些真實(shí)性相當(dāng)高的信息,因此廢棄資料的銷毀和處理就有必要加以重視。事實(shí)上,通過對許多商業(yè)銀行的調(diào)查與統(tǒng)計(jì)許多商業(yè)銀行并沒有制定具體處理措施規(guī)章制度,也沒有指派專人負(fù)責(zé)處理,而是較隨意的丟棄。從這些丟棄的資料中我們不難找到客戶的存款資料,對公賬戶的基本信息,甚至是銀行內(nèi)部的經(jīng)營狀況等等。此類信息是銀行非常機(jī)密的信息,泄露的損失會非常的嚴(yán)重。
3.2錯誤判斷數(shù)據(jù)價值造成的信息安全威脅
在競爭如此激烈的銀行業(yè),當(dāng)沒有發(fā)展和改革是就相當(dāng)于在退步,在失去競爭力。隨著經(jīng)濟(jì)全球化和信息技術(shù)的發(fā)展,金融數(shù)據(jù)正在以空前的速度產(chǎn)生和累積。因此,迫切需要找到一種有效的方法從海量的金融數(shù)據(jù)中提取有用的信息以在銀行制定戰(zhàn)略性計(jì)劃和投資時給予支持。由于銀行業(yè)接觸到的信息量相當(dāng)大,因此會讓領(lǐng)導(dǎo)人員對已有的數(shù)據(jù)視而不見。然而這些數(shù)據(jù)會提供很有用的決策支持,在擁有數(shù)據(jù)而不去利用就會造成利益的損失。由于貸款系統(tǒng)并不可能融入如此復(fù)雜的數(shù)據(jù)量,這些信息就容易被忽略,這樣就容易造成錯誤判斷,最終流失一個良好客戶,也有可能會增加高風(fēng)險(xiǎn)客戶。
3.3隱性信息價值帶來的安全隱患
由于權(quán)限等級劃分帶來了權(quán)利和責(zé)任的高度集中,在多數(shù)銀行都以授權(quán)與代辦關(guān)系存在。往往代辦員只是在辦理業(yè)務(wù)過程中的操作者,而多數(shù)的信息是掌握在授權(quán)者手中。這些授權(quán)者一般屬于銀行的中層管理者,他們掌握的信息包括:大額存款戶資料、貸款戶的資信狀況、營業(yè)網(wǎng)點(diǎn)的經(jīng)營狀況等等。這些都是整個營業(yè)網(wǎng)點(diǎn)經(jīng)營命脈。根據(jù)二八原則的劃分,20%的信息是組織運(yùn)營中的存檔信息,而大量的80%的信息是各個經(jīng)營者所掌握的隱形的信息。這80%的信息安全就只能依靠職業(yè)道德規(guī)范和職業(yè)行為規(guī)范等制度對中層領(lǐng)導(dǎo)的約束來保證,存在著嚴(yán)重的安全隱患。
3.4金融欺詐
隨著經(jīng)濟(jì)的發(fā)展,在金融領(lǐng)域的欺詐行為已經(jīng)越來越多,形式也多種多樣,有貸款、存款、銀行卡等等。例如在銀行業(yè)務(wù)發(fā)展過程中會考核信用卡的發(fā)卡量,為達(dá)到發(fā)卡規(guī)模就會盲目的發(fā)卡、放松發(fā)卡條件等等,大量的信用卡申請信息就會造成信息核實(shí)的時間和人力困難。調(diào)查表明[2]金融機(jī)構(gòu)每年的欺詐損失占其年收入的6%,相當(dāng)于美國每年的GDP損失數(shù)千億美元。英國欺詐損失總額每年也達(dá)到了140億英鎊。欺詐行為會給銀行帶來巨大的經(jīng)濟(jì)損失,同時也會造成信譽(yù)和形象上的重大負(fù)面影響。欺詐行為也是多種多樣的,主要類型有以下三種:一是由于業(yè)務(wù)量大而忽略銀行柜員對信息的訪問控制和跟蹤,銀行內(nèi)部職員會利用系統(tǒng)漏洞,非法進(jìn)入銀行交易系統(tǒng),直接獲取不正當(dāng)利益,或者為以后的作案做準(zhǔn)備;二是由于信用卡等信用貸款量大,無法具體核實(shí)貸款人資信狀況的真實(shí)性,造成以虛假的承諾和虛假的保證來騙取貸款額度;三是隱瞞重要的資信信息,避重就輕,造成銀行的錯誤判斷。銀行可以通過建立自己的數(shù)據(jù)庫,來跟蹤核實(shí)此類信息,在大量的處理業(yè)務(wù)數(shù)據(jù)中對數(shù)據(jù)進(jìn)行挖掘分析并找出相應(yīng)的規(guī)則、規(guī)律、論斷,再結(jié)合人工分析,達(dá)到有效檢測金融欺詐的效果。
4.數(shù)據(jù)挖掘技術(shù)在銀行業(yè)信息保護(hù)中的應(yīng)用
數(shù)據(jù)挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。數(shù)據(jù)挖掘,在人工智能領(lǐng)域,習(xí)慣上又稱為數(shù)據(jù)庫中的知識發(fā)現(xiàn)(KDD),也有人把數(shù)據(jù)挖掘視為數(shù)據(jù)庫中知識發(fā)現(xiàn)過程的一個基本步驟。
金融機(jī)構(gòu)收集到的金融數(shù)據(jù)通常相對完整、可靠并具有高質(zhì)量,方便了系統(tǒng)化的數(shù)據(jù)分析和數(shù)據(jù)挖掘。同樣數(shù)據(jù)挖掘也可以作為銀行信息保護(hù)的一種方法為銀行發(fā)展做出貢獻(xiàn)。為保護(hù)銀行信息安全,數(shù)據(jù)挖掘通常包含以下四個部分的應(yīng)用分析情況。
4.1應(yīng)用數(shù)據(jù)挖掘技術(shù)管理銀行報(bào)表
銀行報(bào)表是每天都會產(chǎn)生的報(bào)表,管理者會通過報(bào)表的數(shù)據(jù)來進(jìn)行日常業(yè)務(wù)決策。根據(jù)調(diào)查顯示,銀行報(bào)表基本是由銀行主管會計(jì)打印、輸出、整理報(bào)送銀行主管人員。在報(bào)送過程中就產(chǎn)生了多個信息安全的風(fēng)險(xiǎn)點(diǎn):首先紙質(zhì)打印就會有錯誤和多余打印的廢棄資料;其次會計(jì)主管必然會掌握和了解各類數(shù)據(jù);再次是整理好的數(shù)據(jù)資料的管理也十分必要。銀行報(bào)表上的數(shù)據(jù)是銀行需要保密的經(jīng)營數(shù)據(jù),它關(guān)系到一家銀行的生存和發(fā)展,只有決策層和領(lǐng)導(dǎo)層有權(quán)限和有必要掌握和了解。因此要從根本上杜絕信息安全隱患就必須從報(bào)表的形式和報(bào)表訪問權(quán)限上來加以控制。據(jù)分析階段對銀行業(yè)務(wù)中產(chǎn)生的龐大數(shù)據(jù)進(jìn)行分類、識別、篩選和初步分析。從大量數(shù)據(jù)中挖掘出適合銀行業(yè)務(wù)人員使用的信息模式和知識,從而產(chǎn)生出報(bào)表,以指導(dǎo)銀行營銷和競爭。
4.2數(shù)據(jù)挖掘提升客戶關(guān)系管理
銀行根據(jù)多個方面的數(shù)據(jù)內(nèi)容建立客戶資料數(shù)據(jù)庫,來維護(hù)客戶,全方位的描述和統(tǒng)計(jì)該客戶的資金流量、信用度等。建立該客戶的信息由有商業(yè)銀行實(shí)施客戶關(guān)系管理(CRM)的目標(biāo)是充分掌握客戶的需求,找出能盈利的客戶。數(shù)據(jù)挖掘技術(shù)在商業(yè)銀行CRM中具有廣泛用途,它首先有助于銀行客戶資源的開發(fā),有助于集成客戶的各種信息,有助于銀行進(jìn)行市場細(xì)分、開發(fā)新產(chǎn)品、拓展新市場。從數(shù)據(jù)挖掘技術(shù)在CRM系統(tǒng)中的具體應(yīng)用來看,可以分為以下五個階段。第一階段:建立客戶信息數(shù)據(jù)庫。數(shù)據(jù)庫是數(shù)據(jù)挖掘的基礎(chǔ),這一階段主要是進(jìn)行數(shù)據(jù)清理,消除現(xiàn)有業(yè)務(wù)系統(tǒng)中數(shù)據(jù)不一致的現(xiàn)象,通過關(guān)聯(lián)將有聯(lián)系相互作用的數(shù)據(jù)建立索引,將其整合到信息庫,建立以客戶為中心的數(shù)據(jù)倉庫基礎(chǔ)環(huán)境。第二階段:記錄、更新客戶交易信息。這一階段主要是把客戶與銀行的所有歷史交易數(shù)據(jù)加載到客戶信息庫。第三階段:建立評估模型。為客戶的每一個賬號建立利潤評測模型,以便了解客戶對銀行的利潤貢獻(xiàn)度,同時掌握模型的利潤貢獻(xiàn)。第四階段:維護(hù)和優(yōu)化客戶關(guān)系。銀行可以通過掌握客戶在生活、職業(yè)等方面的變化及外部環(huán)境的變化,抓住推銷新產(chǎn)品和服務(wù)的時機(jī)。這需要將賬號每次發(fā)生的交易明細(xì)數(shù)據(jù),加載到數(shù)據(jù)倉庫,核對客戶行為的變化。第五階段:風(fēng)險(xiǎn)評估和管理。銀行風(fēng)險(xiǎn)管理的對象主要是與資產(chǎn)和負(fù)債有關(guān)的風(fēng)險(xiǎn),因此與資產(chǎn)負(fù)債有關(guān)文章都各自占一張表,并把所有論題表放入統(tǒng)一數(shù)據(jù)庫中。
4.3建立員工工作日志,量化隱性信息
從上述的銀行信息分類可以看出銀行的80%的信息是隱性信息,是由一線員工掌握的。在銀行內(nèi)部網(wǎng)站中可以創(chuàng)立一個員工工作日志板塊,它可以設(shè)置和微博一般,記錄員工的日常工作中的點(diǎn)滴細(xì)節(jié)。當(dāng)然這類信息只有管理層和本人有訪問權(quán)限,這樣員工掌握的信息就不會隨著他的離職而帶走。許多商業(yè)銀行開辟一個新的市場所采取的策略之中都會考慮雇傭一位當(dāng)?shù)劂y行的中層領(lǐng)導(dǎo),這樣對于迅速打開當(dāng)?shù)厥袌鰰蟹浅:玫男剩驗(yàn)楫?dāng)?shù)劂y行老員工對于當(dāng)?shù)厥袌?、?dāng)?shù)仡櫩投急容^了解。這樣一位員工的流失會給原商業(yè)銀行帶來巨大的損失,為了減少這方面的損失就需要將一線員工掌握的信息進(jìn)行量化,變?yōu)殂y行內(nèi)部可共享的資源。員工可以在工作日志中記錄重要客戶的生日、家庭住址、家庭成員等等,這對客戶維護(hù)是非常有必要的。建立員工工作日志可以通過以下三個步驟實(shí)現(xiàn):首先,開辟工作日志板塊和服務(wù)后臺;其次將工作日志平臺作為信息發(fā)布、交流平臺,促使員工習(xí)慣使用;最后對日志記錄優(yōu)秀者加以獎勵。
4.4金融欺詐檢測
金融欺詐的形式和主體都具有多樣性,但是都是有規(guī)律可循的,針對上述出現(xiàn)的三種類型的金融欺詐,可利用數(shù)據(jù)挖掘技術(shù)進(jìn)行欺詐檢測。欺詐檢測的基本流程包括數(shù)據(jù)比對和清理,數(shù)據(jù)預(yù)處理和轉(zhuǎn)換,數(shù)據(jù)的模型套用和計(jì)算,人工判斷等四個步驟,流程圖如圖2第一階段,數(shù)據(jù)比對和清理。應(yīng)用數(shù)據(jù)挖掘進(jìn)行金融欺詐檢測,首先要選擇的是哪些數(shù)據(jù)是有用的,以及從獲得這些數(shù)據(jù)的來源。也就是說在合適的地方選擇合適的數(shù)據(jù)。第二階段,數(shù)據(jù)預(yù)處理和數(shù)據(jù)轉(zhuǎn)換。數(shù)據(jù)挖掘通常處理的是海量的原始數(shù)據(jù)。數(shù)據(jù)的預(yù)處理是指對原始數(shù)據(jù)進(jìn)行同性化處理,使各項(xiàng)指標(biāo)同趨勢化。第三階段,數(shù)據(jù)的模型套用和計(jì)算。這一過程,是通過運(yùn)用數(shù)據(jù)挖掘?qū)κ占降臄?shù)據(jù)進(jìn)行實(shí)時的欺詐檢測,對欺詐的潛在進(jìn)行定位,并找出隱藏的欺詐模式。第四階段,人工判斷。這一過程主要是人工核對生成的挖掘報(bào)告,對檢測的結(jié)果做進(jìn)一步的比對和判斷,消除誤判,對系統(tǒng)模型進(jìn)行調(diào)整改進(jìn)。這一步就是確認(rèn)欺詐行為的對于金融欺詐檢測來說是一個不可或缺的步驟。通過這一步驟可以提高數(shù)據(jù)挖掘的有效性和準(zhǔn)確率。以上四個步驟是個循環(huán)反復(fù)的動態(tài)過程,只有在動態(tài)運(yùn)行過程中,才有可能對數(shù)據(jù),挖掘模式進(jìn)行動態(tài)調(diào)整,從而有可能實(shí)現(xiàn)對不斷變化的金融欺詐模式的預(yù)警。
5.結(jié)束語
商業(yè)銀行的信息是其經(jīng)營的主要內(nèi)容,信息安全就成為其核心競爭力主要決定力量。根據(jù)數(shù)據(jù)挖掘的性質(zhì)和特點(diǎn),從信息保護(hù)角度出發(fā),將數(shù)據(jù)挖掘急速引入銀行日常管理之中,通過以上四個流程應(yīng)用,改善信息形式、挖掘有價值信息、防止金融詐騙,達(dá)到更好的信息保護(hù)效果。數(shù)據(jù)挖掘是信息化的最高層次,是信息化最高應(yīng)用點(diǎn)的價值所在,它可以將分散的信息變成集中的信息,使孤立的信息變成相互聯(lián)系的信息,使無價值的數(shù)據(jù)變成有價值的信息,我國銀行業(yè)要在激烈的同業(yè)競爭中立于不敗之地,必須堅(jiān)定不移采用數(shù)據(jù)挖掘技術(shù),提高自己的核心競爭力。
參考文獻(xiàn):
① http://www.datamining.com.cn.
②張國榮.淺析數(shù)據(jù)挖掘中的隱私保護(hù)[J].福建電腦,2005(11).
③王越,曹長修.KDD方法在金融欺詐檢測中的應(yīng)用[J].計(jì)算機(jī)工程與設(shè)計(jì).2002.(5).
④王實(shí).銀行業(yè)CRM理論與實(shí)務(wù)[M].北京:電子工業(yè)出版社,2005. ⑤中華人民共和國國家統(tǒng)計(jì)局.中國統(tǒng)計(jì)年鑒(2009)[M].北京:中國統(tǒng)計(jì)出版社,2010.
⑥李強(qiáng).數(shù)據(jù)挖掘在金融業(yè)CRM中的應(yīng)用[J].今日湖北理論版.2007.1(4):21-22.
⑦田小丹.數(shù)據(jù)挖掘在銀行CRM管理中的應(yīng)用研究【J】.商業(yè)科技,2006.
⑧丁寧,劉富星.數(shù)據(jù)挖掘在金融中的應(yīng)用【J】.經(jīng)濟(jì)與管理,2009(7).
⑨胡,張徽燕.數(shù)據(jù)挖掘在銀行業(yè)中的應(yīng)用【J】.長春師范學(xué)院學(xué)報(bào),2006(2).