近年來,各式各樣的數(shù)據(jù)庫隨著信息時代的發(fā)展得以建立,海量的數(shù)據(jù)信息也爆炸式的充斥到了人們的生產(chǎn)生活之中。這些數(shù)據(jù)信息中隱藏著了大量有用的知識,但傳統(tǒng)的人工閱讀或數(shù)據(jù)檢索方式不能有效將這些知識從不同層次的信息中提取出來,造成了嚴重的數(shù)據(jù)信息資源浪費。再從金融行業(yè)的角度來看,其使有關(guān)單位坐失良機的同時大大降低經(jīng)濟效益。為減少損失,我國金融領(lǐng)域研究人員將數(shù)據(jù)挖掘應用到了信息處理之中并取得了很好的成效。利用數(shù)據(jù)挖掘中的數(shù)理統(tǒng)計、回歸分析以及分類聚類等方法可以快速對數(shù)據(jù)信息進行分析,將海量的金融數(shù)據(jù)自動、智能的轉(zhuǎn)化為有用的金融知識,為金融行業(yè)未來發(fā)展決策的制定提供了大量的信息參考,使金融行業(yè)有關(guān)單位的未來發(fā)展戰(zhàn)略更具有效性、科學性。根據(jù)國內(nèi)外發(fā)展形勢來看,當前數(shù)據(jù)挖掘在國外金融領(lǐng)域應用較多但在國內(nèi)卻還處于起步階段。因此,現(xiàn)階段最重要的任務就是充分利用好數(shù)據(jù)挖掘進行金融數(shù)據(jù)分析以促使我國經(jīng)濟穩(wěn)步發(fā)展。
數(shù)據(jù)挖掘DM(Data Mining)實質(zhì)上就是對數(shù)據(jù)庫內(nèi)的數(shù)據(jù)信息進行處理的過程。這樣做的目的是從大量不完整的、模糊的、混亂的和隨機的數(shù)據(jù)中提取不為人知但可能有用的潛在信息和知識。具體來說,數(shù)據(jù)挖掘是數(shù)據(jù)庫知識發(fā)現(xiàn)KDD(Knowledge-Discovery in Databases)中的一個重要步驟,其以人工智能技術(shù)、機器學習技術(shù)以及統(tǒng)計學相關(guān)技術(shù)為手段對原有海量數(shù)據(jù)進行高度自動化的分析、歸納與推理,從中挖掘出潛在的信息并預測未知的行為,改變“人們在數(shù)據(jù)中淹沒卻又極度渴望知識”的數(shù)據(jù)信息資源浪費不利局面。數(shù)據(jù)庫知識發(fā)現(xiàn)是由機器學習技術(shù)與數(shù)據(jù)庫技術(shù)相互交融促進而產(chǎn)生的學科,因為知識發(fā)現(xiàn)過程使用的數(shù)據(jù)來自真實的數(shù)據(jù)庫且需要處理的數(shù)據(jù)量可能相當大,所以數(shù)據(jù)挖掘的效率和可擴展性對其處理過程尤其重要。
數(shù)據(jù)挖掘是當前信息時代分析處理金融數(shù)據(jù)的有力手段。其既是一種對金融信息數(shù)據(jù)庫內(nèi)大量、復雜、模糊、隨機的信息和知識的處理過程,又是一種為發(fā)展決策提供數(shù)據(jù)依據(jù)的過程。當前常用的金融信息數(shù)據(jù)挖掘辦法較多且主要包括分類法、聚類法、回歸分析法、關(guān)聯(lián)規(guī)則法以及神經(jīng)網(wǎng)絡(luò)法等,這幾種數(shù)據(jù)挖掘辦法從不同角度對金融信息進行了深入、全面地分析。
分類法指的就是利用分類模型,對金融信息數(shù)據(jù)庫中一組具有相同特點的數(shù)據(jù)對象劃分成為不同類型,其目的就是為了將數(shù)據(jù)庫中的數(shù)據(jù)項映射道不同的數(shù)據(jù)類別之中。其可以在消費者分類、消費者滿意度分析以及消費者消費傾向預測中得以運用。例如某汽車銷售廠商可以根據(jù)消費者對汽車的喜歡程度進行人員分類,這樣銷售人員就可以根據(jù)不同情況有針對性地向那些喜愛汽車的消費者進行營銷宣傳,在滿足消費者不同需求的同時提高廠商經(jīng)濟效益。
聚類法與分類法類似但也存在不同,聚類法指的是把一組金融數(shù)據(jù)按照相同特點和差異特點分成不同的幾個類別,其目的是使不同類別間的數(shù)據(jù)信息值盡可能的有差異、同一類別間的數(shù)據(jù)信息值盡可能的一致,
回歸分析能夠反映金融信息數(shù)據(jù)庫的數(shù)據(jù)屬性,通過數(shù)據(jù)映射關(guān)系的函數(shù)表達式檢測屬性值之間的依賴關(guān)系,其主要研究方向為數(shù)據(jù)間關(guān)系和數(shù)據(jù)序列的預測。其在當前的市場營銷中具有極強的現(xiàn)實應用意義。例如相關(guān)企業(yè)可以利用回歸分析方法對本季度的生產(chǎn)銷售情況進行預算,并以此為依據(jù)對下一季度的經(jīng)濟形勢和營銷手段做出預測和安排。通過對金融信息數(shù)據(jù)庫進行回歸分析可以明確不同消費者的行為模式和行為規(guī)律,按照這些不同將消費者劃分為不同群體以實現(xiàn)差別化服務。
關(guān)聯(lián)規(guī)則法指的就是根據(jù)數(shù)據(jù)項之間的聯(lián)系由一個數(shù)據(jù)項推出另一個或者多個數(shù)據(jù)項的辦法。運用關(guān)聯(lián)規(guī)則法開展金融數(shù)據(jù)挖掘可分為兩個階段,第一階段是在海量的金融數(shù)據(jù)信息中心挖掘出全部高頻項目組,第二階段是根據(jù)高頻項目組自身具備的關(guān)聯(lián)性推出其他項目類別。關(guān)聯(lián)規(guī)則法當前已經(jīng)被廣泛應用于消費者消費需求的預測之中。例如,銀行根據(jù)消費者消費情況在自動存取款機上捆綁其可能感興趣的信息來供其參考,這在大大提高消費者滿意度的同時改善了銀行的營銷管理水平。
神經(jīng)網(wǎng)絡(luò)方法是一種集自動處理、分塊儲存、高容錯度等優(yōu)勢為一身的先進人工智能技術(shù)。因神經(jīng)網(wǎng)絡(luò)法能夠高效處理那些模糊度高、內(nèi)容不完整、層次不分明的數(shù)據(jù)信息,其當前已經(jīng)被廣泛應用于金融信息數(shù)據(jù)庫的處理工作之中。神經(jīng)網(wǎng)絡(luò)法主要分為三類,第一類是以函數(shù)型網(wǎng)絡(luò)為代表用于數(shù)據(jù)分類預測的前饋式神經(jīng)網(wǎng)絡(luò)模型,第二種是以離散型和連續(xù)型網(wǎng)絡(luò)為代表用于優(yōu)化算法的反饋式神經(jīng)網(wǎng)絡(luò)模型,第三種是以ART 模型為代表的聚類組織映射方法。雖然神經(jīng)網(wǎng)絡(luò)方法具有多種算法模型,但因沒有統(tǒng)一的使用規(guī)則使其在金融數(shù)據(jù)分析中的應用不是很普遍。
在大量的數(shù)據(jù)中搜集、尋找、發(fā)現(xiàn)有效信息是金融行業(yè)開展工作內(nèi)在需要。利用好數(shù)據(jù)挖掘可以使信息開發(fā)工作更為便捷,幫助金融部門科學預測未來發(fā)展趨勢的同時使發(fā)展決策的制定更加有理有據(jù)。
銀行是需要利用數(shù)據(jù)挖掘深入分析數(shù)據(jù)信息的金融機構(gòu)。銀行的借貸業(yè)務范圍很廣,有必要提前對貸款償還進行預測以確保貸款能夠按時收回。對根據(jù)客戶信息開展貸款償還預測還可以更好地鑒別客戶信用數(shù)據(jù),減少銀行貸款損失的同時實現(xiàn)經(jīng)濟效益最大化。借貸業(yè)務和信用卡交易對銀行來說都是必不可少的,但是貸款的償還和客戶信用等級評價會受到許多因素的影響,其中包括貸款利率、貸款期限、借貸人收入水平、借貸人受教育程度、借貸人償還水平等。而金融數(shù)據(jù)挖掘的應用可以將其中的無關(guān)因素很好的剔除出去。利用數(shù)據(jù)挖掘?qū)ι鲜鲆蛩剡M行分析可以發(fā)現(xiàn)借貸人受教育水平和貸款期限與償還速度之間的聯(lián)系不是很大,而償還收入水平和借貸人收入水平是較為重要的因素,這時銀行就可以根據(jù)借貸人的收入、償還水平來制定相關(guān)貸款策略并開展借貸工作。
我國金融領(lǐng)域的犯罪率較高且案件通常難以偵破,當前只能將多個數(shù)據(jù)庫中信息提取并匯總才能很好地偵破金融犯罪案件。利用數(shù)據(jù)挖掘技術(shù)檢測金融數(shù)據(jù)信息庫中的信息以明確短時間內(nèi)發(fā)生的大量資金交易行為,過濾掉其中無關(guān)因素后運用可視化分析方法對交易行為以及相關(guān)聯(lián)系人進行有效分析,進而為偵查人員提供偵查思路、明確偵查方向。此外,利用數(shù)據(jù)挖掘還可以對金融犯罪行為進行事先預判,有效制止金融犯罪的同時減少了國家財產(chǎn)的損失。例如,某企業(yè)在短時間內(nèi)向不明海外賬戶進行多次匯款,這時我們就可以利用數(shù)據(jù)挖掘深入分析其這一行為是否正當合理,通過進一步的調(diào)查明確這一行為是否屬于金融犯罪,若屬于應及時將有關(guān)數(shù)據(jù)調(diào)查結(jié)果送至監(jiān)察機關(guān)予以處理。
利用數(shù)據(jù)挖掘?qū)蛻粜畔⑦M行分類可以幫助銀行更好地開展業(yè)務工作、推動客戶進行定向消費、提高銀行的經(jīng)濟效益。在實際工作過程中,銀行可以篩選出那些收入水平較高、資產(chǎn)狀況穩(wěn)定且有投資意向的客戶,并根據(jù)這些客戶的喜好與不同需求有針對性地開展定向業(yè)務活動,這樣在提高銀行業(yè)務水平的同時滿足了客戶的現(xiàn)實需求,真正實現(xiàn)銀行與客戶之間的互利共贏。但上述工作有效開展的基礎(chǔ)在于科學地利用金融數(shù)據(jù)挖掘技術(shù)。沒有數(shù)據(jù)挖掘就無法準確地開展定向服務活動。例如對200 個客戶開展相關(guān)項目投資的定向活動,這時如果不能將金融信息數(shù)據(jù)挖掘應用其中,銀行就只能進行電話溝通一一了解這200 個客戶的具體想法,浪費大量時間和精力的同時極大程度的降低了銀行的整體工作效率。而利用金融信息數(shù)據(jù)挖掘辦法可以對這200 個客戶進行準確分類,明確其中有投資意向的客戶并針對其喜好開展定向業(yè)務介紹,使得客戶對相關(guān)業(yè)務活動有具體了解的同時大幅度地提高了銀行的工作效率。
綜上所述,數(shù)據(jù)挖掘已廣泛應用于我國金融行業(yè)信息數(shù)據(jù)處理的工作之中,其在幫助金融部門在白熱化的市場競爭中占據(jù)先機同時顯現(xiàn)出了巨大的應用價值。當前世界正經(jīng)歷著百年未有之大變局,全球經(jīng)濟一體化給我國金融業(yè)帶來巨大挑戰(zhàn)的同時也帶來了更多的發(fā)展機遇。因此我們要科學分析金融形勢、把握經(jīng)濟發(fā)展大勢,持續(xù)深化數(shù)據(jù)挖掘和金融數(shù)據(jù)分析的融合,更好地發(fā)揮出金融數(shù)據(jù)分析方法的重要作用。同時還要加快金融行業(yè)體系結(jié)構(gòu)轉(zhuǎn)型升級,構(gòu)建良好的金融發(fā)展新格局,以更高的治理能力和管理水平推動我國金融領(lǐng)域邁上新的臺階。