邱旭君
[摘要]在信息化高速發(fā)展的今天,信息化建設(shè)飛速發(fā)展,在改革與發(fā)展過程中扮演著至關(guān)重要的角色。面對過程中產(chǎn)生的大量數(shù)據(jù),使用數(shù)據(jù)挖掘技術(shù)可以從中分析出有效的信息,為提升管理效率起到了重要作用,財務系統(tǒng)、ERP系統(tǒng)、辦公系統(tǒng)等,都大大提升了管理的效率,并且為企業(yè)管理者決策提供了支持。
本文從數(shù)據(jù)挖掘的重要性出發(fā),介紹了數(shù)據(jù)挖掘的主要方法及關(guān)鍵技術(shù),數(shù)據(jù)挖掘在信息化建設(shè)中的作用,以及信息化建設(shè)的目標。
[關(guān)鍵詞]數(shù)據(jù)挖掘;信息化建設(shè);數(shù)據(jù)挖掘技術(shù)
一、數(shù)據(jù)挖掘的概念和主要方法
數(shù)據(jù)挖掘是指從大量不完全的、有噪聲的、模糊的和隨機的數(shù)據(jù)中,提取隱含的、未知的且潛在有用的知識和模式的過程。它綜合運用計算機科學、人工智能、統(tǒng)計學、信息管理、認知科學等領(lǐng)域的先進理論與技術(shù),研究如何從海量信息資源中快速準確地獲取潛在的知識,是一種信息資源深層開發(fā)的新型信息處理技術(shù)。
數(shù)據(jù)挖掘的主要方法有以下七種:
①分類:就是建立分類模式,對數(shù)據(jù)庫里面的數(shù)據(jù)進行分類。
②估計:對連續(xù)值的輸出進行處理并且估計的量是無法確定的;分類卻是對離散型變量輸出的描述且數(shù)目是確定的。
③預測:分類和估計所得出來的模型,可以通過預測來對其模型進行預測。
預測是需要經(jīng)過長時間來進行驗證的,所以在通過預測后,不要立即否決該模型,要過一段時間再來觀察預測的準確性。
④相關(guān)性分組或關(guān)聯(lián)規(guī)則:是決定哪些事情將會一起發(fā)生。
⑤描述和可視性:是將數(shù)據(jù)挖掘結(jié)果用某些方式表達出來。
⑥聚類:是將一些相似的數(shù)據(jù)記錄在同一個聚集里面。
⑦復雜數(shù)據(jù)類型挖掘。
二、數(shù)據(jù)挖掘的流程
數(shù)據(jù)挖掘的一般流程如下(圖1):
(1)確定對象。在數(shù)據(jù)挖掘中,我們首先要做的是將問題弄清楚,認清挖掘的目的是什么。數(shù)據(jù)挖掘所得的結(jié)果不是確定的,但我們研究的問題是一定的,所以在這個過程中研究對象起到引導作用,分析人員可將對象作為檢驗結(jié)果的重要依據(jù)。(2)數(shù)據(jù)準備。就是通過程序?qū)?shù)據(jù)庫中所需的數(shù)據(jù)分撿出來,然后合成數(shù)據(jù)挖掘的數(shù)據(jù)包的過程。首先要選擇與對象相關(guān)的所有的內(nèi)部與外部數(shù)據(jù)信息,并從中選擇適當?shù)男畔⒆鳛橥诰蛐畔ⅲ黄浯胃鶕?jù)對象選擇必要的數(shù)據(jù)挖掘類型,為下一步的數(shù)據(jù)轉(zhuǎn)換與驗算作預處理準備;最后進行數(shù)據(jù)轉(zhuǎn)換,將數(shù)據(jù)轉(zhuǎn)換成特殊的針對數(shù)據(jù)挖掘算法模型的過程,這也是實現(xiàn)數(shù)據(jù)成功挖掘的必要步驟。(3)尋找規(guī)律。通過建立的已有模型或算法,對數(shù)據(jù)庫中具有一定規(guī)律特點的數(shù)據(jù)進行挖掘,這也是整個挖掘過程的核心所在。(4)知識表示與運用。知識表示就是將最科學、最直觀的方式呈現(xiàn)給用戶,便于他們的理解,找出規(guī)律進行科學直觀的表達的過程。另外,我們的最終目的是將所挖掘的數(shù)據(jù)應用,所以還要將挖掘結(jié)果分配到用戶系統(tǒng)中去。
圖1 數(shù)據(jù)挖掘流程
三、數(shù)據(jù)挖掘在信息化建設(shè)中的作用
信息化社會產(chǎn)生大量數(shù)據(jù),可以將這些數(shù)據(jù)轉(zhuǎn)換成有用的信息和知識。獲取的信息和知識可以廣泛用于各種應用,包括商務管理,生產(chǎn)控制,市場分析,工程設(shè)計和科學探索等。
信息化建設(shè)中各應用系統(tǒng)通過數(shù)據(jù)集合已經(jīng)形成了一個龐大的信息數(shù)據(jù)庫,但這些數(shù)據(jù)沒有被有效的利用起來,在現(xiàn)代信息化的條件下,應對這些長期積累的海量數(shù)據(jù)進行分析和挖掘,可以輔助管理者決策,提高工作質(zhì)量,優(yōu)化綜合實力資源提供可靠的數(shù)據(jù)依據(jù),信息化建設(shè)能夠切實的幫助企業(yè)在各種關(guān)鍵決策中發(fā)揮作用。
數(shù)據(jù)挖掘最直接的作用就是提升企業(yè)核心競爭力,對所搜集到的信息利用數(shù)據(jù)挖掘技術(shù)進行分析,有助于企業(yè)在關(guān)鍵領(lǐng)域建立獨特競爭優(yōu)勢。應用數(shù)據(jù)挖掘技術(shù)能夠充分利用企業(yè)數(shù)據(jù)倉庫中的海量數(shù)據(jù)進行分析,并根據(jù)分析結(jié)果找出企業(yè)管理過程中出現(xiàn)的各種問題,從而提高企業(yè)管理過程中決策的能力。
四、信息化建設(shè)的目標
1、構(gòu)建一個全面的信息溝通平臺
實現(xiàn)網(wǎng)絡的高速互聯(lián)和全面覆蓋,使企業(yè)的各個部門把所有的信息在平臺上進行共享,既提高了工作效率,又提供了決策的依據(jù)。
2、提高企業(yè)信息化價值
企業(yè)信息化建設(shè)的深入應圍繞著如何降低成本、提高利潤這一主線開展。在企業(yè)全員中推,讓大家都有一個明確的目標,通過企業(yè)信息化的應用讓效果公開化,通過績效管理的配合切實的在企業(yè)中貫徹起來。
3、完善企業(yè)信息化機制
不管是完善管理制度還是提高工作效率,企業(yè)都應該納入規(guī)范管理的軌道,這才是企業(yè)全面管理的基礎(chǔ)。
4、利用企業(yè)信息化為領(lǐng)導層提供決策依據(jù)
企業(yè)需要發(fā)現(xiàn)問題并解決問題,但更需要預防問題。通過企業(yè)信息化系統(tǒng)的建立,將企業(yè)存在的問題以數(shù)據(jù)的形式反映出來,為領(lǐng)導層的決策提供有力的依據(jù)。
5、知識管理
建立企業(yè)以及部門、崗位的專業(yè)知識體系,全力推動知識資源的形成、儲存、共享、交流及應用;知識管理可以使企業(yè)全員貢獻和分享自己所掌握的專業(yè)知識從而積少成多,聚沙成塔。創(chuàng)建企業(yè)知識地圖,將知識和人有效的聯(lián)系起來,提高大家獲取知識的效率,使大家能清晰了解企業(yè)知識分布狀況。最終達到擁有企業(yè)創(chuàng)新能力的“學習型”組織。隨著數(shù)據(jù)信息的增多,人們?yōu)榱四軌蛟诤棋绾5臄?shù)據(jù)信息中以最少的時間找到自己想要的數(shù)據(jù),并提高數(shù)據(jù)信息的利用率,就要應用數(shù)據(jù)挖掘。數(shù)據(jù)挖掘技術(shù)可以讓人們更加便利的進行信息提取,為各個領(lǐng)域平臺提供有價值的數(shù)據(jù)信息,以促進企業(yè)的發(fā)展。信息化建設(shè)的進一步發(fā)展,積累在數(shù)據(jù)庫中的信息量快速增加,都要求數(shù)據(jù)挖掘在管理領(lǐng)域的應用以及管理數(shù)據(jù)資源的挖掘逐步完善起來。
參考文獻
[1]程書萍,盛昭瀚,柳炳祥.利用數(shù)據(jù)挖掘技術(shù)提升企業(yè)核心競爭力[J].現(xiàn)代管理科學,2003年11期.
[2]朱演濤.基于數(shù)據(jù)挖掘的軟件應用分析[J].技術(shù)應用,2013,(1):181-182.