劉璐璐
(中州大學(xué)國資處,鄭州450044)
近年來,隨著我校北校區(qū)的大力建設(shè)和硬件設(shè)施的不斷完善及師生人數(shù)的不斷增加,固定資產(chǎn)和低值易耗品的購入數(shù)量與使用頻率隨之增多,設(shè)備檔案資料的種類也在不斷增多,例如:固定資產(chǎn)種類和數(shù)目的不斷增長和調(diào)整,使得資產(chǎn)賬目信息需要大量錄入與輸出,后期相關(guān)數(shù)據(jù)的保存難度和工作量都會隨之加大。要想進一步提高檔案管理的工作效率,就得從原有的純手工檔案資料管理方式上有所突破,這就要求設(shè)備的管理模式不能局限于手工管理模式,要與現(xiàn)代化網(wǎng)絡(luò)數(shù)據(jù)庫管理模式相結(jié)合。
與傳統(tǒng)的檔案管理方式不同,高校設(shè)備檔案具有使用范圍廣、次數(shù)多、使用者要求高的特點。隨著近些年學(xué)校設(shè)備的不斷引進及設(shè)備資料的不斷增多,包括收集、整理、歸納等。傳統(tǒng)檔案管理是手工管理模式,管理方式已經(jīng)無法滿足現(xiàn)行工作需求,我們目前需要一個確實可行的技術(shù)方法——數(shù)據(jù)挖掘技術(shù)。
數(shù)據(jù)挖掘技術(shù)從定義上講就是從大量的不完整的模糊的數(shù)據(jù)中提取信息的一種方法?;镜姆椒ㄓ?①關(guān)聯(lián)分析法。它是從統(tǒng)計學(xué)的角度出發(fā),指在從給定的數(shù)據(jù)集或者數(shù)據(jù)庫中發(fā)現(xiàn)頻繁出現(xiàn)的那部分項或者集合,從而分析這部分數(shù)據(jù)集合的特征和性質(zhì)。例如,某電子市場通過關(guān)聯(lián)分析,找出了若干個用戶在購買所需電子產(chǎn)品時,所需或者偏好購買的品牌電子產(chǎn)品,進而反映出這部分用戶的購買習(xí)慣。②序列模式分析法。它比關(guān)聯(lián)分析法能更進一步解釋數(shù)據(jù)集合的特征。它是指在一組有序的集合中,頻繁出現(xiàn)的那部分集合按一定順序重新組合構(gòu)成的模式。例如:計算超市購物中被共同購買的商品,它把每個顧客的一次交易視作一個Transaction,計算在不同Transaction中不同Item組合的規(guī)律性。而如果我們考慮一個用戶多次在超市購物的情況,那么這些不同時間點的交易記錄就構(gòu)成了一個購買序列,N個用戶的購買序列就組成一個規(guī)模為N的序列數(shù)據(jù)集。③分類分析法。將有關(guān)數(shù)據(jù)信息通過一定方式進行分類的方法。例如:學(xué)??梢愿鶕?jù)學(xué)生的學(xué)習(xí)基礎(chǔ)、掌握知識情況和分數(shù)情況,對其進行層次分劃。④聚類分析法。從表面意義上講就是從分析過的數(shù)據(jù)信息中再次進行細致的加工分析方法。在學(xué)校里,可以通過學(xué)生的基礎(chǔ)信息數(shù)據(jù)將所有學(xué)生信息分組,并對所有學(xué)生的學(xué)習(xí)模式進行描述,找出他們的特征,進而幫助教師制定有計劃和針對性的授課方案。⑤孤立點分析法。孤立點是所有數(shù)據(jù)信息中出現(xiàn)故障或排斥的信息點或信息段。孤立點分析法廣泛應(yīng)用于銀行、金融業(yè)、電信部門和企業(yè)的經(jīng)營管理等。例如:銀行可以利用孤立點分析發(fā)現(xiàn)銀行卡信息詐騙、銀行卡或信用卡丟失等。
當(dāng)今的高校設(shè)備檔案管理模式既是對設(shè)備檔案的管理,也是對其數(shù)據(jù)信息的數(shù)字化統(tǒng)計過程。它不僅從表面上實現(xiàn)了檔案的靜態(tài)模式管理,更實現(xiàn)了其數(shù)字信息不斷更新的動態(tài)管理,從而對檔案管理員的效率也是個提高。設(shè)備檔案管理系統(tǒng)模式的建立使檔案的錄入和查閱工作變得更加方便和快捷。以傳統(tǒng)手工整理模式進而轉(zhuǎn)變?yōu)楦?、準、快的?shù)字化錄入模式,使資產(chǎn)管理人員及時了解學(xué)校設(shè)備的信息,真正實現(xiàn)了錄入、編輯、修改等功能,達到了方便高效的管理目標。
1.設(shè)備檔案的分類
設(shè)備檔案分類是將單位所有固定資產(chǎn)和低值易耗品所建立的檔案分成不同的種類,從橫向來說每一類里的檔案具有相似的屬性,從縱向來說不同類別里的檔案的屬性是不同的。數(shù)據(jù)挖掘可以幫助從事設(shè)備檔案管理的人員細致而準確地將所屬檔案進行分類。例如:數(shù)據(jù)挖掘可將檔案按照屬性類別進行排序,從而提高檔案管理員的檢索效率。
2.設(shè)備檔案的收集工作
首先對各設(shè)備數(shù)據(jù)的基本信息進行分析,建立一個已知的數(shù)據(jù)集模型,對每一個要測試的樣本,用已知的與預(yù)測的類別進行比較,若一個模型的準確率經(jīng)測試被認可,則就可以用這個模型對未知對象進行具體的分類。例如,設(shè)備檔案管理員對全校在編教師筆記本的領(lǐng)用情況進行書面統(tǒng)計,并將統(tǒng)計結(jié)果錄入數(shù)據(jù)庫中。這些信息包括姓名、年齡、性別、職稱、職務(wù)、學(xué)歷層次、所屬學(xué)院(部門)、領(lǐng)用時間、筆記本型號等。當(dāng)一個教師的信息被輸入到數(shù)據(jù)庫中時,該教師與其他新進教師的檔案屬性相匹配后,其他所有新進教職工的信息屬性隨之自然分類。
3.設(shè)備檔案的保管工作
設(shè)備檔案的保管核心工作,是保管好新設(shè)備檔案的同時防止舊設(shè)備檔案流失的過程。對學(xué)校這樣一個特殊群體,其設(shè)備檔案在保管過程中,除了正常的手工保管紙質(zhì)文件要在通風(fēng)干燥的環(huán)境下保存,還要在檔案數(shù)據(jù)庫中建立一個完整的備份系統(tǒng),在這個系統(tǒng)里要建立好相關(guān)的網(wǎng)絡(luò)保護措施,防止外界的病毒侵入,造成整個設(shè)備檔案軟件系統(tǒng)癱瘓。
4.協(xié)助配合資產(chǎn)使用部門搞好服務(wù)工作
設(shè)備檔案信息是為檔案利用人員服務(wù)的,不同單位不同部門的利用人員對檔案的需求和利用程度不同,數(shù)據(jù)挖掘技術(shù)針對不同人員對設(shè)備檔案的不同需求,設(shè)定不同的屬性值和分類情況,為他們提供最優(yōu)的檢索結(jié)果,為國有資產(chǎn)管理部門的主動服務(wù)提供可靠保證。例如:兩個不同的部門查找同一設(shè)備的不同檢索信息,分別輸入設(shè)備的兩個不同屬性,結(jié)果顯示出的結(jié)果是兩個部門所需的不同檢索結(jié)果。
數(shù)據(jù)挖掘技術(shù)的工作過程分為:數(shù)據(jù)的抽取、數(shù)據(jù)的存儲和管理、數(shù)據(jù)的展現(xiàn)等關(guān)鍵技術(shù)。
1.數(shù)據(jù)的抽取
數(shù)據(jù)的抽取是數(shù)據(jù)進入倉庫的入口。由于數(shù)據(jù)倉庫是一個獨立的數(shù)據(jù)環(huán)境,它需要通過抽取過程將數(shù)據(jù)從聯(lián)機事務(wù)處理系統(tǒng)、外部數(shù)據(jù)源、脫機的數(shù)據(jù)存儲介質(zhì)中導(dǎo)入數(shù)據(jù)倉庫。數(shù)據(jù)抽取在技術(shù)上主要涉及互連、復(fù)制、增量、轉(zhuǎn)換、調(diào)度和監(jiān)控等幾個方面的處理。在數(shù)據(jù)抽取方面,未來的技術(shù)發(fā)展將集中在系統(tǒng)功能集成化方面,以適應(yīng)數(shù)據(jù)倉庫本身或數(shù)據(jù)源的變化,使系統(tǒng)更便于管理和維護。
2.數(shù)據(jù)的存儲和管理
數(shù)據(jù)倉庫的組織管理方式?jīng)Q定了它有別于傳統(tǒng)數(shù)據(jù)庫的特性,也決定了其對外部數(shù)據(jù)的表現(xiàn)形式。數(shù)據(jù)倉庫管理所涉及的數(shù)據(jù)量比傳統(tǒng)事務(wù)處理大得多,且隨時間的推移而快速累積。在數(shù)據(jù)倉庫的數(shù)據(jù)存儲和管理中需要解決的是如何管理大量的數(shù)據(jù)、如何并行處理大量的數(shù)據(jù)、如何優(yōu)化查詢等。目前,許多數(shù)據(jù)庫廠家提供的技術(shù)解決方案是擴展關(guān)系型數(shù)據(jù)庫的功能,將普通關(guān)系數(shù)據(jù)庫改造成適合擔(dān)當(dāng)數(shù)據(jù)倉庫的服務(wù)器。
3.數(shù)據(jù)的展現(xiàn)
數(shù)據(jù)展現(xiàn)主要有以下方式:
⑴查詢:實現(xiàn)預(yù)定義查詢、動態(tài)查詢、OLAP查詢與決策支持智能查詢;
⑵報表:產(chǎn)生關(guān)系數(shù)據(jù)表格、復(fù)雜表格、OLAP表格、報告以及各種綜合報表;
⑶可視化:用易于理解的點線圖、直方圖、餅圖、網(wǎng)狀圖、交互式可視化等技術(shù)表現(xiàn)復(fù)雜數(shù)據(jù)及其相互關(guān)系;
⑷統(tǒng)計:進行平均值、最大值、最小值、期望、方差、匯總、排序等各種統(tǒng)計分析;
⑸挖掘:利用數(shù)據(jù)挖掘等方法,從數(shù)據(jù)中得到關(guān)于數(shù)據(jù)關(guān)系和模式信息。
通過數(shù)據(jù)挖掘技術(shù)在資產(chǎn)檔案中的應(yīng)用,大大提高了我校國有資產(chǎn)管理員的檔案管理效率,對于檔案利用者來說也更加及時與方便,通過使用這項技術(shù),我校設(shè)備檔案的管理也顯得更加規(guī)范和有秩序??傊瑪?shù)據(jù)挖掘技術(shù)在我校國有資產(chǎn)檔案管理中起著至關(guān)重要的作用。
[1]萬睿,祁風(fēng)義.淺談高校儀器設(shè)備檔案現(xiàn)代化管理[J].2007(2):154-155.
[2]劉瑾.高校設(shè)備檔案的計算機化管理[J].檔案管理,2002(1):28-29.
[3]Jiawei Han,Micheline Kamber.數(shù)據(jù)挖掘概念與技術(shù)[M].范明,孟小鋒,等譯.北京:機械工業(yè)出版社,2001.