国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘技術(shù)在工業(yè)遺產(chǎn)檔案資源整合中的應(yīng)用

2016-03-16 22:10:30
文化學(xué)刊 2016年10期
關(guān)鍵詞:遺產(chǎn)檔案館數(shù)據(jù)挖掘

楊 杰

(朝陽(yáng)縣住房和城鄉(xiāng)規(guī)劃建設(shè)局,遼寧 朝陽(yáng) 122000)

?

【文化遺產(chǎn)】

數(shù)據(jù)挖掘技術(shù)在工業(yè)遺產(chǎn)檔案資源整合中的應(yīng)用

楊 杰

(朝陽(yáng)縣住房和城鄉(xiāng)規(guī)劃建設(shè)局,遼寧 朝陽(yáng) 122000)

工業(yè)遺產(chǎn)檔案資源分布較為分散,在用戶進(jìn)行查詢與利用時(shí),找到全部相關(guān)聯(lián)的檔案資料首先需要奔波于多個(gè)存檔部門(mén),這一過(guò)程持續(xù)時(shí)間長(zhǎng),耗費(fèi)精力,得到一份有價(jià)值的資料也是需要經(jīng)過(guò)幾分周折的,所以,構(gòu)建一個(gè)系統(tǒng)統(tǒng)一的工業(yè)遺產(chǎn)檔案數(shù)據(jù)庫(kù),為利用者在短時(shí)間內(nèi)迅速地查詢到有價(jià)值的結(jié)果尤為必要。

數(shù)據(jù)挖掘技術(shù);工業(yè)遺產(chǎn)檔案;資源整合

隨著計(jì)算機(jī)及網(wǎng)絡(luò)技術(shù)的迅猛發(fā)展,各個(gè)領(lǐng)域已被深深地標(biāo)注上了信息化的符號(hào),不斷膨脹的信息量讓人們應(yīng)接不暇。那么如何采用科技的技術(shù)手段,將檔案資源中龐大的數(shù)據(jù)進(jìn)行處理并提取出可供利用的規(guī)則和知識(shí)呢,數(shù)據(jù)挖掘技術(shù)不失為最佳選擇。

一、數(shù)據(jù)挖掘技術(shù)及其應(yīng)用

數(shù)據(jù)挖掘即是從海量的數(shù)據(jù)中提取需要的知識(shí)和數(shù)據(jù)。學(xué)術(shù)界給出的定義為:“從大量的、有噪聲、不完全的、模糊的、隨機(jī)的數(shù)據(jù)庫(kù)中,提取隱含在其中的、人們預(yù)先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程”[1]。

此項(xiàng)技術(shù)手段已被應(yīng)用于多個(gè)領(lǐng)域,且成果的實(shí)際的應(yīng)用價(jià)值很高,對(duì)社會(huì)生產(chǎn)生活產(chǎn)生的影響很大。例如,零售業(yè)中沃爾瑪?shù)馁?gòu)物籃分析;公安部門(mén)的“金盾工程”;醫(yī)案處方分析的大承氣湯經(jīng)方等等,另外,在銀行業(yè)也經(jīng)常運(yùn)用這項(xiàng)技術(shù),分析銀行客戶、研究需求,用以提高銀行業(yè)的服務(wù)水平。

數(shù)據(jù)挖掘技術(shù)在數(shù)字檔案建設(shè)方面也有相關(guān)應(yīng)用。有學(xué)者“利用數(shù)據(jù)挖掘技術(shù)將檔案與利用者之間、檔案與各種實(shí)踐活動(dòng)之間以及檔案之間的關(guān)系揭示出來(lái),從而在更深層次上發(fā)揮這些檔案數(shù)據(jù)的信息作用,從數(shù)據(jù)清洗方法、數(shù)據(jù)挖掘算法、數(shù)據(jù)倉(cāng)庫(kù)的建立等方面論述了如何將數(shù)據(jù)挖掘技術(shù)與檔案工作相結(jié)合的具體思路,并提出了一個(gè)數(shù)據(jù)挖掘系統(tǒng)的設(shè)計(jì)思想”[2]。廣州市城建檔案館通過(guò)數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)了規(guī)劃管理業(yè)務(wù)檔案按項(xiàng)目分專(zhuān)業(yè)的關(guān)聯(lián),利用者檢索到的規(guī)劃管理檔案可以是成套的、整合的、統(tǒng)一的,而對(duì)于決策者來(lái)說(shuō)也是掌握了更全面更有價(jià)值的檔案信息[3]。

二、工業(yè)遺產(chǎn)檔案資源界定

工業(yè)遺產(chǎn)檔案即是為每件工業(yè)遺產(chǎn)建立的檔案。工業(yè)遺產(chǎn),是指1840年中國(guó)近代工業(yè)產(chǎn)生以來(lái),具有歷史、科技、藝術(shù)、社會(huì)價(jià)值的近現(xiàn)代工業(yè)文化遺存,包括物質(zhì)遺產(chǎn)和非物質(zhì)遺產(chǎn)[4]。工業(yè)遺產(chǎn)檔案涵蓋:(1)申報(bào)單位收錄的關(guān)于該工業(yè)遺產(chǎn)的所有檔案及資料。即不可移動(dòng)舊址,建筑遺存物;涉及企業(yè)歷史記錄的實(shí)體紙質(zhì)檔案,有工業(yè)企業(yè)正常運(yùn)轉(zhuǎn)時(shí)產(chǎn)生的文書(shū)檔案、科技檔案以及專(zhuān)門(mén)檔案;包括生產(chǎn)工藝流程、手工技能、原料配方、商號(hào)、經(jīng)營(yíng)管理、企業(yè)文化等的非物質(zhì)的東西。(2)申報(bào)過(guò)程中形成的檔案。相關(guān)企業(yè)的申報(bào)材料,包括文字資料、聲像資料等。如填制的《工業(yè)遺產(chǎn)資源調(diào)查表》《工業(yè)遺產(chǎn)價(jià)值評(píng)價(jià)指標(biāo)體系》等表格,包括對(duì)物質(zhì)、非物質(zhì)遺產(chǎn)的描述、繪圖等。(3)可確定公布為工業(yè)遺產(chǎn)后相關(guān)的利用與保護(hù)資料。對(duì)工業(yè)遺產(chǎn)按照“誰(shuí)使用、誰(shuí)負(fù)責(zé)、誰(shuí)保護(hù)、誰(shuí)受益”的管理原則,采取措施將其管理和保護(hù)的東西建檔。專(zhuān)項(xiàng)規(guī)劃存檔,可移動(dòng)實(shí)物可由檔案館等文物收藏單位予以征集收藏、陳列展示。

工業(yè)遺產(chǎn)檔案兼具憑證價(jià)值、文化價(jià)值以及現(xiàn)實(shí)價(jià)值,所記錄的信息對(duì)于人類(lèi)了解工業(yè)文明的發(fā)展、工業(yè)文化等具有無(wú)法替代的作用。這類(lèi)資源主要分布在綜合檔案館、城建檔案館以及企業(yè)內(nèi)部檔案館室,另外,史志辦、文化遺產(chǎn)中心以及經(jīng)濟(jì)與信息化委員會(huì)等也會(huì)保存有相關(guān)資料。

三、資源整合的模型構(gòu)建

構(gòu)建工業(yè)遺產(chǎn)檔案資源整合模型的目的就是要及時(shí)地解決用戶的查詢困難,避免獲取資源的拖沓繁復(fù)問(wèn)題,及時(shí)解決利用者的利用需求,需要對(duì)數(shù)據(jù)挖掘流程進(jìn)行科學(xué)化處理。對(duì)于海量的數(shù)據(jù)資源來(lái)說(shuō),有一個(gè)靈活、高效的網(wǎng)絡(luò)環(huán)境是十分重要的,科學(xué)地分析數(shù)據(jù)可以有效地解決用戶與資源間的矛盾??茖W(xué)合理的處理流程可以提高利用效率。效率一直是檔案工作所追求的,注重征求群眾意見(jiàn)建議,不斷改進(jìn)工作方法,完善窗口運(yùn)行機(jī)制。數(shù)據(jù)挖掘的處理需要進(jìn)行認(rèn)真梳理,在研究分析的基礎(chǔ)上和在法律法規(guī)框架內(nèi),對(duì)相關(guān)程序和流程做進(jìn)一步地精簡(jiǎn)和優(yōu)化,提高工作效率??茖W(xué)合理的處理流程,還可以有效地節(jié)約時(shí)間,避免用戶的周折,做到迅速查詢,減少不必要的麻煩。

用數(shù)據(jù)挖掘技術(shù)構(gòu)建檔案資源的整合模式,需要注意以下幾點(diǎn):

1.開(kāi)發(fā)環(huán)境。利用SQL Server數(shù)據(jù)庫(kù)進(jìn)行開(kāi)發(fā)。SQL Server可以對(duì)數(shù)據(jù)進(jìn)行查詢,實(shí)現(xiàn)搜索功能,并且同步于各類(lèi)工作,作出報(bào)告并完善分析數(shù)據(jù)。多用于中小型企業(yè)數(shù)據(jù)庫(kù)的構(gòu)建。同理可應(yīng)于工業(yè)遺產(chǎn)檔案資源數(shù)據(jù)庫(kù)的構(gòu)建。

2.模型構(gòu)建。模型構(gòu)建具體的方案圖如下所示:

綜合檔案館+城建檔案館+企業(yè)檔案室+史志辦+文化遺產(chǎn)中心+經(jīng)濟(jì)與信息化委員會(huì)→數(shù)據(jù)倉(cāng)庫(kù)→模式評(píng)估→可視化用戶界面

3.數(shù)據(jù)預(yù)處理。對(duì)于原始數(shù)據(jù)的處理是進(jìn)行科學(xué)挖掘的前提,處理的過(guò)程會(huì)花費(fèi)大量的時(shí)間成本,而且經(jīng)過(guò)很多過(guò)程。數(shù)據(jù)預(yù)處理的方法有數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)變換、數(shù)據(jù)歸約等,它們是將不完整、不一致的數(shù)據(jù)進(jìn)行技術(shù)處理,以提高數(shù)據(jù)挖掘的質(zhì)量和效率。

工業(yè)遺產(chǎn)檔案是記錄老工業(yè)區(qū)發(fā)展變遷的歷史資料,它們具有著潛在無(wú)限的再生價(jià)值,通過(guò)科學(xué)技術(shù)手段整合工業(yè)遺產(chǎn)檔案資源,讓工業(yè)遺產(chǎn)檔案煥發(fā)出前所未有的容光,這對(duì)于當(dāng)?shù)毓I(yè)遺產(chǎn)的文化重建,對(duì)于檔案資源的綜合開(kāi)發(fā),甚至對(duì)于本地區(qū)軟實(shí)力的增強(qiáng)是極具幫助性的。

[1]JiaweiHan, MiehelineKamber.數(shù)據(jù)挖掘概念與技術(shù)[M].范明. 孟小峰等譯. 機(jī)械工業(yè)出版社, 2001.

[2]宇然.數(shù)據(jù)挖掘技術(shù)研究以及在檔案計(jì)算機(jī)管理系統(tǒng)中的應(yīng)用[D].沈陽(yáng)工業(yè)大學(xué)碩士論文,2002.11

[3]鄭向陽(yáng).數(shù)據(jù)挖掘技術(shù)及其在城建檔案信息服務(wù)中的應(yīng)用[J].檔案學(xué)通訊,2005,(03).

[4]國(guó)家文物局.工業(yè)遺產(chǎn)保護(hù)和利用導(dǎo)則(征求意見(jiàn)稿)[R].辦保函(2014)758號(hào).

【責(zé)任編輯:周 丹】

G272

A

1673-7725(2016)10-0127-02

2016-09-20

楊杰(1985-),女,遼寧朝陽(yáng)人,檔案館員,主要從事建設(shè)工程檔案管理研究。

猜你喜歡
遺產(chǎn)檔案館數(shù)據(jù)挖掘
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
遺產(chǎn)怎么分
千萬(wàn)遺產(chǎn)
關(guān)于縣級(jí)檔案館館藏檔案開(kāi)發(fā)利用的思考
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
全省部分檔案館新館掠影
浙江檔案(2017年10期)2017-03-31 06:27:31
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
when與while檔案館
遺產(chǎn)之謎
遺產(chǎn)
赤水市| 西林县| 清河县| 平原县| 宁城县| 旅游| 织金县| 松溪县| 西宁市| 江阴市| 安泽县| 墨脱县| 昌乐县| 榆社县| 万源市| 巨鹿县| 泽州县| 六安市| 潢川县| 和硕县| 曲周县| 稷山县| 永善县| 中山市| 县级市| 阳新县| 新和县| 六枝特区| 瑞金市| 新泰市| 图木舒克市| 涪陵区| 喀喇沁旗| 大关县| 磴口县| 平顶山市| 广宗县| 南昌市| 衡山县| 资兴市| 崇州市|