国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

信息分析方法在檔案領(lǐng)域的應(yīng)用現(xiàn)狀綜述

2015-05-30 10:48馬廣惠朝樂門
北京檔案 2015年6期
關(guān)鍵詞:分析方法數(shù)據(jù)挖掘語義

馬廣惠 朝樂門

摘要:本文主要針對(duì)信息分析方法在檔案領(lǐng)域的應(yīng)用現(xiàn)狀進(jìn)行文獻(xiàn)調(diào)研,重點(diǎn)討論了統(tǒng)計(jì)分析方法、計(jì)算機(jī)輔助信息分析方法及新興信息分析方法在檔案領(lǐng)域的具體應(yīng)用。

關(guān)鍵詞:信息分析檔案信息資源管理

Abstract:The application of Informa? tion Analysis Disciplines logic method and specific method, including statistical, computer-aided and emerging analyzing measures,to Archival Science is dis? cussed based upon a literature review of relevant studies.

Keywords:Information Analysis; Ar? chives; Information Resources Manage? ment

目前,檔案學(xué)科正向基于信息資源的管理階段邁進(jìn),在此階段,為推動(dòng)經(jīng)濟(jì)社會(huì)發(fā)展,對(duì)檔案信息資源實(shí)行科學(xué)、有效的開發(fā)利用與管理成為首要任務(wù)。[1]在此歷史背景下,為實(shí)現(xiàn)對(duì)檔案信息資源的深度加工尋找方法指導(dǎo)與工具支持尤為重要。

信息分析是一項(xiàng)內(nèi)容廣泛的信息深加工處理和情報(bào)提煉活動(dòng),它以大量相關(guān)的原生信息為處理對(duì)象,通過對(duì)原生信息內(nèi)容的分析、綜合或評(píng)價(jià),以提煉出對(duì)管理、決策等活動(dòng)有支持作用的情報(bào),為管理、決策等活動(dòng)服務(wù)。[2]作為一門綜合性學(xué)科,信息分析吸收、借鑒了其他學(xué)科的分析方法,其方法體系如圖1所示,主要包括:哲學(xué)方法、一般分析方法與具體分析方法(統(tǒng)計(jì)分析方法、計(jì)算機(jī)輔助信息分析方法及新興信息分析方法)。[3]

信息分析方法的應(yīng)用性及檔案信息資源開發(fā)的必要性,為針對(duì)二者的結(jié)合研究提供了思路。本文從信息分析方法與檔案結(jié)合的視角,采用文獻(xiàn)調(diào)查方法,針對(duì)信息分析中層和底層方法在檔案領(lǐng)域的應(yīng)用現(xiàn)狀進(jìn)行文獻(xiàn)綜述。通過預(yù)調(diào)研和專家討論,最終確定的文獻(xiàn)調(diào)研方法如下:

*檢索詞:“檔案(archiv*)”+“分析(analys*)”;“檔案(archiv*)”+“方法(method*)”;“檔案(archiv*)”+具體方法名稱,如數(shù)據(jù)挖掘;

*檢索數(shù)據(jù)庫:中國期刊全文數(shù)據(jù)庫、中文科技期刊數(shù)據(jù)庫、萬方數(shù)據(jù)資源系統(tǒng)、中國重要會(huì)議全文數(shù)據(jù)庫、中國博士學(xué)位論文全文數(shù)據(jù)庫、中國優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫、Web of Science三大引文庫、ProQuest系列數(shù)據(jù)庫、Engineering Village(EI)、ACM(美國計(jì)算機(jī)協(xié)會(huì))電子期刊數(shù)據(jù)庫;

*檢索策略:標(biāo)題檢索+關(guān)鍵詞檢索,并對(duì)檢索結(jié)果進(jìn)行了相關(guān)性分析和有效文獻(xiàn)過濾。

調(diào)查結(jié)果發(fā)現(xiàn),信息分析與檔案學(xué)科領(lǐng)域內(nèi)尚無針對(duì)信息分析方法在檔案領(lǐng)域應(yīng)用的專題研究,相關(guān)研究分散在信息分析方法分析的具體技術(shù)在檔案領(lǐng)域的應(yīng)用研究之中。

一、一般分析方法及其應(yīng)用

一般分析方法,即科學(xué)整體層次的方法,在信息分析中具有普遍適用意義的科學(xué)方法,主要包括:比較、分析與綜合、推理。一般分析方法作為一種邏輯方法,貫穿人類思維過程的始終,其應(yīng)用范圍廣泛,并對(duì)具體方法的應(yīng)用形成指導(dǎo),但其方法本身決定分析結(jié)果僅是定性的描述,缺乏定量分析。本文不對(duì)一般分析方法在檔案領(lǐng)域的具體應(yīng)用作深入探討。

二、統(tǒng)計(jì)分析方法及其應(yīng)用

相對(duì)于一般分析方法,統(tǒng)計(jì)分析方法主要基于定量分析,主要包括描述性分析、回歸分析、聚類分析、時(shí)間序列分析和主成分分析。作為一種分析工具,統(tǒng)計(jì)分析方法為檔案領(lǐng)域信息分析提供了一套信息收集、處理、分析、解釋的方法。統(tǒng)計(jì)分析方法具體應(yīng)用如下:

(一)描述性分析

信息的分析始于描述,通過描述發(fā)現(xiàn)信息的基本特征是進(jìn)一步分析的基礎(chǔ),描述性分析包括用圖表展示信息和用統(tǒng)計(jì)量描述信息。在我國檔案管理領(lǐng)域,描述性分析應(yīng)用如下:

1.檔案或電子文件分析。檔案的描述性統(tǒng)計(jì)主要針對(duì)檔案的現(xiàn)存狀況進(jìn)行分析,旨在了解檔案的數(shù)量、種類、保存狀況等,通過對(duì)調(diào)查所得信息進(jìn)行匯總計(jì)算,得出檔案數(shù)量總計(jì)結(jié)果、比例、增長率等結(jié)果,進(jìn)而為檔案管理提供依據(jù)。例如,歐盟Moreq2010標(biāo)準(zhǔn)、[4]美國DOD5015.2、[5]國際檔案協(xié)會(huì)ICA標(biāo)準(zhǔn)[6]以及我國GB/T 29194-2012《電子文件管理系統(tǒng)通用功能要求》[7]對(duì)ERMS系統(tǒng)電子文件的統(tǒng)計(jì)分析和報(bào)表報(bào)告要求給出了具體規(guī)定。

2.檔案工作分析。描述性分析主要在檔案管理工作和檔案教育工作中得到應(yīng)用。第一,檔案管理工作分析,在檔案管理工作中,描述性統(tǒng)計(jì)方法主要應(yīng)用于檔案利用環(huán)節(jié)分析:統(tǒng)計(jì)數(shù)據(jù)或來源于統(tǒng)計(jì)年鑒、年報(bào)等二手信息,或由相關(guān)調(diào)查人員通過問卷調(diào)查直接獲得;統(tǒng)計(jì)指標(biāo)主要圍繞檔案資源、開放主體及利用者形成;分析結(jié)果主要通過頻數(shù)分布表、列聯(lián)表和條形圖、餅圖、曲線圖呈現(xiàn),涉及的統(tǒng)計(jì)量包括頻數(shù)、比例等。第二,檔案教育工作分析主要集中于對(duì)檔案高等教育的描述性分析,所得信息大多來自相關(guān)問卷調(diào)查結(jié)果;主要針對(duì)檔案教育工作中的檔案學(xué)專業(yè)、教師、課程、招生就業(yè)、人才培養(yǎng)情況進(jìn)行分析;通過頻數(shù)、比例統(tǒng)計(jì)量對(duì)結(jié)果進(jìn)行描述;以頻數(shù)分布表、列聯(lián)表、條形圖、餅狀圖的形式呈現(xiàn)統(tǒng)計(jì)結(jié)果。

3.檔案學(xué)理論分析。針對(duì)檔案學(xué)理論,大多學(xué)者通過選擇信息源、進(jìn)行檢索、提取信息、確定有效信息的過程開展檔案學(xué)研究,其主要研究對(duì)象確立為:作者、期刊論文、核心期刊、國家社科基金立項(xiàng)及研究現(xiàn)狀。描述性統(tǒng)計(jì)分析方法主要應(yīng)用于對(duì)研究結(jié)果的處理和呈現(xiàn),如通過頻數(shù)分布表、列聯(lián)表、餅圖、折線圖展示信息分布,通過頻數(shù)、比例統(tǒng)計(jì)量呈現(xiàn)信息分析結(jié)果。

綜合考察描述性統(tǒng)計(jì)方法在檔案領(lǐng)域的應(yīng)用情況,該方法在檔案、檔案工作、檔案學(xué)不同方面的應(yīng)用有不同的側(cè)重點(diǎn),應(yīng)用于不同方面的分析有不同的信息收集與信息處理方法。自20世紀(jì)80年代,檔案領(lǐng)域引入描述性統(tǒng)計(jì)方法至今,檔案領(lǐng)域?qū)τ诖祟惙椒ǖ膽?yīng)用主要限于信息展示,且應(yīng)用模式和方式單一,缺乏突破性研究;注重總量的計(jì)算,忽視所得信息整體及變量之間的結(jié)構(gòu)和關(guān)系;限于用簡單的圖表展示研究結(jié)果,缺乏對(duì)信息的概括性度量。因此,描述性統(tǒng)計(jì)方法在檔案領(lǐng)域應(yīng)用仍處于初級(jí)探索階段。

(二)回歸分析

回歸分析是處理兩個(gè)或兩個(gè)以上變量之間依賴關(guān)系的一種統(tǒng)計(jì)分析方法。我國對(duì)回歸方法在檔案領(lǐng)域應(yīng)用的研究現(xiàn)處于起步階段,國外則主要應(yīng)用回歸分析方法開展檔案信息資源開發(fā)利用工作,其應(yīng)用特點(diǎn)可歸納如下:國外檔案領(lǐng)域較早引進(jìn)了回歸分析方法,主要應(yīng)用于檔案信息內(nèi)容開發(fā),其方法的應(yīng)用是一個(gè)由關(guān)系確定、回歸分析、模型檢驗(yàn)到趨勢(shì)預(yù)測(cè)的完備過程。

(三)聚類分析

聚類分析是對(duì)個(gè)體或?qū)ο蠓诸?,以揭示客觀事物內(nèi)在本質(zhì)的分類規(guī)律。國內(nèi)對(duì)聚類分析在檔案領(lǐng)域應(yīng)用的研究較少,其關(guān)注點(diǎn)在于對(duì)聚類分析方法應(yīng)用到檔案領(lǐng)域本身的探討,以尋求適合檔案領(lǐng)域的特定聚類分析方法。[8]國外是將其視為一種輔助研究的工具,作為分析檔案信息的一個(gè)過程、一種手段,其最終目的為解決實(shí)際問題。

(四)時(shí)間序列分析

時(shí)間序列分析是通過對(duì)歷史數(shù)據(jù)變化的分析,來評(píng)價(jià)事物的現(xiàn)狀和估計(jì)事物的未來變化。有學(xué)者提出基于時(shí)間序列分析進(jìn)行檔案危機(jī)管理的理念,將危機(jī)生命周期理論與時(shí)間序列分析相結(jié)合。[9]嚴(yán)格來說,該理念并非統(tǒng)計(jì)學(xué)意義上的時(shí)間序列分析,而只是按時(shí)間管理事件的一種思想。該方法在國外檔案領(lǐng)域的應(yīng)用主要集中于科技檔案信息分析,包括醫(yī)療檔案、考古檔案、測(cè)繪檔案和環(huán)境檔案,應(yīng)用時(shí)間序列分析有不同的目的:對(duì)于過去長期積累數(shù)據(jù),一種是揭示過去事物或現(xiàn)象的原貌與規(guī)律,一種是探究事物或現(xiàn)象的時(shí)間發(fā)展規(guī)律,以預(yù)測(cè)未來;對(duì)于短期積累數(shù)據(jù),主要用于探究事物之間的相關(guān)關(guān)系。

(五)主成分分析

主成分分析是利用降維的思想,在損失部分信息的基礎(chǔ)上把多個(gè)指標(biāo)轉(zhuǎn)化為幾個(gè)綜合指標(biāo)的多元統(tǒng)計(jì)方法。目前,我國針對(duì)主成分分析方法在檔案領(lǐng)域應(yīng)用的研究較少,有學(xué)者曾用主成分分析方法對(duì)電子檔案工作人員離職行為影響因素進(jìn)行分析。[10]國外檔案領(lǐng)域?qū)χ鞒煞址治龇椒ǖ年P(guān)注集中于檔案信息內(nèi)容開發(fā),一種是以檔案信息內(nèi)容為分析對(duì)象,運(yùn)用主成分分析法分析檔案內(nèi)容信息,以檢驗(yàn)已有經(jīng)驗(yàn)、模型的正確性,并在此基礎(chǔ)上作動(dòng)態(tài)分析;另一種是探究針對(duì)特定檔案類型的主成分分析方法,通過比較,為特定檔案類型選擇適宜的分析方法,在此過程中,檔案內(nèi)容信息僅為方法選擇提供數(shù)據(jù)支持,而非特定分析對(duì)象。

三、計(jì)算機(jī)輔助信息分析方法應(yīng)用

數(shù)字化、網(wǎng)絡(luò)化時(shí)代的到來提升了信息分析的難度,與此同時(shí),人們對(duì)高質(zhì)量信息分析成果的需求有所增加,在此背景下,計(jì)算機(jī)輔助信息分析成為發(fā)展趨勢(shì)。為實(shí)現(xiàn)對(duì)檔案領(lǐng)域數(shù)字化、網(wǎng)絡(luò)化信息的分析,檔案界將計(jì)算機(jī)輔助信息分析方法引入檔案領(lǐng)域,其具體應(yīng)用如下:

(一)數(shù)據(jù)挖掘

在技術(shù)領(lǐng)域,數(shù)據(jù)挖掘被定義為運(yùn)用相關(guān)技術(shù)從數(shù)據(jù)集挖掘知識(shí)的過程。數(shù)據(jù)挖掘在檔案領(lǐng)域應(yīng)用主要包括以下幾個(gè)方面:

1.數(shù)據(jù)挖掘應(yīng)用于檔案管理業(yè)務(wù)環(huán)節(jié)。在檔案管理領(lǐng)域,相關(guān)學(xué)者開展了數(shù)據(jù)挖掘在檔案編研選題和檔案提供利用環(huán)節(jié)的研究,通過對(duì)檔案信息管理系統(tǒng)中保存的檔案管理業(yè)務(wù)信息的挖掘,揭示其中隱含的規(guī)律,進(jìn)而推進(jìn)館藏資源建設(shè)、提升檔案信息服務(wù)的水平。

2.數(shù)據(jù)挖掘應(yīng)用于網(wǎng)絡(luò)信息資源開發(fā)。網(wǎng)絡(luò)信息資源通過網(wǎng)絡(luò)信息記載了社會(huì)的發(fā)展變化,是檔案不可或缺的重要組成部分,應(yīng)用數(shù)據(jù)挖掘分析網(wǎng)絡(luò)信息資源成為大勢(shì)所趨,其具體應(yīng)用包括:采用數(shù)據(jù)挖掘技術(shù)對(duì)Web檔案所保存的海量信息進(jìn)行深層次分析和研究,使網(wǎng)絡(luò)信息資源分析從簡單的數(shù)據(jù)統(tǒng)計(jì)分析過渡到信息分析、從數(shù)據(jù)的處理過渡到知識(shí)發(fā)現(xiàn),[11]并將分析結(jié)果以可視化的方式呈現(xiàn);[12]為從用戶角度推進(jìn)網(wǎng)絡(luò)檔案信息資源個(gè)性化服務(wù),基于Web的數(shù)據(jù)挖掘技術(shù)得以提出,該方法從Web文檔與Web活動(dòng)中,發(fā)現(xiàn)并獲取用戶的潛在需求,探索建設(shè)以用戶為中心的智能化服務(wù)平臺(tái),應(yīng)用Web數(shù)據(jù)挖掘技術(shù)建設(shè)數(shù)據(jù)庫。[13]

3.數(shù)據(jù)挖掘在數(shù)字檔案館中的應(yīng)用,為實(shí)現(xiàn)有效管理和利用檔案信息資源,需采用數(shù)據(jù)挖掘技術(shù)轉(zhuǎn)變信息資源管理模式,基于數(shù)字化檔案信息的內(nèi)容特征挖掘出隱含的、有效的數(shù)據(jù)模式,實(shí)現(xiàn)方便、快捷提供數(shù)字化信息資源的目的。[14]

在檔案領(lǐng)域,數(shù)據(jù)挖掘的對(duì)象由檔案管理數(shù)據(jù),尤其是用戶信息,擴(kuò)展至檔案內(nèi)容信息;數(shù)據(jù)挖掘的范圍由檔案管理系統(tǒng)中的信息擴(kuò)展至網(wǎng)絡(luò)信息資源;在檔案管理機(jī)構(gòu)的應(yīng)用由傳統(tǒng)實(shí)體檔案館到數(shù)字檔案館,其應(yīng)用逐步擴(kuò)展,數(shù)據(jù)挖掘的層次、深度逐步提升。由于檔案領(lǐng)域傳統(tǒng)的信息組織方式無法滿足數(shù)據(jù)挖掘?qū)Ω哔|(zhì)量信息的需求及數(shù)據(jù)挖掘技術(shù)應(yīng)用面臨的諸多問題,使得這些不足制約著數(shù)據(jù)挖掘在檔案領(lǐng)域的應(yīng)用。

(二)聯(lián)機(jī)分析處理

聯(lián)機(jī)分析處理(OLAP)即共享多維信息的快速分析,主要用于驗(yàn)證性信息分析,以支持決策。檔案領(lǐng)域應(yīng)用OLAP的理論探討如下:OLAP應(yīng)用于檔案管理系統(tǒng)構(gòu)建和分析,為實(shí)現(xiàn)對(duì)數(shù)據(jù)的深入分析奠定基礎(chǔ);隨著萬維網(wǎng)的普及和網(wǎng)頁歸檔日益得到認(rèn)可,全面記錄網(wǎng)絡(luò)發(fā)展,不僅需要實(shí)現(xiàn)網(wǎng)頁檔案信息的收集,更需要實(shí)現(xiàn)對(duì)于積累的網(wǎng)頁內(nèi)容和附加信息的分析處理,在此基礎(chǔ)上OLAP逐漸轉(zhuǎn)向?qū)W(wǎng)頁檔案信息的分析和處理。[15]國外對(duì)于檔案領(lǐng)域應(yīng)用聯(lián)機(jī)分析處理的研究主要集中于商業(yè)范圍檔案信息開發(fā),屬于實(shí)際應(yīng)用范疇。

(三)社會(huì)網(wǎng)絡(luò)分析

社會(huì)網(wǎng)絡(luò)分析對(duì)社會(huì)關(guān)系結(jié)構(gòu)及其屬性進(jìn)行分析,以觀測(cè)整體網(wǎng)絡(luò)結(jié)構(gòu)及特定變量位置和變量間關(guān)系。在檔案領(lǐng)域社會(huì)網(wǎng)絡(luò)分析應(yīng)用如下:對(duì)作者合作網(wǎng)絡(luò)、引文網(wǎng)絡(luò)及研究主題關(guān)聯(lián)網(wǎng)絡(luò)進(jìn)行分析,通過構(gòu)建針對(duì)特定問題的關(guān)聯(lián)網(wǎng)絡(luò),以探究網(wǎng)絡(luò)整體結(jié)構(gòu)及內(nèi)部關(guān)系,揭示檔案領(lǐng)域內(nèi)部規(guī)律及趨勢(shì);此外,檔案領(lǐng)域開展了對(duì)社會(huì)網(wǎng)絡(luò)分析具體技術(shù)及工具的探討。社會(huì)網(wǎng)絡(luò)分析在我國檔案領(lǐng)域主要用于檔案學(xué)研究,且對(duì)于研究現(xiàn)狀的分析多于面向未來的預(yù)測(cè)。國外,社會(huì)網(wǎng)絡(luò)分析主要是作為一種檔案信息分析的模型、機(jī)制、工具,側(cè)重于應(yīng)用,通過對(duì)檔案信息的分析實(shí)現(xiàn)輔助決策的目的。

四、新興信息分析方法應(yīng)用

面對(duì)信息數(shù)量的增長及數(shù)據(jù)類型的增加,傳統(tǒng)的信息分析方法無法應(yīng)對(duì)新形勢(shì)的挑戰(zhàn),在信息分析的數(shù)量、質(zhì)量及難度方面遇到了障礙,因此,研究、發(fā)展新興信息分析方法成為客觀必然。在此背景下,檔案領(lǐng)域開展了新興信息分析方法應(yīng)用的探討。

(一)大數(shù)據(jù)分析

隨著網(wǎng)上數(shù)字檔案資源的增加以及國內(nèi)外檔案網(wǎng)站知識(shí)服務(wù)的開展,網(wǎng)上數(shù)字檔案大數(shù)據(jù)分析成為新興研究的熱點(diǎn),相關(guān)研究主要集中于技術(shù)探討:相關(guān)學(xué)者在分析檔案大數(shù)據(jù)知識(shí)挖掘需求與挑戰(zhàn)的基礎(chǔ)上,對(duì)檔案大數(shù)據(jù)知識(shí)挖掘的關(guān)鍵技術(shù)進(jìn)行總結(jié);針對(duì)大數(shù)據(jù)分析技術(shù)進(jìn)行研究以構(gòu)建檔案用戶行為大數(shù)據(jù)分析系統(tǒng)。[16]目前,國外主要應(yīng)用大數(shù)據(jù)分析方法開展電子健康檔案內(nèi)容分析,預(yù)測(cè)疾病的相關(guān)影響因素,以進(jìn)行針對(duì)性防御。

大數(shù)據(jù)分析主要針對(duì)數(shù)字化環(huán)境中產(chǎn)生的數(shù)字檔案的分析。大數(shù)據(jù)分析在檔案領(lǐng)域應(yīng)用問題屬于檔案學(xué)前沿研究,現(xiàn)仍處于理論探討階段,其最終實(shí)現(xiàn)需要一系列工具與技術(shù)的支持,雖目前應(yīng)用范圍不是很廣泛,但為檔案領(lǐng)域信息分析提供了新的分析視角,為未來數(shù)字檔案館建設(shè)、知識(shí)服務(wù)、個(gè)性化服務(wù)提供了方向。

(二)語義分析

語義分析旨在分析詞義及詞間語義關(guān)系。語義分析在檔案領(lǐng)域應(yīng)用包括:第一,數(shù)字檔案資源語義檢索。傳統(tǒng)檔案信息檢索基于語法結(jié)構(gòu)進(jìn)行檢索,無法識(shí)別與處理語義關(guān)系,信息檢索結(jié)果與用戶需要信息之間存在較大差異。在此背景下,構(gòu)建語義關(guān)聯(lián)數(shù)據(jù)網(wǎng)絡(luò)、語義檢索研究日益興起。第二,數(shù)字檔案資源體系建設(shè)。當(dāng)前,數(shù)字檔案資源體系的語義異構(gòu)問題,阻礙了數(shù)字檔案的利用和共享,建立檔案領(lǐng)域本體、實(shí)現(xiàn)語義組織,在此基礎(chǔ)上推進(jìn)數(shù)字檔案資源體系語義互操作,將實(shí)現(xiàn)數(shù)字檔案資源的開放互聯(lián)和有效整合。第三,檢索語言語義網(wǎng)絡(luò)化。為實(shí)現(xiàn)檔案檢索工具在語義網(wǎng)絡(luò)環(huán)境中的應(yīng)用,需將傳統(tǒng)的檢索語言遷移至語義網(wǎng),基于RDF的SKOS為檢索語言語義網(wǎng)絡(luò)化提供了可行路徑。此外,國外檔案界較早關(guān)注了語義分析,對(duì)于語義分析的研究主要集中于醫(yī)療檔案信息語義分析的實(shí)現(xiàn)過程,通過語義分析工具和結(jié)構(gòu)化詞表構(gòu)建語義網(wǎng)絡(luò)。

語義分析是一個(gè)集成語義組織語言、資源建設(shè)與語義檢索的綜合方法,各過程相互關(guān)聯(lián)、相互影響,但目前語義分析在檔案領(lǐng)域的研究傾向于分散化,強(qiáng)調(diào)各方面界限的同時(shí)忽略各階段的連接,針對(duì)某一環(huán)節(jié)的探討易于忽略前后相繼的環(huán)節(jié)。

(三)智能分析

智能分析是將智能算法嵌入到數(shù)字信號(hào)處理中,通過分析和提煉移動(dòng)目標(biāo)的各種行為模式,形成核心算法。例如,智能分析技術(shù)已應(yīng)用于電子文件管理系統(tǒng)的自動(dòng)化測(cè)試工作,進(jìn)而提高測(cè)試效率和測(cè)試結(jié)果的客觀性。[17]智能分析處于發(fā)展?fàn)顟B(tài),其在安防及圖像分析方面的優(yōu)勢(shì),將為檔案保管及檢索提供新的思路。

通過以上對(duì)信息分析方法在檔案領(lǐng)域應(yīng)用現(xiàn)狀的分析,可得出以下結(jié)論:第一,相對(duì)于其他信息分析方法,一般分析方法在檔案學(xué)領(lǐng)域的應(yīng)用范圍最為廣泛,且對(duì)具體方法的應(yīng)用形成指導(dǎo);第二,統(tǒng)計(jì)分析方法中描述性分析應(yīng)用較多,適用范圍廣,其他統(tǒng)計(jì)分析方法應(yīng)用較少;第三,計(jì)算機(jī)輔助信息分析方法在檔案領(lǐng)域均有所應(yīng)用,其應(yīng)用范圍由傳統(tǒng)環(huán)境向網(wǎng)絡(luò)環(huán)境擴(kuò)展,分析對(duì)象由檔案管理信息轉(zhuǎn)向檔案內(nèi)容信息;第四,新興信息方法得到了檔案領(lǐng)域的關(guān)注,探索新興信息分析方法在檔案領(lǐng)域的應(yīng)用成為趨勢(shì);第五,計(jì)算機(jī)輔助信息分析方法應(yīng)用集中于對(duì)檔案工作進(jìn)行分析,尤其是檔案管理工作的開發(fā)利用環(huán)節(jié);第六,國外注重應(yīng)用研究,方法應(yīng)用系統(tǒng)完善;國內(nèi)注重理論研究,方法應(yīng)用較為零散。總之,我國檔案領(lǐng)域在信息分析方法的應(yīng)用方面已積累了一定的研究與實(shí)踐,但處于探索階段,需要系統(tǒng)地引進(jìn)領(lǐng)域信息分析的理論與經(jīng)驗(yàn),進(jìn)而推動(dòng)檔案學(xué)科向信息資源管理階段發(fā)展。

注釋及參考文獻(xiàn):

[1]馮惠玲.從文獻(xiàn)管理到基于信息資源的管理——圖書情報(bào)與檔案管理學(xué)科的創(chuàng)新發(fā)展之路[J].情報(bào)資料工作,2013,(03):6-10.

[2]查先進(jìn).信息分析[M].武漢:武漢大學(xué)出版社, 2011.

[3]盧小賓.信息分析概論[M].北京:電子工業(yè)出版社,2014.

[4]DLM Forum Foundation.MoReq2010 Specification[R/ OL].[2014-2-1].http://www.dlmforum.eu/index.php?option= com_jotloader&view=categories&cid=e078fd469dd9933&Itemid= 129?=en.

[5]Department of Defense Chief Information Officer. DoD5015.02-STD Electronic Records Management Soft? ware Applications Design Criteria Standard[S],2007.

[6]The International Council on Archives. Principles and functional requirements for records in electronic office environments[R/OL].[2014-2-1]. http://www.wien2004. ica.org/en/2008/02/26/principles- and- functional- re? quirements- records- electronic- office- environmentscall-com.

[7]中華人民共和國國家標(biāo)準(zhǔn). GB/T 29194- 2012,電子文件管理系統(tǒng)通用功能要求[S], 2012.

[8]王寅同.居民健康檔案數(shù)據(jù)聚類分析的研究[D].長春工業(yè)大學(xué),2012.

[9]袁素娟,申志永,袁穎,郭丹云.基于時(shí)間序列分析的檔案危機(jī)管理探究[J].湖北檔案,2013(12):19-21.

[10]張仙茹.主成分分析法的電子檔案工作人員離職行為影響因素研究[J].技術(shù)與市場(chǎng),2011(4):147.

[11]吳振新,張智雄,孫志茹.基于數(shù)據(jù)挖掘的Web Archive資源應(yīng)用分析[J].現(xiàn)代圖書情報(bào)技術(shù),2009,(1): 28-33.

[12]Li W J, Hershkop S, Stolfo S J. Email archive anal? ysis through graphical visualization[C]//Proceedings of the 2004 ACM workshop on Visualization and data mining for computer security. ACM, 2004: 128-132.

[13]張倩.應(yīng)用Web數(shù)據(jù)挖掘技術(shù)捕獲網(wǎng)絡(luò)檔案信息資源的個(gè)性化服務(wù)研究[J].檔案與建設(shè),2008,(7):15-18.

[14]丁瑾.多媒體數(shù)據(jù)挖掘技術(shù)在數(shù)字檔案中的應(yīng)用[J].蘭臺(tái)世界,2006(22):11-12.

[15]Maristella Agosti,Costantino Thanos.Research and Advanced Technology for Digital Libraries,Rome, Italy, September,2002[C].Springer.

[16]張倩.高校檔案用戶行為大數(shù)據(jù)分析技術(shù)應(yīng)用研究[J].檔案與建設(shè),2014(8):16- 21.

[17]朝樂門.電子文件管理系統(tǒng)的測(cè)試方法研究[J].檔案學(xué)通訊,2014(6):57-60.

猜你喜歡
分析方法數(shù)據(jù)挖掘語義
基于EMD的MEMS陀螺儀隨機(jī)漂移分析方法
一種角接觸球軸承靜特性分析方法
語言與語義
中國設(shè)立PSSA的可行性及其分析方法
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
“上”與“下”語義的不對(duì)稱性及其認(rèn)知闡釋
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
認(rèn)知范疇模糊與語義模糊
核安全設(shè)備疲勞分析方法與步驟
基于GPGPU的離散數(shù)據(jù)挖掘研究