楊佳星
摘 要:關(guān)聯(lián)數(shù)據(jù)是信息時(shí)代下信息技術(shù)以及數(shù)據(jù)處理技術(shù)解決組織、共享、管理與服務(wù)信息的最新延伸技術(shù)。企業(yè)檔案管理是企業(yè)管理中難度較高的一項(xiàng)管理工作,企業(yè)檔案信息整合是指根據(jù)企業(yè)檔案信息的特點(diǎn),圍繞特定主題或?qū)ο?,將分散、異?gòu)、無(wú)序的檔案信息進(jìn)行組織整理的活動(dòng)過(guò)程。通過(guò)企業(yè)檔案信息整合可以集中反映某一主題或?qū)ο蟮木唧w情況、發(fā)展趨勢(shì)等內(nèi)容,從而更好的為企業(yè)服務(wù)。文章通過(guò)SWOT分析法,分析了關(guān)聯(lián)數(shù)據(jù)技術(shù)在企業(yè)數(shù)字化檔案資源轉(zhuǎn)向數(shù)據(jù)化檔案資源整合應(yīng)用中的優(yōu)勢(shì)劣勢(shì)以及相應(yīng)的對(duì)策。
關(guān)鍵詞:關(guān)聯(lián)數(shù)據(jù)應(yīng)用;企業(yè)檔案信息;SWOT分析
1 企業(yè)檔案信息資源整合與關(guān)聯(lián)數(shù)據(jù)
1.1 企業(yè)檔案信息資源整合內(nèi)涵
企業(yè)檔案作為企業(yè)原始的真實(shí)的活動(dòng)記錄,其內(nèi)容有著不可替代的價(jià)值。但檔案信息的價(jià)值是需要通過(guò)有序的收集、整理、加工才能得到體現(xiàn)的。傳統(tǒng)企業(yè)檔案管理模式通常是按照國(guó)家規(guī)定綱目進(jìn)行分類設(shè)定的,但傳統(tǒng)模式管理下的檔案,信息分散且個(gè)別有異構(gòu)的特點(diǎn),使利用受限。
企業(yè)檔案信息整合服務(wù)指根據(jù)企業(yè)檔案信息的特點(diǎn),圍繞特定主題或?qū)ο螅瑢⒎稚?、異?gòu)、無(wú)序的檔案信息進(jìn)行組織整理的工作。例如:在行政管理類檔案中開展整合專業(yè)技術(shù)職稱信息、公司人事任免信息、企業(yè)科技檔案項(xiàng)目成果等信息,為企業(yè)在職工職稱評(píng)定、職務(wù)晉升等工作中,方便快速地檢索出所需的檔案信息,能極大地簡(jiǎn)化辦事流程,提高工作效率;又如:通過(guò)對(duì)同一主題科技檔案信息的整合收集,從而為以后同一類型的項(xiàng)目提供參考依據(jù)或?yàn)槟骋活I(lǐng)域的研究與技術(shù)突破提供有效的數(shù)據(jù)支持。
可以說(shuō)企業(yè)檔案信息整合是一項(xiàng)可以幫助企業(yè)提高檔案利用效率、提升企業(yè)檔案增值服務(wù)、有利于檔案信息資源共享、影響企業(yè)科學(xué)決策、增強(qiáng)企業(yè)競(jìng)爭(zhēng)力的工作。
1.2 關(guān)聯(lián)數(shù)據(jù)定義、本質(zhì)及應(yīng)用
1.2.1 關(guān)聯(lián)數(shù)據(jù)定義
“關(guān)聯(lián)數(shù)據(jù)”是一種用來(lái)組織、發(fā)布和鏈接各類數(shù)據(jù)、信息和知識(shí)的方法,運(yùn)用網(wǎng)絡(luò)技術(shù)、信息技術(shù)等全新數(shù)據(jù)處理技術(shù)對(duì)現(xiàn)有各類的資源進(jìn)行整合,使其在同一網(wǎng)絡(luò)基礎(chǔ)上構(gòu)建一張計(jì)算機(jī)可以理解的語(yǔ)義數(shù)據(jù)網(wǎng)絡(luò),使任何人都能夠準(zhǔn)確、高效、可靠地查找、利用這些相互關(guān)聯(lián)的信息與知識(shí)。
關(guān)聯(lián)數(shù)據(jù)繼承了Web技術(shù)中的超文本傳輸協(xié)議(HTTP)和統(tǒng)一資源定位符(URI),采用數(shù)據(jù)資源描述框架(RDF)來(lái)描述各類“資源”對(duì)象。RDF用統(tǒng)一資源標(biāo)識(shí)符(URI)標(biāo)識(shí)事物,用簡(jiǎn)單的屬性及屬性值來(lái)描述資源并組合成為一個(gè)陳述(被稱為陳述的主體、謂詞和客體),即RDF三元組(RDF triples),可被用于表達(dá)任何可在Web上被標(biāo)識(shí)的事物的信息。此外,關(guān)聯(lián)數(shù)據(jù)采用SPARQL(Simple Pro-tocol and RDF Query Language)技術(shù)作為檢索查詢語(yǔ)言和數(shù)據(jù)獲取協(xié)議,它可以檢索任何用 RDF來(lái)表示的信息資源。
1.2.2 關(guān)聯(lián)數(shù)據(jù)本質(zhì)與應(yīng)用
關(guān)聯(lián)數(shù)據(jù)的本質(zhì)是通過(guò)定義“統(tǒng)一資源標(biāo)識(shí)符(URI)”規(guī)范,使用戶利用 HTTP 機(jī)制和 URI 機(jī)制獲取關(guān)聯(lián)化的數(shù)字信息資源,并打破封閉環(huán)境、減少數(shù)據(jù)冗余、形成關(guān)聯(lián)訪問(wèn),使信息資源關(guān)聯(lián)整合。關(guān)聯(lián)數(shù)據(jù)技術(shù)可以對(duì)不同類型的信息資源(如文件、圖片、音頻、視頻等)賦予相同標(biāo)準(zhǔn)規(guī)范的URI定位,這保證了數(shù)據(jù)資源的一致性,從而有機(jī)會(huì)打破數(shù)據(jù)壁壘與信息孤島;同時(shí)通過(guò)對(duì)不同類型信息資源的URI定位,還可以挖掘不同類型資源之間的隱性關(guān)系,實(shí)現(xiàn)同一主題或?qū)ο筚Y源的融合,形成信息關(guān)聯(lián),方便檢索利用;
我國(guó)對(duì)關(guān)聯(lián)數(shù)據(jù)在檔案管理中的應(yīng)用研究起步較晚,歐洲數(shù)據(jù)圖書館早在2008就通過(guò)OWL語(yǔ)言,對(duì)第一次世界大戰(zhàn)的相關(guān)檔案資料進(jìn)行了重新編譯以及資源整合,法國(guó)國(guó)家檔案管早在2011年就發(fā)布了敘詞表,并提供PDF格式的查詢服務(wù)。
2 關(guān)聯(lián)數(shù)據(jù)應(yīng)用于企業(yè)檔案信息資源整合中的SWOT分析
2.1 優(yōu)勢(shì)分析
1)關(guān)聯(lián)數(shù)據(jù)的優(yōu)勢(shì)。關(guān)聯(lián)數(shù)據(jù)的優(yōu)勢(shì)在于其數(shù)據(jù)信息的開放性與關(guān)聯(lián)性,隨著公開數(shù)據(jù)規(guī)模不斷擴(kuò)大,最終形成數(shù)據(jù)間的交互網(wǎng)絡(luò)??梢杂行Т蚱苽鹘y(tǒng)檔案管理中,不同分類檔案、異構(gòu)檔案之間的界限。對(duì)檔案資源整合有良好的促進(jìn)作用。
另外通過(guò)HTTP協(xié)議、URI定位可以對(duì)資源進(jìn)行更為準(zhǔn)確的定位,在傳統(tǒng)檔案管理模式下,同一主題檔案信息資源整合過(guò)程中,可能會(huì)涉及多種門類檔案,而在查詢中需要分別檢索所涉及門類檔案的信息,以獲取想要的信息資源。而基于關(guān)聯(lián)數(shù)據(jù)的檔案信息整合技術(shù),可以將查詢分解為只涉及單個(gè)檔案門類的查詢模式,現(xiàn)在階段在檔案資源整合工作主要分為收集、整理、分類、整合、利用五個(gè)主要環(huán)節(jié),在關(guān)聯(lián)數(shù)據(jù)的支持下,可以提高數(shù)據(jù)分析以及挖掘,實(shí)現(xiàn)數(shù)據(jù)的全程控制,充分滿足檔案資源整合的各項(xiàng)數(shù)據(jù)處理技術(shù)需求。
2)企業(yè)檔案自身的優(yōu)勢(shì)。企業(yè)檔案信息資源多為結(jié)構(gòu)化或半結(jié)構(gòu)化的信息資源,著錄格式與存儲(chǔ)格式也依照國(guó)家、公司有關(guān)規(guī)定執(zhí)行。因此據(jù)有格式的規(guī)范性,這有利于關(guān)聯(lián)數(shù)據(jù)的統(tǒng)一轉(zhuǎn)換與整合;此外企業(yè)檔案作為企業(yè)的原始真實(shí)的活動(dòng)記錄,還具有憑證價(jià)值與情報(bào)價(jià)值;具有價(jià)值且規(guī)范性的企業(yè)檔案資源非常適合作為數(shù)據(jù)關(guān)聯(lián)中轉(zhuǎn)站,用于信息交換和語(yǔ)義互操作。
2.2 劣勢(shì)分析
1)檔案資源開放權(quán)限與閱讀權(quán)限。關(guān)聯(lián)數(shù)據(jù)在企業(yè)檔案信息資源整合中應(yīng)用的最大阻力是關(guān)聯(lián)數(shù)據(jù)主要針對(duì)公開性的開放數(shù)據(jù),而企業(yè)檔案資源數(shù)據(jù)中有許多數(shù)據(jù)是封閉性的非公開數(shù)據(jù),部分檔案資料屬于企業(yè)機(jī)密有著嚴(yán)格的獲取以及閱讀權(quán)限要求,導(dǎo)致存在矛盾,這也是關(guān)聯(lián)數(shù)據(jù)在企業(yè)檔案信息資源整合中的劣勢(shì)所在。封閉性的企業(yè)檔案資源沒(méi)有辦法利用關(guān)聯(lián)數(shù)據(jù)技術(shù)實(shí)現(xiàn)對(duì)應(yīng)的檔案資源整合。
2)企業(yè)檔案標(biāo)準(zhǔn)化程度低。由于企業(yè)檔案資源在不同的歷史時(shí)期所依據(jù)的著錄標(biāo)準(zhǔn)不同以及在企業(yè)不同歷史時(shí)期企業(yè)檔案信息的產(chǎn)生環(huán)節(jié)和產(chǎn)生渠道不同,導(dǎo)致檔案信息標(biāo)準(zhǔn)化程度低,標(biāo)準(zhǔn)化較低直接影響了檔案信息組織的質(zhì)量,導(dǎo)致資源之間的關(guān)聯(lián)和語(yǔ)義操作的實(shí)在出現(xiàn)障礙。
2.3 機(jī)遇分析
1)企業(yè)自身發(fā)展的需要。企業(yè)檔案信息資源整合有利于挖掘檔案信息資源,提高檔案利用效率;有利于檔案信息集成,實(shí)現(xiàn)檔案增值服務(wù);有利于檔案信息共享,增強(qiáng)企業(yè)競(jìng)爭(zhēng)力。而關(guān)聯(lián)數(shù)據(jù)技術(shù)是實(shí)現(xiàn)企業(yè)檔案信息資源整合的一條可行之路。
2)存在可借鑒的實(shí)踐成果。目前國(guó)外已經(jīng)已經(jīng)開展了關(guān)聯(lián)數(shù)據(jù)應(yīng)用于檔案工作中的相關(guān)研究,如:Linking Lives是英國(guó)聯(lián)合信息系統(tǒng)委員會(huì)(JISC)資助的項(xiàng)目,用于將Archives Hub中的檔案資源關(guān)聯(lián)數(shù)據(jù)化。
國(guó)內(nèi)也開展了一系列的研究工作,如黃欣在《關(guān)聯(lián)數(shù)據(jù)在照片檔案管理中的應(yīng)用研究》中,具體闡述了關(guān)聯(lián)數(shù)據(jù)應(yīng)用的必要性、原則、RDF鏈接制作方法、基礎(chǔ)數(shù)據(jù)構(gòu)建、元數(shù)據(jù)核心集基礎(chǔ)數(shù)據(jù)庫(kù)建設(shè)、數(shù)據(jù)庫(kù)關(guān)聯(lián)等一系列的研究成果;
2.4 挑戰(zhàn)分析
關(guān)聯(lián)數(shù)據(jù)技術(shù)在企業(yè)檔案信息資源整合中遇到的主要威脅來(lái)自于:檔案數(shù)據(jù)的安全性難以保障。檔案信息數(shù)據(jù)安全是檔案信息管理的根本工作之一,而關(guān)聯(lián)數(shù)據(jù)的公開性是管理數(shù)據(jù)應(yīng)用于企業(yè)檔案資源整合中所必需面對(duì)的問(wèn)題。關(guān)聯(lián)數(shù)據(jù)一般通過(guò)PDF以及API等格式進(jìn)行開發(fā),此類API密鑰防盜性較弱,非常容易出現(xiàn)泄漏和入侵等現(xiàn)象,讓數(shù)據(jù)存在風(fēng)險(xiǎn),影響檔案資源的數(shù)據(jù)安全。
3 管理數(shù)據(jù)在企業(yè)檔案資源整合應(yīng)用中的策略
3.1 優(yōu)化檔案著錄標(biāo)準(zhǔn)
首先應(yīng)依據(jù)關(guān)聯(lián)數(shù)據(jù)特點(diǎn),重新優(yōu)化檔案著錄標(biāo)準(zhǔn),以實(shí)現(xiàn)著錄字段向關(guān)聯(lián)數(shù)據(jù)映射,以滿足檔案資源整合的需要;其次,對(duì)于現(xiàn)有檔案資源標(biāo)準(zhǔn)化程度低的情況,研究公司發(fā)展脈絡(luò),補(bǔ)充必要信息;
3.2 構(gòu)建統(tǒng)一利用平臺(tái)
通過(guò)構(gòu)建統(tǒng)一的檢索利用平臺(tái),可以在提供跨種類檔案信息檢索的基礎(chǔ)上,為用戶構(gòu)建參考咨詢或決策建議系統(tǒng)。再通過(guò)完善語(yǔ)義推理機(jī)制以及知識(shí)挖掘,向用戶提供個(gè)性化、可定制的檔案信息資源。以實(shí)現(xiàn)檔案信息精確推送從而影響科學(xué)決策、科研生產(chǎn),提升企業(yè)競(jìng)爭(zhēng)力。
3.3 鼓勵(lì)員工參與
應(yīng)鼓勵(lì)公司員工參與檔案信息整合利用中來(lái)。應(yīng)該在開放員工檢索利用的基礎(chǔ)上,允許普通用戶對(duì)檔案資源進(jìn)行簡(jiǎn)單的組織分類、添加標(biāo)簽,通過(guò)簡(jiǎn)單的組織分類可以研究不同用戶需求,從而改進(jìn)本體推理并優(yōu)化檔案信息推送準(zhǔn)確率。
參考文獻(xiàn)
[1]冷裕波.企業(yè)檔案信息整合服務(wù)研究[J].檔案學(xué)通訊,2011,06
[2]呂元智.數(shù)字檔案資源知識(shí)“關(guān)聯(lián)”組織研究[J].檔案學(xué)研究,2012.06
[3]馬寅源.關(guān)聯(lián)數(shù)據(jù)應(yīng)用于檔案知識(shí)服務(wù)的SWOT分析及策略[J].檔案與建設(shè),2017(02):17-20+12.
[4]宋香蕾,加小雙.多學(xué)科視角下的檔案學(xué)理論研究進(jìn)展(之二)——管理學(xué)視角[J].山西檔案,2017(01):11-17.
[5]徐鶴田.國(guó)家治理視野下的大數(shù)據(jù)審計(jì)工作模式研究——基于SWOT分析[J].中國(guó)內(nèi)部審計(jì),2017(01):77-82.
[6]周耀林,賈聰聰.“互聯(lián)網(wǎng)+”戰(zhàn)略下數(shù)字檔案信息服務(wù)發(fā)展策略研究——基于SWOT框架的分析選擇[J].檔案學(xué)通訊,2016(04):56-61.
[7]梁俊娜.廣西北部灣經(jīng)濟(jì)區(qū)農(nóng)民工遠(yuǎn)程教育培訓(xùn)模式的SWOT分析及對(duì)策研究[J].廣西廣播電視大學(xué)學(xué)報(bào),2014,25(03):23-28.