国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

語義本體應(yīng)用于檔案領(lǐng)域的SWOT分析

2020-08-06 08:29宋志萍
蘭臺世界 2020年7期
關(guān)鍵詞:swot分析法檔案管理

宋志萍

摘 要語義本體是近幾年來越來越被研究者所關(guān)注的信息技術(shù)之一。文章從語義本體的產(chǎn)生及內(nèi)涵出發(fā),采用SWOT的分析方法,對于將語義本體運用到檔案領(lǐng)域中的優(yōu)勢、劣勢、機遇以及威脅進行了深入的分析,并且在此基礎(chǔ)上提出了一系列應(yīng)用的對策,從而推動語義本體技術(shù)在檔案領(lǐng)域的應(yīng)用。

關(guān)鍵詞語義本體 檔案領(lǐng)域 檔案管理 SWOT分析法

Abstract Semantic ontology is one of the information technologies concerned by more and more researchers in recent years. Starting from the generation and connotation of semantic ontology, this paper adopts SWOT analysis method to conduct an in-depth analysis of the advantages, disadvantages, opportunities and threats of applying semantic ontology to the archival field, and on this basis puts forward a series of application countermeasures, so as to promote the application of semantic ontology technology in the archival field.

Keyword semantic ontology; archival field; archives management; SWOT analysis method

近幾年來,隨著信息技術(shù)的不斷發(fā)展,對于語義本體的研究逐漸被研究者所關(guān)注?,F(xiàn)如今,語義本體已經(jīng)在很多領(lǐng)域有所應(yīng)用,例如醫(yī)學(xué)領(lǐng)域、人工智能領(lǐng)域等,并且這些應(yīng)用都取得了較好的效果,促進了相關(guān)領(lǐng)域的進一步發(fā)展?;诖?,筆者思考將語義本體應(yīng)用到檔案領(lǐng)域中來,以期促進檔案領(lǐng)域的發(fā)展。

一、語義本體的產(chǎn)生及內(nèi)涵

“本體”(Ontology)一詞最早產(chǎn)生于古希臘的哲學(xué)領(lǐng)域,指的是“對客觀存在的系統(tǒng)化解釋或說明”[1],即對客觀世界中的真實存在所做出的描述。從20世紀(jì)70年代起,本體不再僅僅局限于哲學(xué)范疇,而是逐漸被應(yīng)用到信息科學(xué)、人工智能等領(lǐng)域當(dāng)中,為了與之前提到的哲學(xué)領(lǐng)域的本體概念相區(qū)分開來,信息科學(xué)領(lǐng)域的本體被稱為“語義本體”。1993年,國外學(xué)者Gruber最早提出了信息科學(xué)領(lǐng)域中的本體的含義,他認為“本體是概念模型的明確的規(guī)范說明”[2],隨后本體的概念又經(jīng)過了一系列的發(fā)展,目前學(xué)術(shù)界普遍認可的概念是由國外學(xué)者Studer給出的,即“本體是共享概念模型的明確的形式化規(guī)范說明”[3]。

從Studer給出的本體定義來看,其體現(xiàn)出來的內(nèi)涵主要包括以下幾點:第一,共享性,即本體中體現(xiàn)出來的知識為人們所公認,是本領(lǐng)域中共同認可的一系列術(shù)語集合;第二,概念化,它是指本體對于客觀事物的描述以一組概念的形式進行展現(xiàn);第三,明確性,這一內(nèi)涵要求本體中所有術(shù)語、屬性、公理等都需要有明確的定義;第四,形式化,即本體是可以被計算機“理解”并進一步處理的。

二、運用SWOT分析檔案領(lǐng)域應(yīng)用語義本體的可行性

SWOT分析法是20世紀(jì)80年代由美國學(xué)者韋里克(H.Weihrich)提出來的,也叫做TOWS分析法。具體說,SWOT分別是指優(yōu)勢、劣勢、機遇以及威脅。檔案領(lǐng)域在應(yīng)用語義本體的過程之中,毫無疑問也會受到一系列內(nèi)部條件和外部環(huán)境等因素的綜合影響,這說明語義本體應(yīng)用于檔案領(lǐng)域的可行性要素與SWOT呈現(xiàn)出一致性。另外,此前已經(jīng)有學(xué)者將SWOT分析法應(yīng)用于檔案領(lǐng)域。例如,王秋潔、孫軍的《綜合性檔案館應(yīng)用人工智能創(chuàng)新管理的SWOT分析》、黃文君的《“互聯(lián)網(wǎng)+”時代下檔案管理工作的SWOT分析》以及孫大東、袁麗娜的《基于SWOT分析法的電子檔案“單套制”管理研究》等,由此可見,運用SWOT來分析語義本體在檔案領(lǐng)域的應(yīng)用是完全可行的。基于此,筆者對于在檔案領(lǐng)域應(yīng)用語義本體的SWOT分析如下,優(yōu)勢包括本體的功能強大,主要體現(xiàn)為其知識表示和知識發(fā)現(xiàn)功能,另外已有的先進案例也可供參考、借鑒;劣勢包括在我國某些檔案是保密檔案,這些檔案視不同的情況而規(guī)定相應(yīng)的密級,在短時間內(nèi)或永久都不會公開以及檔案工作人員對其不夠重視;在機會方面,國家出臺了一系列的政策予以保障,如《中華人民共和國檔案法》《機關(guān)檔案工作條例》等其中都有相應(yīng)的條例,并且社會大眾也表現(xiàn)出了相應(yīng)的需求;威脅主要包括本體構(gòu)建起來難度較大以及本體構(gòu)建時缺乏一系列標(biāo)準(zhǔn)和規(guī)范。

三、檔案領(lǐng)域應(yīng)用語義本體的SWOT分析

將語義本體應(yīng)用到檔案領(lǐng)域中來必定會受到一系列內(nèi)部條件、外部環(huán)境等因素的綜合影響,筆者基于SWOT分析法對這一系列影響因素進行了分析。

1.優(yōu)勢分析(Strengths)。

(1)本體具有知識表示與知識發(fā)現(xiàn)功能。本體是對領(lǐng)域知識的規(guī)范化和抽象化描述,其功能首先表現(xiàn)為它是知識表示和知識組織、知識管理的一種新型方式,它可以將某一領(lǐng)域中概念間的關(guān)系進行清晰的描述,實現(xiàn)對該領(lǐng)域知識的整合。將本體應(yīng)用到檔案領(lǐng)域之中,能夠?qū)n案領(lǐng)域的知識進行整合和共享,解決檔案“資源孤島”以及語義異構(gòu)等問題,因此它的出現(xiàn)有助于實現(xiàn)有效管理檔案信息資源這一目標(biāo),提升檔案管理工作的效率,為檔案工作帶來質(zhì)的飛躍。其次,在傳統(tǒng)條件下,信息檢索的方式主要是基于關(guān)鍵詞,這種檢索方式往往會檢索到一些信息查詢者不需要的信息,造成信息冗余,無法保證信息的查全率以及查準(zhǔn)率。相比之下,當(dāng)用戶查詢信息時,語義本體在知識表示和組織的基礎(chǔ)之上,能夠經(jīng)過邏輯推理和語義關(guān)聯(lián)發(fā)現(xiàn)新的知識,經(jīng)過語義處理從而滿足用戶在語義上的需求,從紛繁復(fù)雜的數(shù)據(jù)中提煉出有價值的信息,準(zhǔn)確檢索,高效、精準(zhǔn)地返回給用戶所需要的信息,提升用戶體驗,實現(xiàn)用戶對信息的有效訪問。

(2)已有應(yīng)用案例的借鑒。語義本體在國內(nèi)和國外的一些領(lǐng)域中已經(jīng)得到了較好的運用。在國內(nèi),武漢大學(xué)的董慧教授等人將本體引入數(shù)字圖書館中,構(gòu)建了本體數(shù)字圖書館檢索模型,并在此基礎(chǔ)上實現(xiàn)了本體推理、檢索以及可視化等功能;在國外,Luan Fonseca等人在BFO頂級本體上提出一個名為GeoCore的核心本體,該本體專門用于描述科學(xué)領(lǐng)域,對地質(zhì)學(xué)家所使用的概念和詞匯進行徹底的闡明,為通過包含更專業(yè)的地質(zhì)概念推導(dǎo)提供了基礎(chǔ),并且還為在地質(zhì)領(lǐng)域內(nèi)整合不同的現(xiàn)有領(lǐng)域本體提供了基礎(chǔ);2011年,IBM公司的Waston在參加綜藝節(jié)目危險邊緣(Jeopardy)的智力問答中首次擊敗了人類;2019年年底,劍橋聯(lián)合會舉辦了一場題為“AI是否會帶來更大的弊端”的辯論賽,其中就有IBM辯論機器人的參與,并且最終獲得了勝利。IBM的這兩個案例中,在分析問題并確定最佳解答的過程中就運用到了語義本體等技術(shù)。除此之外,語義本體技術(shù)還在其他領(lǐng)域有廣泛的應(yīng)用,諸如醫(yī)學(xué)領(lǐng)域、農(nóng)業(yè)領(lǐng)域等,這些已經(jīng)存在的本體的應(yīng)用案例可以為我國將語義本體技術(shù)應(yīng)用于檔案領(lǐng)域提供借鑒和參考。

2.劣勢分析(Weaknesses)。

(1)檔案的非公開性。檔案具有許多自身的特性,其中一條就是某些檔案需要保密,由于這些檔案涉及黨和國家的安危或者機關(guān)單位的利益等其他方面的因素,因此就需要明確檔案的密級。在我國,檔案密級的確定要視具體情況而定,有些檔案的密級為“絕密”,有些檔案密級為“機密”,除此之外還包括“秘密”和“內(nèi)部”,這在一定程度上造成了檔案資源的不開放性。然而,在將語義本體應(yīng)用到檔案領(lǐng)域之中時,無法完全保證涉密檔案信息的安全性,在管理的過程之中可能會對涉密檔案中的信息造成泄露,這就造成了二者之間的矛盾,非公開的檔案資源必然會在一定程度上對語義本體的應(yīng)用造成影響。

(2)檔案工作人員重視程度低。目前,我國的絕大多數(shù)檔案工作人員都將職能重心放在檔案實體管理上,而對于將新興的信息技術(shù)引入檔案領(lǐng)域并沒有足夠的重視,造成這一現(xiàn)象的原因首先是由于到目前為止,我國的檔案管理事業(yè)還沒有納入數(shù)據(jù)科學(xué)的范疇之中,因此具備信息技術(shù)知識如語義本體技術(shù)的人才比較缺乏,需要參加相應(yīng)的技術(shù)培訓(xùn),這使得將語義本體技術(shù)應(yīng)用到檔案領(lǐng)域的構(gòu)想難以成為現(xiàn)實;另一方面,正是由于語義本體技術(shù)在檔案領(lǐng)域并沒有得到廣泛的應(yīng)用,所以造成了傳統(tǒng)的檔案工作人員對于新興技術(shù)的了解不足,如此一來就形成了惡性循環(huán),所以我國檔案人員對于信息技術(shù)的了解有待加強,只有這樣才能提高自身素質(zhì),早日將先進的數(shù)據(jù)科學(xué)技術(shù)運用到檔案領(lǐng)域,實現(xiàn)檔案領(lǐng)域的現(xiàn)代化。

3.機會分析(Opportunities)。

(1)相關(guān)政策支持。在我國有關(guān)檔案的法律法規(guī)中,有很多規(guī)定都對于將語義本體技術(shù)應(yīng)用到檔案領(lǐng)域提供了相應(yīng)的政策支持。其中,《中華人民共和國檔案法》中第十三條規(guī)定:“各級各類檔案館,機關(guān)、團體、企業(yè)事業(yè)單位和其他組織的檔案機構(gòu),應(yīng)當(dāng)建立科學(xué)的管理制度,便于對檔案的利用;配置必要的設(shè)施,確保檔案的安全;采用先進技術(shù),實現(xiàn)檔案管理的現(xiàn)代化。”[4]《機關(guān)檔案工作條例》中第二十三條規(guī)定:“機關(guān)應(yīng)根據(jù)需要和可能,采用先進技術(shù)設(shè)備,逐步實現(xiàn)檔案管理的科學(xué)化、現(xiàn)代化?!盵5]國家檔案局發(fā)布的第13號令《機關(guān)檔案管理規(guī)定》中第五十八條規(guī)定:“機關(guān)應(yīng)當(dāng)積極實施紙質(zhì)檔案數(shù)字復(fù)制件的全文識別,將現(xiàn)有圖像數(shù)據(jù)轉(zhuǎn)化為文本信息,便于檢索和開發(fā)利用?!盵6]此外,2016年國家檔案局印發(fā)的《全國檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》強調(diào)要“加快檔案管理信息化進程”[7]。除上述提及的條例規(guī)定之外,還有很多類似的規(guī)定,其最終目的都是要加強檔案領(lǐng)域的信息化、現(xiàn)代化等,語義本體可以促進檔案領(lǐng)域向信息化、智能化發(fā)展,為檔案領(lǐng)域的發(fā)展提供了契機,具有積極影響。

(2)社會需求迫切。處在今天這樣一個大數(shù)據(jù)時代,數(shù)據(jù)量日益激增,檔案存儲的形式也日益復(fù)雜,各種各樣的結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)諸如文檔、圖片、視頻、音頻以及網(wǎng)頁等都有可能成為檔案保存和管理的對象。然而,不容忽視的一點在于信息爆炸的同時也會帶來一些負面影響,其中重要的一條就是信息匱乏,但個人的接受能力是有限的,如果只關(guān)注個人所獲取信息的數(shù)量而不對質(zhì)量做要求,那么所獲取的這些信息無疑是無效信息。與此同時,社會大眾也對檔案利用和檔案服務(wù)提出了越來越多樣化和個性化的要求,滿足社會大眾需求的關(guān)鍵就在于如何及時有效地從大量的檔案數(shù)據(jù)中找到檔案利用者所需要的信息,而語義本體技術(shù)的先進性在于能夠從海量數(shù)據(jù)中發(fā)現(xiàn)真正有價值的、對用戶有用的信息,用戶無需耗費過多的時間和精力便能得到自己想要的信息,因此語義本體的出現(xiàn)為滿足用戶的個性化需求、提升用戶體驗提供了可能性。

4.威脅分析(Threats)。

(1)本體構(gòu)建難度較大。如前所述,本體是用來描述某個領(lǐng)域的概念模型,“某個領(lǐng)域的本體就是關(guān)于該領(lǐng)域的公認的概念集,該概念集包含確定的語義和概念之間的關(guān)聯(lián)”[8],由于目前的本體開發(fā)基本都是采用人工方式進行的,所以在一個特定的領(lǐng)域之中,找出為領(lǐng)域所公認的術(shù)語概念,明確這些術(shù)語概念的層次關(guān)系以及確定其語義和關(guān)聯(lián)等方面的工作就需要該領(lǐng)域內(nèi)專家的參與和配合,但同時“專家建模往往帶有偏見、具有誤差傾向,使得基于領(lǐng)域文檔實現(xiàn)本體構(gòu)建特別是大型本體構(gòu)建成為一項非常艱巨的任務(wù)”[9]。

在本體構(gòu)建方法的選擇上,雖然本體構(gòu)建的方法多種多樣,但是無論使用哪一種方法構(gòu)建領(lǐng)域本體都需要經(jīng)過反復(fù)迭代,不斷排錯和修改,最終還要進行本體的檢驗和評價,確保本體推理能夠得出新的、正確的知識,是一項費時費力的工作。除此之外,在建立領(lǐng)域本體的過程之中,需要針對所構(gòu)建領(lǐng)域本體的需求和目標(biāo)的不同而對本體開發(fā)工具進行選擇,例如Ontolingua、OntoSaurus、WebOnto以及Protege等,這些工具的功能各不相同。由此可見,領(lǐng)域本體模型的構(gòu)建并非是一蹴而就的,它需要經(jīng)歷一個漫長的過程,相對來講構(gòu)建的難度也比較大。

(2)缺乏統(tǒng)一的標(biāo)準(zhǔn)。在本體的構(gòu)建上,許多方面并沒有形成統(tǒng)一的標(biāo)準(zhǔn),諸如本體構(gòu)建的原則、本體構(gòu)建的方法等,雖眾說紛紜,但并未形成統(tǒng)一標(biāo)準(zhǔn)。此外,在進行某一領(lǐng)域本體構(gòu)建的流程中,一個必不可少的步驟是要有該領(lǐng)域的語義詞匯表,利用語義詞匯表可以將該領(lǐng)域中概念的內(nèi)部邏輯關(guān)系進行清晰地描述,在此基礎(chǔ)上將領(lǐng)域概念進行語義化,這是領(lǐng)域本體構(gòu)建的基礎(chǔ)。例如,要構(gòu)建人物相關(guān)的本體,可以使用FOAF詞匯表、Vcard詞匯表以及Realationship詞匯表,以上的這些語義詞匯表目前都屬于通用詞表,換句話說在該領(lǐng)域已經(jīng)形成了統(tǒng)一的規(guī)范標(biāo)準(zhǔn)。但在檔案領(lǐng)域,并沒有一個通用的語義詞匯表,需要本體構(gòu)建者自行創(chuàng)建,不同的人創(chuàng)建的語義詞匯表又不盡相同,甚至大相徑庭,導(dǎo)致無法形成統(tǒng)一的標(biāo)準(zhǔn),因此“這也使得Ontology只是作為某一個單獨的團體或組織內(nèi)的共享,真正意義上的共享和重利用仍然沒有實現(xiàn)”[10]。

四、在檔案領(lǐng)域應(yīng)用語義本體的對策

由前文分析可以看出,在檔案領(lǐng)域應(yīng)用語義本體能夠為檔案工作帶來知識性的變革,促進檔案事業(yè)的發(fā)展。因此筆者提出以下幾點對策,推動語義本體在檔案領(lǐng)域的應(yīng)用。

1.進一步完善語義本體技術(shù)。由于本體構(gòu)建具有很強的專業(yè)性和復(fù)雜性,目前只是在少數(shù)領(lǐng)域進行了嘗試性的使用,因此在理論與實際的應(yīng)用方面還需要加強研究。在理論方面,“Ontology的評價方法以及形式化方法還需要進一步研究與探討”[11];在實際的應(yīng)用方面,“Ontology很多都是由人工開發(fā)的,這樣需要耗費很多的人力、物力和財力,時間周期也很長,這在一定程度上影響了Ontology的應(yīng)用”[12],另外,本體的集成方法在目前看起來也不是十分成熟。上述的這些問題都對語義本體技術(shù)在檔案領(lǐng)域的應(yīng)用帶來了不利影響,因此需要對所存在的問題進行針對性的解決,進一步完善語義本體技術(shù),使之向高性能、高適應(yīng)性的方向發(fā)展,使之漸趨完善,日益成熟。

2.加強對語義本體技術(shù)的支持。在檔案領(lǐng)域進行語義本體的構(gòu)建并非是一朝一夕能夠完成的,因此仍然需要加強對語義本體技術(shù)的支持,包括政策支持和資金支持。國家應(yīng)該鼓勵我國的權(quán)威檔案部門與開展語義本體技術(shù)研究的國內(nèi)外科技信息公司進行合作,并積極參與其語義本體項目,通過實踐獲取將語義本體應(yīng)用到檔案領(lǐng)域的著手點,同時通過政策也能鼓勵更多的檔案工作人員加強對信息技術(shù)的學(xué)習(xí)和了解,為語義本體應(yīng)用到檔案領(lǐng)域提供足夠的人才儲備。在這個過程中,還需要資金支持,資金一方面是運用到與科技公司進行項目合作時的經(jīng)費支持;另一方面是各級檔案機構(gòu)對檔案人員的技術(shù)培訓(xùn)資金,由此推動語義本體技術(shù)在檔案領(lǐng)域中的應(yīng)用。

3.培養(yǎng)具備語義本體技術(shù)的檔案人員。檔案工作人員需要掙脫傳統(tǒng)觀念的桎梏,不能簡單地認為檔案管理只是實體的管理,更需要從現(xiàn)代信息技術(shù)的角度著眼,將先進的信息技術(shù)應(yīng)用到檔案領(lǐng)域中,由此來提升檔案工作的質(zhì)量,而且今天的圖書館學(xué)、情報學(xué)和檔案學(xué)學(xué)科領(lǐng)域已經(jīng)與信息管理和數(shù)據(jù)科學(xué)領(lǐng)域深度融合,為學(xué)科理論以及實踐都帶來了革命性的變化?!霸缭?001年馮惠玲教授就在中國首屆檔案學(xué)博士論壇上提出,在夾縫時代,檔案人員應(yīng)該將職能重心從實體管理轉(zhuǎn)向信息管理、知識管理?!盵13]語義本體作為知識管理、知識組織的有力工具,必將為檔案工作帶來極大的裨益。所以,就目前形式來看,對于我國各級檔案機構(gòu)來說,優(yōu)化館員結(jié)構(gòu)勢在必行,還需要對檔案人員進行技術(shù)培訓(xùn),優(yōu)化館員的技術(shù)素養(yǎng),使檔案人員向信息化人才發(fā)展。

五、結(jié)語

語義本體作為一種新型的知識管理方式,能夠有效解決知識共享以及利用問題,將其應(yīng)用于檔案領(lǐng)域能夠促進檔案事業(yè)的發(fā)展,實現(xiàn)檔案信息資源智能化的管理、共享和利用,使得計算機對檔案信息的理解上升到語義層次。因此,應(yīng)該最大限度發(fā)揮語義本體的優(yōu)勢,抓住機會,將劣勢和威脅降到最低,推動語義本體在檔案領(lǐng)域的應(yīng)用,提升我國檔案工作的質(zhì)量和效率,實現(xiàn)對檔案領(lǐng)域的知識進行高效的組織和管理,為檔案事業(yè)帶來知識管理層面上的巨大變革。

猜你喜歡
swot分析法檔案管理
關(guān)于企業(yè)檔案管理體制改革的探討
新形勢下檔案管理工作創(chuàng)新探析
新農(nóng)村建設(shè)形勢下衛(wèi)生院檔案管理工作探討
事業(yè)單位檔案管理創(chuàng)新與改革
提高檔案管理科學(xué)化水平的對策
檔案管理現(xiàn)代化中檔案管理原理的運用分析
基于SWOT分析法分析大學(xué)校園二手交易市場
新常態(tài)下對內(nèi)蒙古地區(qū)非公有制企業(yè)的影響分析
壽險公司產(chǎn)品營銷策略優(yōu)化研究
新形勢下宜賓港物流金融的發(fā)展策略研究
沭阳县| 宾川县| 南汇区| 景德镇市| 陕西省| 望奎县| 石渠县| 和林格尔县| 沙湾县| 乌拉特前旗| 广河县| 陈巴尔虎旗| 余干县| 云浮市| 双流县| 鹤山市| 方城县| 湘潭县| 渝中区| 招远市| 望都县| 开远市| 安吉县| 定西市| 阳朔县| 梁山县| 且末县| 宜春市| 星座| 陆川县| 商河县| 罗江县| 专栏| 广丰县| 丹江口市| 伊吾县| 岱山县| 汤阴县| 龙游县| 石楼县| 武山县|