安 源,李雪山
(中國鐵道科學(xué)研究院 科學(xué)技術(shù)信息研究所,北京 100081)
機構(gòu)知識庫(IR),也稱機構(gòu)倉儲,是科研教育機構(gòu)對本單位的知識產(chǎn)出進行統(tǒng)一收集、集中管理、長期保存和檢索利用的知識資產(chǎn)管理系統(tǒng),是促進知識共享、交流及人才培養(yǎng)的重要手段。
中國鐵道科學(xué)研究院(以下簡稱鐵科院)是我國鐵路行業(yè)唯一的多學(xué)科、多專業(yè)的綜合性研究機構(gòu),在高速鐵路建設(shè)、既有線提速、重載運輸、信息化、運輸安全保障、裝備現(xiàn)代化及城市軌道交通等領(lǐng)域積淀了深厚的專業(yè)知識,對這些知識集中管理和共享,不僅可以避免知識產(chǎn)出的個人分散存儲和流失,還有利于展現(xiàn)鐵科院的整體科研實力和水平,有利于增進知識交流,增強學(xué)術(shù)氣氛,有利于人才的發(fā)現(xiàn)和培養(yǎng)。
鐵路機構(gòu)知識庫(RAIL-IR)正是為解決這一問題而構(gòu)建的。它以網(wǎng)絡(luò)為手段,將分散的知識進行統(tǒng)一收集,統(tǒng)一存儲,提供檢索頁面,供查詢和交流。
近年來,國內(nèi)外出現(xiàn)了較多的機構(gòu)知識庫軟件,如Hol l yKM知識管理系統(tǒng), EOS企業(yè)資源管理系統(tǒng),Magnol ia Web內(nèi)容管理系統(tǒng), Al f resco企業(yè)文檔管理系統(tǒng)及DSpace等。
通過調(diào)研,鐵路知識庫系統(tǒng)最終選擇DSpace,原因如下:
(1)DSpace 具有知識資源存儲管理、 基于事件觸發(fā)的工作流機制和多級權(quán)限控制體系等功能。
(2)DSpace是目前用戶數(shù)最多、應(yīng)用最廣泛的IR軟件,全球有近1 500個用戶在使用,其中國內(nèi)用戶有廈門大學(xué)、中國科學(xué)院及其所屬各所等。自2002年正式發(fā)布以來,經(jīng)歷了從DSpace1.0.1到DSpace1.6.2,10多個版本。由于其用戶眾多,已形成了論壇和良好的Bug報告機制,系統(tǒng)的健壯性及通用性完全可以信賴。
(3)DSpace是一個較成熟的模塊化系統(tǒng),其開發(fā)過程使用了高度耦合的模塊化功能設(shè)計方法,其界面和功能都可以根據(jù)需要進行定制。
(4)DSpace是一款免費開源的軟件,任何個人和團體均可獲取其源碼,并可根據(jù)需求進一步定制和完善。
DSpace 是一個專門的數(shù)字資產(chǎn)(Digital assets)管理系統(tǒng), 它管理和發(fā)布由電子文件或“位”(Bi tst reams)組成的記錄,且允許創(chuàng)建、索引和搜索其元數(shù)據(jù)以便定位和存取該記錄。
圖1 DSpace數(shù)據(jù)組織模型[5]
圖1 為DSpace 的數(shù)據(jù)模型。在該模型中, 每個DSpace 站點分成若干個Community (社群),對應(yīng)各個研究所。每個Communi t y 下還可劃分子Community(社群),對應(yīng)研究所下屬的各個部門。每個子Community(部門)下可劃分若干個Col lect ion(集合),對應(yīng)于各部門的專業(yè)或研究方向。DSpace就是利用Community 和Col lection 來管理數(shù)據(jù)記錄,同時完成對整個機構(gòu)知識的組織和管理。
建設(shè)鐵路機構(gòu)知識庫需要解決的問題主要有兩個。
系統(tǒng)建設(shè)的目的主要是將鐵科院科研工作者的科研論文、科研報告、專著及演示文稿等進行統(tǒng)一收集和存儲,同時提供檢索及共享交流服務(wù)。
實際調(diào)查發(fā)現(xiàn),鐵科院在國內(nèi)外刊物、會議上發(fā)表的科技論文比較分散,在SCI、EI、中國知網(wǎng)、維普中文科技期刊、萬方數(shù)據(jù)資源系統(tǒng)等中均可檢索到,這些數(shù)據(jù)庫中任何一個均不能涵蓋所有數(shù)據(jù),且這些數(shù)據(jù)庫因其存儲字段不同、輸出格式各異,而不能直接用來構(gòu)建鐵路機構(gòu)知識庫;而鐵科院的科研報告,以紙質(zhì)形式進行存檔并提供借閱,不僅時間上有延遲,且不便共享交流;對于演示文稿、技術(shù)培訓(xùn)等資料因沒有相關(guān)要求,大多是個人分散存儲。
因此,數(shù)據(jù)采集應(yīng)當(dāng)以用戶個人提交為主,自動回填為輔。DSpace系統(tǒng)應(yīng)便于全院職工主動提交自己的科技資料。
目前,鐵科院下屬10多個專業(yè)研究所,各研究所下屬多個業(yè)務(wù)部門。從實際出發(fā),建設(shè)具有符合實際管理需要的系統(tǒng),使近百個業(yè)務(wù)部門的資料得到全面、細致的集中管理、統(tǒng)計和展示,可以充分調(diào)動全院職工的積極性,增強全院科研能力。
鐵路機構(gòu)知識庫系統(tǒng)建設(shè)應(yīng)當(dāng)采取“統(tǒng)一領(lǐng)導(dǎo)、分工負責(zé)、逐級落實、共建共享”的原則,其組織機構(gòu)如圖2。
圖2 鐵路機構(gòu)知識庫系統(tǒng)組織
系統(tǒng)管理員首先建立相應(yīng)的Communit ies,分別對應(yīng)鐵科院各個研究所(包括處級處室),并為每個Communi t ies指定一名所管理員;所級管理員負責(zé)本所各部門(即子Communi t ies)的建立,并為各部門指定管理員;各部門管理員根據(jù)本部門的實際情況設(shè)置專題(Col lect ions),如期刊論文、科研報告等,同時指定每個專題的發(fā)布流程,如能否可直接發(fā)布、是否需要審核、審核過程中是否可以修改元數(shù)據(jù)等,并指定相應(yīng)的部門成員負責(zé)。
基于DSpace的鐵路機構(gòu)知識庫系統(tǒng)在此方面具有很大的優(yōu)勢,僅需對DSpace做相應(yīng)的配置和有限改動就可滿足要求。
硬件設(shè)置:IBM X3650,4核 2.66 G*2顆,內(nèi)存4 G,硬盤 146 G *3。
操作系統(tǒng):Windows Server 2003。
數(shù)據(jù)庫:Postgre SQL 8.3。
應(yīng)用軟件:Dspace1.6。
Web應(yīng)用服務(wù)器:Tomcat 5.5。
因基于DSpace的二次開發(fā)和應(yīng)用較多,并形成了相關(guān)論壇和大量文檔,所以基于DSpace的鐵路機構(gòu)知識庫系統(tǒng)建設(shè)相對容易。主要包括如下步驟:
(1)基于Windows操作系統(tǒng)安裝。
(2)系統(tǒng)基本參數(shù)配置。
主要包括數(shù)據(jù)庫配置、管理員郵件配置、用戶注冊登錄方式配置、檢索字段配置、lucene中文分詞器配置,索引方式配置、訪問IP限制配置、OAI元數(shù)據(jù)收割配置等。
(3)本地化。
DSpace系統(tǒng)是外國機構(gòu)開發(fā)的開源軟件,原系統(tǒng)為英文界面,需進行漢化,即本地化。本地化主要包括統(tǒng)一編碼環(huán)境、Messages. proper t ies文件、Input - forms. xml文件、郵件模板化及幫助文檔漢化等幾方面[1]。
(4) 界面調(diào)整和優(yōu)化。
(5)特定Col lect ion元數(shù)據(jù)描述模板及數(shù)據(jù)提交流程定制。
DSpace系統(tǒng)默認(rèn)使用都柏林(即DC)元數(shù)據(jù)對系統(tǒng)資源進行描述,可滿足一般圖書文獻機構(gòu)的需要。若有特殊需要,開發(fā)者可根據(jù)實際情況對特定的專題(Col lect ion)元數(shù)據(jù)及提交流程進行定制。
上述第(1)、(2)部分在DSpace附帶的用戶手冊中已有詳細說明,第(3)、(4)部分在中科院、廈門大學(xué)等相關(guān)文章中有詳細描述,在此不再贅述,只對第(5)部分進行敘述。
基于特定專題的Col lect ion元數(shù)據(jù)描述模板及數(shù)據(jù)提交流程定制過程主要包括配置i npu tform.xml文件、注冊元數(shù)據(jù)、配置提交流程等,在此以科技發(fā)文為例對其進行描述。科技發(fā)文相比科技期刊等來說比較簡單,用發(fā)文名稱、發(fā)文編號、發(fā)文機關(guān)、發(fā)文日期等字段描述即可。
(1)X:Dspaceconf iginput-forms.xml文件(X:為系統(tǒng)配置文件所在盤符)。
(2)在
(3)在
若引用系統(tǒng)已存在的dc元數(shù)據(jù),則不需此步驟,若input-forms.xml中涉及的
以管理員身份進入系統(tǒng),進入管理點擊ht tp://localhost/railir/Dspace-admin/metadata-schemaregist ry,輸入Namespace和Name的值,并添加對應(yīng)的元數(shù)據(jù)。
系統(tǒng)默認(rèn)一個提交操作需要7步完成,而對于科技發(fā)文這樣具有簡單描述的信息專題,簡化為2步提交是完全可以的:(1)描述;(2)文件提交。方法如下:
(1)打開文件 X:Dspaceconf igitem-submission.xml;
(2)在
(3)在
(4)在對應(yīng)的
如圖3,系統(tǒng)主界面主要由3部分構(gòu)成,左側(cè)第一欄主要為信息檢索、瀏覽方式及登錄用戶工作區(qū);中間為信息展示區(qū),可進行簡單的查詢和對相應(yīng)的部分知識進行點擊查看;右側(cè)為信息公告區(qū),信息反饋,同時提供了RSS(Real ly Simp le Syndication)信息獲取功能。
圖3 鐵路機構(gòu)知識庫系統(tǒng)主界面
在鐵路機構(gòu)知識庫系統(tǒng)中,用戶屬于不同的部門,各部門根據(jù)本部門情況設(shè)置可提交的專題。授權(quán)用戶在登陸系統(tǒng)后,選擇要提交的知識資源對應(yīng)的專題,填寫必要的元數(shù)據(jù)信息,并上傳相應(yīng)文件就可完成信息的提交,提交界面如圖4。
圖4 用戶提交頁面
提交后的知識資源將被放入審核人員的工作池中,審核人員可由部門負責(zé)人擔(dān)任,也可指定專人擔(dān)任,審核人員在審核過程中可對所提交的知識資源進行檢查,以確定接受或拒絕此知識資源的提交,若不能確定,可指派給其他人員審核,若設(shè)定了元數(shù)據(jù)編輯權(quán)限,還可對提交的知識資源進行元數(shù)據(jù)編輯等操作。
可靈活設(shè)置檢索條件,對整個機構(gòu)庫或指定部門進行檢索。
鐵路知識庫系統(tǒng)建成后,將成為全院科技信息、成果交流學(xué)習(xí)的重要渠道之一。該系統(tǒng)主要功能表現(xiàn)在以下幾方面:
(1) 用戶可直接查看全院各所和部門發(fā)表的科研論文、報告等技術(shù)資料,有助于信息及時發(fā)現(xiàn)、實時統(tǒng)計和了解各業(yè)務(wù)部門的科研動態(tài)。
(2) 用戶可實現(xiàn)以關(guān)鍵字為主題的自動分類瀏覽,可獲取用戶所關(guān)心領(lǐng)域的科技資源。
(3) 系統(tǒng)具有訂閱功能,用戶可定制所關(guān)心的專題,一旦此專題添加了新文章或其他資源,系統(tǒng)將以Emai l的形式向用戶自動推送。
(4) 系統(tǒng)可以對作者的知識資源進行索引,方便作者的科技成果展示,有利于科技人才的發(fā)現(xiàn)和培養(yǎng)。
DSpace作為一開源數(shù)字資產(chǎn)管理系統(tǒng),已在國內(nèi)外大學(xué)和研究機構(gòu)中得到了廣泛應(yīng)用。本文以DSpace為基礎(chǔ),對建立鐵科院機構(gòu)知識庫管理系統(tǒng)進行了嘗試。基于DSpace 鐵路機構(gòu)知識庫系統(tǒng)具有良好的模塊化結(jié)構(gòu),它在用戶管理、資源管理、信息服務(wù)等方面提供了豐富的功能。希望通過對該系統(tǒng)的進一步研究、建設(shè)及完善,切實為科研單位的科研交流和人才培養(yǎng)提供服務(wù)。
[1] 陳 和,蕭德洪,林麗敏. 基于Dspace構(gòu)建機構(gòu)倉儲的本地化實踐[J]. 現(xiàn)代圖書情報技術(shù),2007(3).
[2] 唐兆琦,鄭巧英. 基于開源軟件Dspace構(gòu)建學(xué)位論文提交與發(fā)布系統(tǒng)[J]. 現(xiàn)代圖書情報技術(shù),2007(12).
[3] 孫 萍. 基于Dspace 的高校圖書館開放課件系統(tǒng)的實現(xiàn)[J]. 現(xiàn)代情報,2008(2).
[4] 祝忠明,馬建霞,常 寧,米 波. 基于Dspace構(gòu)建學(xué)科知識庫系統(tǒng)的研究與實踐[J]. 現(xiàn)代圖書情報技術(shù),2006(7).