馬寧寧+周晨+馮紅娟
摘 要 論文介紹了8種數(shù)字資源長期保存開源軟件:Invenio、DSpace、Eprints、Fedora、Drupal、i-Tor、MyCoRe和OPUS,闡述了它們的產(chǎn)生和發(fā)展過程,并從軟件概況、技術(shù)規(guī)范、知識庫及系統(tǒng)管理、系統(tǒng)性能及系統(tǒng)維護5個方面進行了比較分析,概括了這些軟件的共同點和不同點,希望能夠為各機構(gòu)選擇長期保存軟件提供參考,并為國內(nèi)從事數(shù)字圖書館系統(tǒng)設(shè)計和開發(fā)的同行提供參考。
關(guān)鍵詞 數(shù)字資源長期保存 開源軟件 數(shù)字圖書館 技術(shù)規(guī)范 知識庫
分類號 G250.76
Comparison Research of Several Digital Preservation Open Source Software
Ma Ningning, Zhou Chen, Feng Hongjuan
Abstract This paper introduces 8 kinds of digital preservation open source software: Invenio, DSpace, Eprints, Fedora, Drupal, i-Tor, MyCoRe as well as OPUS, describes the emergence and development of them, carries out a comparison and analysis from 5 aspects: software overview, technical specifications, repository and system management, system performance, and system maintenance, summarizes the similarities and differences of these software, hoping to provide a reference for organizations to choose the best digital preservation software, and provide some help to the designer or developer of digital library software system in China.
Keywords Digital preservation. Open Source Software. Digital library. Technical specification. Repository.
0 引言
數(shù)字資源長期保存的概念自20世紀80年代提出以來,國內(nèi)外一直在進行著大量的研究,并且涌現(xiàn)出一大批功能完善、各具特色的數(shù)字資源長期保存開源系統(tǒng)或軟件,深得各國圖書館的青睞。構(gòu)建數(shù)字資源長期保存系統(tǒng)的開源軟件發(fā)展極為迅速,截止到目前,已有Archimede,ARNO,Invenio,DSpace,Eprints,F(xiàn)edora,Drupal,I-Tor,MyCoRe和OPUS等10 余種。本文重點介紹8種比較有代表性的數(shù)字資源長期保存開源軟件,并從數(shù)字圖書館內(nèi)容管理系統(tǒng)應(yīng)具備的主要功能(資源的批量導(dǎo)入與導(dǎo)出、存檔管理及系統(tǒng)維護、用戶查詢與瀏覽、訪問控制)的角度,對這8個系統(tǒng)進行了詳細的比較和分析。
1 系統(tǒng)功能和服務(wù)特性概覽
1.1 DSpace
DSpace由美國麻省理工大學(xué)圖書館和惠普公司實驗室聯(lián)合開發(fā),第一個版本于2002年12月發(fā)布,是一個收集、組織、存儲、索引、發(fā)布任何格式和層次結(jié)構(gòu)的數(shù)字對象的內(nèi)容管理發(fā)布系統(tǒng)。DSpace遵循BSD協(xié)議,采用DC(Dublin Core)元數(shù)據(jù)來描述數(shù)字對象,支持OAI-PMH2.0協(xié)議,可以導(dǎo)出METS格式的數(shù)字對象,通過METS與其他系統(tǒng)交換資源。DSpace系統(tǒng)結(jié)構(gòu)分為三層:應(yīng)用層、事務(wù)邏輯層和存儲層。應(yīng)用層包含DSpace的用戶應(yīng)用界面、數(shù)據(jù)提供導(dǎo)入導(dǎo)出工具、統(tǒng)計工具等功能;事務(wù)邏輯層負責(zé)存檔文件、電子用戶、授權(quán)及工作流等內(nèi)容的管理;存儲層負責(zé)元數(shù)據(jù)及內(nèi)容的物理存儲,如PostgreSQL、Oracle數(shù)據(jù)庫的訪問管理、文件系統(tǒng)管理、維護內(nèi)容索引等[1]。
DSpace可擴展性強、功能集成、界面友好,而且使用的第三方軟件也均為開源軟件,如PostgreSQL,JDK,Apache等,因而受到很多高校和研究機構(gòu)的青睞。當(dāng)然,DSpace也有不足之處,在實際應(yīng)用中需要對其進行本土化處理,如:漢化系統(tǒng)的用戶界面、郵件內(nèi)容、提交作品的描述信息等內(nèi)容,需根據(jù)實際情況設(shè)置系統(tǒng)的主題、提交策略和服務(wù)條款,從而對系統(tǒng)進行相應(yīng)的優(yōu)化改進。
1.2 Fedora
Fedora(Flexible Extensible Digital Object and Repository Architecture)系統(tǒng)始于1997年,在Andrew W. Mellon基金會的資助下,由弗吉尼亞大學(xué)和康奈爾大學(xué)聯(lián)合開發(fā),2001年發(fā)布其第一個版本。Fedora遵循Mozilla許可協(xié)議,采用CORBA和Java技術(shù)實現(xiàn),是一個通用的數(shù)字對象管理和存儲系統(tǒng)。Fedora系統(tǒng)由數(shù)字對象和倉儲框架兩大實體組成,數(shù)字對象是Fedora體系結(jié)構(gòu)的核心,提供了一個集成內(nèi)容(包括數(shù)據(jù)和元數(shù)據(jù))和行為(對內(nèi)容的操作)的框架;Fedora倉儲是為數(shù)字對象服務(wù)的,提供了對數(shù)字對象的存儲管理和訪問接口,客戶端通過管理和訪問接口跟倉儲進行交互。Fedora的體系結(jié)構(gòu)分為web 服務(wù)層、邏輯應(yīng)用層和存儲層三層[2]。
Fedora系統(tǒng)中的數(shù)字對象使用METS標準編碼,以XML格式存儲,方便了數(shù)據(jù)導(dǎo)入導(dǎo)出時的信息交換。Fedora實現(xiàn)了數(shù)字對象框架,擴展性強,適合存儲和管理各種屬性不同的復(fù)合數(shù)字對象;支持OAI協(xié)議,可以很方便地進行互操作,美國塔夫斯大學(xué)、維吉尼亞大學(xué)、英國赫爾大學(xué)等機構(gòu)都是其忠實用戶。但由于Fedora僅提供管理和訪問數(shù)字對象的接口,沒有用戶界面,因此在實際應(yīng)用中需要使用者進行二次開發(fā),通過編碼來調(diào)用這些接口,使用門檻較高。endprint
1.3 EPrints
EPrints由英國的Southampton大學(xué)研發(fā),目的是創(chuàng)建一個高度可配置的基于Web的知識庫,2000年6月發(fā)布第一個版本,可存儲研究論文、圖像、科學(xué)數(shù)據(jù)、音視頻等所有數(shù)字格式的文件。EPrints用Perl語言編寫,使用Apache和MySQL作為其網(wǎng)絡(luò)服務(wù)和存儲軟件;遵循OAI-PHM2.0協(xié)議,靈活性強,用戶可以根據(jù)需求對其進行修改。EPrints還可以自動安裝,可用一種或多種格式存儲數(shù)字對象,支持多種元數(shù)據(jù)方案,自動檢查數(shù)據(jù)完整性,基于web進行系統(tǒng)維護,可通過網(wǎng)頁提交、訂閱、點評資源等,因此擁有廣泛的用戶群,如:西班牙的E-LIS項目、荷蘭Twente大學(xué)、澳大利亞昆士蘭大學(xué)等。
EPrints系統(tǒng)內(nèi)包含四個區(qū)域,分別為用戶工作區(qū)、編輯/提交緩沖區(qū)、存儲區(qū)、刪除區(qū)。用戶工作區(qū)用來存儲未編輯完或未準備好提交的記錄;編輯/提交緩沖區(qū)存儲等待批準審核的記錄;存儲區(qū)存儲已審核通過、允許發(fā)布、可被檢索使用的記錄;刪除區(qū)用于存儲被邏輯刪除的記錄,EPrints中的數(shù)據(jù)是被長久保存的[3]。所謂刪除,只是從發(fā)布區(qū)域移走而已。
1.4 Drupal
Drupal是一套由63多萬用戶和開發(fā)人員共同維護與開發(fā)的開源內(nèi)容管理系統(tǒng),基于PHP開發(fā),基本架構(gòu)為PHP+Mysql,可以定制各種功能模塊,具有典型的web2.0特征,以簡潔的代碼實現(xiàn)了強大的功能。Drupal是一個建設(shè)動態(tài)網(wǎng)站的開源平臺和內(nèi)容管理系統(tǒng),允許用戶輕松地組織、管理和發(fā)布各種內(nèi)容,提供廣泛而全面的功能和服務(wù),包括:用戶管理、發(fā)布工作流、討論功能、新聞聚合、基于受控詞表的元數(shù)據(jù)操作、用于內(nèi)容共享的XML發(fā)布功能。由于功能模塊和參數(shù)設(shè)置均可以自由搭配,Drupal可以支持從個人博客到大型社區(qū)驅(qū)動網(wǎng)站的各種網(wǎng)頁項目[4]。
Drupal提供了一個超薄而功能強大的核心組件平臺。它基于LAMP 平臺,并且支持多種語言,使用容易;模塊化的體系結(jié)構(gòu)使功能組織定制更加靈活,還提供了完善的管理和分析工具;龐大的開發(fā)團隊推動著Drupal的不斷發(fā)展和完善。
Drupal具有三層體系結(jié)構(gòu),即數(shù)據(jù)持久層、邏輯層和表現(xiàn)層。數(shù)據(jù)持久層負責(zé)持久保存各類數(shù)據(jù)對象,支持Mysql、PostgreSQL等關(guān)系型數(shù)據(jù)庫,其它模塊可以通過調(diào)用核心數(shù)據(jù)庫的API來訪問其中的數(shù)據(jù);邏輯層是整個系統(tǒng)的核心,包括Drupal核心庫和模塊組兩部分,通過各個功能模塊對數(shù)據(jù)進行業(yè)務(wù)和邏輯處理;表現(xiàn)層負責(zé)存檔數(shù)據(jù)的用戶呈現(xiàn),以用戶為中心通過主題系統(tǒng)提供強大的內(nèi)容表現(xiàn)機制。
1.5 Invenio
Invenio是一個幫助用戶構(gòu)建自己的數(shù)字圖書館或網(wǎng)絡(luò)文檔庫的免費軟件包。該軟件提供的技術(shù)覆蓋了數(shù)字圖書館管理的所有方面,從文件攝取,到分類、索引、策劃和發(fā)布。Invenio符合OAI-OMH(Open Archives Initiative metadata harvesting protocol,開放文檔計劃元數(shù)據(jù)收割協(xié)議)之類的標準,并使用MARC 21作為其基礎(chǔ)書目格式。Invenio具有靈活性和執(zhí)行性,它是一個管理中等規(guī)模(幾百萬條記錄)文檔庫的綜合解決方案。
Invenio原本由CERN(歐洲核子研究中心)開發(fā),運行CERN的文件服務(wù)器,管理著100多萬條2002年以來高能物理方面的書目記錄,涵蓋了文章、圖書、期刊、照片、視頻等內(nèi)容。目前,Invenio由一個國際合作組織共同開發(fā),該組織包括:CERN、DESY、EPFL、FNAL和SLAC,全球有30多個科研機構(gòu)正在使用Invenio。用戶可以直接到Invenio官網(wǎng)上免費下載安裝軟件包。Invenio具有如下特點。
(1)資源導(dǎo)航樹:文件被組織在集合中,常規(guī)和虛擬的集合樹,每個集合個性化的入口,以及CERN中分裝在700個集合中的100多萬條文檔。
(2)強大的搜索引擎:為實現(xiàn)對包含200多萬條記錄的知識庫的快速檢索而特別設(shè)計的索引,自定義的簡單和高級檢索界面,將元數(shù)據(jù)、全文、引文檢索整合在一個檢索框中,檢索結(jié)果按照集合聚類。
(3)靈活的元數(shù)據(jù)方案:標準元數(shù)據(jù)格式(MARC),管理著文章、圖書、論文、圖片、視頻、博物館藏品等多種格式的文件,自定義顯示和鏈接規(guī)則。
(4)用戶個性化訂制:用戶定義的收藏夾和自動email通知提醒,與用戶群分享收藏的文件,像亞馬遜那樣對知識庫和收藏夾中的文件進行評論[5]。
1.6 I-Tor
I-Tor由荷蘭科學(xué)信息服務(wù)研究所(簡稱NIWI)的創(chuàng)新技術(shù)應(yīng)用(IT-A)部門開發(fā)。是一組基于Linux,Java,MySQL,Mirage和其它免費組件開發(fā)的、用于開放知識庫的工具和技術(shù)。它收割OAI,并將數(shù)據(jù)庫變成開放存檔,包括相似性、鏈接、基于Lucene的檢索。I-Tor的開發(fā)重點面向四個領(lǐng)域:電子出版物、知識庫、內(nèi)容管理系統(tǒng)、“合作實驗室”。I-Tor是一個基于網(wǎng)絡(luò)的技術(shù),用戶利用I-Tor可以通過Web界面展示各種類型的信息,而不用考慮數(shù)據(jù)存儲在哪兒或存儲格式是什么[6]。
I-Tor的目標是實現(xiàn)一個“獨立于數(shù)據(jù)”的存儲庫,內(nèi)容和用戶界面功能作為該系統(tǒng)兩個獨立的部分。從本質(zhì)上講,I-Tor的角色既是一個OAI服務(wù)提供者(能夠收割OAI兼容的存儲庫和其它數(shù)據(jù)庫),又是一個OAI數(shù)據(jù)提供者。
由于I-Tor能夠從各種關(guān)系數(shù)據(jù)庫、文件系統(tǒng)和網(wǎng)站發(fā)布數(shù)據(jù),所以該系統(tǒng)為機構(gòu)組織構(gòu)建知識庫提供了相當(dāng)大的余地。I-Tor可以為知識庫創(chuàng)建新的數(shù)據(jù)庫,也可以使用已有的關(guān)系數(shù)據(jù)庫。此外,I-Tor還能從研究者的個人主頁中直接收割數(shù)據(jù)。最終用戶可以直接通過網(wǎng)頁瀏覽器向系統(tǒng)添加內(nèi)容,而無需軟件開發(fā)者做中介。
由于這種設(shè)計,I-Tor不會執(zhí)行一組或子組的特定工作流。相反,I-Tor為機構(gòu)提供構(gòu)建任何組織需要的工作流的工具(例如,細粒度安全、通知等),而無需將工作流整合到I-Tor系統(tǒng)中。利用I-Tor,機構(gòu)可以在現(xiàn)有的一組完全不同的數(shù)字資源庫的基礎(chǔ)上構(gòu)建一個新的知識庫。endprint
1.7 MyCoRe
MyCoRe是德國埃森大學(xué)MILESS項目的成果。MyCoRe中的“CoRe”代表“Content Repository”(內(nèi)容知識庫)或“Core”(核心),“My”代表本地適應(yīng)和使用。MyCoRe系統(tǒng)目前由一個大學(xué)聯(lián)盟負責(zé)開發(fā),它提供一個核心軟件工具包,來支持數(shù)字圖書館和存檔的解決方案。利用該軟件包,無需本地編程,即可適應(yīng)本地需求,并具有可配置性。
MyCoRe的數(shù)據(jù)模型是完全可配置的,此外,MyCoRe還基于“核心”功能提供了一個應(yīng)用程序樣例——“DocPortal”,向用戶展示如何使用元數(shù)據(jù)配置文件構(gòu)建自己的應(yīng)用程序,DocPortal既是一個演示和測試環(huán)境,又可作為一個模型和應(yīng)用程序框架,來構(gòu)建自己的基于MyCoRe的應(yīng)用程序?!昂诵摹惫δ馨酥R庫實施中需要的所有功能,包括:元數(shù)據(jù)管理、分布式檢索地理上分散的MyCoRe知識庫、OAI接口、圖像查看器、集成的音頻/視頻流支持、文件管理及在線元數(shù)據(jù)編輯等。實際應(yīng)用中,機構(gòu)可以擴展或自定義核心模塊來滿足本機構(gòu)的特殊需求。
MyCoRe并不向特定的底層數(shù)據(jù)庫強制編碼,而是提供一個持久層接口,以及不同數(shù)據(jù)庫的實現(xiàn)程序。除了各種開源數(shù)據(jù)庫系統(tǒng)的實現(xiàn)程序,MyCoRe還支持商業(yè)的、可用于大規(guī)模倉儲的IBM內(nèi)容管理系統(tǒng)。
MyCoRe不是一個完整的、可立即使用的倉儲軟件(像EPrints或OPUS那樣),但它提供創(chuàng)建這些或類似應(yīng)用軟件的API。所以MyCoRe的優(yōu)勢在于提供強大的、全面的功能,具靈活性。例如,元數(shù)據(jù)模型、網(wǎng)絡(luò)接口、搜索及登記表格等功能都可以自由配置。此外,DocPortal可以理解為一個框架,初學(xué)者可以用其建立自己的第一個MyCoRe服務(wù)器。目前在德國有23家機構(gòu)使用該系統(tǒng)。
MyCoRe的特點:進行元數(shù)據(jù)管理、分類管理,以統(tǒng)一資源名稱(URN)標準作為永久標識符,具備搜索、用戶和權(quán)限管理,支持OAI/Z39.50/WebService等接口,適用于各種圖片瀏覽器(可選)、集成的音頻/視頻流媒體服務(wù)器(可選),具有簡單的用戶工作流(可選)、簡單的Web內(nèi)容管理系統(tǒng)、機構(gòu)知識庫功能。
1.8 OPUS
在大學(xué)的研究和教學(xué)過程中會產(chǎn)生大量質(zhì)量相當(dāng)不錯的出版物,如碩士論文、學(xué)位論文、報告、會議論文、講義等。這些科研成果很難被外界準確地檢索到,所以這類出版物通常被業(yè)內(nèi)稱為“灰色”資源。為了改善這種狀況,在德國研究網(wǎng)和德國聯(lián)邦政府的高等教育部的資助下,斯圖加特大學(xué)圖書館和計算機中心于1998年開發(fā)了OPUS(Online Publications of the University of Stuttgart,斯圖加特大學(xué)網(wǎng)絡(luò)出版物)系統(tǒng)。OPUS為大學(xué)教師、學(xué)生和工作人員提供了一個管理其電子出版物(發(fā)表和未發(fā)表的文章、論文和學(xué)位論文)的系統(tǒng),使每位大學(xué)成員(職工和學(xué)生)都能通過萬維網(wǎng)來發(fā)布、檢索和使用電子文檔[7-8]。
使用OPUS發(fā)布資源的方式是:將電子文檔轉(zhuǎn)換為PDF格式(可移植的文檔格式),然后錄入一些關(guān)于該文檔的元數(shù)據(jù),這些元數(shù)據(jù)將以DC格式存儲在SQL數(shù)據(jù)庫中。所以檢索具有其他知名在線數(shù)據(jù)庫的典型特征:不同的檢索字段、分詞選項、布爾運算符等。此外,DC使其能夠加入不斷發(fā)展的、基于Web的搜索引擎和機器人。為了更容易地訪問斯圖加特大學(xué)的電子文檔,OPUS是康斯坦斯高級研究開放式圖書館網(wǎng)絡(luò)(Constance Advanced Research Open Library Network,CAROLINE)的成員。這意味著通過西南德國(South-West Germany,SWB)統(tǒng)一編目可以檢索到其中的資源,SWB中包含了該地區(qū)圖書館擁有的大約6百萬條出版物的題名信息。
OPUS是可擴展的,這意味著其他大學(xué)或機構(gòu)也可以安裝該系統(tǒng),從而使科學(xué)界可供獲取更多的電子文檔,目前有一百多家機構(gòu)正使用OPUS系統(tǒng)來管理其電子出版物,可以同時檢索這些成員機構(gòu)的所有資源。大多OPUS的實施是由機構(gòu)的大學(xué)圖書館來管理和運營的,但也有一些是由圖書館和大學(xué)的出版社和/或?qū)W術(shù)計算機中心合作努力來管理運營的。
OPUS項目于1998年10月結(jié)束,目前OPUS的后續(xù)開發(fā)由斯圖加特大學(xué)資助,與巴登-符騰堡州圖書館服務(wù)中心(BSZ)合作開發(fā),該機構(gòu)擁有OPUS的開發(fā)平臺。自2011年8月,斯圖加特大學(xué)就部署了OPUS 3.2.1版本。未來的發(fā)展主要集中在標準互操作服務(wù)上,如一個網(wǎng)絡(luò)認證知識庫的使用統(tǒng)計和引文分析等。OPUS在以德語為主要語言的國家應(yīng)用面非常廣。
2 性能比較
面對眾多的開源軟件,用戶在選擇開源軟件時,除了需要明確本機構(gòu)的業(yè)務(wù)需求,還需要評估和考察很多指標,本文將從軟件概況、技術(shù)規(guī)范等方面對上述8種主流數(shù)字資源長期保存開源軟件進行比較和分析。
2.1 軟件概況
比較開發(fā)機構(gòu)、發(fā)布日期、注冊用戶數(shù)、版本號、最新版本等軟件信息,有利于我們初步了解各個開源軟件的整體狀況。具體見表1。
2.2 技術(shù)規(guī)范
開源軟件和商業(yè)軟件的主要不同點在于技術(shù)規(guī)范和源代碼的公開。因此,考察一個開源軟件的重要指標就是其技術(shù)規(guī)范的優(yōu)劣。技術(shù)規(guī)范的好壞一方面將影響到開源軟件的質(zhì)量,另一方面也將決定軟件后期是否可以吸引更多的用戶和志愿程序員進行后期的開發(fā)和維護。表2對8種開源軟件所使用的開源許可協(xié)議、開發(fā)語言、操作系統(tǒng)、Web服務(wù)器、支持的數(shù)據(jù)庫、搜索引擎等技術(shù)規(guī)范進行了詳細的比較。
2.3 知識庫及系統(tǒng)管理
知識庫及系統(tǒng)管理部分從各個軟件可接受的文檔格式、是否可以提交包含多個文件的條目、是否可以上傳壓縮文件及是否支持批量導(dǎo)入及導(dǎo)出功能等方面對8種開源軟件進行了深入比較,詳見表3。endprint
表3 內(nèi)容導(dǎo)入/導(dǎo)出比較
2.4 系統(tǒng)性能
系統(tǒng)性能分可擴展性、易用性、模塊化三部分進行了比較??蓴U展性好的軟件將為具有研發(fā)實力的機構(gòu)使用系統(tǒng)提供更大的空間,可滿足更多的需求;易用性決定著開源軟件使用的技術(shù)“門檻”的高低;模塊化的設(shè)計將有助于開源軟件的愛好者和志愿者在軟件后期可以自由操作功能模塊。比較結(jié)果可見表4。
表4 系統(tǒng)性能比較
2.5 系統(tǒng)維護
開源軟件的后期開發(fā)依靠的是廣大的社區(qū)程序志愿者,雖然存在一定的組織,但都是松散的非商業(yè)化組織,所以在選擇開源軟件時還是需要選擇系統(tǒng)維護策略相對完善的軟件。對于是否有系統(tǒng)維護,詳見表5。
表5 系統(tǒng)維護比較
2.6 小結(jié)
通過上文的比較和分析,可以看出這些軟件都具有比較好的開放性、通用性和可擴展性。主要表現(xiàn)在:(1)這8個軟件均遵循開放源代碼許可協(xié)議,可以免費獲取,并可自由修改、升級和重組;(2)均可以在時下主流的操作系統(tǒng)(如Linux/ Unix/ Solaris)上運行;(3)均支持OAI(Open Archives Initiative,開放文檔計劃)元數(shù)據(jù)收割協(xié)議,使每個用戶都能加入全球互操作研究知識庫的網(wǎng)絡(luò);(4)均支持國際上通用的底層數(shù)據(jù)庫(如MySQL/PostgreSQL);(5)可以接受所有的文檔格式;(6)可以批量導(dǎo)入元數(shù)據(jù)和對象數(shù)據(jù),批量導(dǎo)出的數(shù)據(jù)和內(nèi)容均具有可移植性;(7)均使用了模塊化的設(shè)計理念;(8)均可以自動安裝和更新腳本;(9)針對分布式環(huán)境下的數(shù)字資源設(shè)計了元數(shù)據(jù)管理方案,大都采用了國際上通用的元數(shù)據(jù)標準(如DC),并可以根據(jù)需求自主增刪元數(shù)據(jù)字段,8個軟件均可通過系統(tǒng)為存檔資源分配標識符;(10)均提供系統(tǒng)使用的幫助文檔或手冊,并且大多數(shù)軟件均提供對存檔資源的檢索和瀏覽功能。
從上面幾個表格的比較中,我們還可以看出:(1)Dspace目前在全球的用戶數(shù)目最多,其次是Eprints、Fedora、Drupal和OPUS,這5個軟件占據(jù)了全球90%以上的用戶;(2)Drupal和I-Tor在用戶服務(wù)方面的功能最為完善,不但可以定制界面、提供系統(tǒng)討論平臺、支持全文檢索,還提供豐富的資源檢索和瀏覽功能;(3)Dspace、Fedora和Invenio不但制定了數(shù)字資源的長期保存策略,還支持元數(shù)據(jù)的長期保存;(4)Fedora、Drupal、MyCoRe和I-Tor提供了豐富的API接口,擴展容易,而Dspace、EPrints、Invenio和OPUS系統(tǒng)本身的功能就比較完善,密封性強,擴展難度相對較大;(5)Fedora和MyCoRe這兩個軟件不提供面向終端用戶的數(shù)據(jù)操作和訪問界面,不是一個完整的、可立即使用的倉儲軟件,均需要進行二次開發(fā),對使用機構(gòu)的研發(fā)能力有較高的要求,而其它6個軟件的系統(tǒng)功能則比較完備,容易使用。
3 結(jié)語
本文介紹的8種數(shù)字資源長期保存開源軟件沒有絕對的優(yōu)劣之分,它們在創(chuàng)建之初都是根據(jù)特定的運行環(huán)境和功能要求、按照一定的原則和目的來設(shè)計開發(fā)的,側(cè)重點和優(yōu)勢也各不相同。這些軟件各具特色,各有所長:Invenio能夠處理包含不同類型資源的中等規(guī)模倉儲;DSpace支持基于社區(qū)的內(nèi)容政策和提交程序,并提供工具來長期保存提交的數(shù)字對象;Eprints提供了一個簡單、有用的倉儲系統(tǒng),安裝了一個龐大而活躍的用戶社區(qū);Fedora提供了一個功能全面的數(shù)字圖書館系統(tǒng),是容納非常龐大的資源庫;I-Tor提供的工具包是構(gòu)建一個訪問并集成顯示多種數(shù)據(jù)庫內(nèi)容的統(tǒng)一環(huán)境;MyCoRe強調(diào)靈活性,以及配置軟件以支持完全不同的數(shù)字圖書館和倉儲數(shù)據(jù)庫的能力;OPUS則提供了一個龐大而多樣的德國用戶群。
總之,這8種軟件各具特色又有豐富的功能,可滿足大多圖書館保存和管理其數(shù)字資源的需求。各機構(gòu)可根據(jù)自身的實際需求,選擇最適合的軟件作為其應(yīng)用或開發(fā)平臺。本文通過對這8種軟件進行詳細比較,希望能為國內(nèi)從事數(shù)字資源長期保存系統(tǒng)設(shè)計與開發(fā)的同行提供參考,也為機構(gòu)團體選用長期保存開源軟件提供借鑒。
參考文獻:
[ 1 ] DSpace website[EB/OL].[2013-10-03].http://www.dspace.org/.
[ 2 ] Fedora website[EB/OL].[2013-10-03].http://www.fedora-commons.org/about.
[ 3 ] EPrints website[EB/OL].[2013-10-15].http://www.EPrints.org/.
[ 4 ] Drupal Groups[EB/OL].[2013-10-15].http://groups.drupal.org/libraries.
[ 5 ] Invenio website[EB/OL].[2013-11-06].http://invenio-software.org/.
[ 6 ] i-Tor.[EB/OL].[2013-01-06].http://sourceforge.net/pr
ojects/i-tor/.
[ 7 ] MyCoRe website[EB/OL].[2013-11-08].http://www.mycore.de/about.html.
[ 8 ] About OPUS[EB/OL].[2013-11-12].http://elib.uni-stuttgart.de/opus/doku/about.php?la=en.
[ 9 ] Invenio website[EB/OL].[2013-11-15].http://invenio-software.org/wiki/WikiStart?action=history.endprint
[10] sourceforge[EB/OL].[2013-11-25].http://sourceforge.net/projects/i-tor/?source=directory.
[11] MyCoRe website[EB/OL].[2014-01-25].http://www.mycore.de/archive.html.
[12] DuraSpace website[EB/OL].[2014-02-05].http://duraspace.org/about_dspace.
[13] Fedora Commons Registry[EB/OL].[2013-02-15]. https://docs.google.com/spreadsheet/ccc?key=0AnXL
MjeiSH_KdElwYi11dGhQTURMZmR1eEdXbDFZMH
c&hl=en_US#gid=0.
[14] Drupal Groups[EB/OL].[2014-02-15].http://groups.drupal.org/libraries/libraries#consortia.
[15] sourceforge[EB/OL].[2014-02-22].http://sourceforge.net/projects/fedora-commons/files/fedora/.
[16] sourceforge [EB/OL].[2014-02-27].http://sourceforge.
net/projects/mycore/.
[17] MyCoRe website [EB/OL]. [2014-01-05].http://sour
ceforge.net/projects/dspace/files/?source=navbar.
[18] EPrints 3.3.11[EB/OL].[2013-12-03].http://files.eprints.org/827/.
[19] Drupal website[EB/OL].http://drupal.org/,[2013-12-17].
[20] Invenio website [EB/OL]. [2014-03-23].http://invenio
-software.org/wiki/Installation/Download
[21] MyCoRe website[EB/OL].[2014-03-29].http://www.mycore.de/download/index.html.
[22] OPUS Software[EB/OL].[2014-04-11].http://elib.uni-stuttgart.de/opus/doku/opus_sw.php.
馬寧寧 國家圖書館館員。北京,100081。
周 晨 國家圖書館副研究館員。北京,100081。
馮紅娟 國家圖書館館員。北京,100081。
(收稿日期:2014-04-17 編校:方 瑋)endprint
[10] sourceforge[EB/OL].[2013-11-25].http://sourceforge.net/projects/i-tor/?source=directory.
[11] MyCoRe website[EB/OL].[2014-01-25].http://www.mycore.de/archive.html.
[12] DuraSpace website[EB/OL].[2014-02-05].http://duraspace.org/about_dspace.
[13] Fedora Commons Registry[EB/OL].[2013-02-15]. https://docs.google.com/spreadsheet/ccc?key=0AnXL
MjeiSH_KdElwYi11dGhQTURMZmR1eEdXbDFZMH
c&hl=en_US#gid=0.
[14] Drupal Groups[EB/OL].[2014-02-15].http://groups.drupal.org/libraries/libraries#consortia.
[15] sourceforge[EB/OL].[2014-02-22].http://sourceforge.net/projects/fedora-commons/files/fedora/.
[16] sourceforge [EB/OL].[2014-02-27].http://sourceforge.
net/projects/mycore/.
[17] MyCoRe website [EB/OL]. [2014-01-05].http://sour
ceforge.net/projects/dspace/files/?source=navbar.
[18] EPrints 3.3.11[EB/OL].[2013-12-03].http://files.eprints.org/827/.
[19] Drupal website[EB/OL].http://drupal.org/,[2013-12-17].
[20] Invenio website [EB/OL]. [2014-03-23].http://invenio
-software.org/wiki/Installation/Download
[21] MyCoRe website[EB/OL].[2014-03-29].http://www.mycore.de/download/index.html.
[22] OPUS Software[EB/OL].[2014-04-11].http://elib.uni-stuttgart.de/opus/doku/opus_sw.php.
馬寧寧 國家圖書館館員。北京,100081。
周 晨 國家圖書館副研究館員。北京,100081。
馮紅娟 國家圖書館館員。北京,100081。
(收稿日期:2014-04-17 編校:方 瑋)endprint
[10] sourceforge[EB/OL].[2013-11-25].http://sourceforge.net/projects/i-tor/?source=directory.
[11] MyCoRe website[EB/OL].[2014-01-25].http://www.mycore.de/archive.html.
[12] DuraSpace website[EB/OL].[2014-02-05].http://duraspace.org/about_dspace.
[13] Fedora Commons Registry[EB/OL].[2013-02-15]. https://docs.google.com/spreadsheet/ccc?key=0AnXL
MjeiSH_KdElwYi11dGhQTURMZmR1eEdXbDFZMH
c&hl=en_US#gid=0.
[14] Drupal Groups[EB/OL].[2014-02-15].http://groups.drupal.org/libraries/libraries#consortia.
[15] sourceforge[EB/OL].[2014-02-22].http://sourceforge.net/projects/fedora-commons/files/fedora/.
[16] sourceforge [EB/OL].[2014-02-27].http://sourceforge.
net/projects/mycore/.
[17] MyCoRe website [EB/OL]. [2014-01-05].http://sour
ceforge.net/projects/dspace/files/?source=navbar.
[18] EPrints 3.3.11[EB/OL].[2013-12-03].http://files.eprints.org/827/.
[19] Drupal website[EB/OL].http://drupal.org/,[2013-12-17].
[20] Invenio website [EB/OL]. [2014-03-23].http://invenio
-software.org/wiki/Installation/Download
[21] MyCoRe website[EB/OL].[2014-03-29].http://www.mycore.de/download/index.html.
[22] OPUS Software[EB/OL].[2014-04-11].http://elib.uni-stuttgart.de/opus/doku/opus_sw.php.
馬寧寧 國家圖書館館員。北京,100081。
周 晨 國家圖書館副研究館員。北京,100081。
馮紅娟 國家圖書館館員。北京,100081。
(收稿日期:2014-04-17 編校:方 瑋)endprint