孫 艷 馬炳厚 王 棟 (第四軍醫(yī)大學(xué)圖書館 陜西 西安 710032)
隨著信息技術(shù)的發(fā)展和互聯(lián)網(wǎng)的普及,電子資源已成為科研與教育領(lǐng)域的主流資源。而且由于電子資源便利與實(shí)用的特點(diǎn),越來(lái)越多的研究人員已經(jīng)或正在改變著查找資源的習(xí)慣,即更加傾向于使用電子資源。大多數(shù)圖書館購(gòu)買電子資源所占的經(jīng)費(fèi)比例也逐年增加。但由于電子資源不像紙質(zhì)文獻(xiàn)那樣具有有形的實(shí)體可以保存,而且大多數(shù)資源是通過(guò)網(wǎng)絡(luò)獲取的,出版商對(duì)電子資源也沒有長(zhǎng)期保存的義務(wù),因此,圖書館無(wú)法確保正在使用的資源能為未來(lái)的讀者服務(wù)。
2008年11月在北京召開了主題為“國(guó)家數(shù)字文獻(xiàn)資源長(zhǎng)期保存服務(wù)體系建設(shè)”的數(shù)字圖書館高層論壇首屆年會(huì),會(huì)議呼吁國(guó)家教育科研機(jī)構(gòu)和文獻(xiàn)情報(bào)機(jī)構(gòu)充分認(rèn)識(shí)數(shù)字文獻(xiàn)長(zhǎng)期保存的戰(zhàn)略重要性和現(xiàn)實(shí)緊迫性,行動(dòng)起來(lái),促進(jìn)我國(guó)數(shù)字資源長(zhǎng)期保存的順利開展[1]。其實(shí)從上世紀(jì)90年代開始,國(guó)外就已經(jīng)開展了比較正式的對(duì)數(shù)字資源長(zhǎng)期保存的研究活動(dòng),該領(lǐng)域經(jīng)歷了從基礎(chǔ)理論研究到個(gè)體實(shí)驗(yàn)再到最佳實(shí)踐的發(fā)展過(guò)程。目前相對(duì)成熟并已經(jīng)在實(shí)施的模式包括:機(jī)構(gòu)獨(dú)立保存、合作保存和第三方委托保存[2]。機(jī)構(gòu)獨(dú)立保存是由保存機(jī)構(gòu)在擁有對(duì)被保存資源的使用權(quán)的條件下,獲得出版商許可后進(jìn)行的保存。這種保存模式目前一般都有國(guó)家收藏的背景。如英國(guó)國(guó)家圖書館(British Library,簡(jiǎn)稱BL)、荷蘭國(guó)家圖書館(Koninklijke Bibliotheek,簡(jiǎn)稱KB)等。本文將重點(diǎn)放在合作保存和第三方委托保存上。目前這兩種模式比較成熟的代表是LOCKSS和Portico,并且兩種模式也都運(yùn)行了10年左右,都擁有一定的用戶群體。本文下面將從兩種模式的組成模式、工作原理和費(fèi)用3個(gè)方面對(duì)LOCKSS和Portico分別進(jìn)行比較。
2.1.1 LOCKSS(Lots of Copies Keep Stuff Safe)是由MELLON基金(Andrew W. Mellon Foundation)、美國(guó)國(guó)家科學(xué)基金(National Science Foundation)、美國(guó)國(guó)會(huì)圖書館資助,斯坦福大學(xué)圖書館實(shí)施的一個(gè)致力于解決電子資源長(zhǎng)期保存的項(xiàng)目。該項(xiàng)目意為通過(guò)建立出版商與圖書館之間的協(xié)作關(guān)系,允許圖書館在本地收藏、管理圖書館訂購(gòu)的電子資源并提供用戶服務(wù)的系統(tǒng)[3]。LOCKSS從1999年開始運(yùn)行至今已有11年的歷史了,截至2008年秋季,LOCKSS成員包括全球超過(guò)400家主要的出版商和200家圖書館,并且LOCKSS每天新增700萬(wàn)頁(yè)信息[4]。
2.1.2 Portico始于2002年,其宗旨是保存電子形式的學(xué)術(shù)資源,以備將來(lái)的研究人員查找與使用。該項(xiàng)目得到MELLON基金、ITHAKA、美國(guó)國(guó)會(huì)圖書館和JSTOR的資助[5]。Portico作為第三方的資源保存機(jī)構(gòu)為圖書館和出版商服務(wù)。截至2009年8月7日,Portico已擁有授權(quán)電子期刊10 324種、電子書6 488種,總計(jì)13 566 761篇文章。合作出版商75家,其中不乏全球知名學(xué)術(shù)期刊出版商Elsivier、Springer、John Wiley&Sons. Inc. 、IEEE.Inc.、OUP 等,囊括了商業(yè)性出版商、大學(xué)出版社及學(xué)協(xié)會(huì)出版社[6]。其擁有合作圖書館491家,其中334家是美國(guó)圖書館[7]。
2.2.1 LOCKSS采取的模式是為圖書館提供開放性源碼的分布式存儲(chǔ)系統(tǒng),圖書館只要具有資源的認(rèn)證,或者說(shuō)得到了出版商的許可或授權(quán),就可以在本地收藏、管理電子資源。LOCKSS對(duì)運(yùn)行環(huán)境要求很低,一般的個(gè)人計(jì)算機(jī)就可以完成整個(gè)存儲(chǔ)任務(wù)。圖書館員可對(duì)文獻(xiàn)的保存、使用、訪問(wèn)等進(jìn)行管理和監(jiān)控。
LOCKSS運(yùn)作時(shí),首先由出版商給圖書館授權(quán),圖書館利用網(wǎng)絡(luò)爬蟲一類的工具將目標(biāo)資源下載到本地可存檔的LOCKSS存檔箱(LOCKSS Boxes)。同時(shí)LOCKSS存檔箱內(nèi)的內(nèi)容會(huì)持續(xù)不斷地與其他LOCKSS存檔箱中相同的內(nèi)容進(jìn)行比對(duì),以保證內(nèi)容的正確與完整。又由于LOCKSS采用的是Peer-to-Peer對(duì)等方式的分布式保存系統(tǒng),一旦某個(gè)存檔箱中的內(nèi)容有誤或者丟失,它可以通過(guò)LOCKSS內(nèi)部其他存檔箱中的內(nèi)容進(jìn)行修復(fù)[8]。在LOCKSS中,每個(gè)專題只要有不少于6份的備份,就能保證資源的完整與安全,確保整個(gè)系統(tǒng)的正常運(yùn)行。
當(dāng)出版商由于網(wǎng)絡(luò)崩潰、取消訂購(gòu)或出版商倒閉等不能夠再提供服務(wù)時(shí),授權(quán)用戶可以使用LOCKSS存檔箱的信息。
2.2.2 Portico存檔采用的模式是遷移(Migration),即當(dāng)原有的文件格式不再被使用時(shí),存檔內(nèi)容可以轉(zhuǎn)換成其他經(jīng)常被使用的格式。同時(shí),Portico還采用基于字節(jié)保存源文件的模式。
Portico對(duì)電子內(nèi)容的保存方法有一系列指導(dǎo)原則,包括:重視期刊學(xué)術(shù)內(nèi)容的保存,忽略期刊的外觀(如:扉頁(yè)、版權(quán)頁(yè)、目次頁(yè)等),對(duì)出版商的網(wǎng)站或傳播平臺(tái)不予保存。Portico對(duì)內(nèi)容質(zhì)量的保證采取對(duì)保存內(nèi)容實(shí)行自審的方式,同時(shí)接受圖書館、出版商審校,但一般情況下不允許圖書館及用戶訪問(wèn)已存儲(chǔ)的資料。只有當(dāng)出版商停止運(yùn)作、停止某期刊的出版、不再提供回溯期刊、平臺(tái)遭受破壞且資源無(wú)法再?gòu)钠渌搭^獲得時(shí),圖書館具有出版商的授權(quán),Portico允許圖書館通過(guò)采用IP控制或密碼為用戶提供所保存內(nèi)容。在是否允許訪問(wèn)這一點(diǎn)上,LOCKSS和Portico具有相同的要求。由于Portico是第三方電子資源長(zhǎng)期保存模式,為證明其可靠性,Portico承諾如果自身停止運(yùn)行,該組織會(huì)將已保存的內(nèi)容轉(zhuǎn)交美國(guó)國(guó)會(huì)圖書館或其他的非營(yíng)利性機(jī)構(gòu)加以保存并繼續(xù)提供服務(wù)。同時(shí)由荷蘭國(guó)家圖書館線下保存Portico的全部資源,以增強(qiáng)資源對(duì)外部影響的抵抗力[9]。
2.3.1 LOCKSS系統(tǒng)是一個(gè)分布式的電子資源存儲(chǔ)系統(tǒng),而作為一個(gè)分布式的系統(tǒng)必須制定一些關(guān)于軟件開發(fā)與技術(shù)支持以及收藏管理方面的協(xié)調(diào)框架。LOCKSS作為一個(gè)非營(yíng)利的為圖書館和出版商服務(wù)的組織,其系統(tǒng)開發(fā)的成本來(lái)自多項(xiàng)基金的支持,并通過(guò)合作機(jī)制均攤開發(fā)費(fèi)用。所做的工作包括:軟件的開發(fā)、修復(fù)漏洞、系統(tǒng)更新、安裝與使用的技術(shù)支持、協(xié)調(diào)成員的合作,等等[10]。由于系統(tǒng)應(yīng)用的是成熟的對(duì)等網(wǎng)組網(wǎng)技術(shù)和開源系統(tǒng)[11],其運(yùn)行和開發(fā)成本較低。LOCKSS與組織中成員共同參與規(guī)范相關(guān)政策,要求每個(gè)成員為系統(tǒng)提供必要的支持。鼓勵(lì)成員參與到軟件開發(fā)的過(guò)程中,并在開發(fā)中給予技術(shù)支持。通過(guò)成員的廣泛參與,做到成本、風(fēng)險(xiǎn)、利益均攤。
對(duì)于圖書館來(lái)說(shuō),除了參與到LOCKSS中并盡相應(yīng)的義務(wù)外,圖書館自己建立的存儲(chǔ)系統(tǒng)對(duì)硬件的要求非常低,只要是普通的個(gè)人計(jì)算機(jī),就可以轉(zhuǎn)化為一個(gè)數(shù)字信息存檔箱。目前,我國(guó)清華大學(xué)、中國(guó)科學(xué)院、香港大學(xué)、香港中文大學(xué)、香港科技大學(xué)和香港城市大學(xué)已參加了LOCKSS組織。而出版商加入到LOCKSS中是免費(fèi)的。
2.3.2 Portico作為第三方的電子資源存儲(chǔ)機(jī)構(gòu)接受了多方基金的支持。為了避免對(duì)單一資金的依賴,Portico對(duì)接受其服務(wù)的圖書館和出版商采取收取年費(fèi)的方式維持機(jī)構(gòu)的正常運(yùn)行。圖書館繳納的費(fèi)用取決于圖書館的年度采購(gòu)經(jīng)費(fèi)(Library Materials Expenditure,簡(jiǎn)稱LME)。由于每個(gè)圖書館的年度采購(gòu)經(jīng)費(fèi)差別很大,因此Portico公布了不同年度采購(gòu)經(jīng)費(fèi)的不同的保存費(fèi)用,原則上,年度采購(gòu)經(jīng)費(fèi)越高的圖書館,其保存費(fèi)占年度采購(gòu)經(jīng)費(fèi)的比例越低。如當(dāng)圖書館LME低于15萬(wàn)美元時(shí),其保存費(fèi)為L(zhǎng)ME的1%。當(dāng)LME為500萬(wàn)美元時(shí),其保存費(fèi)為L(zhǎng)ME的0.2%,當(dāng)LME為3000萬(wàn)美元時(shí),其保存費(fèi)為L(zhǎng)ME的0.08%[12]。出版商繳納的費(fèi)用取決于其年度期刊的訂購(gòu)收入,包括電子版、印刷版期刊的訂購(gòu)收入、授權(quán)收入和廣告收入等。原則上收入越高,其繳納的費(fèi)用占收入的比例越低,大致每年繳納的費(fèi)用在250-75 000美元之間[13]。
從項(xiàng)目開始運(yùn)行時(shí)間來(lái)看,LOCKSS始于1999年,Portico始于2002年,都有10年左右的發(fā)展歷程。
從運(yùn)行規(guī)模來(lái)看,LCOKSS中參與的出版社有400多家,遠(yuǎn)遠(yuǎn)超過(guò)Portico的75家。當(dāng)然Portico的75家中也包括了世界上主要的出版商。出版商的數(shù)量差別也許與LOCKSS對(duì)出版商免費(fèi)進(jìn)入的政策有關(guān)。尤其對(duì)于中小型出版商來(lái)說(shuō),這種只需要給圖書館提供相應(yīng)的保存文獻(xiàn)的權(quán)利,不用花費(fèi)額外的資金就將長(zhǎng)期保存電子資源的任務(wù)賦予給圖書館的模式,還是很吸引人的。全球參加LOCKSS的圖書館超過(guò)200家,其中近100家為美國(guó)以外國(guó)家的圖書館,包括我國(guó)內(nèi)地和香港地區(qū)的5家圖書館。Portico則有491家圖書館,美國(guó)以外國(guó)家的圖書館有近160家。兩個(gè)項(xiàng)目都以美國(guó)圖書館為主。出版商和圖書館是電子資源長(zhǎng)期保存的兩個(gè)重要方面,缺一不可。
兩個(gè)項(xiàng)目的啟動(dòng)資金都來(lái)自幾種基金的支持。LOCKSS采取的是開放性源碼的分布式存儲(chǔ)系統(tǒng)。即出版社提供保存的認(rèn)證和許可,參與的每一個(gè)圖書館都要進(jìn)行具體的存儲(chǔ)工作。而Portico則是作為獨(dú)立于出版商和圖書館之外的第三方組織來(lái)保存電子資源的。兩者都是在不可抗拒的因素(如出版商變化或倒閉、資源網(wǎng)站受到惡意攻擊、自然災(zāi)害等)影響下,才允許組織內(nèi)的圖書館可以繼續(xù)使用和索取存儲(chǔ)的資源。
LOCKSS采用分布式存儲(chǔ)方式,每個(gè)圖書館收集的內(nèi)容是得到授權(quán)的資源,通過(guò)與其他存檔箱的比對(duì)來(lái)保證資源存儲(chǔ)內(nèi)容的正確性。由于系統(tǒng)內(nèi)的全部備份數(shù)據(jù)損壞的可能性都極低,因此,參加的圖書館越多,其可靠性越有保證。Portico是一個(gè)集中的資源存儲(chǔ)庫(kù),存儲(chǔ)的內(nèi)容包括加入系統(tǒng)的出版商出版的所有資源,并且采用自審的方式。同時(shí),圖書館和出版商也具有對(duì)內(nèi)容審校的權(quán)利。
LOCKSS和Portico都有多項(xiàng)基金的支持,但是對(duì)于后續(xù)的維護(hù)與升級(jí),LOCKSS和Portico的方式不一樣。LOCKSS采用聯(lián)盟機(jī)制,參加的成員將得到免費(fèi)的后臺(tái)管理、操作平臺(tái)和工具插件軟件等,各成員購(gòu)置各自的存儲(chǔ)設(shè)備,對(duì)于項(xiàng)目的開發(fā)費(fèi)用采用均攤的方式,同時(shí)LOCKSS鼓勵(lì)成員參與到軟件開發(fā)中。Portico則按照年度收取服務(wù)費(fèi),即每個(gè)加入的出版商和圖書館都根據(jù)保存的內(nèi)容每年繳納一定的年費(fèi)。
對(duì)比兩種不同的存儲(chǔ)模式,筆者認(rèn)為,首先要得到出版商的支持,只有最大限度地保護(hù)出版商的利益不受侵害(即以最小的代價(jià)獲得最大的利益),才能調(diào)動(dòng)出版商參與的積極性。因此,LOCKSS吸引大出版商參與、同時(shí)也讓小出版商感興趣的做法無(wú)疑奪得頭籌。其次,LOCKSS保存活動(dòng)中不斷與系統(tǒng)內(nèi)相同內(nèi)容的備份進(jìn)行比對(duì)并不斷修復(fù)的模式與Portico以自審為主的模式相比,保存內(nèi)容的正確性具有更可靠的保證。第三,LOCKSS通過(guò)圖書館直接參與電子資源的保存,將資源以較低的成本保留在本地,使圖書館從真正意義上擁有電子資源。這也比較符合圖書館傳統(tǒng)的“收藏”職能。第四,相對(duì)于Portico每年需要繳納的年費(fèi),LOCKSS由于主要是自身的設(shè)備投入,圖書館更加容易接受。當(dāng)然,Portico也有其優(yōu)勢(shì),如避免重復(fù)性資源存儲(chǔ),節(jié)省人力、物力,符合社會(huì)化分工趨勢(shì)等。
綜上所述,電子資源的長(zhǎng)期保存不僅涉及到介質(zhì)的自然損耗,還涉及到技術(shù)的更新與淘汰、數(shù)據(jù)的更新與遷移等,這些都是絕大多數(shù)個(gè)體圖書館難以承擔(dān)的,而圖書館一般又有長(zhǎng)期保存電子資源的愿望。因此,筆者認(rèn)為我國(guó)的高校、科研院所的圖書館及文獻(xiàn)信息中心應(yīng)該成立一個(gè)全國(guó)性的聯(lián)盟,以類似于LOCKSS的模式,由國(guó)家投入一筆啟動(dòng)經(jīng)費(fèi),由清華大學(xué)、中國(guó)科學(xué)院國(guó)家科學(xué)圖書館、國(guó)家圖書館等牽頭單位組織軟件開發(fā)、升級(jí)、維護(hù),從而組成類似于CALIS(China Academic Library & Information System,中國(guó)高等教育文獻(xiàn)保障系統(tǒng))的核心領(lǐng)導(dǎo)小組,并由其負(fù)責(zé)與出版商的談判和圖書館的組織、協(xié)調(diào)與培訓(xùn)等。各個(gè)圖書館都應(yīng)積極參與自身文獻(xiàn)的長(zhǎng)期保存建設(shè),筆者相信通過(guò)圖書館界同仁的共同努力,一定會(huì)推進(jìn)我國(guó)電子資源長(zhǎng)期保存的進(jìn)程。
[1]全國(guó)圖書館界呼吁建設(shè)國(guó)家數(shù)字文獻(xiàn)資源長(zhǎng)期保存服務(wù)體系[J].現(xiàn)代圖書情報(bào)技術(shù), 2008(11):71.
[2]張 玫, 李 麟, 張曉林, 等.中國(guó)圖書館數(shù)字文獻(xiàn)資源長(zhǎng)期保存現(xiàn)狀調(diào)查[J]. 圖書情報(bào)知識(shí),2009(2):47-51, 59.
[3]LOCKSS.About Us[EB/OL].[2009-08-06].http://www.lockss.org/lockss/About_Us.
[4]LOCKSS.Public VS Private LOCKSS Networks[EB/OL].[2009-08-06]. http://www.lockss.org/lockss/Private_LOCKSS_Networks.
[5]Portico. About Portico[EB/OL].[2009-08-06].http://www.portico.org/about/.
[6]Portico. Participating Publishers [EB/OL].[2009-08-06].http://www.portico.org/about/part_publishers.html.
[7]Portico. Facts & Figures: Portico at a Glance [EB/OL].[2009-08-06].http://www.portico.org/about/participating_libraries.html.
[8]LOCKSS.How It Works[EB/OL].[2009-08-06].http://www.lockss.org/lockss/How_It_Works.
[9]丁艷君, 鄭建程. Portico: 第三方數(shù)字資源長(zhǎng)期保存模式初探[J].圖書情報(bào)工作, 2009(2).
[10]王若琳.LOCKSS——實(shí)現(xiàn)網(wǎng)絡(luò)電子資源的持久保存[J].圖書館雜志, 2007(2):58-60.
[11]黃田青, 陳清文.多備份資源保存: 科技電子期刊長(zhǎng)期保存的新模式[J].出版發(fā)行研究, 2007(7):16-20.
[12]Portico.Annual Archive Support[EB/OL].[2009-08-17]. http://www.portico.org/libraries/aas_payment.html.
[13]Portico.Annual Archive Contribution[EB/OL].[2009-08-17]. http://www.portico.org/publishers/pub_contribution.html.