肖海龍
(遼寧師范大圖書館,遼寧 大連 116029)
數(shù)字圖書館是新興的,涉及互聯(lián)網(wǎng)、多媒體、數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、版權(quán)保護(hù)等諸多技術(shù)應(yīng)用領(lǐng)域的建設(shè)。一個(gè)理想的數(shù)字圖書館系統(tǒng),從內(nèi)部看,要很好地實(shí)現(xiàn)內(nèi)部管理人員對(duì)信息加工、處理、存儲(chǔ)、提供檢索等一系列功能;從外部看,要最好地滿足外部終端用戶對(duì)信息獲取的需求。綜合國內(nèi)外數(shù)字圖書館建設(shè)的要求,筆者所設(shè)想的數(shù)字圖書館系統(tǒng)包括5個(gè)基本子系統(tǒng):數(shù)字化內(nèi)容采編創(chuàng)建系統(tǒng)、數(shù)字化內(nèi)容存儲(chǔ)與管理系統(tǒng)、數(shù)字化內(nèi)容發(fā)布與檢索系統(tǒng)、數(shù)字圖書館用戶管理系統(tǒng)、數(shù)字版權(quán)保護(hù)與電子商務(wù)系統(tǒng),這些系統(tǒng)分別滿足了信息資源的數(shù)字化采編整序與元數(shù)據(jù)提取標(biāo)引、數(shù)字化信息的存儲(chǔ)與管理、信息發(fā)布檢索與增值服務(wù)、數(shù)字圖書館的用戶管理、數(shù)字版權(quán)保護(hù)和系統(tǒng)安全分發(fā)這5個(gè)層次的需求。
該多層次數(shù)字圖書館系統(tǒng)設(shè)計(jì)開發(fā)過程中應(yīng)遵循如下幾個(gè)原則:
2.1 先進(jìn)性。系統(tǒng)在體系結(jié)構(gòu)、功能、性能等方面要具有業(yè)界先進(jìn)水平,反映相關(guān)技術(shù)領(lǐng)域的當(dāng)前發(fā)展水平,同時(shí)要具有前瞻性,為后續(xù)開發(fā)打下良好基礎(chǔ)。
2.2 開放性。在知識(shí)資源描述、存儲(chǔ)管理、資源調(diào)度、資源服務(wù)等方面盡可能采用相關(guān)的國際標(biāo)準(zhǔn),系統(tǒng)設(shè)計(jì)應(yīng)具有較優(yōu)的開放能力與良好的互操作能力。
2.3 敏捷性。系統(tǒng)可以方便地裁剪與擴(kuò)展,滿足系統(tǒng)長(zhǎng)期持續(xù)發(fā)展的要求。
2.4 安全性。系統(tǒng)應(yīng)充分重視數(shù)據(jù)安全性要求。
2.5 自主知識(shí)產(chǎn)權(quán)。立足自主,形成自由知識(shí)產(chǎn)權(quán)系統(tǒng),但不排除采用國際先進(jìn)技術(shù)。
3.1 數(shù)字化內(nèi)容采編創(chuàng)建系統(tǒng)
數(shù)字圖書館內(nèi)容的創(chuàng)建和獲取是資源的采集和數(shù)字化,是數(shù)字圖書館資源建設(shè)的一項(xiàng)最基礎(chǔ)的工作。數(shù)字化內(nèi)容采編創(chuàng)建系統(tǒng)的功能需求:要實(shí)現(xiàn)對(duì)文本、圖像、音頻和視頻等信息及知識(shí)的數(shù)字化采編、加工、處理。實(shí)現(xiàn)對(duì)各種信息資源的一次加工、多次使用,適應(yīng)應(yīng)用系統(tǒng)今后的擴(kuò)展需要。
數(shù)字化內(nèi)容采編創(chuàng)建系統(tǒng)應(yīng)根據(jù)圖書館業(yè)務(wù)運(yùn)作的實(shí)際需要,提供一整套靈活多樣的資源數(shù)字化手段,主要包括:數(shù)據(jù)錄入與接收,即用計(jì)算機(jī)輸入文字的方法采集和接收各種新聞報(bào)道、辦公文書、會(huì)議錄、報(bào)紙印刷、書刊出版等電子排版信息,經(jīng)剪裁、加工、整合后形成電子文獻(xiàn)資源庫。圖像掃描采用光學(xué)掃描儀、數(shù)碼相機(jī)等,將現(xiàn)有的紙質(zhì)文獻(xiàn)進(jìn)行掃描后存儲(chǔ),對(duì)已取得版權(quán)許可的館藏文獻(xiàn)進(jìn)行數(shù)字化時(shí),即采取此種方法建庫。光學(xué)字符識(shí)別,即利用計(jì)算機(jī)設(shè)備和軟件技術(shù)把掃描文本轉(zhuǎn)換成字符型文件進(jìn)行存儲(chǔ)。視、音頻捕捉,即通過聲卡、幀捕獲器或影視影像數(shù)字卡將模擬的音頻、視頻材料轉(zhuǎn)換成數(shù)字方式存儲(chǔ),形成電子文檔。網(wǎng)上下載,根據(jù)需要擬定文獻(xiàn)收集范圍,從網(wǎng)上下載沒有版權(quán)爭(zhēng)議的數(shù)據(jù)資源,再按專題進(jìn)行整理、分類、歸檔、數(shù)據(jù)轉(zhuǎn)換和裝庫。建立門戶網(wǎng)站,跟蹤和搜集相關(guān)網(wǎng)站內(nèi)容,加以分門別類,予以鏈接,并建立網(wǎng)上搜索引擎。
數(shù)字化內(nèi)容采編創(chuàng)建系統(tǒng)過程中還要考慮到異構(gòu)資源庫的整合。在數(shù)字圖書館建設(shè)前期,各文獻(xiàn)擁有單位已經(jīng)建設(shè)一批高質(zhì)量的數(shù)據(jù)庫,把這些數(shù)據(jù)庫整合到數(shù)字圖書館系統(tǒng)中,將極大地豐富數(shù)字圖書館的內(nèi)容。數(shù)字圖書館異構(gòu)資源的整合模式可以分為基于數(shù)據(jù)源的整合和基于系統(tǒng)的整合,具體可以采用XML封裝技術(shù)對(duì)現(xiàn)有數(shù)據(jù)庫統(tǒng)一進(jìn)行封裝,將其與數(shù)字圖書館系統(tǒng)連接,使這些數(shù)據(jù)庫作為數(shù)字圖書館的資源得到有效利用。
3.2 數(shù)字化內(nèi)容存儲(chǔ)與管理系統(tǒng)
一個(gè)完整的數(shù)字圖書館系統(tǒng)應(yīng)包括通訊體系、應(yīng)用體系和多媒體數(shù)據(jù)庫體系等,數(shù)字圖書館要求系統(tǒng)支持并行機(jī)制,以加速系統(tǒng)運(yùn)行,支持可擴(kuò)展的海量數(shù)據(jù)資源存儲(chǔ),支持海量資源快速搜索和調(diào)度。在支撐整個(gè)體系的硬件平臺(tái)中,存儲(chǔ)系統(tǒng)是最為核心的部分,它必須能夠滿足不斷增長(zhǎng)的海量存儲(chǔ)空間的需求,提供高速的數(shù)據(jù)傳輸能力和對(duì)于復(fù)雜的異構(gòu)數(shù)據(jù)存儲(chǔ)環(huán)境的管理、備份等能力。
數(shù)字化內(nèi)容存儲(chǔ)系統(tǒng)功能需要:①海量存儲(chǔ)。海量的電子圖書資源和多媒體資源是數(shù)字圖書館存儲(chǔ)的主要內(nèi)容。而這些數(shù)據(jù)每年都在增長(zhǎng),所以必須擁有一套或多套大容量的存儲(chǔ)系統(tǒng)來滿足海量存儲(chǔ)的要求。這不僅要求存儲(chǔ)系統(tǒng)具有超大容量,而且要求硬件具有可靠性。②傳輸速度快。數(shù)字圖書館為讀者提供了豐富的電子信息資源服務(wù),但由于讀者訪問量多,相對(duì)數(shù)據(jù)流量大,所以對(duì)整個(gè)系統(tǒng)的網(wǎng)絡(luò)傳輸性能有著較高的要求。③數(shù)據(jù)備份功能。數(shù)字圖書館數(shù)據(jù)量巨大,且有些數(shù)據(jù)如書目數(shù)據(jù)十分重要,因而數(shù)據(jù)備份功能是保證系統(tǒng)安全運(yùn)行的前提。
數(shù)字化內(nèi)容存儲(chǔ)與管理系統(tǒng)設(shè)計(jì)的要求:①安全性。存儲(chǔ)管理系統(tǒng)必須保證數(shù)據(jù)的安全,防止任何情況下的數(shù)據(jù)丟失。對(duì)數(shù)字圖書館而言,數(shù)據(jù)的丟失等于是傳統(tǒng)圖書館書籍的丟失,代價(jià)非常大。所以,數(shù)字圖書館的存儲(chǔ)系統(tǒng)必須具有快速備份及恢復(fù)能力。存儲(chǔ)系統(tǒng)不只是磁盤陣列,而是完整的高可用性存儲(chǔ)架構(gòu)。②擴(kuò)充性。數(shù)字圖書館電子信息資源每年都在增長(zhǎng),這就要求系統(tǒng)必須具有良好的擴(kuò)充性,在需要時(shí)可方便地增加存儲(chǔ)設(shè)備。③穩(wěn)定性。圖書館數(shù)據(jù)穩(wěn)定性是非常重要的,因而存儲(chǔ)系統(tǒng)應(yīng)具備冗余配置,減少單點(diǎn)故障,從而能夠支持圖書館所有應(yīng)用服務(wù)器全天候服務(wù)。④實(shí)用性。能使用可靠、便捷、功能強(qiáng)大的管理軟件,實(shí)現(xiàn)自動(dòng)化數(shù)據(jù)存儲(chǔ),減少對(duì)人工干預(yù)的依賴。
目前圖書館普遍采用DAS(直接連接存儲(chǔ))和NAS(網(wǎng)絡(luò)附加存儲(chǔ))存儲(chǔ)結(jié)構(gòu),但無論是DAS還是NAS的存儲(chǔ)結(jié)構(gòu),由于其維護(hù)、擴(kuò)充費(fèi)用高,可靠性低,存取速度慢,系統(tǒng)備份、恢復(fù)難,給數(shù)字圖書館的發(fā)展帶來了越來越多的煩惱。SAN存儲(chǔ)區(qū)域網(wǎng)絡(luò))可以為我們提供可靠性更高、存取速度更快、擴(kuò)展更加方便的數(shù)字化圖書館存儲(chǔ)系統(tǒng)解決方案。
3.3 數(shù)字化內(nèi)容發(fā)布與檢索系統(tǒng)
數(shù)字化內(nèi)容發(fā)布與檢索系統(tǒng)是基于網(wǎng)絡(luò)平臺(tái),為用戶提供圖書、報(bào)刊、資料等各種信息的閱讀、檢索、下載及付費(fèi)功能。數(shù)字化內(nèi)容發(fā)布管理應(yīng)包括如下幾個(gè)部分:通過站點(diǎn)設(shè)計(jì)生成系統(tǒng),完成數(shù)字圖書館整個(gè)站點(diǎn)主頁、頻道欄目、信息資源分類及動(dòng)態(tài)頁面的自動(dòng)生成,并提供預(yù)定義模塊實(shí)現(xiàn)對(duì)數(shù)據(jù)顯示和維護(hù)界面、樣式的自定制能力;采用數(shù)據(jù)庫和模板技術(shù),允許各種數(shù)據(jù)來源及使用多種方式完成信息發(fā)布,所有資源自動(dòng)上傳生成網(wǎng)頁,不需要人工干預(yù),實(shí)現(xiàn)網(wǎng)站內(nèi)容的動(dòng)態(tài)發(fā)布和自動(dòng)及時(shí)更新;基于內(nèi)容采編發(fā)布工作流程,支持多級(jí)審核功能,確保只有通過審核后的信息資源才能對(duì)外發(fā)表,實(shí)現(xiàn)信息資源發(fā)布的審批管理;內(nèi)外網(wǎng)可同時(shí)發(fā)布,支持內(nèi)容的多重定向,可為不同定位的用戶提供及時(shí)、精確、個(gè)性化的動(dòng)態(tài)內(nèi)容。
數(shù)字圖書館檢索系統(tǒng)設(shè)計(jì)要求:檢索點(diǎn)全面、檢索方式多樣。檢索系統(tǒng)應(yīng)該既支持字段限定檢索、布爾邏輯檢索、前方一致檢索、相鄰檢索等多種檢索方式,又支持全文檢索;提供簡(jiǎn)單檢索、高級(jí)檢索、專家檢索和瀏覽4種信息獲取界面;整合不同數(shù)字圖書館的檢索結(jié)果,針對(duì)檢索結(jié)果進(jìn)行后續(xù)處理,如過濾、排序。檢索結(jié)果不僅可聯(lián)機(jī)打印、下載,也可以發(fā)送;檢索結(jié)果提供詳細(xì)書目信息和館藏信息。書目信息中的出版者、責(zé)任者、叢書名、主題詞等自動(dòng)設(shè)為檢索熱點(diǎn),方便讀者進(jìn)行連續(xù)追蹤查找。
3.4 數(shù)字圖書館用戶管理系統(tǒng)
為了確保系統(tǒng)運(yùn)行安全,確保各類知識(shí)資源為各種層次人員高速取用,數(shù)字圖書館需要做好用戶管理。數(shù)字圖書館用戶管理系統(tǒng)應(yīng)該包括:①安全認(rèn)證管理。提供系統(tǒng)級(jí)、數(shù)據(jù)庫級(jí)、記錄級(jí)、字段級(jí)4級(jí)安全控制,可對(duì)系統(tǒng)所有的事件和任務(wù)進(jìn)行有效監(jiān)控,提供運(yùn)行日志、WEB訪問等分析功能;同時(shí)可對(duì)允許訪問和拒絕訪問的INTERNET IP地址進(jìn)行設(shè)置,保證系統(tǒng)信息的合法訪問和免受非法攻擊;門禁系統(tǒng)。②統(tǒng)計(jì)進(jìn)出圖書館人員的計(jì)數(shù)系統(tǒng)。此外還具有用戶身份識(shí)別、工作人員考勤、控制非法使用圖書館等作用。③權(quán)限管理。根據(jù)用戶角色,設(shè)置不同權(quán)限,定義不同的工作流程,確保只有授權(quán)用戶才能訪問相關(guān)資源。④計(jì)費(fèi)管理系統(tǒng)。提供基于管理策略的計(jì)費(fèi)管理機(jī)制,按會(huì)員制或者按流量、按檢索查詢資源數(shù)量等方式計(jì)費(fèi),并能根據(jù)付費(fèi)方式對(duì)用戶進(jìn)行控制。
3.5 版權(quán)保護(hù)與電子商務(wù)系統(tǒng)
保證數(shù)字圖書館能夠持續(xù)有效地發(fā)展,需對(duì)部分資源使用進(jìn)行有償服務(wù),在技術(shù)體系中,需要對(duì)數(shù)字圖書館分布式資源跨單位跨庫服務(wù)模式下的版權(quán)保護(hù)與電子商務(wù)系統(tǒng)給予支持。
數(shù)字版權(quán)保護(hù)系統(tǒng)的設(shè)計(jì)要求:一般的數(shù)字版權(quán)保護(hù)系統(tǒng),包括數(shù)字內(nèi)容擁有者、數(shù)字內(nèi)容授權(quán)中心、數(shù)字內(nèi)容分發(fā)服務(wù)器和授權(quán)用戶4部分。在服務(wù)器端,首先對(duì)數(shù)字內(nèi)容用對(duì)稱密鑰加密算法加密,然后將內(nèi)容密鑰放入用XML描述的內(nèi)容許可證中,在獲取用戶的公鑰后,使用用戶公鑰加密內(nèi)容許可證,最后將加密的數(shù)字內(nèi)容和內(nèi)容許可證傳送給用戶。在用戶端,授權(quán)用戶在獲得加密的數(shù)字內(nèi)容和用自己的公鑰加密的內(nèi)容許可證后,用自己的私鑰對(duì)內(nèi)容許可證進(jìn)行解密,從而獲得內(nèi)容密鑰。有了內(nèi)容密鑰,用戶就可以使用它對(duì)數(shù)字內(nèi)容進(jìn)行解密觀看。版權(quán)保護(hù)的核心是數(shù)字內(nèi)容授權(quán)中心,它采用密碼學(xué)技術(shù),經(jīng)過加密、授權(quán)和認(rèn)證3個(gè)階段來獲得對(duì)數(shù)字內(nèi)容版權(quán)的保護(hù)。
數(shù)字內(nèi)容版權(quán)保護(hù)的主要措施:軟件和數(shù)據(jù)加密技術(shù)、水印加載技術(shù)、數(shù)字簽名技術(shù)、數(shù)據(jù)保密和數(shù)據(jù)完整性、CA認(rèn)證技術(shù)、入侵檢測(cè)技術(shù)等。
數(shù)字圖書館電子商務(wù)模式可以分為B2B和B2C兩種模式。B2B電子商務(wù)模式主要體現(xiàn)在:①印刷型圖書采購。在電子商務(wù)采購平臺(tái)的支持下,采購人員可以直接在網(wǎng)上瀏覽書商發(fā)布的各種征訂目錄,并且可以將標(biāo)準(zhǔn)格式的采購數(shù)據(jù)如MARC格式下載到本地采購數(shù)據(jù)庫中,然后根據(jù)本館情況和需要進(jìn)行篩選,通過WEB頁填寫訂單,上傳給書商。②在線銷售,這里的在線銷售既指數(shù)字圖書館通過網(wǎng)絡(luò)向出版商、書店及發(fā)行機(jī)構(gòu)出售本館印刷型或電子出版物的出版權(quán)或發(fā)行權(quán),也指數(shù)字圖書館通過網(wǎng)絡(luò)向其他數(shù)字圖書館和信息機(jī)構(gòu)出售或出租本館電子出版物、自建數(shù)據(jù)庫的鏡像權(quán)、使用權(quán)和復(fù)制權(quán)等,當(dāng)然也包括向個(gè)別用戶提供的書籍、音像制品、電子雜志、聯(lián)機(jī)出版物的在線銷售和訂閱。③在線訂購,與在線銷售相對(duì)應(yīng),在線訂購指數(shù)字圖書館通過網(wǎng)絡(luò)向出版商和發(fā)行機(jī)構(gòu)購買的電子出版物、電子報(bào)刊,向其他數(shù)字圖書館和信息機(jī)構(gòu)購買或租用的電子出版物、光盤數(shù)據(jù)庫及數(shù)字化館藏的鏡像權(quán)和使用權(quán)。B2C電子商務(wù)模式具體體現(xiàn)在辦理借閱卡、付費(fèi)瀏覽和提供信息服務(wù)方面。
網(wǎng)絡(luò)技術(shù)日新月異的發(fā)展給數(shù)字圖書館帶來機(jī)遇的同時(shí),也帶來嚴(yán)峻挑戰(zhàn)。筆者所構(gòu)建的數(shù)字圖書館系統(tǒng)從內(nèi)外兩方面出發(fā),充分考慮其先進(jìn)性、開放性、敏捷性、安全性以及自主知識(shí)產(chǎn)權(quán),從而能更好地迎接這種新形勢(shì)下的挑戰(zhàn)。
[1]夏立新.數(shù)字圖書館導(dǎo)論.武漢:湖北人民出版社,2004.
[2]李培.數(shù)字圖書館原理及應(yīng)用.北京:高等教育出版社,2004.
[3]黃如花.數(shù)字圖書館原理與技術(shù).武漢:武漢大學(xué)出版社,2005.
[4]李爽.數(shù)字圖書館的體系結(jié)構(gòu)的設(shè)計(jì)原則與系統(tǒng)構(gòu)成.圖書情報(bào)知識(shí),2004(2).
[5]雷濤.利用SAN技術(shù)構(gòu)建數(shù)字圖書館存儲(chǔ)系統(tǒng).麗水學(xué)院學(xué)報(bào),2008(2).
[6]蔡偉鴻,彭思喜,胡斯捷.基于版權(quán)保護(hù)的數(shù)字內(nèi)容安全交易系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).計(jì)算機(jī)工程與設(shè)計(jì),2005(9).
[7]何雄.數(shù)字圖書館實(shí)現(xiàn)電子商務(wù)模式研究.圖書館學(xué)研究,2004(8).