熊煒
[摘 要]數(shù)字資源的創(chuàng)建、加工和應(yīng)用是一項艱巨、復(fù)雜并極具挑戰(zhàn)性的工作,其原因在于數(shù)字資源本身以及應(yīng)用環(huán)境與需求的多樣性。CADAL項目為全世界用戶提供服務(wù),促進了中外文化交流,也為學(xué)術(shù)研究者提供了一個權(quán)威的信息檢索平臺。從其官方網(wǎng)站可以看出,至今已有10年之久的CADAL項目,數(shù)字資源得到了不斷豐富和發(fā)展,內(nèi)容和服務(wù)也日臻完善。同時,中國、美國和印度等國家的參建單位將具有重大參考價值的數(shù)字化資源存放在該網(wǎng)站上,也給全世界進一步了解中國悠久歷史的機會。
[關(guān)鍵詞]CADAL 數(shù)字化加工 標(biāo)準(zhǔn)規(guī)范
[中圖分類號] G250.76 [文獻標(biāo)識碼] A [文章編號] 2095-3437(2015)03-0165-02
一、CADAL項目簡介
大學(xué)數(shù)字圖書館國際合作計劃(CADAL:China Academic Digital Associative Library)前身為高等學(xué)校中英文圖書數(shù)字化國際合作計劃(CADAL:China America Digital Academic Library)[1],與中國高等教育文獻保障系統(tǒng)(CALIS:China Academic Library & Information System)一起,共同構(gòu)成中國高等教育數(shù)字化圖書館的框架。[2]CADAL項目為國家重點建設(shè)項目,由浙江大學(xué)聯(lián)合清華大學(xué)、北京大學(xué)、武漢大學(xué)、華中科技大學(xué)等60余所國內(nèi)知名高校,美國互聯(lián)網(wǎng)檔案館,卡內(nèi)基·梅隆大學(xué),伊利諾伊大學(xué),哈佛燕京學(xué)社,哥倫比亞大學(xué)以及印度科學(xué)院,安那大學(xué),阿魯密工程學(xué)院等20余所國外著名學(xué)府或科研機構(gòu)共同承擔(dān)。
該項目從2003年開始啟動,經(jīng)過一期和二期建設(shè),截止2014年2月底,累計入庫數(shù)據(jù)超過274萬冊,其中,中文現(xiàn)代圖書近60萬冊,英文圖書超55萬冊,中文古籍25.6萬冊、民國書刊43.6萬冊。[3]項目建設(shè)的總體目標(biāo)是:構(gòu)建擁有多學(xué)科、多類型、多語種海量數(shù)字資源,由國內(nèi)外圖書館、學(xué)術(shù)組織、學(xué)科專業(yè)人員廣泛參與建設(shè)與服務(wù),具有高技術(shù)水平的學(xué)術(shù)數(shù)字圖書館,成為國家創(chuàng)新體系信息基礎(chǔ)設(shè)施之一。[1]
二、數(shù)字化加工流程與標(biāo)準(zhǔn)規(guī)范
數(shù)字資源建設(shè)是數(shù)字圖書館的一項核心工作,而數(shù)字資源標(biāo)準(zhǔn)化加工流程又是數(shù)字資源建設(shè)的基礎(chǔ),因此,統(tǒng)一數(shù)字資源的加工流程與標(biāo)準(zhǔn)規(guī)范將有效推動和保障數(shù)字圖書館建設(shè)的順利推進。[4]然而,數(shù)字資源的創(chuàng)建、加工和應(yīng)用是一項艱巨、復(fù)雜并極具挑戰(zhàn)性的工作,其原因在于數(shù)字資源本身以及應(yīng)用環(huán)境與需求的多樣性。限于篇幅的考慮,本文僅介紹筆參與武漢大學(xué)圖書館CADAL項目二期建設(shè)期間,中、英文現(xiàn)代圖書和民國圖書的數(shù)字化加工流程及標(biāo)準(zhǔn)規(guī)范。
首先,武漢大學(xué)圖書館向CADAL項目管理中心提交數(shù)字資源參建申請,由CADAL項目組進行評估,并從申報資源中選擇CADAL項目所需的資源類型,待資源查重、審核通過后方可進行數(shù)字化加工制作。然后,合作單位按照如圖1所示的加工流程對其進行數(shù)字化加工。數(shù)字圖書資源加工可大致分為5個步驟:①紙質(zhì)圖書通過掃描儀或數(shù)碼相機獲取黑白、灰度或彩色圖像;②圖像處理環(huán)節(jié),主要包括頁面旋轉(zhuǎn)、版面切割、文字糾偏、內(nèi)容居中、圖像去污等一系列操作;③以單本圖書為著錄單位,保持其目錄章節(jié)結(jié)構(gòu)及層次在排版上基本與原圖書一致,主要包括圖書目錄的OCR識別及內(nèi)容導(dǎo)向鏈接;④以單本圖書為著錄單位,參照《元數(shù)據(jù)著錄規(guī)范》[5]進行圖書元數(shù)據(jù)編輯;⑤將圖書頁面數(shù)據(jù)、目錄數(shù)據(jù)、元數(shù)據(jù)對象按照指定格式封裝,并進行數(shù)據(jù)質(zhì)檢,確保無誤后提交給CADAL項目管理中心。圖書數(shù)字化加工的標(biāo)準(zhǔn)規(guī)范如表1所示。
三、結(jié)束語
CADAL項目為全世界用戶提供服務(wù),促進了中外文化交流,也為學(xué)術(shù)研究者提供了一個權(quán)威的信息檢索平臺。從其官方網(wǎng)站可以看出,至今已有10年之久的CADAL項目,數(shù)字資源得到了不斷豐富和發(fā)展,內(nèi)容和服務(wù)也日臻完善。同時,中國、美國和印度等國家的參建單位將具有重大參考價值的數(shù)字化資源存放在該網(wǎng)站上,也給全世界進一步了解中國悠久歷史的機會。
[ 注 釋 ]
[1] CADAL項目簡介[EB/OL].http://www.cadal.cn / xmjj / [2014-05-19].
[2] 馬選利,魏青山.CADAL項目在西安交通大學(xué)數(shù)字圖書館建設(shè)中應(yīng)用實踐[J].晉圖學(xué)刊,2013(6):22-24.
[3] CADAL資源介紹[EB / OL].http://www.cadal.cn / xmjj / zyjs.htm[2014-06-06].
[4] 劉聰明,姜愛蓉.CADAL項目資源數(shù)字化對比研究——以清華大學(xué)圖書館為例[J].內(nèi)蒙古師范大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2012(6):125-128.
[5] CADAL項目管理中心.CADAL數(shù)字化文本:元數(shù)據(jù)著錄細(xì)則(第2版)[S / OL],http://www.cadal.cn / softdown / CADAL_metadata_2004.pdf[2012-02-05].
[責(zé)任編輯:鐘 嵐]