戴建新
(廣東培正學院 圖書館,廣東 廣州 510830)
民辦高校特色文獻資源數(shù)據(jù)庫建設探討
——以基于DIPS平臺建設民辦高等教育特色資源數(shù)據(jù)庫為例
戴建新
(廣東培正學院 圖書館,廣東 廣州 510830)
特色資源數(shù)據(jù)庫便捷地實現(xiàn)了學科資源集中化,有利于提高信息資源的獲取效率,推動高校教學和科研的發(fā)展。以基于DIPS平臺建設民辦高等教育特色資源數(shù)據(jù)庫為例,探討和總結(jié)如何建設特色文獻資源數(shù)據(jù)庫,對民辦高校特色資源數(shù)據(jù)庫建設具有重要借鑒作用。
民辦高校;特色數(shù)據(jù)庫;數(shù)據(jù)庫建設;數(shù)字資源
中國民辦高等教育事業(yè)飛速發(fā)展,以民辦高等教育為主題的各種類型的數(shù)字化文獻資源不斷增加,形成數(shù)字資源的多樣化。一方面,結(jié)構(gòu)不同,來源不同,提供方式不同的各類數(shù)字化文獻資源給數(shù)字資源的使用、資源的整合、統(tǒng)一管理和訪問服務帶來諸多困難;另一方面,民辦高校普遍存在經(jīng)費緊缺問題,無力購買大量的數(shù)字化資源。因此,如何將多樣化的異構(gòu)資源整合成一個有機的整體,建立民辦高等教育特色文獻數(shù)據(jù)庫,解決民辦高等教育研究日益突出的信息孤島現(xiàn)象,為民辦高等教育研究提供良好的信息服務,推進民辦高等教育事業(yè)的發(fā)展具有重要的實用價值。
建立民辦高等教育特色數(shù)據(jù)庫的目標是充分開發(fā)和整合館藏資源和網(wǎng)絡信息資源,全面收錄國內(nèi)外民辦高等教育紙質(zhì)版、電子版、聲像版、圖片、網(wǎng)絡版等各類數(shù)字化資源,使文獻信息資源數(shù)字化和網(wǎng)絡化,為研究人員提供全面、系統(tǒng)、高質(zhì)量的文獻資源和便捷高效的獲取途徑。數(shù)據(jù)庫建設采用元數(shù)據(jù)收割協(xié)議,方便用戶收割元數(shù)據(jù),有利于文獻資源共享。
圍繞民辦高等教育研究的實際應用需求,把應用、開發(fā)和研究三者緊密結(jié)合。重視原始信息的利用和管理,加強信息資源的重組導航和集成整合,通過現(xiàn)代信息技術(shù),使數(shù)據(jù)庫建設的局部建設與整體規(guī)劃有機結(jié)合,更好地發(fā)揮規(guī)模效益和整體優(yōu)勢的建設原則,具體實施體現(xiàn)在以下幾個方面。
1.先進性。先進性不僅是效率的保證,更是長期投資的保障。首先要內(nèi)容新穎、功能突出。數(shù)據(jù)庫內(nèi)容能夠滿足特定信息需求,豐富多樣、覆蓋面廣,并有一定深度,足以反映學科前沿、水平和熱點。信息數(shù)據(jù)可檢索性強,能適應脫機、聯(lián)機和網(wǎng)絡檢索,直接獲取一次文獻。其次要技術(shù)先進。采用先進的國際元數(shù)據(jù)標準和XML技術(shù),對數(shù)字資源進行收集、加工、整理,達到統(tǒng)一規(guī)劃與管理。支持對文獻資源、光盤資源、音視頻、各種數(shù)據(jù)庫資源的加工、管理及利用,從多角度、全面揭示資源。對有價值的圖像、文本、語音、影像、影視、軟件和科學數(shù)據(jù)等多媒體信息進行搜集,組織規(guī)范性的加工,進行高質(zhì)量保存和管理。
2.開放性。開放性是資源共建共享的基礎和首要條件。它既要保證資源的共享,得到授權(quán)的用戶在任何時間任何地點通過網(wǎng)絡都可得到各種服務,又要保證資源的統(tǒng)一,各個資源建設單位必須服從整體協(xié)議。
3.安全性。通過對數(shù)字資源訪問權(quán)限管理,用戶訪問權(quán)限設置,網(wǎng)絡訪問地址限制,加工、管理權(quán)限設置,從而確保內(nèi)部數(shù)據(jù)的安全性和保密性。
4.標準化。數(shù)據(jù)庫的建設應遵循相應的國際、國內(nèi)業(yè)界標準,如Calis的標準。采用標準的元數(shù)據(jù)標準、中文核心元數(shù)據(jù)標準和MARC數(shù)據(jù)格式,符合中國信息資源建設的規(guī)范與標準,使資源大范圍地共建共享成為可能。
5.兼容性。不但能與已有的數(shù)據(jù)庫系統(tǒng)兼容,具備強大的擴充性和升級能力,而且能實現(xiàn)跨庫檢索,跨網(wǎng)站檢索。
6.開放接口。提供具有開放性的接口,具備擴展性和可移植性??梢苑奖愕馗鶕?jù)項目具體需求進行二次開發(fā),滿足個性化的需求,或?qū)崿F(xiàn)應用集成和相互操作。
1.數(shù)據(jù)庫系統(tǒng)開發(fā)平臺和硬件系統(tǒng)的確定。
特色數(shù)據(jù)庫的建設過程是通過軟硬件平臺實現(xiàn)的,其中軟件平臺一般指的是各種數(shù)據(jù)資源平臺。常見的數(shù)據(jù)資源平臺有清華同方的TPI系統(tǒng)、北大方正的德賽(DESi)系統(tǒng)、北京拓爾思的TRS平臺、中國數(shù)圖公司的DIPS系統(tǒng)等。這些系統(tǒng)雖然均可以完成數(shù)據(jù)加工、管理、發(fā)布等工作,但又具有各自的特色功能。我院數(shù)據(jù)庫建設系統(tǒng)平臺選用“DIPS高校特色資源庫建設與發(fā)布系統(tǒng)”。DIPS系統(tǒng)是一套以全文檢索技術(shù)為基礎,互聯(lián)網(wǎng)內(nèi)容管理為核心,集資源數(shù)字化加工、數(shù)字內(nèi)容管理、信息情報發(fā)布檢索利用于一體的互聯(lián)網(wǎng)內(nèi)容建設基礎平臺軟件。它能夠滿足大容量數(shù)據(jù)及多并發(fā)用戶的要求,是新一代集文檔影像的數(shù)字化加工、存儲和全文檢索的信息管理支撐平臺。使用DIPS及其相應的輔助工具,可以將圖書館及文獻機構(gòu)中已有的各種海量信息資源,快速構(gòu)建起基于互聯(lián)網(wǎng)的信息資源庫,并對這些資源進行統(tǒng)一管理和維護。利用DIPS提供的強大的全文檢索技術(shù),為使用者提供簡便、快捷、準確的信息服務。同時,可以利用DIPS提供的收費管理功能,向社會提供有償?shù)奶厣畔⒎?,讓信息資源發(fā)揮更大的應用價值。
數(shù)據(jù)庫硬件系統(tǒng)由服務端和客戶端兩部分組成,服務端由一臺服務器、一臺磁盤陣列和幾臺管理錄入計算機組成。服務器用于數(shù)據(jù)庫的索引庫和全文數(shù)據(jù)庫,并負責數(shù)據(jù)的管理和發(fā)布, 提供按照字段查詢和全文檢索服務,并提供Web 服務和資源共享服務。磁盤陣列主要存放論文、電子圖書、圖片、視頻等數(shù)字資源。管理錄入計算機用于收集、加工數(shù)據(jù)和數(shù)據(jù)入庫,如數(shù)字化處理、標引分類和相關管理。
服務器配置要求為:P4以上CPU,內(nèi)存不少于512MB,一個可用空間足夠大的獨立硬盤或分區(qū)。操作系統(tǒng)可使用的對換空間最好在100MB以上,局域網(wǎng)連接設備。DIPS系統(tǒng)的軟件運行環(huán)境要求并不高,當前主流的服務器以及計算機足以符合要求。通過對初期計劃的資源存儲情況調(diào)查,結(jié)合未來數(shù)據(jù)擴充的需要,選擇了HP ProLiant DL388 G7服務器和HP MSA 2012磁盤陣列,MSA 2012放置有12個1TB的HP SATA硬盤,為確保數(shù)據(jù)安全,建立了RAID6陣列。
在局域網(wǎng)上,通過安裝PDF 文檔閱讀工具、DIPS 文檔閱讀工具和其它多媒體播放器工具等, 可以對數(shù)據(jù)庫的所有數(shù)據(jù)進行瀏覽檢索。
2.數(shù)據(jù)庫系統(tǒng)設計及實現(xiàn)。
(1)確定子庫及字段。按照Calis數(shù)據(jù)庫的建庫標準和“民辦高等教育文獻資料數(shù)據(jù)庫”的結(jié)構(gòu)模塊,創(chuàng)建了14個子庫,包括民校概況、民校圖庫、辦學規(guī)模、專業(yè)概況、專家學者、期刊論文、學位論文、圖書著作、國外政策法規(guī)、國內(nèi)政策法規(guī)、師資力量、招生就業(yè)、科研成果、文獻保障。再根據(jù)每個子庫的特點定義各庫的字段,從而完成數(shù)據(jù)庫字段的設定工作。
(2)獲取和收集數(shù)據(jù)。數(shù)據(jù)的收集是數(shù)據(jù)庫建設過程中十分重要的環(huán)節(jié)。為了保證收集信息的權(quán)威性和完整性,特別要注意以下幾方面:① 確定合理的收集范圍,包括時限范圍、文種范圍、地域范圍、學科范圍等。② 確定信息源的種類,包括期刊、圖書、專利文獻、學位論文、論文集、報告及網(wǎng)絡信息等;③ 確定收錄信息的形式,包括文字、圖片、表格、音樂、動畫及其它多媒體信息。④ 確定獲取信息的途徑。紙質(zhì)文獻獲取資料的途徑包括:期刊目錄、綜合性書目、著作目錄、民辦高等教育研究論文索引、論文集、資料匯編、學報和一些綜合性普通教育期刊常設的高等教育專欄或固定欄目。電子文獻獲取途徑包括:本館已購買的電子數(shù)據(jù)庫、互聯(lián)網(wǎng)上主要民辦教育文獻信息源的網(wǎng)址、利用搜索引擎進行信息檢索、利用專門教育文獻數(shù)據(jù)庫檢索、登錄各民辦高校網(wǎng)站及其圖書館網(wǎng)站等。
(3)數(shù)據(jù)加工及入庫。DIPS系統(tǒng)數(shù)據(jù)加工子系統(tǒng)采用C/S結(jié)構(gòu),一個或多個客戶端用戶能夠獨立或協(xié)同完成紙質(zhì)資源的數(shù)字化加工。為了避免數(shù)據(jù)加工混亂,按照模塊進行任務分配,即每個人員負責一個或幾個模塊,完成對象數(shù)據(jù)加工和元數(shù)據(jù)加工,對各種已有的電子資源(如:PDF、DOC、HTML等格式化文本,TXT純文本,MARC數(shù)據(jù),ODBC關系型數(shù)據(jù),MP3、MPG、WMA、WMV、SWF、RM等多媒體數(shù)據(jù),JPEG、BMP、TIF等圖像數(shù)據(jù),各種資料光盤數(shù)據(jù)及其它自定義格式等)進行批量處理、轉(zhuǎn)換和導入等獲取系統(tǒng)原始數(shù)據(jù),再經(jīng)過數(shù)據(jù)審核、裝訂、校對、標引等深加工處理,形成數(shù)據(jù)庫的入庫文件,最后形成數(shù)據(jù)庫的源數(shù)據(jù)。數(shù)據(jù)入庫時采用“SQL轉(zhuǎn)Dips批量裝訂工具”,將加工好的數(shù)據(jù)批量入庫。
(4)數(shù)據(jù)庫網(wǎng)頁設計與資源發(fā)布。DIPS網(wǎng)絡發(fā)布與管理子系統(tǒng)采用B/S結(jié)構(gòu),通過標準IE瀏覽,完成DIPS數(shù)據(jù)庫的網(wǎng)上發(fā)布、檢索和應用服務。網(wǎng)絡發(fā)布與管理系統(tǒng)遵循相關國內(nèi)外標準、CALIS標準規(guī)范。如:XML語言編寫發(fā)布界面、CALIS特色庫本地網(wǎng)站基本服務規(guī)范、網(wǎng)站功能元素服務規(guī)范等。網(wǎng)頁提供包括欄目檢索、全文檢索、二次檢索和跨庫檢索等多種多樣的檢索方法,滿足訪問者“快而準”查找所需信息和資源的要求,方便用戶操作。
1.數(shù)據(jù)庫的質(zhì)量。在數(shù)據(jù)庫的建設過程中必須嚴把質(zhì)量關,要及時修正錯誤數(shù)據(jù),確保數(shù)據(jù)的準確性、完整性和權(quán)威性。標準化是數(shù)據(jù)庫建設的生命,是建設高質(zhì)量特色數(shù)據(jù)庫的根本保證。數(shù)據(jù)庫建設應遵循相應的國際、國內(nèi)業(yè)界標準。它不僅保證了數(shù)據(jù)庫的可靠性、系統(tǒng)性、連續(xù)性、完整性和兼容性,而且有利于實現(xiàn)真正意義上的網(wǎng)絡信息資源共享。
2.系統(tǒng)更新和維護。數(shù)據(jù)庫的內(nèi)容是動態(tài)的,數(shù)據(jù)要及時更新,保持數(shù)據(jù)的新穎性和有效性。由于應用環(huán)境的不斷變化,數(shù)據(jù)庫運行過程中物理存儲會不斷變化。因此,對數(shù)據(jù)庫進行評價、調(diào)整、修改等維護工作是一個長期的任務,要保證和提高數(shù)據(jù)庫系統(tǒng)運行的可靠性、安全性、協(xié)調(diào)性和運行效率。
3.尊重知識產(chǎn)權(quán)。在收集資料時應嚴格遵守有關法律法規(guī),充分尊重并保護原作者的相關權(quán)利, 高度重視知識產(chǎn)權(quán),在法律及協(xié)議許可范圍內(nèi)使用相關資源。
4.人才隊伍建設。高素質(zhì)人才隊伍是建設特色數(shù)據(jù)庫的核心和關鍵。特色數(shù)據(jù)庫建設不僅需要圖書館專業(yè)人才,也需要計算機專業(yè)人才,以及與數(shù)據(jù)庫學科相關的專業(yè)技術(shù)人才。因此,要想建設高水平的特色數(shù)據(jù)庫,必須有一支專業(yè)配置合理的人才隊伍。
[1]趙永強,曹歡增,馮軍.高校圖書館特色數(shù)據(jù)庫建設流程的研究——以基于DESi平臺的制鹽特色數(shù)據(jù)庫為例[J].電腦知識與技術(shù),2011(3):1477-1480.
[2]陳曉.基于DIPS 的高校圖書館特色數(shù)據(jù)庫建設[J].情報探索,2008(7):50-51.
[3]代根興,吳旭.高等教育教學成果相關文獻數(shù)據(jù)庫建設研究[J].情報科學,2003(11):1201-1203.
[4]李三鳳.論高校圖書館特色數(shù)據(jù)庫的建設[J].科技情報開發(fā)與經(jīng)濟,2005(5):41.
ClassNo.:G250.73DocumentMark:A
(責任編輯:鄭英玲)
DiscussionofConstructionofLiteratureResourcesDatabasewithCharacteristicinPrivateUniversities
Dai Jianxin
The construction of resource database with characteristic materialized the centralization of disciplinary resources, and improve the efficiency to obtain the information resources ,it also promote the development of college teaching and scientific research. Based on DIPS private higher education platform, this paper discusses how to construct the literature resources database with the characteristics, which is used for reference for the construction of the resource database with characteristic.
private universities;database with characteristics;database construction;digitalized resources
戴建新,助理工程師,廣東培正學院圖書館。
1672-6758(2012)11-0155-2
G250.73
A