李 征 (蘭州理工大學圖書館 甘肅 蘭州 730050)
隨著圖書館資源建設的不斷發(fā)展、各種載體館藏書目數(shù)據(jù)庫建設的逐步完成及中外文大型數(shù)據(jù)庫的大量購入,館藏結(jié)構(gòu)向紙質(zhì)文獻與數(shù)字信息共存的形態(tài)轉(zhuǎn)變。但筆者看到,大量的傳統(tǒng)館藏資源和購入的數(shù)據(jù)庫之間毫無關(guān)聯(lián),給讀者使用資源帶來不便。讀者需要的是通過一個統(tǒng)一的界面,一次性檢索便可獲得多種類型文獻數(shù)據(jù)而不遺漏任何載體的館藏信息。而對于讀者來說,OPAC(Online Public Access Catalogue,聯(lián)機公共目錄查詢系統(tǒng))應當是反映圖書館全部館藏、包容各種載體文獻的重要窗口。將數(shù)字化館藏資源納入目錄控制通過OPAC揭示,就必須對館藏數(shù)字化資源進行編目,將其MARC(MAchine-Readable Cataloging,機讀編目格式)記錄加入中央館藏中,并改變數(shù)據(jù)庫中電子文獻游離于館藏目錄控制之外的狀況,使其與印刷型館藏融為一體,而856字段是對圖書館館藏文獻進行數(shù)字化有效揭示的最好方法。目前,有些數(shù)據(jù)庫提供商(如EBSCO)向訂戶提供所購數(shù)據(jù)庫收錄的電子期刊的MARC記錄,并在其MARC記錄中加入856字段以實現(xiàn)館藏書目數(shù)據(jù)庫與所購數(shù)據(jù)庫的鏈接。這可以使圖書館以批處理方式直接將現(xiàn)成的MARC記錄裝入本館的中央書目庫中,通過856字段的指引,在OPAC中直接點擊訪問具體網(wǎng)絡文獻。該技術(shù)是通過Z39.50等協(xié)議作為后臺支持的,因此,這種鏈接的實現(xiàn)沒有技術(shù)上的障礙[1]。國內(nèi)外多數(shù)圖書館使用的自動化系統(tǒng)(如ILAS、匯文圖書館集成管理系統(tǒng)、INNOPAC、Horizon、SIRSI等)均支持Z39.50協(xié)議,以實現(xiàn)圖書館館藏書目數(shù)據(jù)庫與近年來購入的國內(nèi)外各種電子圖書、電子期刊等數(shù)據(jù)庫的鏈接;對本館紙本館藏中沒有的圖書、期刊直接鏈接電子資源;對紙本館藏中有的圖書、期刊顯示紙本收藏情況、紙本在館情況及鏈接電子資源。這對于多數(shù)圖書館來說,是館藏紙本資源全部揭示為數(shù)字化資源的一種捷徑,是在紙本資源全部借出時補充讀者需求的最好方式,是滿足讀者不同閱讀需求、提高資源有效利用率的最好方法,是中小型圖書館在當前沒有能力完成本館紙本資源全面數(shù)字化的情況下全面揭示館藏數(shù)字化的一種探索,也是各圖書館對書目數(shù)據(jù)庫的一種開發(fā)和利用。
20世紀90年代中期,美國國會圖書館為了在機讀目錄中揭示各類數(shù)字化資源,在USMARC(United States MAchine-Readable Cataloging,美國機讀目錄格式)中增加了一系列新的字段或為有些字段擴充了新的定義,如130、256、307、516、538、856字段。我國西文編目基本采用USMARC,而CALIS(China Academic Library & Information System,中國高等教育文獻保障系統(tǒng))聯(lián)機合作編目項目已在中文CNMARC(China MAchine-Readable Catalogue,中國機讀目錄)格式中正式采用了以上字段。其中856字段被定義為:電子資源地址與檢索,可重復,有主機名稱、路徑、文檔名稱等26個子字段。其指示符1為電子資源的檢索方法(包括:# 無信息提供,0 電子郵件,1 文件傳輸協(xié)議,2 遠程登錄,3 撥號入網(wǎng),4 超文本傳輸協(xié)議,7 檢索方法,$2中說明)。指示符2表示856字段的電子資源與編目文獻之間的關(guān)系(包括:# 未定義,0電子文獻,1有電子版,2相關(guān)資源有電子版,8不生成附注導語)[2]。856字段在實際應用中,主要使用子字段@u和@z。@u來標注與電子資源的URL(Uniform Resource Locator,統(tǒng)一資源定位符或稱網(wǎng)頁地址)鏈接,@z用于電子資源地址相關(guān)的附注說明。如@z為“點擊查看電子資源”,則讀者在檢索界面可以看到“點擊查看電子資源”的超級鏈接,點擊便可以直接打開@u所指向的具體的電子資源的地址,從而實現(xiàn)書目記錄與電子資源的無縫鏈接。而這些就是我們圖書館人需要做的工作。在開展這項工作時,應該先易后難(中文資源較西文資源易于實現(xiàn)),先小后大(數(shù)據(jù)庫資源量相對較小的易實現(xiàn)),逐步實現(xiàn)本館館藏書目數(shù)據(jù)庫與購入的電子資源數(shù)據(jù)庫的鏈接,進而發(fā)展到網(wǎng)絡虛擬資源與館藏書目數(shù)據(jù)庫的鏈接,實現(xiàn)館藏資源數(shù)字化的有效揭示。筆者結(jié)合自己所工作的蘭州理工大學圖書館(以下簡稱我館)關(guān)于856字段的使用,談些許拙見,供同仁商討,以促進856字段的使用和館藏數(shù)字化目標的實現(xiàn)。
我館購入的電子圖書有書生之家電子圖書、方正Apabi教學參考書、超星電子圖書、讀秀知識庫、Knovel電子書。從我們建立856字段的原則分析來看,電子圖書中的方正Apabi教學參考書是中文資源,其數(shù)據(jù)量相對較小而使用率較高,是我館進行856字段著錄的首選。圖1是館藏書目數(shù)據(jù)MARC記錄中加入856字段的實例。
圖1 館藏書目數(shù)據(jù)MARC記錄中加入856字段的書目著錄格式
當在OPAC檢索某本書時,若館藏中沒有此書,可在OPAC上點擊“點擊此處查看方正Apabi電子書”,鏈接到Apabi數(shù)字資源平臺,從而查看電子圖書。若館藏中有此書,也可在OPAC上查看紙本圖書的在館情況,當該書全部借出時,點擊“點擊此處查看方正Apabi電子書”即可查看電子圖書。同時,也實現(xiàn)了方正Apabi數(shù)字資源平臺電子圖書向館藏書目數(shù)據(jù)庫鏈接。如在方正Apabi數(shù)字資源平臺查找某本電子圖書時,若想了解該書的在館情況,通過方正Apabi數(shù)字資源平臺中“點擊查看紙本圖書”,就可鏈接到館藏OPAC書目記錄中該圖書的在館狀況。此外,我館開發(fā)了本科教學參考書系統(tǒng)。該系統(tǒng)建立了全校所有課程的教學參考書的書目數(shù)據(jù)庫,并且將該數(shù)據(jù)庫記錄和館藏書目數(shù)據(jù)庫建立了鏈接。這樣,在學生選課后,若想了解課程需要的教學參考書,就可鏈接到本館的館藏書目數(shù)據(jù)庫中,了解館藏收藏和在館狀況,而從館藏書目數(shù)據(jù)庫又可鏈接方正Apabi數(shù)字資源平臺的電子圖書。從使用效果來看,非常受學生歡迎。該項工作主要是和北京方正Apabi技術(shù)有限公司合作完成,我館確定鏡像服務器地址,該公司完成方正Apabi數(shù)字資源平臺系統(tǒng)安裝和方正Apabi數(shù)字資源平臺的書目數(shù)據(jù)向館藏OPAC書目記錄的鏈接,并負責導出我館購置的電子圖書的MARC數(shù)據(jù)記錄及在MARC數(shù)據(jù)記錄中加好856字段的內(nèi)容。我館在ILAS系統(tǒng)中設立要接入的電子圖書MARC數(shù)據(jù)記錄的書目控制號區(qū)段,通過ILAS系統(tǒng)數(shù)據(jù)接口,把電子圖書MARC數(shù)據(jù)記錄接入到ILAS系統(tǒng)中的中央書目庫中(Biblios),實現(xiàn)館藏紙本圖書書目和電子圖書的鏈接。目前,我館又和超星讀秀公司合作,向超星讀秀公司提供紙本館藏MARC數(shù)據(jù),由超星讀秀公司建立《讀秀學術(shù)搜索》平臺向本館館藏書目庫的鏈接。同時,我們要求超星讀秀公司為我館提供購入的超星電子圖書MARC數(shù)據(jù),以實現(xiàn)本館紙本圖書向超星電子圖書的鏈接,進而擴大紙本資源的數(shù)字化的有效揭示,為讀者帶來方便、快捷、滿意的個性化服務。對于其他電子圖書數(shù)據(jù)庫公司,我們也將與其合作并完成鏈接及有效揭示。從856字段的建立來看,指示符1的內(nèi)容為4表示超文本傳輸協(xié)議(HTTP);@u字段內(nèi)容:電子資源的地址(URL),ID是ISBN 號;@z 字段內(nèi)容:856字段標識的電子資源地址相關(guān)的附注,該附注用于公共顯示。
本館購入的電子期刊數(shù)據(jù)庫有維普、CNKI、萬方、人大報刊復印資料、Springer LINK等。其中,維普電子期刊數(shù)據(jù)庫自1989年以來,收錄有中文期刊12 000種、中文報紙1 000種、外文期刊4 000種,有文摘型電子期刊數(shù)據(jù)庫,其資源擁有量幾乎能完全覆蓋我館所訂購的紙本期刊。若能在本館紙本期刊的書目數(shù)據(jù)MARC中建立856字段,與維普電子期刊數(shù)據(jù)庫鏈接,那么,我館的紙本期刊幾乎完全能被揭示為電子期刊。另外,維普的《中文科技期刊數(shù)據(jù)庫(全文版)》具有符合國際技術(shù)標準OpenUrl協(xié)議的開放鏈接功能,可讓用戶從其他檢索平臺檢索出文獻篇名或期刊名后,直接鏈接到維普數(shù)據(jù)庫的全文數(shù)據(jù),只要用戶的IP地址在被授權(quán)的范圍之內(nèi)就可以直接下載閱讀相應的原文文獻。因而,維普電子期刊數(shù)據(jù)庫成為了我館的首選。下面是維普公司提供的OpenUrl協(xié)議的連接規(guī)則和參數(shù)介紹:
http://IP/cstj/sear.dll?SearchURL?sid=***&genre=***&issn=***&year=***&volume=***&issue=***&spage=***&title=***&pid=****(標準的OpenUrl協(xié)議規(guī)則)
其中IP為維普《中文科技期刊數(shù)據(jù)庫(全文版)》安裝所在的服務器IP地址或網(wǎng)址。
各參數(shù)意義分別為sid——數(shù)據(jù)庫提供商;genre——數(shù)據(jù)類型;issn——國際刊號;year——年份;volume——卷;issue——期;spage——開始頁;title——題名;pid——刊名。其中sid和genre的參數(shù)值固定不變,也可以為空;pid需要進行URL Encode的編碼,用UTF-8字符集。而使用UTF-8編碼的好處是國外的用戶如果使用Windows XP英文版瀏覽UTF-8編碼的任何網(wǎng)頁,無論是中文還是日文、韓文、阿拉伯文,都可以正常顯示,UTF-8是世界通用的語言編碼。
目的:用issn或pid來定位一種期刊,用year、volume、issue來定位一本期刊,用title來定位一條記錄。
如果issn有值,則不需要pid值(pid可以為空值);反之,需要將刊名pid的值解碼。
如果title有值,則定位到一條記錄的全文;反之,在issn(或pid)有值,其它值都為空的條件下,返回整刊的題錄數(shù)據(jù)。
利用這種參數(shù)規(guī)則就可以與OPAC系統(tǒng)實現(xiàn)對接,為OPAC系統(tǒng)提供刊內(nèi)檢索和全文服務。
上面介紹了通過標準的OpenUrl協(xié)議規(guī)則實現(xiàn)與OPAC系統(tǒng)的鏈接。為了方面用戶使用,維普的《中文科技期刊數(shù)據(jù)庫(全文版)》還提供一種更加簡潔的、專為OPAC系統(tǒng)提供鏈接的接口(我館選用了該接口)。接口規(guī)則為:
http://……/cstj/sear.dll?OPAC?ISSN=****&KM=****
其中,ISSN為國際標準刊號,KM為刊名。由于只有兩個參數(shù),方便簡單。筆者建議OPAC系統(tǒng)使用此接口與維普數(shù)據(jù)庫實現(xiàn)鏈接。
原理:以issn號來定位一本期刊,當issn有正確的值時就可以返回結(jié)果,km的值可以為空;當issn值為空時,需要km有正確的值才能返回結(jié)果。
4.4.1 在期刊書目MARC記錄中逐條加入856字段
筆者認為可以調(diào)出期刊書目MARC記錄,逐條建立856字段,如圖2所示。
圖2 期刊書目MARC記錄逐條建立的856字段
其中,指示符1的內(nèi)容為4表示超文本傳輸協(xié)議(HTTP),http://202.201.33.131:8080是鏡像服務器地址,ISSN是該刊的ISSN號,KM是該刊刊名,@z是公開附注(說明)。多數(shù)圖書館的記錄(期刊種數(shù))在5 000條左右,加入856字段不會造成工作量過大,而易完成。
4.4.2 在期刊書目MARC中批量加入856字段
在期刊書目MARC中批量加入856字段時,系統(tǒng)必須帶有MRAC數(shù)據(jù)的批處理工具。我館使用的ILAS系統(tǒng)帶有MARC數(shù)據(jù)批處理工具,因此可以對856字段的增加、替換進行批處理轉(zhuǎn)換,經(jīng)過增加、替換等幾次批處理轉(zhuǎn)換后的856字段如圖3所示。經(jīng)批處理后,856字段中會多出@x、@y、@w3個臨時借用的字段符號,對其刪除即可。
圖3 經(jīng)過增加、替換等幾次批處理轉(zhuǎn)換后的856字段
對西文期刊同樣可建立856字段的鏈接。期刊書目庫中MARC記錄的條數(shù)是館藏實際收藏刊的種數(shù)。因此,用OPAC檢索某刊時,若本館有此刊,會列出其題錄和館藏收藏情況。而“點擊此處查看維普電子期刊”時,若維普電子期刊收有此刊,既顯示該刊收藏范圍及每種刊的目次,又可在目次下看到刊內(nèi)某篇文章的摘要,還可下載原文。這樣就提高了館藏期刊資源數(shù)字化的揭示率和使用率。
關(guān)于書附光盤方面,我館分兩步建設(主要是因為存儲設備不足)。第一步:把上萬種光盤作MARC著錄(在系統(tǒng)中單獨為其設置一段書目控制號區(qū)段和條碼區(qū)段)。著錄時,調(diào)出書目記錄,復制一條記錄后,對該記錄作如下修改:
010字段——該字段著錄文獻國際標準號和獲得方式,著錄子字段 @a ISBN號,@d 獲得方式。若該光盤有不同于圖書的文獻國際標準號、唱片號,那么需要復制一行重新著錄@a。如果光盤是購買的,@d著錄其價格;如果是隨書贈送的,可著錄@d為附書光盤或磁盤。
200字段——該字段著錄電子文獻的題名及有關(guān)信息,著錄子字段@a電子文獻的正題名,@b文獻類型,如@b光盤或@b磁盤。
210字段—— 該字段著錄電子文獻出版社發(fā)行項,有兩家或兩家以上的出版社時,逐一著錄。
215字段——該字段包含在編文獻的載體特征方面的信息。著錄子字段 @a特定文獻類型標識和文獻數(shù)量,如@a2 computer optical disc或@a1 computer disk ;著錄子字段@d尺寸,著錄光盤的直徑15cm或8cm,磁盤的直徑9cm。
著錄時加入館藏條碼,經(jīng)審校入書目總庫。我們把某一種中的1張或1套作為保留光盤(母盤)長期保存,其余的像圖書一樣供讀者借閱,若光盤損壞,可用保留光盤刻錄補充,從而極大地提高了光盤的利用率。第二步:在有條件時,將光盤(母盤)制作成可供下載安裝的光盤鏡像ISO文件,上載到FTP服務器上,使用MARC的856字段(如圖4),使讀者方便地下載光盤文件。同時,我館還探索了使用MARC的856字段建立校內(nèi)相關(guān)專題資源的全文、攝影作品、字畫、音頻、視頻等資料的有效鏈接,這里不再一一贅述。
圖4 書附光盤MARC記錄建立的856字段
隨著數(shù)字化革命的深入和因特網(wǎng)的飛速發(fā)展,網(wǎng)絡信息資源呈現(xiàn)出幾何級數(shù)量增長,規(guī)模已超越了現(xiàn)有的非網(wǎng)絡資源,信息資源從內(nèi)容到形式都發(fā)生了質(zhì)的變化。網(wǎng)絡信息資源與非網(wǎng)絡資源相比,具有地理上分散、組織上無序、數(shù)據(jù)類型多樣、信息組合錯綜復雜等特點。當信息的需求者面對如此浩瀚的信息海洋無法快捷地獲取自己所需的信息時,常常會對檢索和獲取信息的低效感到無奈。要解決二者之間的矛盾,為用戶提供便利的信息獲取途徑和方法,就圖書館而言,最為有效的方法是將網(wǎng)絡信息資源納入圖書館的服務當中,即選定好的網(wǎng)絡資源,對其進行編目,從而將信息資源系統(tǒng)地組織起來,供用戶瀏覽與檢索。圖書館員可以用MARC格式對其進行編目, 而目前 856字段已定義了20多個子字段,包括主機地址、檢索地址、電子文件名、用戶名、口令、幫助信息、操作系統(tǒng)、電子文獻格式、文件大小、統(tǒng)一資源定位器等。但以MARC格式編目網(wǎng)絡資源的做法成本較高(需要耗費較多的財力、人力和時間),而且不容易跟上網(wǎng)絡資源的增長速度。因為MARC格式對編目特定館藏、信息資源地址穩(wěn)定及較重要的網(wǎng)絡信息資源較有優(yōu)勢,而互聯(lián)網(wǎng)上的信息動態(tài)性過強,鏈接到的信息常在一段時間后就不存在或者信息的網(wǎng)址發(fā)生變化,使856字段的鏈接失效,這將嚴重制約MARC記錄中加入856字段進行網(wǎng)絡信息資源的鏈接。因為,失效鏈接的存在,會為書目數(shù)據(jù)庫中積累太多無用的856字段。因而,網(wǎng)上的信息資源著錄工具DC(Dublin Core)——都柏林核心誕生。它是一項描述信息資源的國際標準。1995年3月,在俄亥俄州的都柏林核心研討會上,52位來自圖書館、計算機和網(wǎng)絡方面的學者和專家共同探討了網(wǎng)絡信息資源的描述問題,創(chuàng)建了都柏林核心集。1999年10月,在德國的第七次都柏林核心研討會上,就鞏固不同都柏林核心工作組的發(fā)展,分享實施都柏林核心的經(jīng)驗,推動都柏林核心在異構(gòu)元數(shù)據(jù)系統(tǒng)中對互用性的支持進行討論[3]。這次會議對DC元數(shù)據(jù)進行了重大改進,使DC元數(shù)據(jù)與MARC之間映射更加一致,有利于將MARC轉(zhuǎn)換為DC元數(shù)據(jù)。在網(wǎng)絡信息資源編目過程中,采用DC作為網(wǎng)絡信息資源的著錄工具、XML文檔結(jié)構(gòu)作為著錄格式是將網(wǎng)絡信息資源序化的理想模式。并且一些升級的圖書館自動化集成系統(tǒng)引入元數(shù)據(jù)和MARC兼容的編目,可將MARC編目數(shù)據(jù)轉(zhuǎn)化為元數(shù)據(jù)。這樣就可利用各種數(shù)據(jù)庫入口或ODBC(Open DataBase Connectivity,開放數(shù)據(jù)庫連接)標準直接獲取各種異構(gòu)系統(tǒng)的裸數(shù)據(jù),構(gòu)建新的數(shù)據(jù)集合或者對各種異構(gòu)系統(tǒng)的裸數(shù)據(jù)直接訪問、直接處理。也可設計Agent中間件,如用戶在OPAC系統(tǒng)中檢索定位到某一本圖書時,OPAC會在后臺將對應的參數(shù)傳遞給Agent,Agent利用通用數(shù)據(jù)庫接口在電子圖書數(shù)據(jù)庫中查找對應的電子圖書,從而實現(xiàn)異構(gòu)系統(tǒng)數(shù)據(jù)庫的鏈接[4]。所有這些的發(fā)展,為網(wǎng)絡資源編目和異構(gòu)數(shù)據(jù)庫的鏈接開辟了新的空間。
總之,856字段在圖書館館藏資源的數(shù)字化的有效揭示上還有許多值得我們研究、探討和開發(fā)的地方。筆者認為只有恰當運用其優(yōu)勢,避免其不足(不是其本身的不足,而是客觀的不足),才能使856字段在館藏開發(fā)上發(fā)揮其應有的特點、功能,在館藏全面數(shù)字化的進程中發(fā)揮其應發(fā)揮的優(yōu)勢。
[1]數(shù)字化館藏資源的多層次揭示[EB/OL]. (2009-04-10)[2009-05-21].http://lw.china-b.com/gllw/20090410/1299549_1.html.
[2]謝琴芳. CALIS聯(lián)機合作編目手冊:下[M]. 北京:北京大學出版社, 2000.
[3]都柏林核心(Dublin Core)元數(shù)據(jù)[EB/OL]. (2007-09-18) [2009-05-21].http://www.danganj.net/bbs/viewthread.php?tid=1339.
[4]論基于OPAC的信息資源整合信息資源整合的現(xiàn)實意義[EB/OL]. (2009-04-10) [2009-05-21].http://blog.5d.cn/user11/pine/200601/202396.html.