閆曉弟 李 娟
摘要SUSHI是一個數(shù)據(jù)采集、傳遞的標準協(xié)議,為圖書館提供了更加高效、方便的獲取本館電子資源利用統(tǒng)計數(shù)據(jù)的手段。該文詳細介紹了該規(guī)范的起源、架構(gòu)、核心內(nèi)容以及相關(guān)應(yīng)用。
關(guān)鍵詞SUSHI COUNTER ScholarlyStats電子資源利用與統(tǒng)計
近幾年,很多圖書館都在進行著巨大的變革,越來越多的圖書館以網(wǎng)絡(luò)化電子資源的形式把信息資源提供給用戶。圖書館用于購買電子資源的費用逐年遞增,美國研究圖書館協(xié)會的統(tǒng)計數(shù)據(jù)表明,該協(xié)會大學成員館平均電子資源花費占文獻總經(jīng)費的比例已經(jīng)從1992-1993年的3.6%上升到2000-2001年的16.25%,2003-2004年上升到31.33%,2005-2006年更上升到43%;國內(nèi)一些大學圖書館的電子資源購置費占到全年文獻資源建設(shè)費的三分之一甚至更高,因此,圖書館希望了解電子資源的使用情況,包括利用統(tǒng)計數(shù)據(jù)、各用戶使用狀況等,通過掌握統(tǒng)計數(shù)據(jù)和相關(guān)信息,可以評價電子資源采購的價值、制訂和調(diào)整電子資源建設(shè)政策,開展相應(yīng)的用戶培訓服務(wù)等,使電子資源成本效益最大化。
雖然各數(shù)據(jù)庫商都提供給圖書館有關(guān)統(tǒng)計數(shù)據(jù),但是,數(shù)據(jù)商各自都有一套內(nèi)部的統(tǒng)計數(shù)據(jù)處理方法,尤其是國內(nèi)的數(shù)據(jù)商提供的統(tǒng)計信息千差萬別,這就影響了統(tǒng)計數(shù)據(jù)收集的一致性和標準性。為了比較不同數(shù)據(jù)庫的使用情況,更科學、可靠地評價本館電子資源的使用價值,圖書館希望數(shù)據(jù)庫商提供的數(shù)據(jù)具有可比性,也就是這些統(tǒng)計數(shù)據(jù)要遵循統(tǒng)一的標準得出,在這種情況下,COUNTER(Counting online usage of Networked Electronic Re-sources)應(yīng)運而生,它為SUSHI協(xié)議的產(chǎn)生提供了前提條件。在介紹SUSHI前有必要了解一下COUNT-ER標準。
1、COUNTER標準簡介
COUNTER的目標是研制一系列實施規(guī)范,以管理不同類型網(wǎng)上電子資源的使用數(shù)據(jù),規(guī)范記錄和交換這些數(shù)據(jù)的指標和途徑。要求“遵從者”必須向用戶提借符合COUNTER標準的使用統(tǒng)計報告,并規(guī)范了在線使用數(shù)據(jù)的定義,使各供應(yīng)商生成的統(tǒng)計數(shù)據(jù)具有一致性、可靠性和相互兼容性,并且能方便記錄和交換。2005年4月,在COUNTER第2版草案經(jīng)過一年的試用后,正式發(fā)布。
COUNTER報告的內(nèi)容包括:期刊報告、數(shù)據(jù)庫報告和選擇性報告。COUNTER報告的使用,為圖書館科學、客觀地評價數(shù)據(jù)庫使用情況提供了準確的數(shù)據(jù)依據(jù),對于數(shù)據(jù)庫出能做出較為客觀的評價。很多數(shù)據(jù)庫商都為用戶提供基于COUNTER標準的使用統(tǒng)計。但是另一方面,電子資源種類豐富、各用戶所需要數(shù)據(jù)不盡相同,而且每個出版商提供的數(shù)據(jù)也不盡一致,依然存在著格式的不一致性,EXCEL并不是最好的導人數(shù)據(jù)到自動化系統(tǒng)的最好格式,收集和處理報告比較費時,因為有眾多的數(shù)據(jù)庫商,很多站點的日志,需要不同的程序處理很多報告。因此迫切需要一個統(tǒng)一的數(shù)據(jù)統(tǒng)計平臺或協(xié)議,SU-SHI就是在這種需求下產(chǎn)生的。
2、SUSHI協(xié)議
2.1SUSHI項目的由來
電子資源在圖書館館藏資源中占有越來越重要的位置,圖書館每年會花費不少的經(jīng)費在電子資源上,但是這些資源的利用情況如何?所購電子資源是否滿足讀者的需求?圖書館就需要相關(guān)的使用統(tǒng)計數(shù)據(jù),如何才能更方便地收集、整理和分析統(tǒng)計數(shù)據(jù),并使各數(shù)據(jù)庫商提供的使用數(shù)據(jù)具有可比性、可靠性和一致性?基于對這些因素的考慮,SUSHI(The Standardized Usage Statistics Harvesting Initia-tive)作為一個草案標準版本由NIS0發(fā)起,標準定案完成于2006年9月,作為草案標準用于測試使用,試用日期為2006年9月20至2007年5月20日,在測試使用顯示比較成功后,對標準進行了小幅的調(diào)整,2007年7月被選作為Z39.93-200X標準協(xié)議。
SUSHI是一個協(xié)議,自動通過一個XML架構(gòu)將使用數(shù)據(jù)從一個系統(tǒng)傳送到另一個系統(tǒng),這個XML架構(gòu)定義了一個請求和響應(yīng)系統(tǒng)。它是一個XML信息,也是一種在兩個系統(tǒng)之間傳輸信息的方法,以Web Service的方式實現(xiàn),它使用的是一個SOAP(simple Object Access Protocol)協(xié)議。
這個標準協(xié)議定義了一個利用web服務(wù)框架,自動請求和答復獲取電子資源使用數(shù)據(jù)的模式,它被設(shè)計為與COUNTER報告一起使用,SUSHI協(xié)議也被擴展到其它類型的使用報告。SUSHI的目標是從日益增長的數(shù)據(jù)資源提供商那里解決和實現(xiàn)使用統(tǒng)計數(shù)據(jù)的收割和管理問題,完善了使用格式的一致性并能對數(shù)據(jù)進行自動化處理。
2.2SUSHI與COUNTER
在使用COUNTER之前,由于網(wǎng)絡(luò)電子資源和數(shù)據(jù)庫來自不同的出版商或中間商,在提供給用戶的報告中,采用的是不同的統(tǒng)計內(nèi)容、統(tǒng)計標準以及不同的統(tǒng)計格式,用戶在比較不同資源在本單位的使用時,會遇到很多麻煩,甚至無法比較。COUNT-ER標準的采用在一定程度上規(guī)范了數(shù)據(jù)庫商向用戶提供的數(shù)據(jù)格式、內(nèi)容、術(shù)語等,使各數(shù)據(jù)庫的使用數(shù)據(jù)具有一定的可比性,解決了圖書館用戶和信息工作人員統(tǒng)計數(shù)據(jù)庫利用情況時的難題。
但隨著網(wǎng)絡(luò)電子資源和數(shù)據(jù)庫日益增多,僅僅用COUNTER進行規(guī)范也有其局限性,正如前邊提到,不是所有的數(shù)據(jù)庫商都提供符合COUNTER標準的數(shù)據(jù),依然存在著格式的不一致問題,以及眾多的平臺和數(shù)據(jù)庫的數(shù)據(jù)處理問題等。SUSHI在COUNTER標準的基礎(chǔ)上,采用統(tǒng)一的協(xié)議,來收集這些不同數(shù)據(jù)庫商提供的數(shù)據(jù)并進行處理,使用戶在很大程度上能更系統(tǒng)、高效地收集和分析數(shù)據(jù)庫商提供的使用數(shù)據(jù),節(jié)省用戶在使用數(shù)據(jù)收集和整理上的時間,使用戶有更多的時間進行數(shù)據(jù)分析,為用戶的科學決策提供數(shù)據(jù)依據(jù)。未來,支持SUSHI可能會成為COUNTER依從的必要條件。
2.3SUSHI的結(jié)構(gòu)
SUSHI的結(jié)構(gòu)如圖1所示,使用SUSHI的圖書館系統(tǒng)發(fā)出一個使用統(tǒng)計報告的請求,SUSHI客戶端將這個請求發(fā)出,SUSHI服務(wù)器收到這個請求后處理這個請求并且利用COUNTER報告,然后將數(shù)據(jù)報告打包并返回應(yīng)答,最后SUSHI客戶端處理返回的COUNTER報告。
圖書館和內(nèi)容提供商都連接到互聯(lián)網(wǎng)上,SU-SHI客戶端是一個運行在圖書館服務(wù)器上的軟件,通常與ERM系統(tǒng)結(jié)合在一起。SUSHI服務(wù)器是一個運行在內(nèi)容提供商服務(wù)器上的軟件,通過它可以訪問使用數(shù)據(jù)。當ERM系統(tǒng)需要一個COUNTER報告時,它向SUSHI客戶端發(fā)出請求,客戶端收到后,向內(nèi)容提供商提出請求,這個請求詳細說明了報
告的具體要求和哪一個圖書館需要這個報告,SU-SHI服務(wù)器讀到這個請求后,會處理相關(guān)的使用數(shù)據(jù)。之后,SUSHI服務(wù)器創(chuàng)建一個XML格式的請求COUNTER的報告,依據(jù)SUSHI XML架構(gòu),SUSHI服務(wù)器準備回復信息,COUNTER報告(XML)被加載到回復信息中,這個響應(yīng)被傳送到客戶端,SUSHI客戶端會處理這個回復信息并且抽取COUNTER報告,被抽取的COUNTER報告會被傳送到ERM系統(tǒng)中做進一步的處理。
2.4SUSHI的應(yīng)用——SeholadyStats
MPS Technologies公司與美國、澳大利亞及非洲等的團體和學術(shù)機構(gòu)信息工作人員緊密合作,開發(fā)了增強圖書館利用統(tǒng)計分析服務(wù)。通過合作,MPS了解圖書館希望把利用統(tǒng)計的數(shù)據(jù)整合成館藏與價格的對照模式,于是在50多個參與館的協(xié)助下,ScholarlyStats得以成形,并通過一個用戶界面友好、以跨平臺的方式為各圖書館提供統(tǒng)一的使用情況統(tǒng)計。這套系統(tǒng)在SUSHI協(xié)議的基礎(chǔ)上,將獲得的利用報告用ScholarlyStats加以整理并自動轉(zhuǎn)換成圖書館所需要的數(shù)據(jù),進一步減少組織這些數(shù)據(jù)的時間,并且極大地提高使用效率。
ScholarlyStats為信息人員提供一個單點訪問其所有數(shù)據(jù)庫平臺的使用情況統(tǒng)計,它可以統(tǒng)一收集、整理來自不同平臺的使用報告,將這些使用報告整合為一個綜合性報告提供給用戶。它是一個因特網(wǎng)架構(gòu)的入口網(wǎng)站,可以從多個信息來源很方便地承擔搜集、整合與分析電子期刊使用量的工作。在COUNTER格式的支持下,圖書館可以通過單一、直觀接口查看與下載使用量統(tǒng)計報告,使圖書館工作人員能正確搜集到資源的使用信息并以此作為采購決策的輔助依據(jù)。使用統(tǒng)一的ScholarlyStats報表,圖書館工作人員可以掌握期刊和數(shù)據(jù)庫每個題目級別的使用,ScholarlyStats報表提高了進一步分析確定使用的趨勢,指出高使用率和低使用率的資源。
ScholarlySmts的工作過程如圖2所示,Schd-arlyStats收集和整合書商每月提供給圖書館的期刊和數(shù)據(jù)庫使用統(tǒng)計數(shù)據(jù),將這些信息處理為標準的格式,并且將這一系列的報告發(fā)送到圖書館的ScholarlyStats門戶。ScholarlyStats報告包括一套整理過的統(tǒng)一的報告,這些報告在COUNTER編碼標準的基礎(chǔ)上顯示了所有數(shù)據(jù)庫所提供的數(shù)據(jù)庫的使用情況。為了提高分析使用的趨勢,還發(fā)送一組增強的圖表報告。根據(jù)需求,MPS可以將Schol-arlyStats報告?zhèn)魉偷狡渌膱D書館系統(tǒng),包括ERM系統(tǒng),因為ScholarlyStats遵循工業(yè)標準SUSHI協(xié)議,因此可以將這些數(shù)據(jù)自動地進行傳輸。
伯明翰大學圖書館也和其他圖書館一樣,利用更多的時間收集和分析數(shù)據(jù)庫的使用數(shù)據(jù)和結(jié)果,伯明翰大學信息服務(wù)通過10個具體學科的圖書館站點和資源中心向讀者提供圖書館服務(wù)。他們提供了現(xiàn)代的、高科技的、功能型的學習空間,并將圖書館與計算機設(shè)備相結(jié)合,提供了16000多種電子期刊。2006年2月他們開始利用ScholarlyStats作為其電子資源分析的平臺,在很大程度上能更系統(tǒng)、更有效地收集和分析使用數(shù)據(jù)。在使用ScholarlyStats之前,伯明翰大學圖書館沒有系統(tǒng)地收集任何相關(guān)的使用數(shù)據(jù),因為沒用足夠的人力資源按月收集、統(tǒng)計數(shù)據(jù),這樣做太浪費時間。輸入密碼、登陸到每個網(wǎng)站,再從五花八門的數(shù)據(jù)中找到一致性,這個過程相當麻煩。
伯明翰大學的預算都被分配到各個學院,各院的教授通過投票來決定是否重新訂購還是取消續(xù)訂,這種操作的實際反饋率很低,而且給人們的印象是實際操作是不可靠的。目前學院主要的資源都轉(zhuǎn)移到了網(wǎng)絡(luò),從而提供可靠有用的數(shù)據(jù)就變得尤為重要。所以他們下決心通過工具來減輕數(shù)據(jù)統(tǒng)計的壓力,讓工作人員有更多的時間去分析結(jié)果,并將館藏情況反饋給學院。
使用了ScholarlySats,他們在統(tǒng)計數(shù)據(jù)方面取得了很大的進步。ScholarlyStats提供的整合的期刊全文請求和數(shù)據(jù)庫搜索與進程報告,得到一個整體的交叉平臺的題名或者一系列題名及數(shù)據(jù)庫的使用情況的圖形,也可以用資源報告形式在續(xù)訂時來評估一些訂購的實際價值,無需去數(shù)據(jù)庫商的網(wǎng)站查詢。顯然,ScholarlyStats為伯明翰大學圖書館提供了一個很好的機會來更好地定性分析他們的期刊館藏。
同樣,奧塔哥大學(The University of Otago)有一個強有力的遠程教育系統(tǒng),教授范圍涉及了整個新西蘭,同時覆蓋了澳大利亞、斐濟的一些地區(qū),這意味著他們要為許多個人提供遠程支持。而電子信息內(nèi)容是其中非常重要的一部分,能有效地提供這種電子資源就顯得尤為關(guān)鍵。奧塔哥大學圖書館也希望有一個更好更便捷的方式來評估數(shù)據(jù)庫商電子信息內(nèi)容的使用統(tǒng)計數(shù)據(jù)。MPS科技為奧塔哥大學推薦了ScholarlyStats,并為奧塔哥大學提供了單獨的人口,這樣就可以以一種統(tǒng)一的、標準的形式來評估數(shù)據(jù)庫的使用統(tǒng)計數(shù)據(jù)。
在使用ScholarlyStats之前,每個網(wǎng)絡(luò)資源提供商都會在不同的時間以不同的形式來提供使用數(shù)據(jù)。為了使報告中的數(shù)據(jù)具有一致性、可用性,圖書館工作人員需要花很多的時間來重新整理這些使用數(shù)據(jù)。管理這些數(shù)據(jù)要花很長的時間,因此他們通常只在續(xù)訂時查看統(tǒng)計資料。這樣做的最終結(jié)果,導致除了那些比較貴的數(shù)據(jù)庫外,大部分信息都被忽略了,失去了更好地評估所有內(nèi)容的機會。
使用MPS的ScholarlyStats后,他們利用Schol-arlyStats來收集網(wǎng)上的使用統(tǒng)計數(shù)據(jù)并使其標準化,ScholarlyStats讓圖書館能更便利地統(tǒng)一期刊信息和統(tǒng)計在整個數(shù)據(jù)庫商平臺上的各個數(shù)據(jù)庫的使用情況,在此基礎(chǔ)上,來決定是否要購買。
統(tǒng)一的數(shù)據(jù)庫報告使圖書館員可以了解一個完整的概況,而不是單個數(shù)據(jù)庫資源的使用情況。圖表報告也是一個很神奇的工具,它提供了一個快捷的概觀。奧塔哥大學圖書館鼓勵全體職員定期利用ScholarlyStats對圖書館的使用進行分析。每個星期10到12名圖書館工作人員使用這個平臺來存取數(shù)據(jù)。來自這些職員的反饋一致都很積極,他們覺得該網(wǎng)站非常便于用戶使用,設(shè)置帳戶很容易,查看各種報告和提供的管理工具都非常簡便。奧塔哥大學對于ScholarlyStats這樣的使用結(jié)果非常滿意。
從這兩個大學圖書館的使用情況來看,Schol-arlyStms容易設(shè)置而且用起來很方便,如:添加平臺的詳細信息只需花費很短的時間,同時可以創(chuàng)建用戶帳號。當有可用的新平臺時,ScholarlyStats會及時通知用戶,用戶就可以及時決定是否要包含它們。
ScholarlyStats在SUSHI協(xié)議的基礎(chǔ)上,很大程度上可以減輕信息工作人員收集和整理電子資源使用報告的工作量,節(jié)省了人工統(tǒng)計數(shù)據(jù)的時間,同時幫助信息專業(yè)人員更清晰地揭示院校機構(gòu)內(nèi)部的用戶如何運用信息??梢宰寛D書館工作人員有更多的時間去進行使用數(shù)據(jù)的分析和評估,為圖書館的采訪決策提供科學依據(jù)。
ScholarlyStats遞送整合性統(tǒng)計報告給全球各地的圖書館,透過46種平臺提供一份可涵蓋7萬多種期刊與橫跨將近450種數(shù)據(jù)庫清晰的使用量內(nèi)容。這個網(wǎng)站可以與圖書館所使用的ERM系統(tǒng)相整合,為此Swets已經(jīng)與三家地區(qū)性系統(tǒng)整合伙伴(其中包括Innovative Interfaces)進行合作計劃,新的平臺與新的合作伙伴仍持續(xù)增加中。除了ScholarlyS-tats,Innovative Interfaces、ExLibris等公司也將他們的產(chǎn)品升級支持SUSHI協(xié)議,如Innovative Interfaces的ERM。
我國大部分圖書館對于電子資源利用相關(guān)信息的收集和分析缺乏經(jīng)驗,因此,國內(nèi)應(yīng)該有一個統(tǒng)一的權(quán)威機構(gòu)來規(guī)定或者要求和規(guī)范數(shù)據(jù)庫商所提供的統(tǒng)計數(shù)據(jù)的提交格式、提交方式、統(tǒng)計項目、統(tǒng)計數(shù)據(jù)的可靠性等,規(guī)定所有數(shù)據(jù)商必須提供符合COUNTER標準的統(tǒng)計報告。同時,ScholarlyStats平臺在國外的應(yīng)用也為國內(nèi)圖書館在收集和分析電子資源利用情況時提供了借鑒。