姜瑩瑩,劉佳音
(南京航空航天大學(xué) 圖書館,江蘇 南京 210016)
高校電子資源因其使用方便、快捷,已經(jīng)成為師生重要的信息源,受到了廣大師生的歡迎。電子資源下載量是衡量電子資源利用情況的最基本、最重要的指標之一。每個電子資源數(shù)據(jù)庫后臺記錄了每天產(chǎn)生的大量下載記錄數(shù)據(jù),通過對這些數(shù)據(jù)進行分析,可以獲得有利于資源建設(shè)的信息,從而掌握讀者的利用行為,提升圖書館的服務(wù)質(zhì)量。
電子圖書(以下也簡稱為電子書)是圖書館館藏資源建設(shè)和服務(wù)的重要文獻類型。傳統(tǒng)上,電子圖書下載的分析指標主要是下載總量、平均下載量和篇均下載成本等,這些指標和方法在一定程度上揭示了電子資源的利用情況,但是無法深入分析讀者和下載資源之間內(nèi)部的關(guān)聯(lián)。
本文希望通過更多的定量指標分析中文電子圖書的利用數(shù)據(jù),優(yōu)化紙電館藏比例,合理利用資源建設(shè)經(jīng)費,服務(wù)更多的讀者。
國外關(guān)于電子圖書的研究主要集中在電子書的實際應(yīng)用、系統(tǒng)構(gòu)建、對圖書館的影響及未來發(fā)展、用戶態(tài)度和行為研究、管理和成本定價等方面。電子書服務(wù)、技術(shù)以及對圖書館的影響和發(fā)展等均屬于國內(nèi)研究的重點內(nèi)容[1]。國內(nèi)外關(guān)于h指數(shù)和p指數(shù)的應(yīng)用研究主要集中于評價研究者、研究機構(gòu)、期刊、某領(lǐng)域的研究水平等。h指數(shù)和p指數(shù)不僅可以評價學(xué)術(shù)影響力,還可以用于其他相似領(lǐng)域中。周志峰[2]關(guān)于圖書館流通數(shù)據(jù)的h指數(shù)研究僅為h指數(shù)分析的應(yīng)用示例,更多的是方法論上的意義,沒有對分析結(jié)果中的圖書集合和讀者群的不同進行深入分析。錢玲飛[3]對圖書館OPAC數(shù)據(jù)進行了深入分析,利用h指數(shù)得出不同圖書集合的“讀者熱衷度”,不同讀者群的“借閱活躍度”以及不同圖書集合的“核心讀者”以及不同讀者群的“核心圖書”等。G. Prathap[4]利用h指數(shù)和p指數(shù)對圖書館館流通數(shù)據(jù)進行評估,得出不同學(xué)科主題分類下圖書h指數(shù)和p指數(shù),評價館藏中的優(yōu)質(zhì)領(lǐng)域、優(yōu)質(zhì)用戶、優(yōu)質(zhì)圖書,認為p指數(shù)在圖書館藏評價方面具有很好的適用性。
h指數(shù)是2005年由美國加利福尼亞大學(xué)圣地亞哥分校的物理學(xué)家喬治·赫希(Jorge Hirsch)提出的,其目的是量化科研人員作為獨立個體的研究成果,被提出后就廣泛應(yīng)用于科學(xué)評價的各個領(lǐng)域。一名科學(xué)家的h指數(shù)是指其發(fā)表的Np篇論文中有h篇,每篇至少被引h次;而其余Np-h篇論文,每篇被引均小于或等于h次[5]。
p指數(shù)是由h指數(shù)發(fā)展而來,體現(xiàn)了數(shù)量(被引次數(shù))與質(zhì)量(平均被引率)的平衡。2010年,G. Prathap[6]認為(C2/N)1/3(N指載文量,C指被引次數(shù))具有模擬h指數(shù)的功能,他開始使用hm來代表(C2/N)1/3,隨后他又用p指數(shù)來代替hm,即p=hm=(C×(C/N))1/3。p指數(shù)延續(xù)了h指數(shù)的簡潔計算過程,并且當(dāng)h指數(shù)值相同而使得很多評價案例無法區(qū)分時,p指數(shù)能更合理地進行排名。
H指數(shù)雖然是針對評價科學(xué)家的學(xué)術(shù)成就提出的,但它的思想和方法可以被用于其他類似的領(lǐng)域中,圖書館中處于流通狀態(tài)的圖書和學(xué)者的論文相似,圖書被借閱頻次對應(yīng)論文被引頻次,可以像分析論文被引一樣分析借閱數(shù)據(jù),從而可以將h指數(shù)應(yīng)用于圖書館借閱數(shù)據(jù)分析[3]。電子圖書的下載數(shù)據(jù)類似于紙質(zhì)圖書(以下也簡稱為紙質(zhì)書)的流通數(shù)據(jù),圖書下載次數(shù)對應(yīng)紙質(zhì)圖書流通次數(shù),這就成為國內(nèi)外電子圖書研究的重要手段之一,因此h指數(shù)和p指數(shù)可應(yīng)用于中文電子圖書的下載數(shù)據(jù)分析。
利用h指數(shù)和p指數(shù)對電子圖書下載數(shù)據(jù)進行分析,而不是簡單的統(tǒng)計電子圖書下載量,一方面能夠客觀反映電子圖書的利用狀況和讀者的借閱行為,另一方面可以確定核心電子圖書和用戶,可以體現(xiàn)電子圖書利用的個性化特點。h指數(shù)和p指數(shù)簡潔易計算,可操作性強,便于推廣。h指數(shù)是局部考察,p指數(shù)則是整體評價,p指數(shù)較h指數(shù)視野更開闊[7],因此h指數(shù)可用于確定各大類的核心電子書和核心用戶,p指數(shù)區(qū)分度好、支持動態(tài)變化排名,可用于確定優(yōu)質(zhì)電子書所在的類和優(yōu)質(zhì)用戶所在的學(xué)院。
選取某中文電子圖書數(shù)據(jù)庫,此數(shù)據(jù)庫中的中文電子圖書分類按照館藏紙本圖書的分類,從后臺系統(tǒng)中導(dǎo)出2017年至2019年的使用統(tǒng)計報告。電子圖書下載的數(shù)據(jù)包含了用戶下載圖書的數(shù)據(jù)和圖書被下載的數(shù)據(jù)這兩部分。如果將這兩個數(shù)據(jù)按照借閱頻次進行排序,把電子圖書的下載種數(shù)作為N,把這N種圖書的下載次數(shù)作為C,就會形成h指數(shù)和p指數(shù)原始定義中載文量和引用量之間的關(guān)系,就可以計算h指數(shù)和p指數(shù)了。
按照h指數(shù)和p指數(shù)的計算方法,根據(jù)《中國圖書館分類法》(第五版)[8],計算22個大類的h指數(shù)和p指數(shù),結(jié)果見表1。按照各類的h指數(shù)進行排序,結(jié)果如圖1所示。
表1 各大類電子圖書借閱的h指數(shù)和p指數(shù)Table 1 H-index and p-index of e-book download in various categories
Fig.1 H-index and p-index of e-book download in various categories圖1 各類電子圖書的h指數(shù)和p指數(shù)
從圖1可以看出,O(數(shù)理化學(xué)和科學(xué))、T(工業(yè)技術(shù))、V(航空航天)這三大類電子圖書下載的h指數(shù)和p指數(shù)均超過了20,S(農(nóng)業(yè)科學(xué))和Z(綜合類圖書)這兩大類的h指數(shù)和p指數(shù)明顯低于其他類。O、T、V這三大類電子圖書的下載占總下載量的78.92%,S、Z這兩類的下載量僅占總下載量的0.2%。p指數(shù)高的類,其電子圖書利用率較高。因此本校用戶對中文電子圖書的利用主要集中在O、T、V這三大類。
我校是具有航空航天和民航特色的理工類高校,O類圖書是理工專業(yè)學(xué)科的基礎(chǔ)用書,V類是航空航天特色圖書,T類是工業(yè)技術(shù)類圖書,因此這三大類的電子書利用較好。我校沒有農(nóng)業(yè)類學(xué)科專業(yè),用戶對S類書籍需求很低,Z類圖書的關(guān)注較少,因此這兩大類的電子書的全年下載量、h指數(shù)和p指數(shù)均較低。
D(政治、法律)、E(軍事)、P(天文學(xué)、地球科學(xué))、Q(生物科學(xué))、R(醫(yī)藥衛(wèi)生)這五大類電子圖書的h指數(shù)相同,B(哲學(xué)、宗教)、F(經(jīng)濟)、G(文化科學(xué)、教育、體育)、K(歷史、地理)、N(自然科學(xué)總論)這五大類的電子圖書的h指數(shù)也相同,但是p指數(shù)有差別,因p指數(shù)比h指數(shù)更具敏感度,p指數(shù)越高代表下載的圖書越集中,所以F類存在高核現(xiàn)象(單本電子圖書的下載次數(shù)大大超過了h值)或者長尾現(xiàn)象(未被下載的電子圖書較多)。C(社會科學(xué)總論)、Q(生物科學(xué))、X(環(huán)境科學(xué)、安全科學(xué))這三類電子圖書的h指數(shù)和p指數(shù)相差很小,說明這三類電子圖書的下載較分散,因此p指數(shù)也具有一定的穩(wěn)定性。
O、T、V類這三類電子圖書的h指數(shù)較高,將這三類電子圖書下載次數(shù)不少于h的電子書作為各類的核心電子書。O類核心電子書30種(詳情見表2),T類核心電子書28種,V類核心電子書24種。O類30種核心電子書見表2(按照下載次數(shù)從高到低排序)。
表2 O類核心電子書Table 2 Core e-books of class O
續(xù)表2 O類核心電子書Continued Table 2 Core e-books of class O
由表2可以看出,O類核心電子書主要為近20年出版的圖書,并且從這些電子書的館藏紙本流通數(shù)據(jù)看,相應(yīng)紙本的借閱次數(shù)也較多,說明紙本圖書的流通與電子圖書的下載密切相關(guān)。O類核心電子書p指數(shù)的差異較大,p指數(shù)越高說明此類圖書的下載種數(shù)和次數(shù)越高,用戶對此類圖書的需求越高。p指數(shù)最高的類為O241.82,其種數(shù)占O類核心電子書總種數(shù)的50%,應(yīng)為以后紙電圖書采訪優(yōu)先類。
布拉德福定律既適用于特定主題期刊管理,而且能應(yīng)用于藏書管理[9]。并且期刊下載次數(shù)表現(xiàn)出布拉德福分布的特征,電子圖書的下載也類似。根據(jù)布拉德福文獻規(guī)律[10],將O類電子圖書按照下載量多少,以遞減順序排列劃分為3個下載量基本相等的區(qū)域,其中電子圖書種類最少的區(qū)域為核心區(qū)域,即核心類電子圖書。計算這些核心類的p指數(shù),見表3(按照下載次數(shù)遞減排序)。
由表2可以看出,分類號為O241.82有15種電子圖書,O343有2種電子圖書,O151.2有2種電子圖書,O35、O441.4、O313、O211.6各有1種電子書,屬于核心電子書。由表3可以看出O241.82、O151.2、O35、O343、O441.4、O313、O211.6屬于核心類。由此可以看出偏微分方程的數(shù)值解法(包含有限元和模態(tài)分析)和彈性力學(xué)這兩類類圖書入選核心圖書較多,并且屬于下載較多的核心類。線性代數(shù)和電磁波與電磁場也是我校師生利用較多的電子圖書類。力學(xué)是我校的雙一流學(xué)科和國家重點學(xué)科,因此O35、O342、O343、O313這類圖書的利用較好,p指數(shù)均為10左右。但O342沒有核心圖書,可能與紙質(zhì)圖書的副本和借閱頻率相關(guān)。T類和V類的核心電子書和核心類以相同的方法統(tǒng)計確定核心圖書和核心類,在此不再贅述。
表3 O類圖書的核心類Table 3 Core classes of class O
分析不同類型用戶的下載情況,可以了解不同類型用戶利用中文電子圖書的區(qū)別。分析的用戶類型包括本科生、碩士研究生(包含學(xué)術(shù)碩士研究生、專業(yè)碩士研究生、工程碩士研究生和進修碩士研究生)、博士研究生、教職工及其他,計算各類用戶的h指數(shù)和p指數(shù)如表4所示。
表4 各類用戶的下載h指數(shù)和p指數(shù)Table 4 h index and p index of various users
由表4可以看出,碩士研究生的h指數(shù)和p指數(shù)最高,其次是博士研究生和本科生,可能與碩士研究生和博士研究生的利用習(xí)慣有關(guān)系。
將每類用戶下載次數(shù)不小于h定義為核心用戶,因p指數(shù)較h指數(shù)的敏感性高[11],而各類用戶的p指數(shù)和h指數(shù)相差不大,說明核心用戶比較穩(wěn)定。對核心用戶所在學(xué)院進行分析,選取核心用戶數(shù)量排名前3的學(xué)院如表5所示。
表5 各類用戶中核心用戶數(shù)量TOP 3的學(xué)院Table 5 TOP 3 colleges of core users
由表5可以看出,機電學(xué)院、航空學(xué)院、民航飛行學(xué)院、自動化學(xué)院的核心用戶數(shù)較多,說明這幾個學(xué)院的學(xué)生有良好的學(xué)習(xí)習(xí)慣和中文電子圖書利用習(xí)慣。
以適當(dāng)?shù)姆绞讲少忞娮訒M行數(shù)字資源建設(shè),是當(dāng)前圖書館業(yè)務(wù)轉(zhuǎn)型的關(guān)鍵之一。紙質(zhì)書與電子書的配合是近年圖書市場的熱門話題[12]。不同的用戶對電子書的認知度存在很大差異,因此對電子圖書的利用就存在很大差異。如何提高中文電子圖書的利用率,并使圖書館的紙電圖書分配合理,是圖書館做好文獻資源建設(shè)的主要研究課題。目前本校紙質(zhì)圖書采訪的副本為2至3本,并且本校有多個校區(qū),平均下來可能每個校區(qū)只有1本,對利用帶來一定的制約,因此中文電子圖書的保障顯得尤為重要。
通過利用h指數(shù)和p指數(shù)對中文電子書的下載數(shù)據(jù)進行分析發(fā)現(xiàn)。
第一,本校用戶在中文電子圖書的利用上傾向于自然科學(xué)領(lǐng)域。O類、T類和V類的h指數(shù)和p指數(shù)最高,此三類中文電子書可優(yōu)先保障。F類的p指數(shù)比h指數(shù)高60%以上,存在高核現(xiàn)象或者長尾現(xiàn)象。需要細分D、F這兩大類圖書中下載較多的小類,在以后電子圖書的采訪中優(yōu)先保障這些圖書。
第二,O類電子圖書h指數(shù)最高,說明O類電子圖書利用較多。分析O類電子圖書的小類,根據(jù)p指數(shù)確定的O類的核心類電子圖書可在圖書館主頁、微信平臺等進行推廣。
第三,碩士研究生和博士研究生對中文電子圖書的利用較高,本科生最低,可能本科生傾向于紙質(zhì)書。機電學(xué)院、航空學(xué)院、民航飛行學(xué)院、自動化學(xué)院的核心用戶數(shù)最多,說明這幾個學(xué)院的學(xué)生有良好的學(xué)習(xí)習(xí)慣和中文電子圖書利用習(xí)慣。因此可對此類用戶的中文電子書需求優(yōu)先保障。
本文通過分析中文電子書的利用情況得出了一些有益的結(jié)論,可以指導(dǎo)圖書館優(yōu)化館藏資源,了解用戶對不同類別電子圖書的閱讀需求,從而做好文獻資源建設(shè),提升高校圖書館的服務(wù)質(zhì)量。但本文研究還有一些不足的地方:第一,還有需要進一步細化的地方,比如存在高核或者長尾現(xiàn)象的類在資源保障上按照學(xué)科需求、館藏需求進行細化。第二,統(tǒng)計數(shù)據(jù)還有些單薄,前期先利用小數(shù)據(jù)做一些工作,后期隨著數(shù)據(jù)的積累需繼續(xù)深入研究。第三,統(tǒng)計方法也可以改進,比如考慮不同類型圖書的總量、不同類型用戶的總?cè)藬?shù)等。第四,統(tǒng)計指標選擇上較單一,比如還可以利用其它H類指數(shù)中的A指數(shù)和G指數(shù)等進行分析,為避免單一指標應(yīng)用的風(fēng)險,綜合多指標的綜合評價,提高中文電子圖書的利用率,使紙電圖書配置合理,還需進一步的研究和探索。