陳鶴陽 張力
〔摘 要〕本文通過對(duì)文獻(xiàn)計(jì)量主要方法H-type指數(shù)的修正和改進(jìn),從學(xué)科屬性的角度對(duì)高校圖書館流通數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,并應(yīng)用改進(jìn)后的h-type指數(shù)計(jì)算以天津某高校圖書館英語翻譯專業(yè)為例的核心圖書,較h-index指數(shù)更加精細(xì)的區(qū)分并且大大提高了區(qū)分度,從而幫助在校學(xué)生有針對(duì)性的認(rèn)識(shí)和了解學(xué)科的核心內(nèi)容,同時(shí)也為今后圖書館信息服務(wù)的開展提供有益的參考與借鑒。
〔關(guān)鍵詞〕文獻(xiàn)計(jì)量;h指數(shù);h-type指數(shù);學(xué)科圖書;高校圖書館
DOI:10.3969/j.issn.1008-0821.2016.04.022
〔中圖分類號(hào)〕G252.5 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2016)04-0119-05
〔Abstract〕The paper,based on bibliometric main method H-type index of modifications and improvements,from the perspective of the property subject to the statistical analysis of University Library Circulation data,applied in Tianjin university library by improved h-type index computing core books,compared the h-index greatly improves the discrimination,helping students targeted core content knowledge and understanding of science,but also for the future conduct of Library Information Service to provide useful information and reference.
〔Key words〕bibliometric;h-index;h-type index;subject book;university library
文獻(xiàn)計(jì)量的主要研究方法包括引文分析方法、詞頻分析方法、h-type指數(shù)法,都是利用文獻(xiàn)的某些特征數(shù)據(jù)來描述或者預(yù)測(cè)用戶行為,發(fā)現(xiàn)現(xiàn)象規(guī)律。高校圖書館流通數(shù)據(jù)挖掘的重點(diǎn)是要體現(xiàn)圖書的學(xué)科屬性以指導(dǎo)館藏的優(yōu)化、讀者的薦閱,提高圖書的使用率。引文分析法和詞頻分析法對(duì)于高校圖書館流通數(shù)據(jù)學(xué)科屬性的挖掘適用性較h-index指數(shù)差,因?yàn)椴煌咝2捎貌煌墓ぷ飨到y(tǒng),流通數(shù)據(jù)的采集無法實(shí)現(xiàn)文獻(xiàn)之間關(guān)聯(lián)的體現(xiàn)和詞頻的統(tǒng)計(jì),需要投入大量的人力進(jìn)行人工分析,效率極低,而利用h-index指數(shù)能夠有效的挖掘出高校圖書館流通數(shù)據(jù)的學(xué)科屬性,在一定程度上也能夠反映出高校的學(xué)科發(fā)展和專業(yè)設(shè)置的特點(diǎn)。h-index指數(shù)是J.E.Hirsch于2005年在美國科學(xué)學(xué)院院報(bào)(PNAS)上發(fā)表的一篇名為“An Index to Quantify an Individuals Scientific Research Output”中提出的,是衡量科學(xué)家個(gè)人成就的一種簡(jiǎn)單有效的方法,在經(jīng)過眾多學(xué)者對(duì)h指數(shù)的改進(jìn)、延伸和擴(kuò)展后,h-type指數(shù)作為一個(gè)簡(jiǎn)單又易于理解的指標(biāo)被廣泛應(yīng)用于各種評(píng)價(jià)環(huán)境中,如期刊h指數(shù)[2-3]、機(jī)構(gòu)h指數(shù)[4]、專利質(zhì)量評(píng)價(jià)等方面[5]。雖然h指數(shù)最初是針對(duì)科學(xué)家學(xué)術(shù)成就評(píng)價(jià)提出的,但其思想和方法也可以擴(kuò)展應(yīng)用到圖書館的借閱數(shù)據(jù)分析中。2009年周志鋒就h指數(shù)應(yīng)用于圖書館借閱數(shù)據(jù)中的可行性進(jìn)行了分析并以上海圖書館“圖書借閱風(fēng)云榜”為實(shí)證研究進(jìn)行驗(yàn)證[6],但其僅從方法論的角度介紹了h指數(shù)在圖書館應(yīng)用的可行性。錢玲飛、汪榮利用h指數(shù)統(tǒng)計(jì)得出不同讀者群的“借閱活躍度”和“核心讀者”,為高校圖書館開展服務(wù)提供了一種新的思路,但是在其文章中計(jì)算h指數(shù)時(shí)沒有充分考慮某類圖書的館藏量以及在確定核心讀者時(shí)也沒有考慮學(xué)院的人數(shù),這些因素都會(huì)影響研究結(jié)論的偏差[7]。張貝運(yùn)用hg指數(shù)分析圖書館的借閱數(shù)據(jù),得出圖書高利用率的讀者群體,從讀者借閱行為的角度進(jìn)行hg指數(shù)的分析,并沒有從圖書的屬性進(jìn)行hg指數(shù)分析[8]。
為了能夠更加直觀、客觀的評(píng)價(jià)學(xué)科圖書,避免由于上述偏差和相關(guān)因素造成結(jié)論的偏倚,本文對(duì)h指數(shù)進(jìn)行了改進(jìn),提出了一種新的計(jì)算方法從而修正了學(xué)科圖書受館藏量、平均借閱量影響而造成的偏差,同時(shí)也提高了由于出版時(shí)間而使h指數(shù)區(qū)分度不高的問題。
1 概念邊界
本文的研究目的是要通過h-type指數(shù)對(duì)圖書進(jìn)行評(píng)價(jià),利用圖書的類目屬性確定圖書的學(xué)科范圍,從而得到某一學(xué)科范圍內(nèi)的核心圖書,以期為讀者提供一個(gè)關(guān)于該學(xué)科的知識(shí)圖譜并通過圖書的形式表征出來。學(xué)科圖書在學(xué)術(shù)界并沒有明確的定義,這里泛指能夠反映某一專業(yè)領(lǐng)域內(nèi)涵和外延的知識(shí),并能按照一定的分類編目體系進(jìn)行學(xué)科屬性的特征歸屬,最終以圖書的形式表征出來。從整體上,學(xué)科圖書是了解該學(xué)科的現(xiàn)狀、知識(shí)分布、發(fā)展方向的重要途徑,不僅作為讀者的知識(shí)載體用以傳播,同時(shí)它和整個(gè)學(xué)科發(fā)展的知識(shí)體系也密切相關(guān)。圖書館作為讀者汲取知識(shí)的重要場(chǎng)所,通過獲取讀者的借閱信息,并將其借閱信息與借閱圖書的學(xué)科屬性建立相關(guān)關(guān)系,然后利用h-type指數(shù)評(píng)價(jià)從而確定學(xué)科的核心圖書。
2 h指數(shù)在評(píng)價(jià)學(xué)科圖書方面的不足
2.1 忽視了h核內(nèi)圖書的最高被借閱次數(shù)
在h核內(nèi)無法區(qū)分出借閱率高的圖書,它是一個(gè)平均量化值,因?yàn)樵趆指數(shù)計(jì)算的過程中,我們只統(tǒng)計(jì)大于等于h次被借閱的圖書,即便存在某些圖書的被借閱次數(shù)高于h幾倍,也無法體現(xiàn)其高借閱率,最終h指數(shù)仍以剛超過h數(shù)值為準(zhǔn),無法區(qū)分高借閱率的圖書。
2.2 忽視了出版時(shí)間
h指數(shù)無法公正的顯現(xiàn)剛出版圖書的指數(shù),因其得出的數(shù)值并不客觀,這主要是因?yàn)閔指數(shù)是受時(shí)間因素影響的指標(biāo),出版發(fā)行較早的圖書其借閱率交近期發(fā)行的圖書要高,自然它的h指數(shù)也較高。隨著時(shí)間的變化,h指數(shù)只會(huì)不斷上升,不會(huì)下降,也就是說原來h指數(shù)較高的圖書會(huì)依然保持著高借閱量,其h指數(shù)仍然很高,這樣在統(tǒng)計(jì)的過程中,往往會(huì)忽視了一些極具時(shí)代發(fā)展代表性的圖書。例如大數(shù)據(jù)、云計(jì)算等相關(guān)圖書,在剛出版時(shí)由于受到樣本量的影響,在短時(shí)間內(nèi)其借閱次數(shù)無法迅速提升,所以類似這樣的圖書,h指數(shù)并不能客觀的反映其價(jià)值。
2.3 忽視了學(xué)科偏倚
利用h指數(shù)統(tǒng)計(jì)學(xué)科圖書,其最終的數(shù)據(jù)往往受到高校學(xué)科建設(shè)、專業(yè)設(shè)置的影響,理工科類院校往往在館藏構(gòu)建時(shí)更偏重理工類圖書,那么在其學(xué)科圖書h指數(shù)自然是理工類圖書居多,同理,反之。所以h指數(shù)并不適合跨學(xué)科、跨學(xué)校的比較,它只能作為高校圖書館開展信息服務(wù)的一個(gè)風(fēng)向標(biāo),它代表的是自身學(xué)校讀者的閱讀傾向。
3 改進(jìn)的h-type指數(shù)
為了提高由于h指數(shù)方法自身缺點(diǎn)造成區(qū)分能力不足問題,國內(nèi)外已經(jīng)提出了數(shù)十種改進(jìn)方法,學(xué)術(shù)上統(tǒng)稱為h-type指數(shù)[9],這些指數(shù)的設(shè)計(jì)分別針對(duì)h指數(shù)的時(shí)間問題、數(shù)量問題、虛假合作問題進(jìn)行了改進(jìn)。在這其中A指數(shù)因其計(jì)算簡(jiǎn)單、直觀得到了廣泛應(yīng)用,但A指數(shù)是基于平均數(shù)來計(jì)算的,忽視了內(nèi)部差異。例如對(duì)于22大類圖書來說,傳統(tǒng)h指數(shù)是通過借閱頻次來進(jìn)行排序的,從而得出某一類圖書的h指數(shù),但是這樣往往忽視了該類圖書內(nèi)部的差異,舉例來說,A—140、20、20;B—60、60、60,平均被借閱的次數(shù)都是60,但是A類圖書中有明顯借閱率高于其他圖書的情況,因此更需要高度關(guān)注,在關(guān)注平均借閱的同時(shí)還要考慮最高借閱的情況,提高區(qū)分度,因此在A指數(shù)研究的基礎(chǔ)上對(duì)其進(jìn)一步的改進(jìn)和完善,以保證數(shù)據(jù)合理客觀的呈現(xiàn)。綜上所述,提出一種改進(jìn)的指數(shù)A+即:
A+指數(shù)=h核心圖書被借閱次數(shù)和+最高借閱次數(shù)h
A+指數(shù)引入了最高借閱次數(shù)除以h的項(xiàng)目,反映了類目內(nèi)圖書的差異,突出了最高借閱次數(shù)圖書的重要性,提高了指數(shù)的區(qū)分能力。但在學(xué)科內(nèi)確定核心圖書時(shí),不僅要考慮圖書的借閱頻次還要考慮圖書的復(fù)本量,因此在計(jì)算h指數(shù)時(shí)要依據(jù)相對(duì)借閱次數(shù)進(jìn)行排序,為避免區(qū)分度不高的情況出現(xiàn),對(duì)其進(jìn)行修正其公式為:
相對(duì)借閱頻次=總借閱頻次復(fù)本量
hx=h+h相對(duì)借閱頻次
4 實(shí)證研究
4.1 數(shù)據(jù)樣本來源
以天津外國語大學(xué)(以下簡(jiǎn)稱天外)圖書館2004-2014年各類圖書借閱數(shù)據(jù)為樣本,其具體體現(xiàn)為圖書館管理系統(tǒng)(Unicorn系統(tǒng))中所記錄的借閱數(shù)據(jù),依據(jù)中國圖書分類法(第5版)的類目信息確定學(xué)科主題圖書,利用h指數(shù)的基本思想,當(dāng)且僅當(dāng)?shù)趆本學(xué)科圖書每本的借閱頻次不少于h次,剩下的(N-h)圖書的借閱頻次小于h次,即第h+1本書借閱頻次小于h+1時(shí),該學(xué)科圖書的h指數(shù)為h,通過引入圖書最高被借閱次數(shù),計(jì)算A+指數(shù)。數(shù)據(jù)檢索時(shí)間為:2015年5月18日
4.2 A+指數(shù)計(jì)算及分析
本文通過對(duì)22大類圖書A+指數(shù)的計(jì)算和評(píng)價(jià),從而確定了天外的核心學(xué)科館藏,如表1所示,在核心學(xué)科館藏范圍內(nèi)以英語翻譯專業(yè)為例,按照中圖法分類規(guī)則,其對(duì)應(yīng)的分類號(hào)為H315.9,在結(jié)合A+指數(shù)的評(píng)價(jià)思想確定該專業(yè)領(lǐng)域內(nèi)的核心圖書,因天外為多語種院校,圖書分為中文普通書和外文普通書,為了體現(xiàn)語種的不同其分類規(guī)則以語種+類屬性的形式體現(xiàn),所以滿足英語翻譯學(xué)科圖書的檢索參數(shù)應(yīng)為:以H315.9和31/H315.9為檢索詞,依據(jù)中圖法C和中圖法W進(jìn)行設(shè)置,計(jì)算結(jié)果如表2所示:
如表1所示,22大類圖書的h指數(shù)評(píng)價(jià)有重復(fù)的情況(S類和V類),A+指數(shù)在考慮最高借閱頻次的數(shù)值后,更加精細(xì)的區(qū)分了各類圖書的指數(shù),能夠降低h指數(shù)高重復(fù)幾率的出現(xiàn)。另外,隨著區(qū)分能力的提高,各類圖書的指數(shù)排名會(huì)出現(xiàn)細(xì)微變化,當(dāng)該類圖書的最高借閱頻次越高其A+指數(shù)相對(duì)h指數(shù)的變化就會(huì)越大,例如Q類圖書的h指數(shù)排名為18位,其核內(nèi)圖書最高借閱頻次為113,故它的A+指數(shù)會(huì)發(fā)生較大的變化,其排名也隨之上升了3位。第三,存在兩種評(píng)價(jià)的結(jié)果比較接近的類目,如H類和I類圖書,兩類圖書在h指數(shù)和A+指數(shù)的評(píng)價(jià)中的排名占據(jù)了前兩位,一般情況下,A+指數(shù)評(píng)價(jià)排名較高的圖書類目在一定程度上對(duì)應(yīng)著該校的核心專業(yè)。以天外為例,作為語言類文科院校其核心學(xué)科主要體現(xiàn)為語言和文學(xué)兩大學(xué)科,這一點(diǎn)從分析數(shù)據(jù)上也得到了支持。A+指數(shù)也可以應(yīng)用在作者、出版社的評(píng)價(jià)上,以此來提高區(qū)分能力,更加細(xì)分的顯現(xiàn)學(xué)科領(lǐng)域內(nèi)的核心作者以及核心出版社。
如表2所示,通過圖書相對(duì)借閱頻次計(jì)算得出h指數(shù),因h指數(shù)的時(shí)間敏感性在排序上按照?qǐng)D書的出版時(shí)間進(jìn)行倒序排列,但依然存在區(qū)分度不高的問題,很多圖書的h指數(shù)相同,經(jīng)過hx指數(shù)修正后大大提高了區(qū)分度,也使得核心圖書的排序發(fā)生了細(xì)微的變化,究其原因是由于借閱頻次的差異造成的。當(dāng)h指數(shù)相同,復(fù)本量越大借閱頻次越高,但其相對(duì)借閱頻次未必高,所以hx指數(shù)有可能會(huì)反轉(zhuǎn)如序號(hào)7和8的圖書。借閱數(shù)據(jù)是讀者對(duì)圖書所蘊(yùn)含的核心知識(shí)的直接驅(qū)動(dòng)力,對(duì)圖書館館藏海量的借閱信息進(jìn)行h-type指數(shù)的提取以此來確定學(xué)科核心圖書是有價(jià)值的。
4.3 結(jié)果討論
4.3.1 相關(guān)關(guān)系分析
利用SPSS統(tǒng)計(jì)軟件對(duì)表2中所得到的學(xué)科圖書評(píng)價(jià)指標(biāo)數(shù)據(jù)進(jìn)行相關(guān)關(guān)系統(tǒng)計(jì)分析,樣本影響因子C和借閱頻次P與學(xué)科圖書hx指數(shù)之間的相關(guān)性進(jìn)行分析。如圖1和圖2所示,兩種因子指標(biāo)在散點(diǎn)圖中表現(xiàn)出一定的相關(guān)關(guān)系。其中復(fù)本量C與hx指數(shù)之間存在一定弱相關(guān)關(guān)系,也就是說復(fù)本量大的學(xué)科圖書hx指數(shù)未必高,而借閱頻次P與hx指數(shù)之間成強(qiáng)正線性相關(guān)。
為更加精確地分析學(xué)科圖書h指數(shù)與其他評(píng)價(jià)指標(biāo)之間的相關(guān)關(guān)系,利用SPSS計(jì)算Pearson相關(guān)系數(shù)如表3和表4所示。
由表3可知,復(fù)本量C與hx指數(shù)的簡(jiǎn)單相關(guān)系數(shù)為0.011,說明兩者之間存在正的弱相關(guān)性,其相關(guān)系數(shù)檢驗(yàn)的概率P-值近似為1,大于給定的顯著性水平α,不能拒絕原假設(shè),認(rèn)為兩總體存在零相關(guān)。但這與存在弱相關(guān)之間是不矛盾的。表4可知,借閱次數(shù)P與hx指數(shù)的簡(jiǎn)單相關(guān)系數(shù)為0.837,說明兩者之間存在正的強(qiáng)相關(guān)性,其相關(guān)系數(shù)檢驗(yàn)的概率P值近似為0,拒絕兩總體零相關(guān)的原假設(shè)。因此,學(xué)科圖書hx指數(shù)的確定與圖書的館藏復(fù)本量成正弱相關(guān)性,與借閱頻次成正強(qiáng)相關(guān)性,說明復(fù)本量大的圖書未必是學(xué)科的核心圖書,相反一些復(fù)本量少但借閱頻次高的圖書,如商務(wù)英語口譯。
4.3.2 館藏學(xué)科圖書書目分析
英語翻譯作為一門理論與實(shí)踐相結(jié)合的學(xué)科,其學(xué)科核心書目特征也以理論基礎(chǔ)類和實(shí)踐應(yīng)用類的圖書為主,正如表2所示,從內(nèi)容上看其中理論基礎(chǔ)類圖書占據(jù)24種,占58.6%,學(xué)科主題圖譜如圖3所示,從主題圖譜中可以看出,通過對(duì)學(xué)科圖書的細(xì)分可以客觀、直接的了解本校讀者對(duì)英語翻譯學(xué)科圖書的閱讀傾向及該學(xué)科知識(shí)體系構(gòu)成,為更好的構(gòu)建學(xué)科圖書館藏資源建設(shè)提供數(shù)據(jù)支持。
從讀者的角度,學(xué)科圖書hx指數(shù)體現(xiàn)了認(rèn)知主體的選擇,借閱某本圖書必定能夠解決其某一方面的問題,是讀者認(rèn)可圖書價(jià)值的最直觀體現(xiàn)方式,雖然學(xué)科圖書hx指數(shù)不能完全代表該學(xué)科領(lǐng)域內(nèi)的核心知識(shí),但是趨近的狀態(tài)是顯而易見的。從學(xué)科圖書書目上看,也反映了讀者對(duì)該學(xué)科領(lǐng)域內(nèi)實(shí)踐應(yīng)用的需求,如筆譯、口譯等級(jí)考試類的圖書,占總比重的24%。
5 結(jié) 語
學(xué)科圖書在一定程度上能夠充分體現(xiàn)學(xué)科核心知識(shí),利用h指數(shù)的思想對(duì)h指數(shù)的修正和改進(jìn)使得學(xué)科圖書的確定更加具有客觀性,并能真實(shí)的反映讀者閱讀需求,我們?cè)跒樽x者提供知識(shí)文本的同時(shí),根據(jù)讀者的需求提供推送式、引導(dǎo)式的學(xué)科服務(wù)是確定學(xué)科圖書的主要目的。隨著學(xué)科理論知識(shí)的豐富和不斷創(chuàng)新,以圖書為表征形式的知識(shí)文本將會(huì)不斷更新,高校圖書館應(yīng)對(duì)學(xué)科圖書進(jìn)行定期的統(tǒng)計(jì),從而更及時(shí)、準(zhǔn)確、全面的為讀者提供學(xué)科化知識(shí)服務(wù),同時(shí)有利于高校圖書館信息服務(wù)向知識(shí)服務(wù)的推進(jìn)。未來也可以更加細(xì)化分析,核心圖書與讀者的關(guān)聯(lián)關(guān)系,核心圖書與與借閱時(shí)間的關(guān)聯(lián)關(guān)系等,這些數(shù)據(jù)的確立都將進(jìn)一步完善圖書館知識(shí)服務(wù)的水平,從而全面提高圖書館服務(wù)水平。
參考文獻(xiàn)
[1]J.E.Hirsch.An index to quantify an individuals scientific research output[J]PNAS,2005,102(46).
[2]趙基明.h指數(shù)及其在中國學(xué)術(shù)期刊評(píng)價(jià)中的應(yīng)用[J].評(píng)價(jià)與管理,2007,(4):14-20.
[3]劉銀華.h指數(shù)評(píng)價(jià)期刊的有效性分析[J].情報(bào)理論與實(shí)踐,2007,(6):809-811,815.
[4]萬錦,花平寰,趙呈剛.中國部分重點(diǎn)大學(xué)h指數(shù)的探討[J].科學(xué)觀察,2007,(3):9-16.
[5]陳攀,沙勇忠.我國985大學(xué)專利H指數(shù)分析[J].圖書與情報(bào),2014,(5):53-61.
[6]周志峰.h指數(shù)應(yīng)用于圖書館借閱數(shù)據(jù)分析的探索[J].圖書館建設(shè),2009,(11):82-84,89.
[7]錢玲飛,汪榮.基于h指數(shù)的OPAC數(shù)據(jù)分析及應(yīng)用[J].大學(xué)圖書館學(xué)報(bào),2012,(2):61-62.
[8]張貝.試用hg指數(shù)應(yīng)用于圖書借閱數(shù)據(jù)分析研究[J].現(xiàn)代情報(bào),2012,32(12):95-98,104.
[9]王凌峰.一個(gè)新的h-type指標(biāo)[J].情報(bào)雜志,2013,(1):55-58.
(本文責(zé)任編輯:郭沫含)