臧弘毅
摘 要:本文以Web of Science文獻數(shù)據(jù)為樣本文獻,利用引文分析可視化軟件Histcite對樣本文獻進行操作,分析數(shù)字圖書館領域內的文獻發(fā)表年份、地區(qū)、核心期刊、核心作者等,繪制引文編年圖,從而剖析其研究方向和發(fā)展規(guī)律。
關鍵詞:數(shù)字圖書館;引文分析;Histcite
中圖分類號:G254? ? 文獻標識碼:A? ? 文章編號:1671-0037(2018)12-87-4
DOI:10.19345/j.cxkj.1671-0037.2018.12.022
數(shù)字圖書館指的是對各種數(shù)字信息資源采取數(shù)字技術進行處理和存儲的圖書館,其實質上是一種多媒體制作的分布式信息系統(tǒng)[1]。隨著互聯(lián)網(wǎng)技術的快速發(fā)展,數(shù)字圖書館得到了快速發(fā)展,因此對數(shù)字圖書館的研究分析是有必要的。
本文利用引文分析可視化軟件Histcite,選取Web of Science中關于數(shù)字圖書館的文獻進行分析,從文獻數(shù)量、高被引作者等方面分析,繪制引文圖譜,掌握其發(fā)展脈絡,了解其核心課題及研究前沿。
1 文獻來源與研究方法
1.1 文獻來源
本文研究分析所需的樣本文獻數(shù)據(jù)均來自Web of Science數(shù)據(jù)庫。所采取的檢索策略是以“Digital library”為主題詞進行檢索,選取的年限為“2018年之前”,類型為“information science library science”,文獻類型為“Article”,共得到1 944篇文獻。以全記錄與引用的參考文獻為下載內容,純文本格式為下載格式進行下載。
1.2 研究方法
引文分析是利用數(shù)學和統(tǒng)計學的方法,同時采用比較、歸納、抽象等一系列邏輯的方法,對期刊、論文、作者等各個分析對象的引證與被引證現(xiàn)象進行有效的分析,從而揭示其中的數(shù)量特征和內在規(guī)律的一種文獻計量分析方法[2]。
Histcite是由SCI的創(chuàng)始人尤金·加菲爾德開發(fā)的一款可視化引文分析軟件,Histcite及History of cite,意思是引文分析歷史。它可以利用圖示的方法展示某個領域內的不同文獻間的關系,可以了解某一領域的發(fā)展方向,繪制出其發(fā)展脈絡,確定其核心作者、重要文獻等重要內容。
本文所采用Histcite中的指標有:
①LCS(Local Citation Score),本地引用次數(shù),是指某篇文獻在下載的所有文獻中被引用的次數(shù);②GCS(Global Citation Score),引用次數(shù),是指某篇文獻在WOS中被引用的總次數(shù);③LCR(Local Cited References),引用本地參考文獻數(shù)量,是指某篇文獻引用的所有參考文獻中,有多少篇文獻在當前數(shù)據(jù)庫當中;④CR(Cited References),引用所有參考文獻量,是指某篇文獻在WOS中引用的所有參考文獻;⑤TLCS(Total Local Citation Score),本地引用總次數(shù);⑥TGCS(Total Global Citation Score),引用總次數(shù)。其中,若某篇文獻的GCS值高,則表示該文章被全球范圍內的專家廣泛關注。若某篇文獻的GCS高,但LCS小,則表示關注該文章的專家學者來自于多個領域。
2 分析與結果
將從WOS中下載的1 944篇文獻導入可視化引文分析軟件Histcite當中,共得到1 918篇分析記錄,缺失26篇,其原因可能是文獻格式問題。在剩余的1 918篇文獻中,文獻分布在2001—2017年,共計3 318個作者,76種期刊,44 802篇參考文獻,3 212個關鍵詞,本地引用次數(shù)(LCS)為1 373,引用次數(shù)(GCS)為9 687。
2.1 文獻發(fā)表年份分析
下載的1 918篇文獻的年份分布如圖1所示。
由圖1可以看出,首先出現(xiàn)在2001年,其原因可能是在此之前關于數(shù)字圖書館的相關文獻并沒有歸類在“information science library science”中,因為數(shù)字圖書館是伴隨著互聯(lián)網(wǎng)技術的發(fā)展而產生的,依靠于現(xiàn)代計算機技術和現(xiàn)代通信技術。2002年增長過后又在2003年、2004年維持了2001年的水平,從2004年開始快速增長,在2006年達到頂峰,該年有183篇數(shù)字圖書館方向的文獻,并在2007—2015年保持在一個較高的水平上,但是近兩年的文獻量呈持續(xù)下降趨勢。2005年后維持在較高水平的原因可能是2005年由國際圖聯(lián)管理委員會探討制定并在2007年底正式通過《國際圖聯(lián)數(shù)字圖書館宣言》,該宣言倡導消除數(shù)字鴻溝,促進世界文化與科學遺產的普及,其重要方法就是各國各類圖書館對數(shù)字圖書館的積極推廣。近兩年下降的原因則可能是數(shù)字圖書館發(fā)展日漸完善,創(chuàng)新點減少,或者研究過程中出現(xiàn)了一定的瓶頸從而導致發(fā)文量有所減少。
2.2 文獻發(fā)表國家(地區(qū))分析
數(shù)字圖書館的興起是在美國,并在全球范圍內快速發(fā)展起來,此次研究的1 918篇關于數(shù)字圖書館的文獻來自78個國家和地區(qū),表1是發(fā)文量排名前9位的國家和地區(qū)。其中,歐美發(fā)達地區(qū)占主要,最多的是美國,發(fā)文量為612篇,占總計1 918篇的32%??梢哉f美國在數(shù)字圖書館領域的研究是最領先的,研究能力最強,其原因可能是:①計算機技術及互聯(lián)網(wǎng)技術的快速發(fā)展;②國家政策的扶持與資金投入較大;③美國作為世界上綜合實力最強的國家之一,擁有大批的圖書情報人才等。歐洲地區(qū)的發(fā)文量緊隨美國之后,其可能是法國國家圖書館館長讓納內在2005年發(fā)起倡議的“歐洲數(shù)字圖書館建設計劃”引起的歐洲對數(shù)字圖書館領域的研究快速發(fā)展。隨著綜合國力的提升和互聯(lián)網(wǎng)技術的快速發(fā)展,逐漸涌現(xiàn)出一批優(yōu)秀的圖書情報人才。我國在數(shù)字圖書館方面的重視程度也逐漸增強,研究能力也逐步進入世界前列,發(fā)文量排在第四位,有165篇,占8.6%。
2.3 文獻發(fā)表核心作者分析
目前,核心作者的確定還沒有完全統(tǒng)一的標準,一般來說可按照發(fā)文量和被引用量進行確定。根據(jù)普賴斯平方根定律可知,核心作者的發(fā)文數(shù)量將占該領域所有文獻總數(shù)的一半,核心作者最低發(fā)文數(shù)量為m=0.749[nmax],其中nmax為發(fā)文量最多作者的發(fā)文量,本文的取值為17,計算得出m=3。所以核心作者的發(fā)文數(shù)量應該在3篇以上,發(fā)文作者在3篇以上共有208位,占發(fā)文作者總數(shù)3 318的6.2%,共發(fā)文926篇,占總發(fā)文量的48.2%,基本符合普賴斯定律(Price'Law)。
本文對發(fā)文量排在前十位的作者(如表2)和本地被引量(TLCS)排在前十的作者(如表3)進行分析,發(fā)現(xiàn)兩項均排在前列的有Nicholas D、Goncalves MA、Huntington P、Jamali HR等。在這當中Nicholas D(大衛(wèi)·尼古拉斯)發(fā)表的論文最多,大衛(wèi)·尼古拉斯是倫敦大學學院的圖書館、檔案和信息學的學科帶頭人,他主要的研究領域是信息通信技術對戰(zhàn)略性用戶群體的影響、信息需求分析、聯(lián)機與數(shù)字圖書館的使用與評估等方面,有著多年的研究經驗,并承擔了30余項國家項目,發(fā)表300多篇論文。其中有2個具有核心影響力的項目,分別是:①電子期刊的評估與使用;②英國國家電子書平臺構建。同時,他還擔任《信息管理協(xié)會會報 :新信息展望》(Aslib Proceedings: new information perspectives)的主編。
2.4 文獻發(fā)表核心期刊分析
經分析,選取的1 918篇文獻來自78種期刊,排名前十的期刊共發(fā)文972篇,占51%。而根據(jù)英國科學家布拉德福德提出的布拉德福德定律,刊載論文總數(shù)約占1/3的期刊是該學科的核心期刊,可以看出《ELECTRONIC LIBRARY》《LIBRARY HI TECH》《PROGRAM-ELECTRONIC LIBRARY AND INFORMATION SYSTEMS》《JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY》《RESEARCH AND ADVANCED TECHNOLOGY FOR DIGITAL LIBRARES》等為該領域的核心期刊,具有較強的學科影響力。分析本地被引量可以發(fā)現(xiàn),被引量排名靠前的期刊其發(fā)文量也排名前列。從所列的期刊列表可以看出,涉及數(shù)字圖書館的研究論文主要發(fā)表在與圖書館學、信息學相關的期刊上,但是,美國著名的數(shù)字圖書館雜志(D-Lib Magazine)并不在統(tǒng)計列表上,其原因是該期刊不在SCI、SSCI的收錄名單當中。
2.5 引文時序分析
Histcite中最具有特色的功能就是形成文獻引文編年圖,其可以反映一段時期內某一領域內的重要文獻及其引用關系,可以了解該領域的研究方向和主題發(fā)展的歷史脈絡。由于文獻數(shù)量較多,本文選取樣本文獻中LCS值較高的前100篇文獻進行數(shù)字圖書館引文時序分析,如圖2所示。其中每一個圓圈代表一篇文獻,圓圈內的數(shù)字為文獻序號,圓圈的大小代表文獻被引用量的多少,圓圈越大表示文獻的被引次數(shù)越多,受關注程度越高,文獻間用箭頭連接,箭頭表示文獻間的相互引用關系,箭頭指向是被引用文獻。同時,還可以用連線的密集程度來判斷研究活躍程度,連線密集就說明研究活躍,文獻間相互引用頻繁。
由LCS排序前100的文獻組成的引文編年圖可以看出數(shù)字圖書館領域呈現(xiàn)出3個較為明顯的引證關系鏈,第一個是以文獻18、52、345、917為主要文獻,第二個是以文獻306為主要文獻,第三個是以文獻924為主要文獻。同時,圖中還存在著一些孤立的且被引次數(shù)較高的文獻,如文獻309、716等,產生這樣的原因可能是LCS的閥值選取不夠高,一些文獻的相互引用關系未能表達出來,或者是這些文獻中數(shù)字圖書館并不是主要內容。通過增大LCS的閥值和閱讀獨立文獻的摘要等驗證了本文作者的觀點。
第一個引證關系鏈中,可以明顯看出大致有4篇重要文獻,第一篇是序號18,由Hong W; Thong J Y L等在2001年發(fā)表在《JOURNAL OF MANAGEMENT INFORMATION SYSTEMS 》上的《Determinants of user acceptance of digital libraries: An empirical examination of individual differences and system characteristics》,這也是引證關系鏈1中最早的一篇文獻,其基于對一個大學優(yōu)秀數(shù)字圖書館的585個用戶的調查研究,結果支持了TAM對用戶使用數(shù)字圖書館意愿方面的預測以及外部信息對易用性和有用性的影響,得到個體差異和系統(tǒng)特征對數(shù)字圖書館易用性和有效性有顯著影響的結論。第二篇是序號52,由Monopoli M, Nicholas D等發(fā)表在《ASLIB PROCEEDINGS》上的《A user-oriented evaluation of digital libraries: case study the “electronic journals” service of the library and information service of the University of Patras, Greece》,其對希臘佩特雷大學使用圖書館和信息處電子期刊服務的情況進行了相應的評估。調查這些電子期刊服務用戶以及他們使用服務的頻率、使用的原因、使用的訪問點和使用的搜索方法和服務。此外,邀請用戶在電子期刊和紙質期刊之間進行選擇,并指出一些阻礙他們訪問電子期刊服務的因素。第三篇是序號345,由Xie HI于2006年發(fā)表在《LIBRARY & INFORMATION SCIENCE RESEARCH》上的《Evaluation of digital libraries: Criteria and problems from users perspectives》,該文主要對數(shù)字圖書館的標準進行探究,從48個不同的角度來進行評估,最終得出用戶認為的數(shù)字圖書館標準(收集質量、任務可使用性、系統(tǒng)性能效率、服務質量、用戶意見征集),揭示了當前數(shù)字圖書館設計與開發(fā)中存在的問題,探討了改進數(shù)字圖書館設計的建議,并提出了進一步研究的領域。第四篇是序號917,由Nov O,Ye C在2009年發(fā)表在《JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY》上的《Resistance to Change and the Adoption of Digital Libraries: An Integrative Model》,該文通過對一些資料的研究,包括信息技術的采用、社會心理學、數(shù)字圖書館的使用等,利用結構方程模型來探討數(shù)字圖書館發(fā)展的阻力。通過對重要文獻的分析,不難看出引證關系鏈1中研究的重點是數(shù)字圖書館影響因素和數(shù)字圖書館的標準。
第二個引證關系鏈中的重要文獻有序號306的,Pomerantz J在2005年發(fā)表在《JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY》上的《A conceptual framework and open research questions for chat-based reference service》,文章探討了在提供同步、基于聊天參考過程中的各個步驟以及在每一步中提供這種服務所涉及的問題,探索的目的是提出一些開放性的研究問題,提供一個基于聊天的參考服務的高層次抽象模型,并希望該模型可以作為未來基于聊天參考的應用程序開發(fā)的概念模型。通過結合關系鏈中其他文獻的分析研究,可以看出引證關系鏈2主要是對參考咨詢方面進行的研究。
第三個引證關系鏈則有序號924,Choi Y, Rasmussen E于2009年發(fā)表在《JOURNAL OF ACADEMIC LIBRARIANSHIP》上的《What Qualifications and Skills are Important for Digital Librarian Positions in Academic Libraries? A Job Advertisement Analysis》為主要文獻。該文通過收集分析1999—2007年間高校圖書館發(fā)布的數(shù)字圖書館招聘信息中的數(shù)據(jù),驗證了數(shù)字圖書館人員配置需求和所需資格的變化,證實了數(shù)字圖書館員在高校圖書館中的地位得到了有效的提升。結合文獻5、36可以看出,在引證關系鏈3當中主要研究的內容是關于數(shù)字圖書館館員應具有的能力及其重要性。
3 結語
數(shù)字圖書館已經有將近20年的發(fā)展歷史,它的興起是計算機技術與通信技術發(fā)展的產物。數(shù)字圖書館的發(fā)展離不開圖書情報領域的專家,同時也與計算機通訊領域有著密切的聯(lián)系,多方面促成了數(shù)字圖書館今天的成就。
本文通過利用Histcite對WOS中關于數(shù)字圖書館的1 918篇文獻進行分析,對數(shù)字圖書館領域的核心作者、核心期刊等有了一定的認知,并通過引文時序分析對其研究方向有了直觀的了解,并能夠對未來發(fā)展方向有一定的指引,同時對引文編年圖的分析也驗證了對核心作者、核心期刊等分析的正確性。
參考文獻:
[1] 肖明,沈英.國內外數(shù)字圖書館研究現(xiàn)狀及未來走向[J].現(xiàn)代圖書情報技術,2000(6):25-28,87.
[2] 閆偉東.數(shù)字圖書館發(fā)展的可視化分析[J].公共圖書館,2012(1):30-34.
[3] 羅昭峰.引文分析軟件histcite簡介[EB/OL].(2018-03-09)[2018-09-10].http://blog.sciencenet.cn/home.php?mod=space&uid=304685&do=blog&id=383399.
[4]張月紅.HistCite:一個新的科學文獻分析工具[J].中國科技期刊研究,2007(6):1096.