王旭
關鍵詞:圖書館學;情報學;大數(shù)據(jù);文獻計量;CiteSpace
摘要:文章以CNKI期刊數(shù)據(jù)庫收錄的2008—2015年圖書情報領域大數(shù)據(jù)相關論文為依據(jù),利用文獻計量方法,借助CiteSpaceIV,以繪制知識圖譜的形式,對論文時間分布、期刊分布、高產(chǎn)作者分布以及研究熱點(關鍵詞)等進行分析,為今后國內(nèi)學者對圖書情報領域大數(shù)據(jù)深入研究提供參考。
中圖分類號:G250文獻標識碼:A文章編號:1003-1588(2016)04-0129-04
1背景
大數(shù)據(jù)被稱作是“信息時代的新石油”,大量數(shù)據(jù)正以每年50%的速度在增長,大數(shù)據(jù)已經(jīng)成為圖書情報學科領域研究的熱點問題。筆者采用文獻計量方法,以繪制知識圖譜的形式,分別從文獻、期刊、作者及關鍵詞4個角度,分析近8年我國圖書情報領域大數(shù)據(jù)的研究進展及未來發(fā)展趨勢,期望能為該領域的相關研究者提供參考。
2研究方法
筆者采用文獻計量方法對國內(nèi)圖書情報領域大數(shù)據(jù)研究發(fā)展現(xiàn)狀進行分析,借助文獻的各種特征,采用數(shù)學與統(tǒng)計學方法來描述、評價和預測該領域研究的現(xiàn)狀與發(fā)展趨勢。通過繪制科學知識圖譜來反映國內(nèi)圖書情報領域大數(shù)據(jù)研究熱點及發(fā)展趨勢,可為該領域研究提供切實、有價值的參考。
2.1數(shù)據(jù)收集
筆者選取中國知網(wǎng)的中國學術期刊網(wǎng)絡出版總庫,檢索式為:主題=大數(shù)據(jù)(精確匹配),學科類別為:圖書情報與數(shù)字圖書館,檢索時間:2008—2015年,期刊范圍選取全部期刊,共得到論文1,080篇,經(jīng)去重、剔除、整理后得到1,019篇。
2.2可視化工具
筆者使用由美國德雷塞爾大學陳超美教授開發(fā)的CiteSpace4.0R1版本進行分析,該軟件在Java語言環(huán)境下運行,被廣泛用于引文網(wǎng)絡分析。利用CiteSpace分析國內(nèi)圖書情報領域大數(shù)據(jù)的研究現(xiàn)狀、進展、前沿,試圖從科學文獻中發(fā)現(xiàn)其發(fā)展的新趨勢和新動態(tài)。
2.3統(tǒng)計工具
筆者利用Excel軟件,對通過中國知網(wǎng)檢索到的有關圖書情報領域大數(shù)據(jù)研究,時間段為2008—2015年的發(fā)文數(shù)量進行統(tǒng)計,以呈現(xiàn)國內(nèi)圖書情報領域大數(shù)據(jù)研究相關文獻的時間分布趨勢,并利用IBMSPSS進行曲線回歸擬合分析,預測其發(fā)展趨勢?;谖墨I計量方法,以CiteSpaceIV軟件可視化的效果,分別對圖書情報領域大數(shù)據(jù)研究的期刊分布、高產(chǎn)作者以及關鍵詞等進行分析。
3我國圖書情報領域大數(shù)據(jù)研究的時空知識圖譜及其分析
3.1年代分布分析
文獻計量分析方法中,從文獻歷時性上可以分析出學科的發(fā)展趨勢,發(fā)文量的多少代表了在一定時期內(nèi)該領域的研究的冷熱程度。從圖1所示的年代分布情況來看,國內(nèi)圖書情報領域大數(shù)據(jù)研究文獻
數(shù)量(2015年文獻數(shù)量只統(tǒng)計至11月份)整體上處于增長的趨勢,呈現(xiàn)出一片繁榮景象。2008—2012年為該領域研究的起步探索階段,5年所發(fā)文總量只有14篇,經(jīng)分析這些文獻,發(fā)現(xiàn)數(shù)據(jù)挖掘、數(shù)據(jù)倉儲及語義網(wǎng)絡是該階段圖情領域主要的研究內(nèi)容,其為大數(shù)據(jù)研究奠定了基礎。2012年以后,國內(nèi)圖書情報領域大數(shù)據(jù)發(fā)文量呈現(xiàn)爆炸式的增長態(tài)勢,截至2015年11月,發(fā)文量已達522篇,學術成果豐碩,可見大數(shù)據(jù)在圖情領域備受關注,已成為當前研究的熱點。
回歸分析法是通過試驗和觀測來推斷變量之間的關系,并預測研究對象未來數(shù)量狀態(tài)的統(tǒng)計分析方法。用IBMSPSS做曲線回歸分析并進行擬合,同時選用多種曲線回歸模型來進行擬合,擬合結(jié)果見表1和圖2。
通過觀察圖2和表1,經(jīng)比較可以確定出與原始觀測值擬合度最好的是三次曲線模型,表達式為:y=16.857+3.113x-12.306x2+2.533x3。由此可預測,未來幾年圖書情報領域大數(shù)據(jù)研究文獻數(shù)量將會呈現(xiàn)出增長趨勢。總體上看,我國圖書情報領域大數(shù)據(jù)研究已經(jīng)積累了大量文獻,隨著該領域研究的持續(xù)發(fā)展,可以大膽預測未來幾年該領域研究熱度不會減,國內(nèi)圖情領域?qū)Υ髷?shù)據(jù)將進行更深入、更廣泛的研究。
3.2來源期刊分布分析
為了解圖書情報領域大數(shù)據(jù)研究的空間分布特點,并進一步為相關研究者深化對該領域研究提供情報源分布,有必要對有關圖書情報領域大數(shù)據(jù)研究論文的來源期刊進行分析。根據(jù)布拉德福定律的區(qū)域分析法,將經(jīng)計算,a值為4.4,確定的核心區(qū)期刊為10種,相關區(qū)期刊有44種,外圍區(qū)期刊有198種(見表2)。從表2可以看出,核心區(qū)10種期刊發(fā)文342篇,占論文總數(shù)的33.57%;相關區(qū)44種期刊發(fā)文336篇,占論文總數(shù)的32.97%;外圍區(qū)198種期刊發(fā)文341篇,占論文總數(shù)的33.46%。因此,總體上看,國內(nèi)圖書情報領域大數(shù)據(jù)研究文獻的期刊分布基本符合布拉德福定律,呈現(xiàn)一種相對集中卻又高度分散的特征。圖書情報領域大數(shù)據(jù)研究的核心區(qū)期刊名稱如表3所示,圖書情報領域大數(shù)據(jù)研究的10種核心期刊中,6種是CSSCI來源期刊,2種是CSSCI擴展版來源期刊,這說明該領域大數(shù)據(jù)研究的集中程度較高,已經(jīng)開始形成該領域研究的核心期刊群。
3.3高產(chǎn)作者知識圖譜
由于發(fā)文量是衡量作者學術水平和科研能力的重要指標,高產(chǎn)作者對該領域發(fā)展及演變產(chǎn)生根本且深遠的影響,因此對其研究具有重要意義。根據(jù)普萊斯定律,高產(chǎn)作者的論文下限為:M=0.749(Nmax)1/2,其中Nmax為最高產(chǎn)作者論文數(shù)。經(jīng)IBMSPSS統(tǒng)計得知,馬曉亭為最高產(chǎn)作者,其論文數(shù)為19篇,可得到M值為3.3,M取鄰近最大整數(shù)為4篇。因此,將發(fā)文4篇以上(含4篇)的作者稱為高產(chǎn)作者(由于篇幅有限,高產(chǎn)作者分布表未列出)。
為了更好地了解我國圖情領域大數(shù)據(jù)研究的高產(chǎn)作者分布情況,在2008—2015年,以1年為時間段,取每年該領域研究發(fā)文數(shù)量最多的30位作者,經(jīng)最小生成樹算法修剪處理后,運行CiteSpaceIV軟件,生成圖書情報領域大數(shù)據(jù)研究發(fā)文作者的知識圖譜(見圖3)。圖中節(jié)點越大,表示該作者發(fā)文量越多,圖中共有104個節(jié)點,27條連線,網(wǎng)絡密度為0.005。結(jié)合由普萊斯定律確定的高產(chǎn)作者分布和圖3可知,蘭州商學院的馬曉亭(19篇)和陳臣(14篇),桂林理工大學的張興旺(10篇)和李晨暉(5篇),南京大學信息管理學院的蘇新寧(6篇)、陳雅(6篇)和鄭建明(5篇),武漢紡織大學管理學院的吳金紅(6篇),中山大學資訊管理學院的黃曉斌(5篇),武漢大學信息資源研究中心的張斌(4篇),北京大學信息管理系的李廣建(4篇)等為高產(chǎn)作者??傮w上來看,高校圖書館員和專業(yè)教師仍是我國圖書情報領域大數(shù)據(jù)研究的主要力量,他們具有濃厚的大數(shù)據(jù)研究底蘊,擁有較強的科研實力和科研隊伍,是國內(nèi)該領域大數(shù)據(jù)研究的主力軍。但是,該領域公共圖書館的相關研究人員較少,因此,還需要更多的專業(yè)人員加入公共圖書館,給予更好的理論分析及實踐研究。
3.4關鍵詞知識圖譜
關鍵詞是文章研究內(nèi)容的直接體現(xiàn),對關鍵詞出現(xiàn)的頻次進行統(tǒng)計,可以確定圖書情報領域大數(shù)據(jù)研究的熱點和發(fā)展動向。在2008—2015年,節(jié)點選擇關鍵詞,運行CiteSpaceIV,生成圖書情報領域大數(shù)據(jù)研究關鍵詞知識圖譜(見圖4),其中,共有58個節(jié)點,80條連線,網(wǎng)絡整體密度為0.0484??傮w上看,關鍵詞知識圖譜節(jié)點聯(lián)系較為緊密,圖書情報領域大數(shù)據(jù)研究主題較為集中,圖書館和高校圖書館是當前圖書情報領域大數(shù)據(jù)研究的主要機構(gòu),并且相關研究人員也多集中在圖書館或從事圖書館學研究。
同時,經(jīng)清理,整合關鍵詞,利用IBMSPSS統(tǒng)計出包括“大數(shù)據(jù)、圖書館”在內(nèi)的高頻關鍵詞(由于篇幅有限,統(tǒng)計結(jié)果未列出)。大數(shù)據(jù)時代下,國內(nèi)圖書情報領域圍繞大數(shù)據(jù)研究產(chǎn)生了一系列的關鍵詞,包括圖書館、高校圖書館、信息服務、數(shù)字圖書館、數(shù)據(jù)挖掘、云計算、數(shù)據(jù)分析、競爭情報、數(shù)字資源、情報分析、數(shù)據(jù)處理等。大數(shù)據(jù)推動著圖情機構(gòu)服務模式的改變,要求服務創(chuàng)新,提供個性化、信息化的知識服務、數(shù)據(jù)服務、學科服務。大數(shù)據(jù)環(huán)境下,作為信息中心的圖書情報機構(gòu),在數(shù)據(jù)分析、情報分析、數(shù)據(jù)處理、資源建設、數(shù)據(jù)存儲、決策支持等方面面臨巨大考驗。
結(jié)合圖4和關鍵詞統(tǒng)計結(jié)果可以總結(jié)出我國圖書情報領域大數(shù)據(jù)研究的幾個方面:①圖書情報領域大數(shù)據(jù)研究面臨的機遇和挑戰(zhàn)。海量數(shù)據(jù)將對圖書館的存貯能力提出挑戰(zhàn),對信息服務、數(shù)據(jù)挖掘、數(shù)據(jù)處理、數(shù)據(jù)分析提出了更高要求。吳金紅等人認為:全面、社會化、真實、準確、及時有效的數(shù)據(jù)給競爭情報帶來機遇,但情報存儲、情報安全、情報分析、人才緊缺等問題也是競爭情報不得不面對的挑戰(zhàn)。②大數(shù)據(jù)時代圖書情報的創(chuàng)新服務與發(fā)展。大數(shù)據(jù)時代圖書館的服務可能更具有針對性和鮮明性,其服務方式、途徑、模式等都將發(fā)生改變。李廣建等人認為:大數(shù)據(jù)時代下情報研究的發(fā)展趨勢可以總結(jié)為5個方面:多種數(shù)據(jù)源綜合利用、全方位的情報研究、新型信息資源的分析、情報研究的嚴謹性和智能化。③大數(shù)據(jù)時代圖書情報的資源建設。圖書情報機構(gòu)一直將資源建設作為工作重點,資源建設也是其開展個性化服務的基礎和保障,大數(shù)據(jù)時代下資源利用和開發(fā)程度得到空前深化,同時意味著資源組織和建設工作力度也必將加大。大數(shù)據(jù)時代下,重視用戶需求資源顯得十分重要,而云計算、物聯(lián)網(wǎng)等技術正是為用戶資源需求的決策處理與應用提供了技術支持。
4結(jié)語
筆者對近8年國內(nèi)圖書情報領域大數(shù)據(jù)研究論文進行統(tǒng)計,采用文獻計量方法,利用知識圖譜工具,以可視化的效果展示并分析了當前國內(nèi)圖書情報領域大數(shù)據(jù)研究的現(xiàn)狀??傮w來看,得出以下結(jié)論:①從國內(nèi)圖書情報領域大數(shù)據(jù)研究的時間及期刊分布來看,該領域大數(shù)據(jù)研究已經(jīng)積累了大量文獻,未來幾年該領域研究熱度不減,國內(nèi)圖情領域?qū)Υ髷?shù)據(jù)將進行更深入、更廣泛的研究。同時,該領域研究的核心期刊群已經(jīng)開始形成,但缺乏交叉學科的研究,因此,應該多吸收其他學科的專家加入。如:計算機學科、經(jīng)濟學、管理學等專家,更深入地進行圖書情報領域大數(shù)據(jù)研究,獲取更好更多的研究成果。②從國內(nèi)圖書情報領域大數(shù)據(jù)研究核心作者來看,高校圖書館員和專業(yè)教師仍是我國圖書情報領域大數(shù)據(jù)研究的主要力量,但該領域公共圖書館的相關研究人員較少。因此,還需要更多的專業(yè)人員加入公共圖書館,給予更好的理論分析及實踐研究。相關研究人員在大數(shù)據(jù)研究的創(chuàng)新性和持續(xù)性方面有待加強,應將情報機構(gòu)及信息服務工作的實踐應對策略研究作為研究重點。③從國內(nèi)圖書情報領域大數(shù)據(jù)研究關鍵詞來看,其研究內(nèi)容主要總結(jié)為3個方面:圖書情報領域大數(shù)據(jù)研究面臨的機遇和挑戰(zhàn)、大數(shù)據(jù)時代圖書情報的創(chuàng)新服務與發(fā)展、大數(shù)據(jù)時代圖書情報的資源建設。但是,總體來說,該領域研究側(cè)重于理論探討,在技術和實踐應用上還有待加強。
參考文獻:
[1]肖明,孔成果.大數(shù)據(jù):何去何從:基于文獻計量學的視角[J].圖書館學刊,2014(11):110-117.
[2]樊一陽,許京京.基于CiteSpace文獻計量法的石墨烯研究文獻可視化圖譜分析[J].現(xiàn)代情報,2015(8):81-91.
[3]Chen C.CiteSpaceⅡ:Detecting and visualizingemerging trends and transient patterns in scientific literature[J].Journal of the American Society for information Science and Technology,2006(3):359-377.
[4]許智.圖書情報學知識服務的知識圖譜分析[J].現(xiàn)代情報,2013(2):166-170.
[5]夏麗華,謝金玲,等.SPSS數(shù)據(jù)統(tǒng)計與分析標準教程[M].北京:清華大學出版社,2014:191.
[6]余少瑛.我國圖書館知識產(chǎn)權(quán)研究的文獻計量統(tǒng)計分析[J].情報科學,2012(2):183-189.
[7]邱均平.信息計量學[M].武漢:武漢大學出版社,2007:105.
[8]寧寶英,宋敏紅,申巧南,等.1982—2011年《高原氣象》論文發(fā)表趨勢:基于文獻計量分析結(jié)果[J].高原氣象,2012(1):285-293.
[9]陳悅,陳超美,胡志剛,等.引文空間分析原理與應用:CiteSpace實用指南[M].北京:科學出版社,2014:69.
[10]王春華,李維,文庭孝.我國圖書情報領域大數(shù)據(jù)研究熱點分析[J].圖書情報知識,2015(4):82-89.
[11]吳金紅,張飛,鞠秀芳.大數(shù)據(jù):企業(yè)競爭情報的機遇、挑戰(zhàn)及對策研究[J].情報雜志,2013(1):5-9.
[12]李廣建,楊林.大數(shù)據(jù)視角下的情報研究與情報研究技術[J].圖書與情報,2012(6):1-8.
(編校:崔萌)