楊茜蕓
摘 要:本文選取CNKI數(shù)據(jù)庫收錄的3390篇有關(guān)數(shù)字圖書館的相關(guān)研究的論文為數(shù)據(jù)源,利用BICOMB進(jìn)行相關(guān)數(shù)據(jù)提取。首先是對研究文獻(xiàn)進(jìn)行形式特征的可視化分析,包括研究文獻(xiàn)的時間分布、著者及著者機(jī)構(gòu)分布、來源分布。然后對研究文獻(xiàn)的內(nèi)容特征進(jìn)行可視化分析,通過高頻關(guān)鍵詞的統(tǒng)計分析、共詞分析等分析了近年來數(shù)字圖書館有關(guān)研究的熱點(diǎn)領(lǐng)域。發(fā)現(xiàn)我國數(shù)字圖書館研究論文年發(fā)文量和研究主題隨時間的推移而變化顯著。從數(shù)量上看,發(fā)文量依次經(jīng)歷了上升、下降、基本持平3個階段,從內(nèi)容上看,以資源建設(shè)、信息技術(shù)、知識服務(wù)等主題相互結(jié)合、滲透的線索發(fā)展。
關(guān)鍵詞:數(shù)字圖書館;bicomb;研究熱點(diǎn)
1.引言
數(shù)字圖書館的建設(shè)及相關(guān)研究起步于20 世紀(jì)90 年代初的美國。我國國家圖書館自1995 年起開始跟進(jìn)國際上數(shù)字圖書館的研發(fā)進(jìn)展。1997 年,由國家圖書館、中山圖書館等單位共同承擔(dān)的“中國試驗(yàn)型數(shù)字圖書館項(xiàng)目”,標(biāo)志著我國數(shù)字圖書館事業(yè)進(jìn)入到了試驗(yàn)階段。經(jīng)歷了10 余年的發(fā)展,我國數(shù)字圖書館領(lǐng)域的研究課題立項(xiàng)逐漸增多,研究內(nèi)容日益廣泛,研究成果大量發(fā)表,其中也出現(xiàn)了一些關(guān)于數(shù)字圖書館研究文獻(xiàn)定量分析的論文。本文在有關(guān)文獻(xiàn)研究的基礎(chǔ)上,選取國內(nèi)CNKI 收錄的1994-2014 年間刊載在核心期刊的有關(guān)數(shù)字圖書館的相關(guān)研究論文,對論文的發(fā)表年代進(jìn)行統(tǒng)計與分析。得出該研究領(lǐng)域不同時段的研究熱點(diǎn),以期發(fā)現(xiàn)我國數(shù)字圖書館研究主題的發(fā)展與變化規(guī)律。
2.數(shù)據(jù)來源與研究工具
2.1 數(shù)據(jù)來源
本研究以中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫作為數(shù)據(jù)來源,為了能夠檢索到準(zhǔn)確、全面的論文,數(shù)據(jù)檢索起止時間段設(shè)定為“不限”到“2014”。以“篇名”為檢索項(xiàng),采用“數(shù)字圖書館”作為主要檢索入口詞,分別組配“評價”、“評估”(組配邏輯為“與”)的方式進(jìn)行檢索。由于檢索到的論文包含有會議通知、會議講話、紀(jì)念文章以及與主題明顯相關(guān)性不大的論文,在期刊的來源里面就只勾選SCI來源期刊、EI來源期刊、核心期刊和CSSCI,最后經(jīng)過篩選以及去重,最后得到論文3390篇。
2.2 研究工具
具體分析時主要采用 Bicomb軟件、Excel 軟件作為主要研究工具。其中Bicomb共詞分析軟件采用目前技術(shù)成熟、流行的數(shù)據(jù)庫語言開發(fā),對CNKI的書目文獻(xiàn)信息進(jìn)行快速掃描,準(zhǔn)確提取并歸類存儲、矩陣分析等等,為進(jìn)一步研究提供全面、準(zhǔn)確的基礎(chǔ)數(shù)據(jù),并允許用戶對某些功能進(jìn)行修改、增加等拓展,具有較強(qiáng)的適應(yīng)性。
3.研究文獻(xiàn)的形式特征可視化分析
文獻(xiàn)特征,是指將不同文獻(xiàn)區(qū)分開來的標(biāo)志。它包括文獻(xiàn)的內(nèi)容特征和文獻(xiàn)的形式特征。對研究文獻(xiàn)的形式特征進(jìn)行匯總性分析,有利于發(fā)現(xiàn)某一主題內(nèi)的文獻(xiàn)隨時間的變化情況、核心作者群及核心來源等。
3.1研究文獻(xiàn)的時間分布
科學(xué)文獻(xiàn)的數(shù)量是衡量科學(xué)知識的重要尺度之一,本文著眼于整體的宏觀的文獻(xiàn)數(shù)量與比率的分布狀況,通過文獻(xiàn)的數(shù)量與比率的數(shù)據(jù)統(tǒng)計與計算,來描述和預(yù)測文獻(xiàn)的數(shù)量、比率的發(fā)展?fàn)顩r,進(jìn)而給出總體性的統(tǒng)計描述與結(jié)論。經(jīng)過BICOMB統(tǒng)計,CNKI共收錄了1994年至2014年3390篇論文,依照文獻(xiàn)分布的年代次序,繪制成圖1。
由圖1可看出數(shù)字圖書館相關(guān)研究論文的發(fā)表數(shù)量總體呈逐步上升趨勢。大致可分為三個時期:①1994-2000年,我國有關(guān)數(shù)字圖書館的研究已初見成熟。②2001-2003年,有關(guān)數(shù)字圖書館的研究發(fā)展緩慢。③2004-2006年,數(shù)字圖書館的相關(guān)研究已經(jīng)進(jìn)入快速發(fā)展時期。④2006至今,我國有關(guān)數(shù)字圖書館的研究論文的文獻(xiàn)發(fā)文量則處于一個比較平穩(wěn)的狀態(tài)。
3.2研究文獻(xiàn)的著者分析
我們在統(tǒng)計過程中采用正規(guī)計數(shù)法對論文著者進(jìn)行著者分析,經(jīng)統(tǒng)計,數(shù)字圖書館研究領(lǐng)域的3390篇論文共有3205位作者,見表1。
由表1可見,發(fā)表一篇論文的作者數(shù)占總作者數(shù)的81%,同時寫兩篇論文的作者為368人,這與洛特卡定律所描述的數(shù)據(jù)還存在差異,這表明在有關(guān)數(shù)字圖書館的研究尚未達(dá)到使用洛特卡定律的條件,也說明該領(lǐng)域的研究尚處于發(fā)展階段,還沒有形成穩(wěn)定的核心作者群。從表1可以得出,發(fā)文量最多的著者論文數(shù)為32篇,m4.24,因此,根據(jù)普賴斯理論,可以認(rèn)為,在數(shù)字圖書館相關(guān)研究領(lǐng)域,發(fā)文3篇及以上者為核心著者。
3.3研究文獻(xiàn)的機(jī)構(gòu)分析
利用BICOMB統(tǒng)計了全部作者的機(jī)構(gòu),現(xiàn)列舉出發(fā)文量較大的部分高校,見表2。統(tǒng)計的結(jié)果顯示,我國在圖書館相關(guān)文獻(xiàn)的作者大多分布在高校和科研機(jī)構(gòu)中,而且這些院校多為實(shí)力雄厚的綜合型高校以及理工科高效,如武漢大學(xué)、蘭州商學(xué)院信息工程學(xué)院等。
3.4研究文獻(xiàn)的來源分析
根據(jù)BICOMB統(tǒng)計,3390篇論文共涉及發(fā)表在209種不同期刊上,現(xiàn)列舉出部分?jǐn)?shù)據(jù),見表3。由此可發(fā)現(xiàn),數(shù)字圖書館相關(guān)的論文分布比較集中,主要分布于與圖書情報密切相關(guān)的信息管理類、情報學(xué)和圖書館學(xué)等學(xué)科期刊上。
4.研究文獻(xiàn)的內(nèi)容特征可視化分析
文獻(xiàn)的內(nèi)容特征常按照文獻(xiàn)內(nèi)容的學(xué)科分類或主題關(guān)系來描述。通常一篇文章的關(guān)鍵詞是其核心內(nèi)容的濃縮和提煉,是文獻(xiàn)的精髓所在,能夠較好地反映某一研究領(lǐng)域的主題分布與特點(diǎn),可以體現(xiàn)出某一學(xué)科領(lǐng)域的發(fā)展方向,從而有助于發(fā)現(xiàn)該學(xué)科的范式特征。對研究文獻(xiàn)的內(nèi)容特征進(jìn)行分析,能夠把握某一領(lǐng)域的研究熱點(diǎn)與趨勢。
4.1高頻關(guān)鍵詞的統(tǒng)計分析
關(guān)鍵詞是從論文的題名、摘要和正文中選取出來的,是對文章主題的高度凝練。某一關(guān)鍵詞在文獻(xiàn)中出現(xiàn)的次數(shù)越多,則表明該關(guān)鍵詞所表征的研究主題是越熱門的研究熱點(diǎn)。因此,通過關(guān)鍵詞的詞頻進(jìn)行統(tǒng)計分析,高頻關(guān)鍵詞集中體現(xiàn)了某研究領(lǐng)域的研究熱點(diǎn)和發(fā)展動向。由于不同作者對同一概念的關(guān)鍵詞界定不同,為保證詞匯的內(nèi)容指向性以及語義規(guī)范性,需要對關(guān)鍵詞進(jìn)行規(guī)范化的處理,即對同義詞進(jìn)行合并處理。
4.2高頻關(guān)鍵詞的共詞分析
如果僅對高頻關(guān)鍵詞進(jìn)行統(tǒng)計,則無法看出這些關(guān)鍵詞之間的關(guān)系,所以要進(jìn)一步對高頻關(guān)鍵詞進(jìn)行處理,通過關(guān)鍵詞共現(xiàn)技術(shù)來深入挖掘它們之間的聯(lián)系。
利用BICOMB軟件共現(xiàn)矩陣功能統(tǒng)計其高頻關(guān)鍵詞在每篇論文中出現(xiàn)的頻次,可以得到35*35的共現(xiàn)矩陣。下表是高頻關(guān)鍵詞共現(xiàn)矩陣的部分?jǐn)?shù)據(jù),其中,“0”表示該詞在該篇文獻(xiàn)中沒有出現(xiàn)過,“1”表示該詞在該篇文獻(xiàn)中出現(xiàn)過。對角線上的數(shù)據(jù)為該關(guān)鍵詞出現(xiàn)的頻次。
5.結(jié)語
數(shù)字圖書館的研究是一個不斷發(fā)展的過程,我國數(shù)字圖書館領(lǐng)域研究日趨成熟,也可能是隨著研究的不斷深化,出現(xiàn)新的分支研究領(lǐng)域。過去的20年中,數(shù)字圖書館的熱點(diǎn)研究內(nèi)容隨著時間推移也出現(xiàn)了變化,以數(shù)字圖書館為主題的論文研究內(nèi)容豐富多樣。隨著計算機(jī)網(wǎng)絡(luò)技術(shù)的發(fā)展,必然會影響到傳統(tǒng)圖書館的發(fā)展趨勢。2000年以后,數(shù)字圖書館的概念逐漸清晰,虛擬圖書館等概念被數(shù)字圖書館取代,其相關(guān)研究結(jié)果表明數(shù)字圖書館的總體發(fā)展趨勢基本上是按照數(shù)字圖書館資源建設(shè)、技術(shù)研發(fā)等主題為線索持續(xù)開展的,研究內(nèi)容逐漸從數(shù)字圖書館建設(shè)構(gòu)想過渡到技術(shù)實(shí)現(xiàn)及資源開發(fā),再到資源共建共享、完善數(shù)字圖書館服務(wù)等方面。綜上所述,數(shù)字圖書館研究論文內(nèi)容的變化側(cè)面反映出我國數(shù)字圖書館的建設(shè)已經(jīng)從理論逐步走向?qū)嵺`。為用戶提供個性化信息服務(wù)以及完善數(shù)字圖書館的資源共享共建、數(shù)字圖書館軟環(huán)境建設(shè)及服務(wù)質(zhì)量完善成為目前的研究熱點(diǎn)。結(jié)合當(dāng)前信息技術(shù)和網(wǎng)絡(luò)技術(shù)發(fā)展最新成果,如云計算技術(shù)在數(shù)字圖書館共享共建研究中的應(yīng)用也應(yīng)該會成為今后的研究熱點(diǎn)。(作者單位:華中師范大學(xué))
參考文獻(xiàn):
[1] 中國數(shù)字圖書館[EB/OL].http://www.d-library.com.cn/wm/lsyg.html.
[2] 殷沈琴,張計龍,任磊.基于關(guān)鍵詞共現(xiàn)和社會網(wǎng)絡(luò)分析法的數(shù)字圖書館研究熱點(diǎn)分析[J].大學(xué)圖書館學(xué)報,2011(4):25-30,38.
[3] 董偉.國內(nèi)近十年數(shù)字圖書館領(lǐng)域研究熱點(diǎn)分析———基于共詞分析[J].圖書情報知識,2009(5):58-63.
[4] 蘇娜.基于共詞分析的數(shù)字圖書館領(lǐng)域研究主題及進(jìn)展分析[J].情報雜志,2009(6):15-19.