●朱鎖玲,唐惠燕,倪 峰,陳蓉蓉,施 文(南京農(nóng)業(yè)大學(xué)圖書館,南京 210095)
大數(shù)據(jù)時(shí)代我國文獻(xiàn)計(jì)量應(yīng)用研究現(xiàn)狀及服務(wù)實(shí)踐策略研究
●朱鎖玲,唐惠燕△,倪峰,陳蓉蓉,施文
(南京農(nóng)業(yè)大學(xué)圖書館,南京210095)
[關(guān)鍵詞]文獻(xiàn)計(jì)量;應(yīng)用研究;高校圖書館;信息服務(wù);大數(shù)據(jù)
[摘要]從研究主體、研究對(duì)象、研究內(nèi)容、研究方法等方面對(duì)大數(shù)據(jù)時(shí)代以來我國文獻(xiàn)計(jì)量應(yīng)用研究的發(fā)展現(xiàn)狀進(jìn)行系統(tǒng)梳理及問題剖析;在此基礎(chǔ)上,以理論成果為支撐,將文獻(xiàn)計(jì)量應(yīng)用研究的理論成果和高校圖書館的業(yè)務(wù)實(shí)踐相結(jié)合,提出大數(shù)據(jù)時(shí)代高校圖書館面向?qū)W科發(fā)展和科研決策開展文獻(xiàn)計(jì)量服務(wù)實(shí)踐的對(duì)策。
自2008年大數(shù)據(jù)概念出現(xiàn)以來,學(xué)者們借助大型分析型數(shù)據(jù)庫及文獻(xiàn)計(jì)量分析方法,廣泛開展了各學(xué)科領(lǐng)域的文獻(xiàn)計(jì)量應(yīng)用研究,產(chǎn)生了大批理論研究成果。與此同時(shí),大數(shù)據(jù)時(shí)代的到來也給高校圖書館的發(fā)展帶來了挑戰(zhàn)和機(jī)遇。如何基于海量數(shù)據(jù),借助信息分析方法,面向?qū)W科發(fā)展和科研決策開展相關(guān)信息服務(wù),成為高校圖書館界共同關(guān)注的話題。本文以理論成果為支撐,擬通過對(duì)現(xiàn)有文獻(xiàn)計(jì)量應(yīng)用研究的理論成果進(jìn)行梳理及分析,將文獻(xiàn)計(jì)量應(yīng)用研究的理論成果和高校圖書館的業(yè)務(wù)實(shí)踐相結(jié)合,提出高校圖書館開展文獻(xiàn)計(jì)量服務(wù)實(shí)踐的策略,旨在為文獻(xiàn)計(jì)量應(yīng)用研究的發(fā)展,為大數(shù)據(jù)時(shí)代高校圖書館服務(wù)轉(zhuǎn)型提供參考和借鑒。
1.1研究主體
(1)高校圖書情報(bào)專業(yè)相關(guān)科研人員。如北京大學(xué)信息管理系、武漢大學(xué)信息資源研究中心、南京大學(xué)信息管理系等科研人員。他們基于大型分析型數(shù)據(jù)庫對(duì)相關(guān)科學(xué)領(lǐng)域的科研論文進(jìn)行文獻(xiàn)計(jì)量分析,力求在計(jì)量分析方法及分析結(jié)果的可視化展示技術(shù)上不斷突破。
(2)高校圖書館、科研圖書館及科研院所文獻(xiàn)信息中心等科研人員。如上海交通大學(xué)圖書館、中科院國家科學(xué)圖書館、中國農(nóng)業(yè)科學(xué)院信息研究所等機(jī)構(gòu)研究人員。他們基于SCI、ESI等數(shù)據(jù)庫開展相關(guān)學(xué)科領(lǐng)域或研究分支的發(fā)展態(tài)勢(shì)分析。近年來,這類研究人員開展文獻(xiàn)計(jì)量應(yīng)用研究的理論成果越來越多,其研究涉及的學(xué)科領(lǐng)域越來越廣,研究分支越來越細(xì),他們是文獻(xiàn)計(jì)量應(yīng)用研究的生力軍。
(3)高校及科研院所從事相關(guān)學(xué)科專業(yè)研究的科研人員。如山東省果樹研究所、中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)經(jīng)濟(jì)與發(fā)展研究所和國家大豆產(chǎn)業(yè)技術(shù)研發(fā)中心等研究人員。他們?cè)诳蒲泄ぷ飨嚓P(guān)信息需求驅(qū)動(dòng)下,通過對(duì)大型分析型數(shù)據(jù)庫的學(xué)習(xí)和應(yīng)用,在完成其科研項(xiàng)目的同時(shí),也間接地推動(dòng)了文獻(xiàn)計(jì)量學(xué)在多學(xué)科領(lǐng)域的應(yīng)用研究。
1.2研究對(duì)象
目前我國已有的文獻(xiàn)計(jì)量應(yīng)用研究中,多數(shù)是基于大型分析型數(shù)據(jù)庫對(duì)機(jī)構(gòu)和學(xué)科領(lǐng)域的科研論文進(jìn)行的文獻(xiàn)計(jì)量分析,對(duì)專利的計(jì)量分析相對(duì)較少。在大量針對(duì)科研論文進(jìn)行的文獻(xiàn)計(jì)量應(yīng)用研究中,主要分為兩個(gè)層面。
(1)機(jī)構(gòu)層面。其中,既有對(duì)國家或地區(qū)所有機(jī)構(gòu)發(fā)文的文獻(xiàn)計(jì)量研究;[1-2]也有對(duì)國家或地區(qū)某一類機(jī)構(gòu)發(fā)文的計(jì)量分析,其中以高校居多。[3]就高校這一類機(jī)構(gòu)中,有學(xué)者對(duì)不同類型高校進(jìn)行了科研論文產(chǎn)出的文獻(xiàn)計(jì)量研究,如紡織類、海洋類、農(nóng)業(yè)類等;也有對(duì)具體某一高??蒲姓撐漠a(chǎn)出的計(jì)量研究。[4]
(2)學(xué)科層面。其中,既有對(duì)國家或機(jī)構(gòu)所有學(xué)科領(lǐng)域發(fā)文情況的文獻(xiàn)計(jì)量分析研究,如基于SCI論文的統(tǒng)計(jì)分析,對(duì)中國科學(xué)的整體發(fā)展水平和學(xué)科結(jié)構(gòu)進(jìn)行的思考與分析;[1]也有專門針對(duì)某一學(xué)科領(lǐng)域發(fā)文情況的文獻(xiàn)計(jì)量分析,包括對(duì)全球工程科學(xué)、環(huán)境科學(xué)、藥學(xué)、毒理學(xué)、計(jì)算機(jī)科學(xué)等學(xué)科的計(jì)量研究,對(duì)我國生物信息學(xué)、藥學(xué)、數(shù)學(xué)、化學(xué)、食品科學(xué)等學(xué)科的計(jì)量研究,對(duì)我國某機(jī)構(gòu)具體某一學(xué)科的文獻(xiàn)計(jì)量研究,如對(duì)中國農(nóng)業(yè)大學(xué)植物與動(dòng)物科學(xué)學(xué)科的分析等;還有對(duì)學(xué)科內(nèi)某一分支領(lǐng)域的文獻(xiàn)計(jì)量研究,如對(duì)干細(xì)胞、視網(wǎng)膜脫離、水稻、大豆、腦膜炎等專題研究發(fā)展態(tài)勢(shì)的文獻(xiàn)計(jì)量分析。
1.3研究內(nèi)容
(1)科研生產(chǎn)力計(jì)量??蒲猩a(chǎn)力的計(jì)量主要以對(duì)發(fā)文量的統(tǒng)計(jì)為代表,少量涉及專利成果的統(tǒng)計(jì)。發(fā)文量是指某國家、機(jī)構(gòu)、期刊等在統(tǒng)計(jì)期間發(fā)表的全部科技論文數(shù),代表產(chǎn)出水平。幾乎所有已開展的文獻(xiàn)計(jì)量應(yīng)用研究都涉及對(duì)以發(fā)文量為代表的科研生產(chǎn)力的計(jì)量,其中包括國家、地區(qū)、研究機(jī)構(gòu)、科學(xué)家、刊載期刊、分布學(xué)科等各項(xiàng)論文總量的對(duì)比分析。
(2)科研影響力計(jì)量??蒲杏绊懥Φ挠?jì)量主要以對(duì)科技論文被引頻次的統(tǒng)計(jì)為代表。被引頻次是文獻(xiàn)計(jì)量學(xué)中被用來測(cè)度學(xué)術(shù)論文社會(huì)顯示度和學(xué)術(shù)影響力的重要指標(biāo),包括被引總頻次、篇均被引頻次等。被引總頻次是指某國家、機(jī)構(gòu)、期刊等在統(tǒng)計(jì)期間發(fā)表的全部科技論文被引用的總次數(shù)。篇均被引頻次是指在統(tǒng)計(jì)期間某國家、機(jī)構(gòu)、期刊等每篇科技論文平均被引用的次數(shù)。在現(xiàn)有的文獻(xiàn)計(jì)量應(yīng)用研究中,多數(shù)均涉及國家、地區(qū)、研究機(jī)構(gòu)、機(jī)構(gòu)內(nèi)重點(diǎn)實(shí)驗(yàn)室、科學(xué)家等科研實(shí)體的科研影響力對(duì)比分析。
(3)科研卓越性計(jì)量??蒲凶吭叫缘挠?jì)量主要以對(duì)機(jī)構(gòu)或科學(xué)家的H指數(shù)的統(tǒng)計(jì)為代表。H指數(shù),是一個(gè)混合量化指標(biāo),用以評(píng)價(jià)科研人員個(gè)人的研究績效。一個(gè)科學(xué)家的H指數(shù)是指在一定期間內(nèi)他發(fā)表的N篇論文中有H篇論文每篇至少被引用了H次,而其余論文每篇至多被引用了H次?,F(xiàn)有的文獻(xiàn)計(jì)量應(yīng)用研究中,有不少學(xué)者利用文獻(xiàn)計(jì)量學(xué)的方法對(duì)理科學(xué)者、文科學(xué)者、企業(yè)專利權(quán)人等各類科研人員的H指數(shù)進(jìn)行了實(shí)證研究。[5-7]近年來,隨著學(xué)者們對(duì)H指數(shù)的日益關(guān)注,他們針對(duì)H指數(shù)的缺陷進(jìn)行了多次修正和改進(jìn),提出了諸如g指數(shù)、R指數(shù)、P指數(shù)等各種衍生指數(shù),并開展了相關(guān)實(shí)證研究,[8]這些研究都不同程度推進(jìn)了文獻(xiàn)計(jì)量學(xué)的理論研究,并對(duì)實(shí)際應(yīng)用具有深刻的指導(dǎo)意義。
(4)科研合作分析。盡管學(xué)者們已經(jīng)認(rèn)識(shí)到從合著論文的角度去考察科研合作行為具有一定的局限性,但鑒于利用合著來研究科研合作的方法具有更直接、可量化、較經(jīng)濟(jì)等優(yōu)勢(shì),利用合著研究合作仍然是目前最為通用和實(shí)用的一種方法。[9]所以,不少學(xué)者選擇了通過文獻(xiàn)計(jì)量方法,從對(duì)科研合著的統(tǒng)計(jì)分析中研究各個(gè)層面的科研合作。有的從某一學(xué)科入手,分析該學(xué)科領(lǐng)域國際、國內(nèi)的科研合作情況;[10]有的則著眼于所有學(xué)科領(lǐng)域,分析不同國家、不同機(jī)構(gòu)之間的科研合作情況,如中/印國際科學(xué)合作比較研究、我國校企科研合作研究。[11]
(5)學(xué)科發(fā)展態(tài)勢(shì)分析。利用文獻(xiàn)計(jì)量學(xué)的方法,從學(xué)科層面對(duì)國家/機(jī)構(gòu)的科研論文進(jìn)行統(tǒng)計(jì),分析其學(xué)科結(jié)構(gòu)和特征,可了解國家、機(jī)構(gòu)的整體學(xué)科發(fā)展水平,分析其學(xué)科發(fā)展態(tài)勢(shì),掌握本國、本機(jī)構(gòu)的學(xué)科發(fā)展優(yōu)勢(shì)和潛勢(shì),能夠?yàn)楹侠碇贫▽W(xué)科發(fā)展政策提供決策參考?,F(xiàn)有文獻(xiàn)計(jì)量應(yīng)用研究中,既有對(duì)國家整體學(xué)科水平和結(jié)構(gòu)的分析,如通過對(duì)亞洲和西方國家在學(xué)科領(lǐng)域的活躍性和影響力比較研究,發(fā)現(xiàn)亞洲國家的化學(xué)、物理、材料科學(xué)和工程等四個(gè)學(xué)科領(lǐng)域占據(jù)本國科學(xué)研究的主導(dǎo)地位;[12]也有對(duì)具體某個(gè)機(jī)構(gòu)的學(xué)科發(fā)展優(yōu)勢(shì)的分析,如對(duì)中國農(nóng)業(yè)大學(xué)的潛勢(shì)學(xué)科的分析與預(yù)測(cè)。[13]
(6)學(xué)科熱點(diǎn)與前沿分析。及時(shí)了解本學(xué)科的發(fā)展前沿和研究熱點(diǎn),能夠較好地幫助科研工作者開展科學(xué)研究。目前,已有不同學(xué)科領(lǐng)域的研究者基于文獻(xiàn)計(jì)量,借助引文分析、共現(xiàn)分析、社會(huì)網(wǎng)絡(luò)分析等方法以及CiteSpace、Ucinet等相關(guān)軟件,通過繪制知識(shí)圖譜揭示學(xué)科及分支領(lǐng)域的演化過程、研究熱點(diǎn)和前沿發(fā)展趨勢(shì)。如通過對(duì)高影響力作者、高頻關(guān)鍵詞以及突變專業(yè)術(shù)語的計(jì)量分析,實(shí)現(xiàn)對(duì)國際范圍內(nèi)圖書情報(bào)學(xué)領(lǐng)域的研究熱點(diǎn)和前沿進(jìn)行辨識(shí)和追蹤等。
1.4研究方法
文獻(xiàn)計(jì)量應(yīng)用研究中研究者們以信息分析為基礎(chǔ),在不同階段綜合運(yùn)用多種數(shù)據(jù)處理及分析方法、工具實(shí)現(xiàn)對(duì)科研論文的計(jì)量研究,主要包括以下幾方面。
(1)數(shù)據(jù)采集與清洗階段。數(shù)據(jù)是文獻(xiàn)計(jì)量的基礎(chǔ),決定了分析結(jié)果的客觀性和準(zhǔn)確性。這一階段最重要的是對(duì)數(shù)據(jù)進(jìn)行清洗與歸并。已有的應(yīng)用研究理論成果中,學(xué)者們對(duì)數(shù)據(jù)清洗工作的重視程度不同,有的幾乎不作介紹,有的僅作簡(jiǎn)單介紹,僅少數(shù)研究對(duì)數(shù)據(jù)清洗工作十分重視,專門探討文獻(xiàn)計(jì)量應(yīng)用研究中的數(shù)據(jù)清洗和去重工作。如董琳提出對(duì)文獻(xiàn)進(jìn)行一級(jí)學(xué)科分類和二級(jí)學(xué)科分類的方法建議,并歸納了文獻(xiàn)中國家和機(jī)構(gòu)名稱標(biāo)注混亂的原因,從而制作了國家名稱敘詞表和若干機(jī)構(gòu)名稱敘詞表。[14]張晉輝設(shè)計(jì)了一種基于推理機(jī)的SCI地址字段數(shù)據(jù)清洗方法。[15]閆雪等通過總結(jié)“臟數(shù)據(jù)”的主要類型,并利用基于Excel或ACCESS的VBA編程,實(shí)現(xiàn)了對(duì)中文期刊論文的半自動(dòng)數(shù)據(jù)清洗。[16]
(2)數(shù)據(jù)統(tǒng)計(jì)與分析階段。這一階段,學(xué)者們主要基于文獻(xiàn)計(jì)量學(xué)方法,即以文獻(xiàn)體系和文獻(xiàn)計(jì)量特征為研究對(duì)象,采用數(shù)學(xué)、統(tǒng)計(jì)學(xué)等計(jì)量方法,研究文獻(xiàn)情報(bào)的分布結(jié)構(gòu)、數(shù)量關(guān)系、變化規(guī)律和定量管理,進(jìn)而探討科學(xué)技術(shù)的某些結(jié)構(gòu)、特征和規(guī)律。如通過文獻(xiàn)作者聚類分析,發(fā)現(xiàn)學(xué)科領(lǐng)域的前沿代表作者;通過文獻(xiàn)共被引分析,發(fā)現(xiàn)科學(xué)研究演進(jìn)過程中的經(jīng)典文獻(xiàn)(又稱知識(shí)基礎(chǔ));通過關(guān)鍵詞聚類分析,挖掘?qū)W科領(lǐng)域的研究熱點(diǎn);通過突現(xiàn)詞檢測(cè)分析,分析學(xué)科領(lǐng)域的研究前沿。[17]除文獻(xiàn)計(jì)量學(xué)方法外,在分析學(xué)科優(yōu)勢(shì)、科研合作等方面,定標(biāo)比超、社會(huì)網(wǎng)絡(luò)分析等方法也常被學(xué)者們廣泛應(yīng)用。定標(biāo)比超是競(jìng)爭(zhēng)情報(bào)分析常用的方法之一。文獻(xiàn)計(jì)量應(yīng)用研究中,通過定標(biāo)比超能為國家、機(jī)構(gòu)了解其自身科研狀況在同行中的位置、合理制定科研決策提供參考。社會(huì)網(wǎng)絡(luò)分析,就是對(duì)社會(huì)網(wǎng)絡(luò)中行為者之間的關(guān)系進(jìn)行量化研究。社會(huì)網(wǎng)絡(luò)分析方法應(yīng)用于文獻(xiàn)計(jì)量應(yīng)用研究時(shí),即把文獻(xiàn)中所包含的各字段之間的關(guān)系看作一個(gè)知識(shí)網(wǎng)絡(luò),利用社會(huì)網(wǎng)絡(luò)分析法中的權(quán)力指數(shù)、點(diǎn)出度與特征向量中心性、共詞網(wǎng)絡(luò)分析、合著網(wǎng)絡(luò)分析等,實(shí)現(xiàn)對(duì)科技文獻(xiàn)與期刊、學(xué)科研究熱點(diǎn)、科研合作情況、學(xué)科交叉程度等進(jìn)行科學(xué)評(píng)價(jià)。[18]
(3)數(shù)據(jù)分析結(jié)果的展示階段。數(shù)據(jù)可視化是指將大型數(shù)據(jù)以圖形、圖像形式表示,并利用數(shù)據(jù)分析和開發(fā)工具發(fā)現(xiàn)其中未知信息的處理過程。隨著數(shù)據(jù)可視化技術(shù)快速發(fā)展,學(xué)者們紛紛嘗試將各種可視化技術(shù)運(yùn)用于文獻(xiàn)計(jì)量應(yīng)用研究。如,通過雷達(dá)圖展示研究論文的主要學(xué)科分布,[19]通過學(xué)科交叉圖輔助分析國家科技計(jì)劃資助宏觀學(xué)科領(lǐng)域情況,[20]通過知識(shí)圖譜分析學(xué)科領(lǐng)域的知識(shí)基礎(chǔ)、研究主體、研究熱點(diǎn)與前沿等。[21]另外,有學(xué)者還從空間展現(xiàn)模式和平臺(tái)兩方面分析了文獻(xiàn)計(jì)量指標(biāo)GIS空間展現(xiàn)的可行性。[22]
2.1參與人員多,但交流合作少
大數(shù)據(jù)時(shí)代,文獻(xiàn)計(jì)量應(yīng)用研究因其頗具理論和實(shí)踐意義贏得各類研究人員的關(guān)注和參與。他們有各自不同的優(yōu)勢(shì),關(guān)注的側(cè)重點(diǎn)也有所不同。圖書情報(bào)專業(yè)的科研人員擁有專業(yè)的圖情知識(shí)和科研技能,重在探索文獻(xiàn)計(jì)量學(xué)相關(guān)計(jì)量指標(biāo)和工具的科學(xué)性,并通過實(shí)證研究不斷提出改進(jìn)意見;圖書館等信息服務(wù)部門人員具有豐富的數(shù)據(jù)庫資源和服務(wù)技能,重在探索文獻(xiàn)計(jì)量學(xué)的社會(huì)效用,試圖通過文獻(xiàn)計(jì)量應(yīng)用研究探索信息服務(wù)工作的新模式;學(xué)科領(lǐng)域科研人員和科研、人才管理部門的行政人員,他們雖缺乏圖情知識(shí)和數(shù)據(jù)資源,但他們有專業(yè)的學(xué)科背景知識(shí),有強(qiáng)烈的信息需求作為其研究動(dòng)機(jī),希望借助文獻(xiàn)計(jì)量的應(yīng)用研究了解學(xué)科發(fā)展態(tài)勢(shì)、掌握人才發(fā)展現(xiàn)狀。
文獻(xiàn)計(jì)量應(yīng)用研究是一門涉及多學(xué)科、多領(lǐng)域的實(shí)踐應(yīng)用型研究,不僅需要大量全面、可靠的數(shù)據(jù)資源作為研究基礎(chǔ),更需要專業(yè)的圖情知識(shí)和數(shù)據(jù)分析、處理技能作為文獻(xiàn)計(jì)量分析的科學(xué)保障,同樣也依賴專業(yè)的學(xué)科背景知識(shí)作為相關(guān)學(xué)科內(nèi)容分析的理論支撐。上述各類研究人員理應(yīng)相互學(xué)習(xí)、交流與合作,取長補(bǔ)短,才能達(dá)到理想的研究效果,但實(shí)際情況并不樂觀。從理論成果的文獻(xiàn)作者來看,多數(shù)均為某一領(lǐng)域的研究人員獨(dú)立或合作完成,僅有少數(shù)研究是由不同領(lǐng)域的研究人員共同完成,研究群體間普遍缺乏交流與合作,從而導(dǎo)致研究論文存在數(shù)據(jù)處理不夠科學(xué)、計(jì)量方法有失公正、相關(guān)學(xué)科內(nèi)容分析較為淺顯等現(xiàn)象。
2.2文獻(xiàn)來源有所拓寬,但用于科研評(píng)價(jià)不夠全面和客觀
從科技論文到專利成果,現(xiàn)有的文獻(xiàn)計(jì)量應(yīng)用研究中,其文獻(xiàn)來源雖有所拓寬,但仍不足以全面、客觀地對(duì)機(jī)構(gòu)、科學(xué)家進(jìn)行科研評(píng)價(jià)。之所以不全面,是因?yàn)榭茖W(xué)家的研究成果不僅僅體現(xiàn)在科技論文、專利成果中,還體現(xiàn)在專著、研究報(bào)告中。而且,隨著開放存取環(huán)境的發(fā)展,研究人員的網(wǎng)絡(luò)發(fā)表也已成為其成果公布的重要一面,科研成果的網(wǎng)絡(luò)影響力也是科研評(píng)價(jià)的重要指標(biāo),僅僅通過對(duì)數(shù)據(jù)庫中論文和專利的計(jì)量來進(jìn)行科研評(píng)價(jià),顯然不夠全面。之所以不客觀,則是因?yàn)榛诖笮头治鲂蛿?shù)據(jù)庫開展文獻(xiàn)計(jì)量這種定量評(píng)價(jià)方法并不適用于所有學(xué)科的科研評(píng)價(jià)。如SCI、EI、ESI等大型分析性數(shù)據(jù)庫對(duì)人文社科文獻(xiàn)的收錄有限,而且論文、專利、專著、報(bào)告等成果在理工科和人文社科的地位也不同。更何況基于文獻(xiàn)計(jì)量的定量評(píng)價(jià),其相關(guān)評(píng)價(jià)指標(biāo)本身就缺乏一定的科學(xué)性和公正性,如發(fā)文量、引文量、H指數(shù)等計(jì)量指標(biāo)只對(duì)從事科研時(shí)間較長的學(xué)者有優(yōu)勢(shì),用在統(tǒng)一的科研評(píng)價(jià)中確實(shí)存在缺陷。故同行評(píng)議、分類評(píng)價(jià)、第三方評(píng)價(jià)、代表作制度等方法一直被呼吁作為深化科研評(píng)價(jià)體系改革的建議。
2.3應(yīng)用領(lǐng)域廣,但框架重復(fù)多
文獻(xiàn)計(jì)量應(yīng)用研究因受到不同領(lǐng)域的研究者越來越多的關(guān)注,其產(chǎn)生的研究成果也就越來越多。盡管這些研究成果分散在圖書情報(bào)類、科技管理類、生物醫(yī)學(xué)類、工程類等各類期刊上,但通過閱讀大量文獻(xiàn)并進(jìn)行比照不難發(fā)現(xiàn),現(xiàn)有的相關(guān)研究雖然其應(yīng)用涉及的學(xué)科領(lǐng)域不同,但其研究框架頗為相似。多數(shù)是首先介紹研究方法和數(shù)據(jù)來源,然后重點(diǎn)分析該領(lǐng)域影響力較高的國家、地區(qū)、科研機(jī)構(gòu)、重點(diǎn)期刊、核心作者、發(fā)表論文,再基于ESI總結(jié)學(xué)科領(lǐng)域研究的前沿和熱點(diǎn)。在計(jì)量分析過程中,學(xué)者們常常借助大篇幅圖表數(shù)據(jù)作相關(guān)定量分析,學(xué)科領(lǐng)域的科研人員能夠從中獲取的信息較為寬泛,缺乏適當(dāng)?shù)慕Y(jié)合學(xué)科內(nèi)容的定性分析。
2.4分析數(shù)據(jù)量大,但清洗工作少
對(duì)于統(tǒng)計(jì)分析而言,數(shù)據(jù)來源的可靠性和科學(xué)性至關(guān)重要,因?yàn)閿?shù)據(jù)是基礎(chǔ),決定了分析結(jié)果的客觀性和準(zhǔn)確性。文獻(xiàn)計(jì)量應(yīng)用研究需要依賴大量的文獻(xiàn)數(shù)據(jù)作分析基礎(chǔ),數(shù)據(jù)采集和清洗過程中的每個(gè)步驟都非常關(guān)鍵,如關(guān)鍵詞和檢索策略的制定、數(shù)據(jù)的去重與合并等。然而實(shí)際研究中,學(xué)者們對(duì)數(shù)據(jù)清洗工作的重視普遍不夠。研究論文中對(duì)數(shù)據(jù)處理方法多數(shù)是簡(jiǎn)單介紹,而且從其簡(jiǎn)單介紹中不難看出,其數(shù)據(jù)處理主要依靠人工判別,機(jī)器輔助實(shí)現(xiàn)的較少;有些因數(shù)據(jù)不夠精確(如文獻(xiàn)地址未能精確到所在詳細(xì)機(jī)構(gòu)和重點(diǎn)實(shí)驗(yàn)室)的論文直接不歸入統(tǒng)計(jì)范圍;又或直接依賴某些指標(biāo)數(shù)據(jù)庫的清洗歸并,造成統(tǒng)計(jì)數(shù)據(jù)的遺漏等。所有這些對(duì)數(shù)據(jù)清洗工作的不重視,最終都將導(dǎo)致統(tǒng)計(jì)數(shù)據(jù)的不準(zhǔn)確,分析結(jié)果難具信服力。
3.1健全服務(wù)機(jī)制,加強(qiáng)交流與合作
從上文分析得知,圖書館等信息服務(wù)部門人員在三類主要研究群體中最具資源優(yōu)勢(shì)和服務(wù)技能特長,故由其作為服務(wù)主體開展文獻(xiàn)計(jì)量服務(wù)實(shí)踐有一定優(yōu)勢(shì)。而高校圖書館不僅享有大量的數(shù)據(jù)資源,擁有專業(yè)的信息服務(wù)設(shè)備,還具備豐富的人力資源和服務(wù)經(jīng)驗(yàn)。高校圖書館可通過設(shè)置專門的文獻(xiàn)計(jì)量服務(wù)部門和崗位,聘用專業(yè)的文獻(xiàn)計(jì)量學(xué)科館員,建立健全長效的服務(wù)工作機(jī)制,確保該實(shí)踐工作科學(xué)、有效地運(yùn)行。高校圖書館日常業(yè)務(wù)中諸如查收查引、科技查新等工作開展過程中形成的嚴(yán)謹(jǐn)?shù)臉I(yè)務(wù)流程、嚴(yán)格的審核制度、規(guī)范的報(bào)告文檔等,都可以作為文獻(xiàn)計(jì)量服務(wù)實(shí)踐的參考和借鑒。當(dāng)然,在服務(wù)實(shí)踐過程中,和數(shù)據(jù)庫公司及其他研究人員的交流與合作至關(guān)重要。如,通過和湯森路透公司的合作,進(jìn)一步規(guī)范人名、機(jī)構(gòu)名等數(shù)據(jù)的處理;通過和圖情專業(yè)人士的交流與學(xué)習(xí),不斷提升自身的理論水平,從而指導(dǎo)實(shí)踐工作;通過和學(xué)科專業(yè)研究人員的交流和溝通,全面了解其信息需求,擴(kuò)充一定的專業(yè)背景知識(shí),從而更好地提供定量與定性相結(jié)合、基于學(xué)科內(nèi)容的信息分析服務(wù)。
3.2區(qū)分服務(wù)對(duì)象,注重服務(wù)內(nèi)容的個(gè)性化與針對(duì)性
事實(shí)上,由于文獻(xiàn)計(jì)量指標(biāo)存在一定缺陷,有些分析結(jié)果并不具有客觀公正性,且實(shí)際應(yīng)用過程中,各類用戶的信息需求也不盡相同。因此,本著公正、客觀的原則,面向不同用戶開展有針對(duì)性的文獻(xiàn)計(jì)量服務(wù)實(shí)踐才是合理之舉。例如,對(duì)于學(xué)??蒲泄芾聿块T,他們重在掌握科研基金的分配情況,可利用文獻(xiàn)計(jì)量對(duì)學(xué)科、機(jī)構(gòu)、個(gè)人在受基金資助前后的科研產(chǎn)出及影響力進(jìn)行評(píng)價(jià)和對(duì)比分析,給科研管理部門提供決策參考;對(duì)于人事管理部門,他們重在掌握科研人才的整體情況,可通過文獻(xiàn)計(jì)量對(duì)學(xué)科、機(jī)構(gòu)、個(gè)人的科研產(chǎn)出進(jìn)行發(fā)文量、被引頻次和H指數(shù)的統(tǒng)計(jì)分析,給人事管理部門提供學(xué)科師資力量的分布情況。又如,對(duì)于知名教授或?qū)W科帶頭人,他們重在了解個(gè)人或團(tuán)隊(duì)在同行中的位置,可通過文獻(xiàn)計(jì)量提供其個(gè)人或團(tuán)隊(duì)研究成果的收錄、被引情況、H指數(shù)、科研團(tuán)隊(duì)合作分析等;對(duì)于學(xué)術(shù)新人和中堅(jiān)力量,他們更為關(guān)注學(xué)科領(lǐng)域的發(fā)展態(tài)勢(shì),可通過文獻(xiàn)計(jì)量提供學(xué)科領(lǐng)域或研究方向的重點(diǎn)研究機(jī)構(gòu)、高影響力期刊、高被引作者、學(xué)科研究熱點(diǎn)和前沿等。當(dāng)然,面向不同學(xué)科類別的文獻(xiàn)計(jì)量服務(wù)實(shí)踐在數(shù)據(jù)源的選擇上也應(yīng)有所不同,如人文社科的文獻(xiàn)計(jì)量除科技論文外,還應(yīng)包括學(xué)術(shù)專著,而理工科的文獻(xiàn)計(jì)量則應(yīng)主要依據(jù)科技論文、研究報(bào)告和專利成果等。
3.3重視數(shù)據(jù)來源,確保分析結(jié)果的科學(xué)性與準(zhǔn)確性
大數(shù)據(jù)時(shí)代,基于海量數(shù)據(jù),借助文獻(xiàn)計(jì)量分析方法開展面向?qū)W科發(fā)展和科研決策的信息服務(wù),是高校圖書館轉(zhuǎn)型時(shí)期尋求角色轉(zhuǎn)變與服務(wù)創(chuàng)新的一項(xiàng)重要實(shí)踐探索。該實(shí)踐不僅能夠發(fā)揮圖書館館藏資源優(yōu)勢(shì),拓寬圖書館服務(wù)領(lǐng)域,提升學(xué)科服務(wù)層次,還能提高圖書館在學(xué)校的地位,樹立圖書館良好形象。但該實(shí)踐活動(dòng)中,數(shù)據(jù)來源的可靠性和科學(xué)性至關(guān)重要,決定了分析結(jié)果的信服力和實(shí)踐活動(dòng)的影響力。因此,在開展文獻(xiàn)計(jì)量服務(wù)實(shí)踐過程中,學(xué)科館員一定要本著客觀、公正的服務(wù)態(tài)度,認(rèn)真對(duì)待數(shù)據(jù)采集、處理、分析過程中的每一步,力求為用戶提供科學(xué)、準(zhǔn)確的信息服務(wù)。如數(shù)據(jù)采集和清洗階段,一方面要加強(qiáng)同學(xué)科用戶的反復(fù)交流和溝通,充分了解其信息需求,確定最終的檢索策略;另一方面要高度重視數(shù)據(jù)清洗工作,通過借助數(shù)據(jù)清洗工具,輔以部分人工判別,保證數(shù)據(jù)來源的科學(xué)性。數(shù)據(jù)分析評(píng)價(jià)階段,要堅(jiān)持一切以事實(shí)為依據(jù)原則,確保數(shù)據(jù)的準(zhǔn)確性和服務(wù)的信服力??偨Y(jié)討論階段,仍然要加強(qiáng)同學(xué)科用戶的交流與溝通,適當(dāng)引入部分同學(xué)科內(nèi)容相結(jié)合的定性分析,為科研人員提供切實(shí)有效的參考信息。
3.4劃分服務(wù)階段,力求服務(wù)方式的多樣化與可行性
多樣化的服務(wù)方式,能給用戶帶來更多的服務(wù)體驗(yàn),從而有利于改善和提高服務(wù)水平。可用于文獻(xiàn)計(jì)量服務(wù)實(shí)踐的方式有很多,但為了保證服務(wù)效果,在服務(wù)周期的不同階段,側(cè)重使用的服務(wù)方式也應(yīng)有所不同。如文獻(xiàn)計(jì)量服務(wù)實(shí)踐開展的初期,因多數(shù)學(xué)科用戶對(duì)該服務(wù)不夠了解,可選擇一兩個(gè)學(xué)科為試點(diǎn),通過主動(dòng)推送的方式,將文獻(xiàn)計(jì)量服務(wù)推介給用戶。如主動(dòng)將機(jī)構(gòu)或?qū)W科領(lǐng)域的科研發(fā)展態(tài)勢(shì)推送給學(xué)院領(lǐng)導(dǎo),為其科研決策提供參考;將個(gè)人研究成果的收錄情況和被引情況、H指數(shù)、科研團(tuán)隊(duì)合作分析等推送給學(xué)科帶頭人,為其科學(xué)研究提供參考。用戶在體驗(yàn)了該服務(wù)后,對(duì)服務(wù)有所了解并進(jìn)一步熟悉,此時(shí),為進(jìn)一步拓寬服務(wù)內(nèi)容,提升服務(wù)層次,可適當(dāng)引導(dǎo)用戶,挖掘其潛在的相關(guān)信息需求,形成個(gè)性化定制方案,根據(jù)用戶的個(gè)性化信息需求提供更為專業(yè)、更具有針對(duì)性的信息服務(wù)。如定期更新其收錄和被引情況,分時(shí)段提供其科研產(chǎn)出的計(jì)量分析等。可見,不同的服務(wù)方式只有在適宜的階段被采用,才能發(fā)揮最大的效用。
[1]楊立英,等.中國科學(xué):發(fā)展水平與學(xué)科結(jié)構(gòu)的思考——2010年SCI論文統(tǒng)計(jì)分析[J].科學(xué)觀察,2011(1):23-50.
[2]胡天天,等.SCI收錄浙江省論文的統(tǒng)計(jì)分析[J].中華醫(yī)學(xué)圖書情報(bào)雜志,2011(2):75-78,81.
[3]殷晶晶,胡永紅.基于ESI數(shù)據(jù)庫的江蘇高校學(xué)科競(jìng)爭(zhēng)力分析[J].江蘇科技信息,2014(20):23-25.
[4]夏琬鈞,等.基于Incites和ESI的高??蒲挟a(chǎn)出統(tǒng)計(jì)與分析——以西南交通大學(xué)為例[J].四川圖書館學(xué)報(bào),2014(3):14-16.
[5]潘有能,等.基于Web of Science的理科學(xué)者h(yuǎn)指數(shù)實(shí)證研究[J].大學(xué)圖書館學(xué)報(bào),2009 (2):61-65,84.
[6]丁楠,等.基于CSSCI的文科學(xué)者h(yuǎn)指數(shù)實(shí)證研究[J].大學(xué)圖書館學(xué)報(bào),2009(2):55-60.
[7]次仁拉珍.專利權(quán)人h指數(shù)研究——以世界百強(qiáng)企業(yè)為例[D].杭州:浙江大學(xué),2008.
[8]王志軍,鄭德?。畃指數(shù)運(yùn)用于人才評(píng)價(jià)的有效性實(shí)證研究[J].圖書情報(bào)工作,2012(14):93-97.
[9]趙蓉英,溫芳芳.科研合作與知識(shí)交流[J].圖書情報(bào)工作,2011(20):6-10,27.
[10]靜瑩,等.中美漁業(yè)科技合作現(xiàn)狀與發(fā)展趨勢(shì)的計(jì)量學(xué)分析[J].中國農(nóng)學(xué)通報(bào),2012(20):106-112.
[11]郭永正.中國和印度:國際科學(xué)合作的文獻(xiàn)計(jì)量比較研究[D].大連:大連理工大學(xué),2010.
[12]徐志瑋,等.亞洲和西方國家在學(xué)科領(lǐng)域的活躍性和影響力比較研究[J].情報(bào)雜志,2011 (7):45-49,54.
[13]陳仕吉,等.科研機(jī)構(gòu)潛勢(shì)學(xué)科的識(shí)別方法與實(shí)證分析——以中國農(nóng)業(yè)大學(xué)為例[J].情報(bào)雜志,2012(2):43-47.
[14]董琳.學(xué)科評(píng)價(jià)之文獻(xiàn)計(jì)量數(shù)據(jù)準(zhǔn)備[J].情報(bào)理論與實(shí)踐,2010(6):49-52.
[15]張晉輝,劉清.基于推理機(jī)的SCI地址字段數(shù)據(jù)清洗方法設(shè)計(jì)[J].情報(bào)科學(xué),2010(5): 741-746.
[16]閆雪,等.文獻(xiàn)計(jì)量數(shù)據(jù)準(zhǔn)備之?dāng)?shù)據(jù)采集與清洗——以中國水產(chǎn)科學(xué)研究院中文期刊論文分析為例[J].農(nóng)業(yè)圖書情報(bào)學(xué)刊,2014(4):36-40.
[17]薛調(diào).國內(nèi)圖書館學(xué)科知識(shí)服務(wù)領(lǐng)域演進(jìn)路徑、研究熱點(diǎn)與前沿的可視化分析[J].圖書情報(bào)工作,2012(15):9-14.
[18]孫玉偉.面向科研決策的信息服務(wù)框架探析[J].情報(bào)雜志,2013(6):167-171,175.
[19]孫秀煥,路文如.基于Web of Science的“水稻”研究論文產(chǎn)出分析[J].中國農(nóng)業(yè)科技導(dǎo)報(bào),2012(2):31-39.
[20]王文平,等.中國政府資助中歐科技合作的特征研究——基于文獻(xiàn)計(jì)量分析的視角[J].科學(xué)學(xué)研究,2014(6):801-810,824.
[21]孫建軍.鏈接分析:知識(shí)基礎(chǔ)、研究主體、研究熱點(diǎn)與前沿綜述——基于科學(xué)知識(shí)圖譜的途徑[J].情報(bào)學(xué)報(bào),2014(6):659-672.
[22]王雪梅,等.文獻(xiàn)計(jì)量指標(biāo)的GIS空間展現(xiàn)[J].圖書情報(bào)工作,2014(3):72-77.
[收稿日期]2015-05-27[責(zé)任編輯]徐娜
[作者簡(jiǎn)介]朱鎖玲(1983-),女,博士,南京農(nóng)業(yè)大學(xué)圖書館副研究館員,研究方向:文獻(xiàn)計(jì)量與數(shù)字圖書館;唐惠燕(1968-)女,博士,南京農(nóng)業(yè)大學(xué)圖書館副館長,研究方向:圖書館管理與知識(shí)服務(wù);倪峰(1960-),男,博士,館長,研究方向:圖書館管理與經(jīng)濟(jì)學(xué)理論;陳蓉蓉(1978-)女,碩士,副研究館員,研究方向:圖書與情報(bào);施文(1983-)女,碩士在讀,助理館員,研究方向:圖書與情報(bào)。
通訊作者:△唐惠燕
[基金項(xiàng)目]本文系中央高??蒲小暇┺r(nóng)業(yè)大學(xué)人文社科基金項(xiàng)目“方志類古籍智能化整理與開發(fā)利用研究”(項(xiàng)目編號(hào):SK2014033)研究成果之一。
[文章編號(hào)]1005-8214(2015)12-0033-06
[文獻(xiàn)標(biāo)志碼]A
[中圖分類號(hào)]G250.252