張燕飛+孔慶杰+劉東亮
[摘 要] 基于CNKI期刊數(shù)據(jù)庫,以數(shù)據(jù)共享為檢索詞,借助文獻(xiàn)分析工具SATI、Ucinet,以時(shí)間、作者及其影響力、期刊來源、機(jī)構(gòu)、關(guān)鍵詞等多個(gè)指標(biāo)進(jìn)行分析,采用共詞分析法對圖書情報(bào)學(xué)數(shù)據(jù)共享的主題及演變過程進(jìn)行分析,結(jié)合目前我國圖書館領(lǐng)域數(shù)據(jù)共享現(xiàn)狀,探討開發(fā)適合我國數(shù)據(jù)庫共享平臺等多種方式,實(shí)現(xiàn)以高校圖書館為主的數(shù)據(jù)分享的藍(lán)圖。
[關(guān)鍵詞] 數(shù)據(jù)共享;圖書館;演變趨勢;高校圖書館
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2017. 03. 088
[中圖分類號] G353 [文獻(xiàn)標(biāo)識碼] A [文章編號] 1673 - 0194(2017)03- 0162- 05
0 引 言
檔案學(xué)對“數(shù)據(jù)共享”的定義為:“多用戶同時(shí)使用同一個(gè)數(shù)據(jù)信息集合”。2013年以來,國際上多個(gè)領(lǐng)域已經(jīng)開始廣泛關(guān)注科學(xué)數(shù)據(jù)共享[1]。目前,在圖書情報(bào)學(xué)領(lǐng)域研究主要熱點(diǎn)關(guān)鍵詞包括數(shù)字閱讀、數(shù)字圖書館與個(gè)性化服務(wù)、推送服務(wù)、移動(dòng)圖書館、新媒體營銷、云計(jì)算等[2]。數(shù)據(jù)共享是以互聯(lián)網(wǎng)大數(shù)據(jù)的背景為前提條件,數(shù)據(jù)共享能夠?qū)崿F(xiàn)數(shù)據(jù)資源最大化利用、數(shù)據(jù)管理、數(shù)據(jù)服務(wù)等功能。采用云計(jì)算的模式作為數(shù)字圖書館的底層架構(gòu),圖書館服務(wù)的改善表現(xiàn)在數(shù)據(jù)安全、數(shù)據(jù)共享、用戶體驗(yàn)等方面[3]。每個(gè)學(xué)科在其數(shù)據(jù)共享實(shí)踐中都有不同的策略,數(shù)據(jù)共享與學(xué)術(shù)圖書館合作,為數(shù)據(jù)管理與共享提供相應(yīng)的制度。目前,對該領(lǐng)域的主題及演變趨勢的研究極少。
筆者基于CNKI數(shù)據(jù)庫,檢索詞=數(shù)據(jù)共享,學(xué)科=圖書情報(bào)學(xué),從論文發(fā)表時(shí)間、作者及其影響力、期刊來源、機(jī)構(gòu)、關(guān)鍵詞等多個(gè)指標(biāo),借助SATI,經(jīng)DetDraw可視化,以圖譜的方式呈現(xiàn),旨在探索我國圖書館領(lǐng)域數(shù)據(jù)共享研究的主題以及其演變過程,以我國現(xiàn)狀為基礎(chǔ),提出相應(yīng)的對策和建議。
1 研究方法與數(shù)據(jù)來源
研究方法:采用共詞分析法,利用統(tǒng)計(jì)分析工具SATI 3.2,Ucinet 6進(jìn)行處理描述,抽取字段、提取關(guān)鍵詞、作者、機(jī)構(gòu)、期刊來源詞頻,并生成共現(xiàn)矩陣,相異矩陣;利用IBM SPSS 19.0聚類分析;處理數(shù)據(jù),統(tǒng)計(jì)分析。
數(shù)據(jù)來源:CNKI的中國期刊全文數(shù)據(jù)庫。數(shù)據(jù)樣本時(shí)間范圍:1987年1月1日至2016年10月30日。以數(shù)據(jù)共享進(jìn)行主題精確檢索,去重后,圖書情報(bào)與數(shù)字圖書館學(xué)科有302條記錄。檢索時(shí)間:2016年10月30日。
2 統(tǒng)計(jì)結(jié)果分析
2.1 論文發(fā)表隨時(shí)間呈上升趨勢
自1987年以來,該研究數(shù)量隨著時(shí)間的變化曲線見圖1。
由圖1可見,2006年至2012年,論文數(shù)量經(jīng)過兩個(gè)波峰,整體比上一階段高,在2009年達(dá)到小高峰,發(fā)文量達(dá)到30篇;2012年到2015年,研究論文數(shù)量一直呈現(xiàn)增長趨勢,2015年發(fā)表數(shù)量增至最高值(69篇),發(fā)文量隨著時(shí)間的增長基本上呈現(xiàn)增長趨勢。
2.2 論文著者之間多以個(gè)人形式存在,缺乏多人合作團(tuán)體
從作者發(fā)文量及其著者合作發(fā)文的情況,能夠清晰科研主導(dǎo)力量及其機(jī)構(gòu)之間的合作情況。筆者以作者和第一作者為統(tǒng)計(jì)指標(biāo)。共463位作者,共現(xiàn)次數(shù)=522,出現(xiàn)一次作者的人數(shù)=413,占全部的79.12%。合計(jì)274位第一作者,共現(xiàn)次數(shù)=297次,出現(xiàn)一次作者的人數(shù)=252,占全部的84.85%。以作者共現(xiàn)矩陣得作者之間的關(guān)系網(wǎng)絡(luò)圖譜如圖2所示。
按照K-core共分為3個(gè)值。0:左側(cè)作者群;1:四邊形;2:三角形。由圖2可知,K-core=2在圖譜中占據(jù)該研究的重要地位。著者之間的共同合作較為缺乏,一般多數(shù)都是單獨(dú)研究,主要分布在圖的左側(cè),在前50位作者中,聯(lián)系最為緊密的是江洪與鐘永恒,聯(lián)系最多作者數(shù)量為3人。未來團(tuán)隊(duì)合作能夠促使作者之間的關(guān)系更為密切。
2.3 期刊分布來源少,出現(xiàn)單一現(xiàn)象
論文分布在128種刊物上,期刊載文量為1篇的占總量的29.1%。發(fā)文量前10的期刊信息見表1。載文量最多的期刊為《圖書情報(bào)工作》(IF=2.018,最高),30篇,其余前9位期刊載文量均在12篇以下,TOP10期刊的載文量累計(jì)概率為36.4%。除《科技情報(bào)開發(fā)與經(jīng)濟(jì)》與《農(nóng)業(yè)圖書情報(bào)學(xué)刊》外,其余期刊的影響因子IF均在1左右。
2.4 高產(chǎn)機(jī)構(gòu)地域分布不均勻
筆者以研究機(jī)構(gòu)為指標(biāo),大致將所有文章分屬到高等院校、公共圖書館、科研單位及醫(yī)院四個(gè)單位類別,高等院校所占比率最大,論文數(shù)量接近200篇。進(jìn)一步對高等院校以華東、華北、東北、華南、華中、西北、西南為劃分標(biāo)準(zhǔn),高產(chǎn)機(jī)構(gòu)主要分布在我國的華東、華中、華北地區(qū)。
2.5 高頻關(guān)鍵詞及熱點(diǎn)主題分析
2.5.1 高頻關(guān)鍵詞(數(shù)據(jù)共享、圖書館、科學(xué)數(shù)據(jù))
通過對數(shù)據(jù)源的關(guān)鍵詞共現(xiàn)分析歸納該學(xué)科的研究熱點(diǎn)主題,根據(jù)詞頻統(tǒng)計(jì)結(jié)果繪制數(shù)據(jù)共享研究所涉及關(guān)鍵詞的共現(xiàn)圖譜,從圖譜中更能清晰地看出研究熱點(diǎn)、各主題之間的內(nèi)在聯(lián)系。該研究主題有903個(gè)關(guān)鍵詞,平均每篇論文關(guān)鍵詞數(shù)量為3。出現(xiàn)1次的關(guān)鍵詞有756次,占總數(shù)的54.98%,詞頻﹥5的關(guān)鍵詞如表2所示。
數(shù)據(jù)共享出現(xiàn)了80詞意義不大,因?yàn)闄z索主題詞為“數(shù)據(jù)共享”。除數(shù)據(jù)共享外出現(xiàn)頻次前3的關(guān)鍵詞依次是圖書館(33)、科學(xué)數(shù)據(jù)(32)、數(shù)字圖書館(18)。為使關(guān)鍵詞的圖譜具有代表性,筆者選取關(guān)鍵詞出現(xiàn)的頻次前50個(gè)關(guān)鍵詞。
2.5.2 四類研究主題分析
關(guān)鍵詞通過可視化圖譜能反應(yīng)出研究領(lǐng)域內(nèi)親疏關(guān)系。為了進(jìn)一步清晰地描述研究主題,筆者采用IBM SPSS 19.0系統(tǒng)聚類處理前50個(gè)關(guān)鍵詞,參考線Y=23將聚類圖中該領(lǐng)域的關(guān)鍵詞大致分為四類(見表 3),A類:數(shù)字圖書館與網(wǎng)絡(luò)技術(shù)類,因?yàn)閄ML具有兼容Web應(yīng)用,實(shí)現(xiàn)信息交換與共享[4]。B類:高校圖書館信息資源建設(shè)類。C類:元數(shù)據(jù)類。D類:科學(xué)數(shù)據(jù)管理、保存、共享類。
2.5.3 戰(zhàn)略坐標(biāo)分析(A、D類合為一類)
戰(zhàn)略坐標(biāo)圖是向心度和密度為橫、縱坐標(biāo)軸,戰(zhàn)略坐標(biāo)點(diǎn)分布在四個(gè)象限,每個(gè)戰(zhàn)略坐標(biāo)點(diǎn)位置和距離的遠(yuǎn)近表示不同領(lǐng)域間的關(guān)系、內(nèi)部成員之間的關(guān)聯(lián)程度。第一象限點(diǎn):兩個(gè)數(shù)值都高,它為該領(lǐng)域的核心與成熟區(qū);第二象限點(diǎn),向心度低,密度高,邊緣與成熟區(qū);第三象限點(diǎn),兩者均低,邊緣與不成熟區(qū);第四象限,向心度高,密度低,核心與不成熟區(qū)域。四類的平均坐標(biāo)值為(3.4,5.8),該研究的戰(zhàn)略坐標(biāo)圖見圖2。
結(jié)合上述理論,發(fā)現(xiàn)A、D兩類處在邊緣與成熟區(qū),主要是在網(wǎng)絡(luò)技術(shù)下發(fā)展起來的新型話題,可將這兩類合為一類。核心和成熟區(qū)并未出現(xiàn)戰(zhàn)略坐標(biāo)點(diǎn),該研究領(lǐng)域仍舊處在發(fā)展中,均在確定目前該研究的發(fā)展趨勢。以元數(shù)據(jù)、整合為內(nèi)容的C類處在該研究領(lǐng)域的邊緣與不成熟區(qū);高校圖書館、信息資源共享為主的B類處在核心與不成熟區(qū)域,高校圖書館如何有效利用資源的工作值得進(jìn)一步研究。
由SATI生成50×50階共詞矩陣,經(jīng)Ucinet的經(jīng)Netdraw中心性分析后得關(guān)鍵詞共現(xiàn)圖譜見圖3。
圖3中節(jié)點(diǎn)的大小表示不同的度,表示與該節(jié)點(diǎn)相連線的條數(shù),節(jié)點(diǎn)之間連線的粗細(xì)代表關(guān)鍵詞之間的關(guān)聯(lián)程度。圖3中所有節(jié)點(diǎn)最大的除數(shù)據(jù)共享外,其次是圖書館、科學(xué)數(shù)據(jù),較為明顯的還有:數(shù)字圖書館、信息服務(wù)、高校圖書館等,其中數(shù)據(jù)共享與科學(xué)數(shù)據(jù)的關(guān)系最為密切,圖的右上角也形成了一個(gè)較為緊密的圖譜,處于網(wǎng)絡(luò)圖譜邊上的關(guān)鍵詞之間的相互聯(lián)系越不緊密。
2.6 演變趨勢分析
2.6.1 計(jì)算機(jī)管理、編目為主(1987-2005年)
第一階段,由前50個(gè)高頻關(guān)鍵詞共現(xiàn)矩陣,經(jīng)過Ucinet的NetDraw可視化處理,數(shù)據(jù)共享、資源共享、書目數(shù)據(jù)、計(jì)算機(jī)編目、編目工作等這些為第一階段的核心關(guān)鍵詞,數(shù)據(jù)共享與圖書館自動(dòng)化的關(guān)系較為緊密。數(shù)字圖書館、標(biāo)引類、科學(xué)數(shù)據(jù)共享等關(guān)鍵詞處在圖譜的邊緣上。合作館藏建設(shè)、聯(lián)機(jī)聯(lián)合編目是圖書館的基礎(chǔ)工作[5]。
2.6.2 數(shù)字圖書館、高校圖書館與XML等技術(shù)相結(jié)合發(fā)展(2006-2012年)
第二階段,節(jié)點(diǎn)最大的關(guān)鍵詞仍然是數(shù)據(jù)共享,其次為數(shù)字圖書館、圖書館、高校圖書館,該階段數(shù)字圖書館與數(shù)據(jù)集成、云計(jì)算、XML之間關(guān)系緊密,關(guān)系較密的關(guān)鍵詞群有:數(shù)據(jù)共享、圖書館、云計(jì)算;高校圖書館、文獻(xiàn)資源建設(shè)、信息資源共享。與第一階段相比較,從偏重管理和編目的研究轉(zhuǎn)變?yōu)樾戮W(wǎng)絡(luò)技術(shù)與圖書館相結(jié)合,重點(diǎn)偏向于計(jì)算機(jī)技術(shù)與數(shù)字圖書館的發(fā)展。圖書館的變化起源于美國和其它國家,網(wǎng)絡(luò)無國界,各地互聯(lián)網(wǎng)連接,圖書館也受其影響,逐漸走向電子化,數(shù)字及虛擬圖書館也就應(yīng)運(yùn)而生。
2.6.3 科學(xué)數(shù)據(jù)共享與圖書館為主(2013-2016年)
第三階段,數(shù)據(jù)共享的節(jié)點(diǎn)最大,科學(xué)數(shù)據(jù)、圖書館、科學(xué)數(shù)據(jù)共享陸續(xù)緊隨其后,網(wǎng)絡(luò)圖譜相互交錯(cuò),聯(lián)系較為緊密,與上兩個(gè)階段相比,它們之間的聯(lián)系比較緊密,主要表現(xiàn)AD和D上。一、二、三階段關(guān)鍵詞之間的平均距離AD1= 2.369、AD2=3.162、AD3=2.215,AD2﹥AD1﹥AD3,即第三階段關(guān)鍵詞之間聯(lián)系最為緊密;基于距離的內(nèi)聚力D1= 0.331,D2= 0.332,D3= 0.470,D3﹥D2﹥D1,第三階段的內(nèi)聚性最大。
3 對 策
目前,我國處在較低的發(fā)展階段,存在的突出問題:共享理念不夠普及,相關(guān)機(jī)制并不健全,平臺與技術(shù)規(guī)范發(fā)展速度比較慢,共享服務(wù)的效果不夠明顯[6-7],缺乏相關(guān)數(shù)據(jù)存檔服務(wù)。開放數(shù)據(jù)許可協(xié)議對促進(jìn)數(shù)據(jù)共享具有重要作用,政府機(jī)構(gòu)、知識共享組織、開放數(shù)據(jù)共用項(xiàng)目制訂相對應(yīng)的開放數(shù)據(jù)許可協(xié)議。數(shù)據(jù)協(xié)議包含:數(shù)據(jù)的使用,數(shù)據(jù)的支持與分享,數(shù)據(jù)責(zé)任[8]等。圖書館按照服務(wù)對象的不同,產(chǎn)生不同類型的圖書館,主要以高校圖書館、公共圖書館、研究型圖書館。圖書館在文化信息資源共享工程建設(shè)發(fā)揮著重要的作用[9]。數(shù)字和高校圖書館在數(shù)據(jù)共享研究領(lǐng)域占據(jù)重要的地位。
基于國內(nèi)該領(lǐng)域發(fā)展的現(xiàn)狀,提出以下五種措施:
(1)鼓勵(lì)數(shù)據(jù)共享,共享科學(xué)界公認(rèn)的真實(shí)數(shù)字化資料。諸如采用Google分享數(shù)據(jù)[10]。
(2)自由選擇數(shù)據(jù)管理和訪問的方式,NIH數(shù)據(jù)共享的可選方式包含四種:研究人員自我提供數(shù)據(jù)共享,提交數(shù)據(jù)庫,設(shè)置訪問權(quán)限,混合方式[11]。
(3)技術(shù)保障,相關(guān)共享平臺是數(shù)據(jù)實(shí)現(xiàn)共享的基礎(chǔ)。充分利用先進(jìn)的互聯(lián)網(wǎng)技術(shù),實(shí)現(xiàn)科學(xué)數(shù)據(jù)在不同對象的共享。
(4)政策和相關(guān)法規(guī)標(biāo)準(zhǔn)的保障機(jī)制。短期內(nèi)實(shí)現(xiàn)數(shù)據(jù)共享很難只靠個(gè)人意愿。通過獎(jiǎng)勵(lì)機(jī)制或硬性要求,從法律的角度才能確保其被國家單位或個(gè)人的重視。
(5)在政策和相關(guān)法規(guī)標(biāo)準(zhǔn)的保障機(jī)制的基礎(chǔ)上,建立標(biāo)準(zhǔn)化的模式。方便和快捷地為人群服務(wù),提高信息數(shù)據(jù)的被利用率。
主要參考文獻(xiàn)
[1]邱春艷,黃如花.近3年國際科學(xué)數(shù)據(jù)共享領(lǐng)域新進(jìn)展[J]. 圖書情報(bào)工作,2016(3):6-14.
[2]韓曉雪,張丹丹,王春華. 我國圖書情報(bào)領(lǐng)域微信研究熱點(diǎn)分析[J]. 圖書館學(xué)研究,2016(8):7-13.
[3]周舒,張嵐嵐.云計(jì)算改善數(shù)字圖書館用戶體驗(yàn)初探[J].圖書館學(xué)研究,2009(4):28-30.
[4]申傳斌. 基于XML的數(shù)字圖書館異構(gòu)數(shù)據(jù)庫互連[J]. 現(xiàn)代情報(bào), 2005(7):99-102.
[5]黃長著,霍國慶. 我國信息資源共享的戰(zhàn)略分析[J]. 中國圖書館學(xué)報(bào),2000(3):3-11.
[6]劉潤達(dá),諸云強(qiáng). 科學(xué)數(shù)據(jù)共享關(guān)鍵問題探索—以地球系統(tǒng)科學(xué)數(shù)據(jù)共享網(wǎng)為例[J]. 地理科學(xué)進(jìn)展,2007(5):118-126.
[7]黃心正. 基于WEB的科學(xué)數(shù)據(jù)庫數(shù)據(jù)共享現(xiàn)狀分析與共享機(jī)制建立[J]. 現(xiàn)代情報(bào),2004(10):111-113.
[8]楊敏,夏翠娟,徐華博.開放數(shù)據(jù)許可協(xié)議及其在圖書館領(lǐng)域的應(yīng)用[J].圖書館論壇,2016(6):91-98.
[9]羅少波.充分發(fā)揮圖書館在文化信息資源共享工程中的主體作用[J].圖書館論壇,2004(5):70-71.
[10]Mak Collette, Ellingson Margaret, Lancaster Charla. Does Your Data Deliver for Decision Making? New Directions for Resource Sharing Assessment[J].Interlending & Document Supply,2013,41(4):104-112.
[11]汪俊. 美國科學(xué)數(shù)據(jù)共享的經(jīng)驗(yàn)借鑒及其對我國科學(xué)基金啟示:以NSF和NIH為例[J]. 中國科學(xué)基金,2016(1):69-75.