朱玲玲 彭愛東 朱永鳳
(1.南京農(nóng)業(yè)大學信息科技學院 南京 210095;2.南京航空航天大學經(jīng)濟與管理學院 南京 211106)
在大數(shù)據(jù)時代,數(shù)據(jù)的價值不言而喻,數(shù)據(jù)開放已成為研究熱點。國務院《促進大數(shù)據(jù)發(fā)展行動綱要》及工業(yè)和信息化部發(fā)布的《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016—2020年)》都強調(diào)了要通過數(shù)據(jù)開放、共享做到數(shù)據(jù)取之于民、用之于民[1]。與此同時,數(shù)據(jù)開放研究已經(jīng)引起國內(nèi)學者的關注,研究成果主要集中在定性研究和案例分析的層面,如以我國地方性政府數(shù)據(jù)開放為例,提出我國政府數(shù)據(jù)平臺存在的問題與不足[2];從開放數(shù)據(jù)的不同主體和不同階段歸納其責任義務及運行機制[3]等。隨著研究的深入和范圍的擴大,陸續(xù)出現(xiàn)了數(shù)據(jù)開放政策、數(shù)據(jù)管理和元數(shù)據(jù)標準等研究子主題。為了對本領域研究主題的整體分布、態(tài)勢及彼此之間的關聯(lián)有更直觀清晰的認識,文章擬采用共詞分析、社會網(wǎng)絡分析、聚類分析及戰(zhàn)略坐標分析等方法對國內(nèi)圖書情報領域數(shù)據(jù)開放研究文獻進行計量分析,以發(fā)現(xiàn)其中的研究熱點并揭示其研究主題的發(fā)展脈絡,在此基礎上對國內(nèi)圖書情報領域數(shù)據(jù)開放研究的發(fā)展趨勢進行展望。
文章數(shù)據(jù)來源于中國知網(wǎng)CNKI期刊全文數(shù)據(jù)庫。選擇高級檢索功能,學科領域選擇圖書情報與數(shù)字圖書館,檢索項中選擇“主題”,檢索詞中選擇“開放數(shù)據(jù)”或含“數(shù)據(jù)開放”,并將時間限定為2009年至2018年,剔除與主題不相關論文,最終得到切合主題的205條記錄,以此作為本研究的數(shù)據(jù)源,并選擇Endnote作為文獻導出格式。
2009—2018年我國圖書情報領域對數(shù)據(jù)開放的研究呈現(xiàn)遞增趨勢,但文獻總量不大。2009—2014年發(fā)文量較少,且多數(shù)研究提到數(shù)字圖書館的元數(shù)據(jù)應用、關聯(lián)數(shù)據(jù)應用的協(xié)議研究或是大數(shù)據(jù)時代圖書館的開放創(chuàng)新研究,對數(shù)據(jù)開放的研究還處于基本的概念解釋階段。2015年國務院出臺了《促進大數(shù)據(jù)發(fā)展行動綱要》[4],國內(nèi)圖書情報領域的數(shù)據(jù)開放研究開始迅速增長,目前處于穩(wěn)定發(fā)展階段。
文章選取2009—2018年國內(nèi)圖書情報領域數(shù)據(jù)開放研究的期刊論文進行發(fā)文量統(tǒng)計。借助文獻題錄信息統(tǒng)計分析工具SATI3.2,將Endnote格式的文獻題目導入工具中,運用共詞分析法對國內(nèi)圖書情報領域關于數(shù)據(jù)開放論文中的關鍵詞字段進行抽取,并統(tǒng)計詞頻,同時對關鍵詞進行同義詞合并處理。再通過關鍵詞的兩兩統(tǒng)計,在Rows/Cols設定共現(xiàn)矩陣行列數(shù)構建關鍵詞共詞矩陣,以Excel文檔格式存儲,運用Netdraw軟件繪制出數(shù)據(jù)開放高頻關鍵詞共現(xiàn)網(wǎng)絡,分析圖書情報領域內(nèi)數(shù)據(jù)開放主題的發(fā)展趨勢。最后將相異矩陣導入SPSS19.0進行聚類分析,對輸出的聚類樹狀圖剖析,得出國內(nèi)數(shù)據(jù)開放研究的高頻主題類團,通過計算每一類團的密度和向心度繪制出戰(zhàn)略坐標圖,揭示出關鍵詞的親疏關系以及該領域研究主題現(xiàn)狀。在對數(shù)據(jù)開放的文獻進行梳理的基礎上,將聚類分析與戰(zhàn)略分析相結合,并結合數(shù)據(jù)開放的實踐,展望未來數(shù)據(jù)開放研究發(fā)展趨勢,以期為國內(nèi)圖書情報領域的數(shù)據(jù)開放研究提供參考。
在文獻計量與內(nèi)容分析法中關鍵詞是對文章內(nèi)容的高度概括,也是研究某一學術領域的重要指標。文章抽取了國內(nèi)圖書情報領域數(shù)據(jù)開放研究的205篇論文的474個關鍵詞,發(fā)現(xiàn)有些詞語出現(xiàn)同義不同詞的情況,先對關鍵詞進行同義詞合并處理,如將政府數(shù)據(jù)開放、政府開放數(shù)據(jù)、開放政府數(shù)據(jù)合并為政府數(shù)據(jù)開放,將數(shù)據(jù)開放、開放數(shù)據(jù)統(tǒng)一為開放數(shù)據(jù),再按頻次降序排列。數(shù)據(jù)開放研究起步晚,導致關鍵詞數(shù)量少,詞頻普遍偏低。為了更全面地反映研究主題熱點分布及后期的聚類分析,截取頻次≧3的39個高頻關鍵詞,其累計頻次占所有關鍵詞總頻次的72.17%。如下表1所示,可見開放數(shù)據(jù)、科學數(shù)據(jù)、政府數(shù)據(jù)開放、開放獲取、圖書館、元數(shù)據(jù)、數(shù)據(jù)政策等關鍵詞頻次高。
表1 國內(nèi)圖書情報領域數(shù)據(jù)開放研究論文高頻關鍵詞統(tǒng)計表(部分)
在詞頻統(tǒng)計基礎上,基于高頻關鍵詞的共現(xiàn)進行兩兩統(tǒng)計,構建39*39的關鍵詞共現(xiàn)矩陣導入Ucinet軟件中,進行格式轉化,將其文件格式生成.##h后綴文件,再在Netdraw中繪制出數(shù)據(jù)開放研究高頻關鍵詞共現(xiàn)網(wǎng)絡圖(見圖1),圖中關鍵詞節(jié)點間的連線數(shù),顯示了它們之間共現(xiàn)的關系強弱,兩者呈正相關關系。
圖1 國內(nèi)圖書情報領域數(shù)據(jù)開放研究高頻關鍵詞共現(xiàn)網(wǎng)絡
通過可視化的圖譜展示205個數(shù)據(jù)樣本文獻中高頻關鍵詞之間的相關性。從圖1可以看出,開放數(shù)據(jù)、科學數(shù)據(jù)、政府數(shù)據(jù)開放、開放獲取、圖書館、大數(shù)據(jù)、元數(shù)據(jù)等關鍵詞位于該共現(xiàn)網(wǎng)絡圖中心,對其他關鍵詞的影響最深。另外,隨著數(shù)據(jù)開放實踐的不斷開展,邊緣關鍵詞如:開放數(shù)據(jù)服務、開放共享、數(shù)據(jù)管理等,可能會演變?yōu)檠芯筷P注點,進而成為核心關鍵詞。
在SPSS軟件中采用聚類分析,根據(jù)研究對象的特征,遵循物以類聚的原則,把需要處理的數(shù)據(jù)分為不同的類,相似性大的對象會聚到同一類,相異性大的分為不同類的分類分析方式[5]。在SPSS19.0中導入前文的高頻關鍵詞相異矩陣,聚類方法中選擇Ward法,采用系統(tǒng)聚類進行聚類分析,標準化處理時選用Z分數(shù),輸出我國2009—2018年數(shù)據(jù)開放研究高頻關鍵詞共現(xiàn)聚類樹圖,如圖2。結合社會網(wǎng)絡分析中關鍵詞的所處點及其與其它關鍵詞的共現(xiàn)次數(shù),可分為5大類研究主題:科學數(shù)據(jù)開放、元數(shù)據(jù)研究、政府數(shù)據(jù)開放研究、數(shù)據(jù)政策研究、圖書館參與數(shù)據(jù)開放途徑討論。
圖2 關鍵詞聚類分析樹狀圖
Law[6]等提出戰(zhàn)略坐標法,即用密度、向心度兩個指標衡量某研究領域研究內(nèi)容間相互影響的情況。其中密度表示研究主題內(nèi)部關聯(lián)程度,密度數(shù)值越大則該主題研究越成熟;向心度表示該主題與其它研究主題間的密切程度,數(shù)值越大表明與其它類別聯(lián)系越緊密,在該研究領域中處于核心地位。文章在共詞矩陣和聚類分析的基礎上,計算2009—2018年我國圖書情報領域內(nèi)數(shù)據(jù)開放五大類主題類團的密度和向心度。計算密度的方法是取類團內(nèi)所有關鍵詞兩兩共現(xiàn)頻次總和的均值;向心度表示該類團與其它類團的聯(lián)系程度,用類團中關鍵詞與其它類團關鍵詞共現(xiàn)之和的均值表示[7]。用X軸表示向心度,Y軸表示密度,兩個軸的平均數(shù)(11.59,15)為坐標原點,繪制四象限主題類團戰(zhàn)略坐標圖,描述關于數(shù)據(jù)開放的不同研究主題的發(fā)展現(xiàn)狀。
圖3 主題類團戰(zhàn)略坐標圖
由圖3的戰(zhàn)略坐標圖可知,B類元數(shù)據(jù)標準研究、D類數(shù)據(jù)開放政策研究位于第一象限中,其密度、向心度都相對較高,表明該研究主題內(nèi)部聯(lián)系緊密且與其它主題的聯(lián)系強,說明這兩類研究主題是數(shù)據(jù)開放研究領域的關注熱點,不易消失;E類圖書館參與數(shù)據(jù)開放研究位于第二象限,密度值高,說明該主題研究成熟,也漸趨形成獨立的研究領域;A類科學數(shù)據(jù)開放研究處于第三象限,密度與向心度指標均低于其它團類,表明研究不成熟,與其它研究主題的聯(lián)系也不緊密,有待加強關注;C類政府數(shù)據(jù)開放研究位于第四象限內(nèi),有一定的向心度,與其它研究主題聯(lián)系較緊密,說明政府數(shù)據(jù)開放的研究表現(xiàn)活躍,但其密度偏低,還不夠成熟。
在將數(shù)據(jù)開放研究的高頻關鍵詞進行共現(xiàn)、聚類及戰(zhàn)略坐標分析的基礎上,得到我國圖書情報領域內(nèi)的數(shù)據(jù)開放研究的具體主題內(nèi)容,為了探究數(shù)據(jù)開放研究各主題的研究發(fā)展空間,將檢索出的以“數(shù)據(jù)開放”為主題的文獻內(nèi)容進行分析梳理,展開對國內(nèi)圖書情報領域內(nèi)數(shù)據(jù)開放的熱點進行分析。
數(shù)據(jù)開放經(jīng)歷了科學數(shù)據(jù)開放和政府數(shù)據(jù)開放的階段。A類科學數(shù)據(jù)開放與C類政府數(shù)據(jù)開放的基礎研究,主要側重于對科學數(shù)據(jù)開放、政府數(shù)據(jù)開放的概念、特點等方面的基礎理論研究。黃永文[8]等基于國外開放科學數(shù)據(jù)的發(fā)展進程,闡述開放科學數(shù)據(jù)的含義、基本內(nèi)容及相關政策,解釋Figshare、Dryad、PANGAEA三種重要的數(shù)據(jù)倉儲。李成贊[9]等學者歸納了單源數(shù)據(jù)共享模式、分布式注冊模式、集中存繳模式、科學數(shù)據(jù)出版、數(shù)據(jù)集市等五種數(shù)據(jù)開放模式。馬建華[10]等人歸納了data repository、data journal、data explanatory material三種具體的科研數(shù)據(jù)開放途徑。2018年3月17日,我國國務院頒布了《科學數(shù)據(jù)管理辦法》[11],明確提出對社會和相關部門開放科學數(shù)據(jù)??茖W數(shù)據(jù)開放在理論研究方面已取得一定成果,卻面臨著如何保證建立國家級的科學數(shù)據(jù)中心,如何保障科學數(shù)據(jù)的傳播和重用等實際問題?;纠碚撗芯?,尤其是在大數(shù)據(jù)時代背景下,政府數(shù)據(jù)開放與開放政府之間相互關系的研究對于實踐開展具有理論指導意義。趙潤娣[12]闡述政府數(shù)據(jù)開放是政府信息公開的新階段,解釋開放政府、政府數(shù)據(jù)、開放數(shù)據(jù)等基本概念。周志峰[13]等以美國、英國、加拿大、澳大利亞和新加坡五國的政府開放數(shù)據(jù)平臺為例,分析在用戶參與下的數(shù)據(jù)開放門戶網(wǎng)站的功能設計。A類與C類研究主題需進一步加強與其它主題的緊密度,未來關于如何推動數(shù)據(jù)開放理念的踐行、提供開放數(shù)據(jù)服務等具體實際應用問題研究將成為研究熱點。
元數(shù)據(jù)標準是數(shù)據(jù)開放共享的關鍵所在,若要使數(shù)據(jù)集被發(fā)現(xiàn)的可能性高就必須提高數(shù)據(jù)集的元數(shù)據(jù)可描述性,采用統(tǒng)一的元數(shù)據(jù)標準發(fā)布數(shù)據(jù),才能實現(xiàn)數(shù)據(jù)開放的價值。我國在開放數(shù)據(jù)與元數(shù)據(jù)標準方面主要集中于基本理論研究、案例研究、制度層面的研究,它們都是數(shù)據(jù)開放研究領域內(nèi)的熱點內(nèi)容。武琳[14]等學者分析了發(fā)達國家數(shù)據(jù)開放的元數(shù)據(jù)政策和標準,介紹了其元數(shù)據(jù)格式、元數(shù)據(jù)框架等內(nèi)容。司莉[15]等以美國政府數(shù)據(jù)開放的元數(shù)據(jù)標準為研究對象,指出我國應按數(shù)據(jù)集內(nèi)容與數(shù)據(jù)集格式的不同建立元數(shù)據(jù)標準,增強數(shù)據(jù)集的可操作性;耿騫[16]等從注冊管理方面、從需求變化出發(fā),認為元數(shù)據(jù)標準要具有靈活的描述體系。從制度層面出發(fā),學者以開放水平較高的澳大利亞為例,認為我國不僅要建立統(tǒng)一的元數(shù)據(jù)標準,提供多種開放格式,還要設置專門的維護機構,承擔元數(shù)據(jù)標準管理[17]。此外,元數(shù)據(jù)研究與科學數(shù)據(jù)開放、政府數(shù)據(jù)開放研究聯(lián)系密切,例如圖書館推行科研數(shù)據(jù)管理中的元數(shù)據(jù)應用,提供元數(shù)據(jù)標準。趙蓉英以Data.gov.uk為例歸納了政府數(shù)據(jù)開放的CKAN記錄格式和GEMINI標準的不同類型元數(shù)據(jù)標準,認為我國政府數(shù)據(jù)開放亟待建立通用的、統(tǒng)一的元數(shù)據(jù)標準[18]。
數(shù)據(jù)開放的政策研究是圖書情報領域數(shù)據(jù)開放的研究熱點,涉及科學數(shù)據(jù)開放、政府數(shù)據(jù)開放及相關數(shù)據(jù)管理等內(nèi)容。國外出臺了相關的強制性開放科學數(shù)據(jù)政策,如美國的National Science Foundation、英國的Research Council UK、澳大利亞的Australian Research Council制定了科學數(shù)據(jù)開放共享的政策[19]。張玉娥等人以“歐盟地平線2020”計劃為例,探討歐盟的科研數(shù)據(jù)開放政策,認為美國、英國、新西蘭、加拿大等數(shù)據(jù)開放的先行國家,在保護個人數(shù)據(jù)隱私與對數(shù)據(jù)使用進行監(jiān)管方面[20],形成了較完備的法律體系;朱貝等人介紹了英國政府數(shù)據(jù)開放政策[21];馬海群等人利用文獻研究的定性方法比較了國內(nèi)外的數(shù)據(jù)開放政策的特點,強調(diào)對具體的專業(yè)領域開放數(shù)據(jù)政策的研究,在制定數(shù)據(jù)開放政策時呼吁社會組織參與其中[22]。此外,關聯(lián)數(shù)據(jù)的研究也是熱點,關聯(lián)數(shù)據(jù)涉及廣泛的數(shù)據(jù)類型,覆蓋政府、出版物、科學等不同領域。在數(shù)據(jù)開放中關聯(lián)數(shù)據(jù)可提供網(wǎng)絡應用方式,但須有與之配套的應用協(xié)議,現(xiàn)廣泛應用的協(xié)議有Creative Commons License(知識共享許可協(xié)議)、Design Science License(設計科學許可協(xié)議)等[23],不過目前尚未建立明確的保障關聯(lián)數(shù)據(jù)可持續(xù)發(fā)展的法律機制。數(shù)據(jù)開放政策關系到數(shù)據(jù)開放實踐的展開,因此,其不僅要從相關政策的頂層設計入手,更需要從推進數(shù)據(jù)開放實踐的策略方面進行研究。
圖書館作為社會公共文化機構,是數(shù)據(jù)開放的實踐者,如上海圖書館舉辦開放數(shù)據(jù)應用開發(fā)競賽,建設本館的數(shù)據(jù)開放平臺等。圖書館利用自身在信息組織與獲取、宣傳推廣等方面的經(jīng)驗與優(yōu)勢,通過參與政府數(shù)據(jù)開放,提供相關數(shù)據(jù)服務,更好地拓展了圖書館的服務內(nèi)容和服務方式[24]。張磊從內(nèi)容、服務、平臺角度構建了圖書館開放數(shù)據(jù)服務的基本框架,凸顯圖書館數(shù)據(jù)開放的靈活性[25]。在實踐層面,圖書館作為開放的信息資源和信息服務中心,還可以開展科學數(shù)據(jù)培訓、科研數(shù)據(jù)管理等系列服務,以促進科研數(shù)據(jù)利用并加大宣傳,實現(xiàn)科研數(shù)據(jù)的開放共享。目前我國部分高校圖書館已開始提供科學數(shù)據(jù)服務,如北京大學開放研究數(shù)據(jù)平臺是由北京大學圖書館與北京大學管理科學數(shù)據(jù)中心聯(lián)合主辦,為研究者提供如中國家庭追蹤調(diào)查(CFPS)、中國健康與養(yǎng)老追蹤調(diào)查(CHARLS)等31個精品數(shù)據(jù)空間和232個數(shù)據(jù)集,同時鼓勵研究者共享研究科研數(shù)據(jù)[26]。圖書情報領域應拓展圖書館與數(shù)據(jù)開放結合發(fā)展的新研究領域,在技術和實踐層面推進圖書館與數(shù)據(jù)開放研究的深度,以此擴大數(shù)據(jù)開放研究的輻射范圍。
數(shù)據(jù)開放研究領域的各研究主題仍有很大的發(fā)展空間。結合對已有研究成果的總結分析,筆者認為以下四個方面為國內(nèi)圖書情報領域內(nèi)數(shù)據(jù)開放研究的趨勢:
進入數(shù)據(jù)開放應用迅速發(fā)展時期。Tim·Berners[27]解釋了政府數(shù)據(jù)、科學數(shù)據(jù)、社區(qū)數(shù)據(jù)等通過“實時的開放”,進行數(shù)據(jù)關聯(lián)后,釋放出巨大的數(shù)據(jù)價值。開放數(shù)據(jù)不只是簡單的免費獲取數(shù)據(jù),而是數(shù)據(jù)連接起來后可得到有意義的實踐應用,只有以需求驅動和應用導向的數(shù)據(jù)開放才能實現(xiàn)深度開放目標。從研究內(nèi)容看,數(shù)據(jù)開放應用實踐研究是數(shù)據(jù)開放研究符合用戶需求的研究主題,未來可從以實現(xiàn)數(shù)據(jù)資源公開共享及數(shù)據(jù)創(chuàng)新為目的的數(shù)據(jù)服務、信息服務等方面展開相應的應用實踐。筆者認為該主題應成為未來的研究重點。
元數(shù)據(jù)標準研究在基本理論研究、案例研究等方面已取得一定進展。元數(shù)據(jù)標準關系到數(shù)據(jù)開放的效率與價值,是數(shù)據(jù)開放研究領域內(nèi)的熱點,有望引發(fā)研究者的持續(xù)關注,并加強對其的“深度”與“廣度”研究。元數(shù)據(jù)標準是考察數(shù)據(jù)開放質量的重要指標。從內(nèi)容上看,目前國內(nèi)元數(shù)據(jù)標準研究集中在以國外政府數(shù)據(jù)開放平臺為例,對元數(shù)據(jù)標準進行總結等方面。我國尚未建成國家級的政府數(shù)據(jù)開放平臺。隨著國家級、地方級的不同層級數(shù)據(jù)開放平臺的建立,有關元數(shù)據(jù)標準的研究可進一步細化,如根據(jù)國內(nèi)政府開放的不同數(shù)據(jù)類型,開展元數(shù)據(jù)標準構建研究,并加深其研究深度。就研究廣度而言,元數(shù)據(jù)標準研究可與其它研究主題聯(lián)合展開,比如圖書館參與數(shù)據(jù)開放需要元數(shù)據(jù)作為必備工具,因此圖書館參與數(shù)據(jù)開放的元數(shù)據(jù)應用研究,可成為深入研究的主題。
數(shù)據(jù)開放政策研究是圖書情報領域數(shù)據(jù)開放的研究熱點,但在數(shù)據(jù)開放實踐中,為保證數(shù)據(jù)發(fā)布的效率與質量,難免會發(fā)發(fā)侵犯版權問題以及侵犯個人隱私問題,此時需要頂層的政策協(xié)調(diào),數(shù)據(jù)開放政策也因此成為促進數(shù)據(jù)開放研究的驅動力量[28]。在數(shù)據(jù)開放中個人隱私保護及數(shù)據(jù)安全更是社會問題,加拿大盲目追求數(shù)據(jù)開放的程度,與數(shù)據(jù)安全政策失衡,造成了巨大的社會經(jīng)濟損失;而英國的數(shù)據(jù)開放平臺Data.gov.uk則強調(diào)從數(shù)據(jù)技術和組織程序保護用戶的數(shù)據(jù)安全[29]??梢?,個人數(shù)據(jù)的保護成為數(shù)據(jù)開放中的重要研究主題。數(shù)據(jù)開放與隱私保護的關系是數(shù)據(jù)開放實踐中的長久難題,數(shù)據(jù)開放政策要與個人隱私保護政策互為平衡[30],開放數(shù)據(jù)政策與數(shù)據(jù)安全政策要協(xié)同制定。要根據(jù)數(shù)據(jù)開放的具體階段性內(nèi)容和模式,在實踐推進的不同階段,圍繞新的科學研究周期,預見性地、有針對性地對數(shù)據(jù)開放實踐展開政策評估,以保護數(shù)據(jù)安全,從而實現(xiàn)數(shù)據(jù)開放實踐的突破進展。
圖書館在數(shù)據(jù)開放中承擔著“服務者”與“實踐者”的角色,利用關聯(lián)數(shù)據(jù)技術,以更加開放的姿態(tài)向社會開放公共數(shù)據(jù),圍繞數(shù)據(jù)開放提供數(shù)據(jù)整合、數(shù)據(jù)關聯(lián)等數(shù)據(jù)服務,以促進開放數(shù)據(jù)的再利用。德國國家圖書館提供關聯(lián)數(shù)據(jù)服務(Linked Data Service)[31];大英圖書館以Z39.50方式開放英國國家書目數(shù)據(jù)(Linked Open British National Bibliography),提供開放數(shù)據(jù)服務,成為數(shù)據(jù)與大眾間的橋梁,承擔起兩者之間的對接、利用與反饋[32];Europeana(歐洲數(shù)字圖書館)以服務為核心,運用關聯(lián)數(shù)據(jù)統(tǒng)一資源整合中的數(shù)據(jù)結構,對收錄數(shù)據(jù)資源的許可協(xié)議,包括對許可協(xié)議的介紹、數(shù)據(jù)交換協(xié)議、使用公共領域貢獻宣告(CC0)等有明確規(guī)定內(nèi)容[33]。圖書館舉辦開放數(shù)據(jù)競賽是國內(nèi)圖書館數(shù)據(jù)開放的實踐活動之一,如上海圖書館在2018年3月啟動了開放數(shù)據(jù)應用開放競賽,向全社會開放歷史人物數(shù)據(jù),鼓勵參賽者以開放數(shù)據(jù)為基礎,開發(fā)優(yōu)秀移動應用產(chǎn)品原型或服務創(chuàng)意[34]。圖書館作為與政府、企業(yè)、用戶、文化館、博物館等進行數(shù)據(jù)資源開放與分享的信息資源主體,是數(shù)據(jù)開放的“服務者”和“實踐者”,圖書館在數(shù)據(jù)開放領域內(nèi)的研究已深入至理論與實踐研究中,是未來數(shù)據(jù)開放研究領域的熱點,可進一步擴大圖書館的數(shù)據(jù)開放研究的輻射范圍。
文章以中國知網(wǎng)CNKI數(shù)據(jù)庫收錄的“數(shù)據(jù)開放”文獻作為數(shù)據(jù)源,對數(shù)據(jù)開放的研究主題進行詞頻分析并構建共詞矩陣,借助SPSS、Ucinet等工具進行可視化分析,可得出以下結論:
第一,從2015年開始,數(shù)據(jù)開放研究受到學者的廣泛關注,相關論文增幅明顯,數(shù)據(jù)開放領域已經(jīng)進入快速發(fā)展階段。
第二,開放數(shù)據(jù)、科學數(shù)據(jù)、政府數(shù)據(jù)開放、開放獲取、圖書館、大數(shù)據(jù)、元數(shù)據(jù)等關鍵詞位于該結構圖中心位置,與其它研究主題聯(lián)系緊密。
第三,共詞聚類分析結果揭示了我國圖書情報領域在數(shù)據(jù)開放方面的研究熱點主要有:科學數(shù)據(jù)開放研究、元數(shù)據(jù)研究、政府數(shù)據(jù)開放研究、數(shù)據(jù)開放政策研究、圖書館參與討論等,處于研究邊緣的開放數(shù)據(jù)服務、開放數(shù)據(jù)管理的研究還不成熟,但與熱點研究聯(lián)系緊密,發(fā)展?jié)摿^大。
第四,數(shù)據(jù)開放的五大類團主題的研究力度不均衡,圖書館參與數(shù)據(jù)開放的研究表現(xiàn)活躍,圖書館作為數(shù)據(jù)開放實踐者的角色,將是以后的研究熱點。
第五,未來數(shù)據(jù)開放研究趨勢主要為數(shù)據(jù)開放應用實踐研究、元數(shù)據(jù)標準的“深度”與“廣度”研究、數(shù)據(jù)開放政策與個人隱私保護研究、圖書館的“數(shù)據(jù)開放”新角色研究四個方面。
(來稿時間:2018年12月)