劉彥喬,楊熙若,雍石泉,李亞丹,王 濤
(四川省科學(xué)技術(shù)信息研究所,四川 成都 610021)
近年大數(shù)據(jù)、云計算引領(lǐng)的信息技術(shù)已然改變了全球經(jīng)濟和社會運行模式,觸角遍布幾乎所有行業(yè)的工作場景和人們的日常生活。數(shù)據(jù)是這場轉(zhuǎn)變的中心,而且未來還會有更多的數(shù)據(jù)。數(shù)據(jù)驅(qū)動創(chuàng)新將帶來巨大的利益,例如通過改進個性化醫(yī)療、更新移動傳輸介質(zhì),促進可持續(xù)化綠色發(fā)展。與此同時,全球共享科學(xué)數(shù)據(jù)和商業(yè)數(shù)據(jù)量不斷增加,數(shù)據(jù)存儲和處理方式的技術(shù)革新將成為把握時代命脈的關(guān)鍵。
1994年我國正式接入互聯(lián)網(wǎng),數(shù)據(jù)化、信息化革命開始席卷我國各行各業(yè)的科學(xué)技術(shù)發(fā)展,科學(xué)數(shù)據(jù)也迎來數(shù)量激增期,數(shù)據(jù)存儲規(guī)模日益擴大,同樣刺激情報學(xué)發(fā)展變革,對情報學(xué)如何存儲、處理、整合以及利用數(shù)據(jù)施加了不小的壓力,情報學(xué)研究逐漸向信息化過渡。2021 年我國進入“十四五”規(guī)劃階段,對科技創(chuàng)新有了更高的要求和期許[1],面臨這個關(guān)鍵時期,準確了解前沿科技發(fā)展方向和尺度,制定合乎我國國情的發(fā)展戰(zhàn)略,情報學(xué)就成為了我國邁向科技強國的指南針。以情報學(xué)深度挖掘科學(xué)數(shù)據(jù)價值,達到科學(xué)數(shù)據(jù)利用效率最大化,正是通向科技強國的一條關(guān)鍵路徑[2]。本論述通過梳理科學(xué)數(shù)據(jù)和情報學(xué)研究發(fā)展歷程,利用文獻可視化分析了解交叉領(lǐng)域研究現(xiàn)狀,情報學(xué)領(lǐng)域研究變化情況,以此得出影響情報學(xué)變革的主要原因。
科學(xué)數(shù)據(jù)指的是在科技活動(實驗、觀測、探測、調(diào)查)中通過其他方式所獲取的反應(yīng)客觀世界本質(zhì)、特征、變化規(guī)律等的原始數(shù)據(jù),以及根據(jù)不同科技活動需要,進行系統(tǒng)加工整理的各類數(shù)據(jù)集[3]。
在大數(shù)據(jù)時代背景下,數(shù)據(jù)傳輸?shù)乃俣?、影響、潛力都已?jīng)與一個國家戰(zhàn)略實力高度成正比,科學(xué)數(shù)據(jù)更是成為科技創(chuàng)新的基石和命脈。歐美等國家早已開啟深度挖掘科學(xué)數(shù)據(jù)資源余量價值,我國雖然起步較晚,但也逐步在人才培養(yǎng)、政策制定上顯現(xiàn)出對科學(xué)數(shù)據(jù)的重視。
科學(xué)數(shù)據(jù)伴隨科學(xué)研究范式的變化而變化,科學(xué)數(shù)據(jù)目前為止經(jīng)歷了4 個科學(xué)研究范式:實驗科學(xué)范式、理論科學(xué)范式、計算科學(xué)范式和數(shù)據(jù)密集型科學(xué)范式[4],如圖1所示。
圖1 科學(xué)研究發(fā)展范式
信息化時代科學(xué)數(shù)據(jù)存儲和傳播都更加便利快捷,數(shù)據(jù)量級井噴式增長,數(shù)據(jù)所帶來的信息資訊更新?lián)Q代頻率也極其迅速,為了避免“知識鴻溝”出現(xiàn),科技發(fā)展早已告別科學(xué)家們“單打獨斗”的時代,公眾科學(xué)同樣關(guān)乎綜合國力,全世界各國政府都緊緊抓住技術(shù)突破當口,紛紛實施科學(xué)數(shù)據(jù)開放共享。
歐盟長期重視科研數(shù)據(jù)的開放獲取,并走在數(shù)據(jù)共享的前列,在2016年發(fā)布的《開放革新、開放科學(xué)、向世界開放——歐洲愿景》中規(guī)定三個“開放”作為優(yōu)先政策,其中開放科學(xué)政策旨在讓整個歐洲的科研數(shù)據(jù)達到可尋找、可獲取、可互動和可重現(xiàn)的目的[5]。在此之前,歐盟已經(jīng)提倡建立開放和競爭的“單一數(shù)據(jù)市場”理念,這里的“單一”指的是無國界、無邊界[6],意欲借助數(shù)據(jù)化、信息化技術(shù)整合歐洲,乃至全世界的數(shù)據(jù)資源。
2001年,“科學(xué)數(shù)據(jù)共享工程”由我國科技部啟動,十年時間內(nèi)完成了從共享機制到國家級數(shù)據(jù)共享網(wǎng)絡(luò)的建立[7],2015 年國務(wù)院為規(guī)范大數(shù)據(jù)發(fā)展,印發(fā)《促進大數(shù)據(jù)發(fā)展行動綱要》,2018 年又發(fā)布《科學(xué)數(shù)據(jù)管理辦法》,其實質(zhì)都是為順應(yīng)大數(shù)據(jù)時代、信息技術(shù)時代蓬勃發(fā)展,推動科學(xué)數(shù)據(jù)向大眾開放共享,增強我國科技創(chuàng)新能力,提高整體科技水平,得到社會、經(jīng)濟全面發(fā)展。
縱觀情報學(xué)學(xué)科發(fā)展歷程,始終是與時代前沿技術(shù)革新和突破發(fā)生的重大結(jié)點相一致,情報學(xué)的研究方法和學(xué)科范式不僅持續(xù)隨著科技發(fā)展更新?lián)Q代,還利用技術(shù)特征,消化成為自身學(xué)科優(yōu)勢。
情報學(xué)以文獻學(xué)開始,半個多世紀經(jīng)歷了從文獻學(xué)、情報技術(shù)到情報學(xué)科的發(fā)展歷程,其內(nèi)涵、體系和方法都隨著信息化、數(shù)字化技術(shù)的不斷突破、用戶需求持續(xù)變化及自身分析算法演變而不斷完善,社會功能及價值也在不斷提高。
從情報學(xué)學(xué)科發(fā)展范式來看,總體大致經(jīng)歷了以下四個階段:第一階段:基于information 的事實型情報學(xué)發(fā)展范式;第二階段:基于information management的綜述型情報學(xué)發(fā)展范式;第三階段:基于Intelligence的智慧型情報學(xué)發(fā)展范式;第四階段:基于大數(shù)據(jù)的情報學(xué)發(fā)展范式[8]。
我國情報學(xué)起始是1958年中國科學(xué)院以創(chuàng)辦中國科學(xué)情報大學(xué)為標志,在我國率先形成文獻與情報融合的學(xué)科發(fā)展模式。我國圍繞專業(yè)學(xué)科背景構(gòu)建情報機構(gòu)體系是從中國科學(xué)院科學(xué)情報研究所更名為中國科學(xué)院科學(xué)技術(shù)情報研究所開始的[9],這也發(fā)生在1958年。情報工作開展的重心也由簡單的編譯報道、檢索服務(wù),向多維度多角度的情報研究、情報決策轉(zhuǎn)變[10]。
以新中國成立之后我國情報研究的路徑創(chuàng)新來劃分有三個階段:第一階段:以傳統(tǒng)科技情報為支撐的事實認知范式;第二階段:以信息網(wǎng)絡(luò)為依托的技術(shù)分析范式;第三階段:以大系統(tǒng)融合為方向的情報工程范式[11]。
可見傳統(tǒng)情報學(xué)跟隨數(shù)字時代發(fā)展注入了新活力,發(fā)揮其包容的特質(zhì),接納新技術(shù)并加以利用,在科技發(fā)展浪潮中,情報學(xué)在不停地更新自己的領(lǐng)域邊界,以免落后或淘汰。
本論述利用CiteSpace 軟件對“科學(xué)數(shù)據(jù)”和“情報學(xué)”主題下的文獻進行可視化分析。中文文獻選擇知網(wǎng)(CNKI)數(shù)據(jù)庫,英文文獻選擇Web of Science(以下簡稱為WoS)的核心庫。
在知網(wǎng)(CNKI)通過高級檢索輸入主題“科學(xué)數(shù)據(jù)”和“情報”進行檢索,共有404篇文獻同時涉及到科學(xué)數(shù)據(jù)與情報學(xué)領(lǐng)域,篩選后導(dǎo)出文獻369 篇,利用CiteSpace轉(zhuǎn)換為Web of Science文獻目錄格式得到368篇為可分析的文獻。
在WoS 核心庫中分別用“Scientific data”和“information science”主題以及“Scientific data”和“Informatica”主題進行檢索分別得到171和232篇文獻共403篇,利用CiteSpace篩選去重后,得到234篇可分析文獻。
2.1.1 國外交叉領(lǐng)域研究現(xiàn)狀
英文文獻跨度自1979~2022 年為43 年,選擇5 年為時間切片,得到共現(xiàn)關(guān)鍵詞如圖2所示,節(jié)點數(shù)量為N=764,連線數(shù)量為2466,密度為0.0085。以文獻標題為基準進行聚類(cluster)分析,發(fā)現(xiàn)出現(xiàn)頻次最高的文獻群組為研究數(shù)據(jù)(research data)、情報學(xué)(information science)和基于服務(wù)的框架(service-based framework)。處于網(wǎng)絡(luò)中心位置的是研究數(shù)據(jù)(research data),且根據(jù)時間切片是2021~2022 年,說明科學(xué)數(shù)據(jù)與情報學(xué)交叉領(lǐng)域的研究中,研究數(shù)據(jù)是當今最頻繁最新穎的主題。
圖2 交叉領(lǐng)域英文文獻共現(xiàn)關(guān)鍵詞網(wǎng)絡(luò)
2.1.2 國內(nèi)交叉領(lǐng)域研究現(xiàn)狀
中文文獻的時間跨度是從1988~2022 年,共34年,以4 年為時間切片的共現(xiàn)關(guān)鍵詞網(wǎng)絡(luò)如圖3 所示,節(jié)點數(shù)為430,連線數(shù)量1229,密度為0.0133。處于網(wǎng)絡(luò)中心地帶是中文文獻討論熱度最高的關(guān)鍵詞,中文文獻交叉領(lǐng)域的研究以科學(xué)數(shù)據(jù)為主。結(jié)合共現(xiàn)關(guān)鍵詞網(wǎng)絡(luò)和高頻關(guān)鍵詞(表1),情報學(xué)和科學(xué)數(shù)據(jù)交叉領(lǐng)域受數(shù)據(jù)化、信息化技術(shù)浪潮影響,研究逐漸與大數(shù)據(jù)、數(shù)據(jù)科學(xué)等黏性增強,說明密集型數(shù)據(jù)量激增,在持續(xù)影響情報學(xué)科研究方向和技術(shù)手段。
圖3 交叉領(lǐng)域中文文獻共現(xiàn)關(guān)鍵詞網(wǎng)絡(luò)
表1 科學(xué)數(shù)據(jù)與情報學(xué)交叉研究高頻關(guān)鍵詞
2.1.3 原因分析
隨著搜索引擎、社交信息網(wǎng)絡(luò)等互聯(lián)網(wǎng)應(yīng)用的盛行,數(shù)據(jù)量呈爆發(fā)式增長趨勢,科學(xué)研究進入了以數(shù)據(jù)為基礎(chǔ)進行科學(xué)發(fā)現(xiàn)的第四范式時代[12]。科學(xué)研究的發(fā)展到達第四范式是數(shù)據(jù)密集型范式,以數(shù)據(jù)考察為其遵循原則和度量基礎(chǔ),科學(xué)數(shù)據(jù)自然成為其理論構(gòu)成、實踐路徑的重中之重[13]。
原來科學(xué)數(shù)據(jù)并沒有得到足夠重視和利用,研究視角大部分都是基于文獻或者圖書這類紙質(zhì)材料的信息載體,流通成本較高,速度較慢。信息技術(shù)的廣泛應(yīng)用,使數(shù)據(jù)的存儲、傳輸、下載、更新等操作變得簡單,使用門檻也較低,科學(xué)數(shù)據(jù)的價值逐漸被研究者們發(fā)掘,但目前科學(xué)數(shù)據(jù)的利用率與其體量比起來還比較滯后,尚待全面的政策支持和深層次的價值挖掘機制出現(xiàn)。
情報學(xué)是以“知識”為中心,以“分析”為方法的學(xué)科[14],科學(xué)數(shù)據(jù)具備“知識”的屬性,隨著信息技術(shù)的發(fā)展和科學(xué)數(shù)據(jù)共享機制的產(chǎn)生,情報學(xué)擁有了充足的事實數(shù)據(jù)和更加完備的“分析”技術(shù),情報學(xué)的變革隨之發(fā)生。
如上所述,各類數(shù)據(jù)數(shù)量激增使得數(shù)據(jù)密集型科學(xué)范式的產(chǎn)生,而科學(xué)數(shù)據(jù)共享機制的推行,豐富了情報學(xué)“知識”的素材和形式??萍紕?chuàng)新需要決策科學(xué)化來引領(lǐng)前進的腳步,情報學(xué)則就發(fā)揮了其“耳目、尖兵、參謀”的學(xué)科特點,獨樹一幟的獲得了“創(chuàng)新發(fā)展情報先行”的有利地位,情報學(xué)研究發(fā)展也進入基于大數(shù)據(jù)的研究發(fā)展范式。
2.2.1 情報學(xué)領(lǐng)域的研究發(fā)展
在WoS 核心數(shù)據(jù)庫搜索主題“情報學(xué)(informatics)”+標題“情報學(xué)(informatics)”得到8182 篇文獻,通過CiteSpace 篩選去重復(fù)后,英文文獻為3106 篇,跨度從1966至2022年達58年。
(1)情報學(xué)與各領(lǐng)域深入融合發(fā)展
對英文文獻以5年為時間切片,進行共現(xiàn)關(guān)鍵詞和領(lǐng)域分析。共現(xiàn)關(guān)鍵詞網(wǎng)絡(luò)節(jié)點數(shù)為543,連線數(shù)量1812,密度為0.0123。從圖4中可見,聚類(cluster)字體大小代表文獻數(shù)量,可見情報學(xué)在醫(yī)學(xué)信息學(xué)和健康信息學(xué)領(lǐng)域研究最廣泛,根據(jù)時間切片判斷最近情報學(xué)在材料信息學(xué)中應(yīng)用逐漸增多。結(jié)合共現(xiàn)領(lǐng)域網(wǎng)絡(luò)分析(圖5),出現(xiàn)頻次最高的幾乎都是情報學(xué)與其他領(lǐng)域融合產(chǎn)生的交叉學(xué)科,涉及情報學(xué)自身領(lǐng)域發(fā)展的研究較少。計算機科學(xué)(computer science)為頻次最高的領(lǐng)域,1082 次,其次是醫(yī)學(xué)信息學(xué)(medical informatics)和社會學(xué)(social science)。
圖4 情報學(xué)領(lǐng)域英文文獻共現(xiàn)關(guān)鍵詞分析
圖5 情報學(xué)領(lǐng)域英文文獻共現(xiàn)領(lǐng)域網(wǎng)絡(luò)
(2)我國情報學(xué)領(lǐng)域發(fā)展勢頭強勁
對英文文獻進行國家合作網(wǎng)絡(luò)分析(圖6),節(jié)點數(shù)為149,連線數(shù)為652,密度為0.0591。合作網(wǎng)絡(luò)顯示時間從1966~2022 年以5 年為時間切片的變化情況,從國家在情報領(lǐng)域的發(fā)文量看,美國位居第一,且是斷崖式超越其他國家,中國和英國居第二、第三位(表2),最上沿時間切片可以分辨出中國和英國的發(fā)文量增加集中在近十年。
圖6 情報學(xué)領(lǐng)域英文文獻國家合作網(wǎng)絡(luò)
表2 情報學(xué)領(lǐng)域英文文獻國家合作網(wǎng)絡(luò)-國家頻次
我國不僅發(fā)文量近年增加,經(jīng)突發(fā)性探測(圖7)發(fā)現(xiàn),文獻被引量在2016~2022年也維持在較高水平,發(fā)展勢頭強勢。其他亞洲國家,如日本、印度和巴基斯坦也在近年有文獻被引量增加的態(tài)勢。
圖7 情報學(xué)領(lǐng)域英文文獻國家合作網(wǎng)絡(luò)突發(fā)性探測
2.2.2 原因分析
1992 年9 月15 日,國家科委在召開的全國科技情報工作會議上宣布:經(jīng)國家科委研究決定,從這次會議開始,將“科技情報”改稱為“科技信息”[15]。至此之后,在“情報”(intelligence)與“信息”(information)的適用邊界和語義規(guī)范上的討論在情報學(xué)科持續(xù)至今。但其實兩者的內(nèi)涵和外延都有著較為明確的區(qū)分,情報本質(zhì)上是信息,但是又不等同于信息,比信息擁有更加具有戰(zhàn)略意義的延升。
介于“信息”在大眾和科技領(lǐng)域的普及程度,“情報”已經(jīng)出現(xiàn)經(jīng)常被“信息”一詞所替代的情況。目前情報工作受大數(shù)據(jù)、云計算等信息技術(shù)影響熱衷于建庫(數(shù)據(jù)庫、語料庫)、建網(wǎng)(信息系統(tǒng))與數(shù)字化資源建設(shè)等,并表現(xiàn)出明顯的后現(xiàn)代主義特征,學(xué)科的中心內(nèi)容不斷被游移或者稀釋[16]。并且由于情報學(xué)本身的包容性,衍生了各式各樣的交叉學(xué)科,雖然情報學(xué)在各個行業(yè)領(lǐng)域都能發(fā)揮作用,但卻時常處在附庸位置。
如今我國學(xué)者對情報學(xué)學(xué)科研究增加,發(fā)展勢頭迅猛。借此勢頭,情報學(xué)科可從樹立自身學(xué)科優(yōu)勢的角度,適應(yīng)時代發(fā)展的同時,主動發(fā)揮學(xué)科特色,尋找深化研究范式的路徑。
信息技術(shù)正深刻改變我們的日常生活、工作和商業(yè)模式以及人們旅行、交流和相互聯(lián)系的方式。數(shù)字通信、社交媒體互動、電子商務(wù)和數(shù)字企業(yè)正在穩(wěn)步改變我們的世界。當前生成的數(shù)據(jù)量不斷增加,如果能夠?qū)@些數(shù)據(jù)進行匯集、整理和使用,借助這種創(chuàng)造價值的新手段和水平,將會是一場與工業(yè)革命一樣的根本性變革。
各學(xué)科之間的交叉融合,相互影響變得容易。但是隨著數(shù)字化、信息化等技術(shù)浪潮席卷全球經(jīng)濟、科學(xué)乃至政治領(lǐng)域,對各行業(yè)各學(xué)科帶來新活力的同時,也伴隨著新舊模式變革挑戰(zhàn)。科學(xué)數(shù)據(jù)發(fā)展將新機遇帶給了情報學(xué),情報學(xué)從邊緣學(xué)科逐漸在我國創(chuàng)新決策科學(xué)化要求下嶄露頭角。
情報學(xué)在科技領(lǐng)域中不僅要把握國內(nèi)科技發(fā)展態(tài)勢,還應(yīng)對全球科技前沿有清晰感知,情報學(xué)能夠?qū)π畔蚀_分析研判,國際國內(nèi)政府、各科研機構(gòu)須共同努力推動科學(xué)數(shù)據(jù)公開共享,無縫訪問。科學(xué)數(shù)據(jù)的范圍也需探索拓展到從研究提案、籌備、執(zhí)行和結(jié)束全生命周期產(chǎn)生的如軟件、科研筆記、失敗案例等方方面面,提高科研資源利用率,避免浪費。
開放共享科學(xué)數(shù)據(jù)將促進科技情報能力轉(zhuǎn)變?yōu)橐粐萍几偁帉嵙?,情報學(xué)科也應(yīng)當積極引進先進數(shù)字化技術(shù)和算法,豐富自身理論體系,重視方法實踐,做好國家科技戰(zhàn)略指南針。