顏嘉麒 閔超 余厚強(qiáng) 魏家鵬 賈韜 馬建
摘? ?要:大科學(xué)裝置和大規(guī)??茖W(xué)基礎(chǔ)設(shè)施產(chǎn)生的科學(xué)數(shù)據(jù)促進(jìn)了領(lǐng)域科學(xué)研究的新一輪發(fā)展,更加驅(qū)動(dòng)了科學(xué)研究者之間的創(chuàng)新科研協(xié)作??茖W(xué)數(shù)據(jù)驅(qū)動(dòng)的科研協(xié)作,成為科學(xué)研究的新范式和大趨勢(shì)。第六屆中國(guó)科學(xué)數(shù)據(jù)大會(huì)以“科學(xué)數(shù)據(jù)與重大科研基礎(chǔ)設(shè)置”為主題,關(guān)注科學(xué)數(shù)據(jù)管理與開(kāi)放共享過(guò)程中的政策、方法、技術(shù)及基礎(chǔ)設(shè)施建設(shè)等問(wèn)題。文章以大會(huì)分論壇“科學(xué)數(shù)據(jù)驅(qū)動(dòng)的科研協(xié)作”內(nèi)容的梳理和總結(jié)為基礎(chǔ),從科學(xué)數(shù)據(jù)驅(qū)動(dòng)的科研協(xié)作之機(jī)理、特征、案例、研究路徑等視角進(jìn)行述評(píng),揭示了科學(xué)數(shù)據(jù)驅(qū)動(dòng)的科研協(xié)作的新范式,提出了未來(lái)研究方向與機(jī)會(huì)。
關(guān)鍵詞:科研協(xié)作;科學(xué)數(shù)據(jù);科學(xué)裝置;科學(xué)基礎(chǔ)設(shè)施
中圖分類(lèi)號(hào):G250.2;G311? ?文獻(xiàn)標(biāo)識(shí)碼:A? ?DOI:10.11968/tsyqb.1003-6938.2020052
Abstract The scientific research data generated by large scale scientific apparatus and research infrastructures has accelerated the new development in scientific domain research, driving innovative research collaborations among scientific researchers. The collaboration driven by scientific data has become a new paradigm and trend for scientific research. Under such circumstances, the 6th China Data Science Conference (CDSC) was held with the theme of "Scientific Data and Large Scale Scientific Infrastructure", focusing on the problems occurring in the process of scientific data management and sharing, including policies, methods, technologies, and infrastructures construction, etc. As a summary of the Workshop of Scientific Data driven Research Collaboration (SDRC) in the CDSC, the paper made investigation and study of the mechanism, features, cases, and research paths of SDRC. New paradigm of research collaboration driven by scientific data was identified, and proposals were put forward for future research directions and opportunities, which provides a foundation for the theoretical and practical development of scientific research collaboration.
Key words research collaboration; scientific data; scientific apparatus; research infrastructures
1? ?引言
科學(xué)數(shù)據(jù)是國(guó)家科技創(chuàng)新發(fā)展和經(jīng)濟(jì)社會(huì)進(jìn)步的重要基礎(chǔ)性戰(zhàn)略資源,是科研創(chuàng)新最基本、最活躍、影響面最寬的科技資源。隨著大天區(qū)面積多目標(biāo)光纖光譜天文望遠(yuǎn)鏡(LAMOST)、大亞灣核反應(yīng)堆中微子實(shí)驗(yàn)、500米口徑球面射電望遠(yuǎn)鏡(FAST)等近年來(lái)相繼投入運(yùn)行使用,這些科研基礎(chǔ)設(shè)施將產(chǎn)生大量可靠的科學(xué)數(shù)據(jù)資源。以這些大科學(xué)裝置產(chǎn)生的數(shù)據(jù)為代表,科學(xué)數(shù)據(jù)引發(fā)領(lǐng)域科學(xué)研究的范式變革,驅(qū)動(dòng)了科學(xué)研究者之間的科研協(xié)作創(chuàng)新??茖W(xué)數(shù)據(jù)驅(qū)動(dòng)的科研協(xié)作方式,成為科學(xué)研究的新范式和大趨勢(shì)。在此背景下, 2019年8月21-23日在中國(guó)貴陽(yáng)主辦的第六屆中國(guó)科學(xué)數(shù)據(jù)大會(huì)以“科學(xué)數(shù)據(jù)與重大科研基礎(chǔ)設(shè)施”為主題,設(shè)有5個(gè)大會(huì)報(bào)告、21個(gè)并行分會(huì)、216個(gè)分會(huì)報(bào)告,關(guān)注科學(xué)數(shù)據(jù)管理與開(kāi)放共享過(guò)程中的政策、方法、技術(shù)及基礎(chǔ)設(shè)施建設(shè)等問(wèn)題。
中國(guó)科學(xué)數(shù)據(jù)大會(huì)是在2013年由國(guó)際科技數(shù)據(jù)委員會(huì)(Committee on Data for Science and Technology,CODATA)中國(guó)全國(guó)委員會(huì)發(fā)起并開(kāi)始籌備, 旨在推動(dòng)我國(guó)科學(xué)數(shù)據(jù)的開(kāi)放、技術(shù)交流及數(shù)據(jù)科學(xué)的發(fā)展。中國(guó)科學(xué)數(shù)據(jù)大會(huì)在我國(guó)加快科研大數(shù)據(jù)開(kāi)放共享、大數(shù)據(jù)時(shí)代科研信息化基礎(chǔ)環(huán)境建設(shè)、全球影響力科技創(chuàng)新中心建設(shè)、科學(xué)數(shù)據(jù)與數(shù)據(jù)科學(xué)學(xué)科建設(shè)、科學(xué)數(shù)據(jù)服務(wù)創(chuàng)新發(fā)展等方面起到積極的推動(dòng)作用??茖W(xué)大數(shù)據(jù)是中國(guó)科學(xué)數(shù)據(jù)大會(huì)長(zhǎng)期以來(lái)關(guān)注的重要問(wèn)題,首屆科學(xué)數(shù)據(jù)大會(huì)就以“科研大數(shù)據(jù)與數(shù)據(jù)科學(xué)”為主題;在第四屆科學(xué)數(shù)據(jù)大會(huì)上,中科院副院長(zhǎng)張亞平還指出,在科學(xué)研究領(lǐng)域,繼觀測(cè)實(shí)驗(yàn)、理論分析、計(jì)算模擬之后,一種“大數(shù)據(jù)驅(qū)動(dòng)的科學(xué)發(fā)現(xiàn)”新模式已經(jīng)開(kāi)始顯現(xiàn),科學(xué)大數(shù)據(jù)已經(jīng)成為科技創(chuàng)新的新引擎。
本次中國(guó)科學(xué)數(shù)據(jù)大會(huì)上,南京大學(xué)信息管理學(xué)院顏嘉麒副教授、閔超助理教授、南京理工大學(xué)經(jīng)濟(jì)管理學(xué)院余厚強(qiáng)副教授、西南大學(xué)計(jì)算機(jī)與信息科學(xué)學(xué)院賈韜教授與香港城市大學(xué)資訊系統(tǒng)系的馬建教授共同發(fā)起并籌辦了“科學(xué)數(shù)據(jù)驅(qū)動(dòng)的科研協(xié)作”主題分會(huì)。來(lái)自上海交通大學(xué)、中科院成都文獻(xiàn)情報(bào)中心、大連理工大學(xué)等機(jī)構(gòu)的演講嘉賓和科研人員共50余人參加了分會(huì)的現(xiàn)場(chǎng)討論與交流。本文通過(guò)對(duì)會(huì)議內(nèi)容與嘉賓研討的梳理和總結(jié),從科學(xué)數(shù)據(jù)驅(qū)動(dòng)的科研協(xié)作之機(jī)理、特點(diǎn)、案例、研究路徑等視角進(jìn)行述評(píng),提出未來(lái)研究方向與機(jī)會(huì),以期為相關(guān)實(shí)踐與理論發(fā)展提供參考。
2? ?科學(xué)大數(shù)據(jù)背景下科研協(xié)作范式的轉(zhuǎn)變
科學(xué)數(shù)據(jù)產(chǎn)生,通常是由科學(xué)研究者以特定的科學(xué)裝置(或者特定的實(shí)驗(yàn)環(huán)境)通過(guò)某種實(shí)驗(yàn)程序收集而來(lái)。從信息系統(tǒng)(Human, System, Information)的研究角度[1]來(lái)看,科學(xué)數(shù)據(jù)驅(qū)動(dòng)的科研協(xié)作主要是由科學(xué)研究者、科研裝置(環(huán)境)、科學(xué)數(shù)據(jù)三個(gè)因素組成的科研協(xié)作新范式(見(jiàn)圖1)。科學(xué)研究者是科學(xué)實(shí)踐的主體,確定研究對(duì)象并設(shè)計(jì)科學(xué)活動(dòng)??茖W(xué)裝置(環(huán)境)是科學(xué)活動(dòng)中科學(xué)研究者采用的實(shí)踐工具,也代表科學(xué)活動(dòng)的程序和規(guī)范??茖W(xué)數(shù)據(jù)是表征研究對(duì)象客體各種特征的產(chǎn)物,是通過(guò)科學(xué)活動(dòng)由某種科學(xué)裝置(環(huán)境)而產(chǎn)生的。
傳統(tǒng)的科研協(xié)作是科學(xué)研究者主導(dǎo)的[2]??茖W(xué)研究者使用科學(xué)裝置,科學(xué)裝置產(chǎn)生科學(xué)數(shù)據(jù),科學(xué)研究者處理科學(xué)數(shù)據(jù)??茖W(xué)研究者的基本特征是能動(dòng)性和創(chuàng)造性??茖W(xué)研究者以個(gè)體面貌出現(xiàn),也以群體面貌出現(xiàn)??茖W(xué)研究者之間的科研協(xié)作隨著研究者之間越來(lái)越明確的分工而顯得越來(lái)越明顯。科學(xué)裝置(環(huán)境)的基本特征是規(guī)范性和工具性,而科學(xué)數(shù)據(jù)的基本特征是客觀性和對(duì)象性。隨著科研協(xié)作的發(fā)展,多套科學(xué)裝置協(xié)作同時(shí)研究一個(gè)科學(xué)問(wèn)題、多份科學(xué)數(shù)據(jù)互相驗(yàn)證科學(xué)研究的情形也變得越來(lái)越常見(jiàn)。
科學(xué)大數(shù)據(jù)是指與科學(xué)研究相關(guān)的大數(shù)據(jù)[3]。在科學(xué)大數(shù)據(jù)時(shí)代,科學(xué)研究者、科學(xué)裝置和科學(xué)數(shù)據(jù)三者之間的相互作用和影響進(jìn)一步促進(jìn)了科學(xué)協(xié)作新模式的出現(xiàn)。重大科研基礎(chǔ)設(shè)施的建設(shè)與更新,引發(fā)數(shù)據(jù)快速累積;高通量?jī)x器設(shè)備以及新數(shù)據(jù)處理技術(shù)和方法帶來(lái)了科學(xué)數(shù)據(jù)的快速增長(zhǎng),打破了過(guò)去由科學(xué)研究者主導(dǎo)科研協(xié)作的平衡。五百米口徑球面射電望遠(yuǎn)鏡(FAST)多科學(xué)目標(biāo)巡天每天將產(chǎn)生約500TB的零級(jí)未壓縮數(shù)據(jù),需要100G高速網(wǎng)絡(luò)將數(shù)據(jù)傳輸至數(shù)據(jù)中心進(jìn)行處理①。FAST科學(xué)工程的建立和產(chǎn)生的大量難以處理的科學(xué)數(shù)據(jù),驅(qū)使天文學(xué)家主動(dòng)尋求與全球范圍內(nèi)計(jì)算機(jī)科學(xué)家、人工智能專(zhuān)家、軟硬件工程師的跨領(lǐng)域科研協(xié)作。同樣的,在生命科學(xué)領(lǐng)域,高通量測(cè)序技術(shù)能一次對(duì)幾十萬(wàn)到幾百萬(wàn)條DNA分子進(jìn)行序列測(cè)定。我國(guó)具有龐大的基因數(shù)據(jù)產(chǎn)出能力,隨著國(guó)家在人口健康領(lǐng)域的戰(zhàn)略部署,將產(chǎn)生百PB級(jí)的基因數(shù)據(jù)①,占世界總數(shù)的一半以上。這種大規(guī)模的基因數(shù)據(jù),使得生命科學(xué)在生命科學(xué)家與數(shù)據(jù)庫(kù)、數(shù)據(jù)科學(xué)、信息管理等領(lǐng)域?qū)<业幕?dòng)與協(xié)作中迸發(fā)出新的科學(xué)發(fā)現(xiàn)模式。
有別于實(shí)驗(yàn)科學(xué)、理論科學(xué)、計(jì)算科學(xué),上述這種科學(xué)發(fā)現(xiàn)模式強(qiáng)調(diào)數(shù)據(jù)作為科學(xué)發(fā)現(xiàn)的基礎(chǔ),并以數(shù)據(jù)為中心和驅(qū)動(dòng)、基于對(duì)海量數(shù)據(jù)的處理和分析去發(fā)現(xiàn)新知識(shí)為基本特征。科學(xué)研究者參與到科學(xué)數(shù)據(jù)的采集、存儲(chǔ)、管理、分析、可視化和知識(shí)發(fā)現(xiàn)的各個(gè)不同階段,形成科學(xué)協(xié)作、科學(xué)發(fā)現(xiàn)的新方法和新途徑。
3? ?科學(xué)數(shù)據(jù)驅(qū)動(dòng)科研協(xié)作的特征
科學(xué)數(shù)據(jù)驅(qū)動(dòng)的科研協(xié)作模式順應(yīng)的是科學(xué)研究范式的改變。20世紀(jì),科學(xué)史學(xué)家普賴(lài)斯[4]就曾經(jīng)指出科學(xué)研究的模式將由大學(xué)實(shí)驗(yàn)室所從事的小科學(xué)(Little Science)轉(zhuǎn)變?yōu)槎鄬W(xué)科整合應(yīng)用性的大科學(xué)(Big Science)。普賴(lài)斯指出,小科學(xué)強(qiáng)調(diào)昔日個(gè)人化的研究成果,而由于科學(xué)文獻(xiàn)數(shù)量大增、資訊超載,致使科學(xué)研究者無(wú)法及時(shí)充分掌握及利用科學(xué)資訊,且造成研究之重復(fù),因而現(xiàn)在的研究趨向集體研究而產(chǎn)生大科學(xué)[5]。大科學(xué)研究模式的改變,使得科學(xué)協(xié)作也已經(jīng)從研究者之間的“合作”,逐漸轉(zhuǎn)變?yōu)橛纱罅靠茖W(xué)數(shù)據(jù)產(chǎn)生驅(qū)動(dòng)下,科學(xué)家、工程師、從業(yè)者之間以及他們與科研儀器之間的“協(xié)同工作”。具體說(shuō)來(lái),與傳統(tǒng)科研協(xié)作相比,科學(xué)數(shù)據(jù)驅(qū)動(dòng)的科研協(xié)作至少在以下六方面表現(xiàn)出顯著的特征。
3.1? ? 科學(xué)合作規(guī)模持續(xù)增大
在過(guò)去的數(shù)十年間,科學(xué)研究的主體整體上經(jīng)歷了從單打獨(dú)斗到團(tuán)隊(duì)合作的發(fā)展變遷,尤其是近年來(lái)呈現(xiàn)出從小團(tuán)隊(duì)科研到大團(tuán)隊(duì)科研的明顯趨勢(shì)??茖W(xué)研究者之間的頻繁合作行為表現(xiàn)在不斷增長(zhǎng)的科研團(tuán)隊(duì)規(guī)模,而團(tuán)隊(duì)規(guī)模的增長(zhǎng)在科學(xué)論文合著行為中體現(xiàn)得十分明顯。胡志剛②基于科睿唯安公司的InCites工具分析發(fā)現(xiàn),如今論文合著中科研團(tuán)隊(duì)的規(guī)模已經(jīng)增長(zhǎng)到四十年前的三倍多。在1980-1984年間,一篇科學(xué)論文的作者數(shù)量平均是3.29人,而這一數(shù)字到2015-2019年間已增長(zhǎng)到6.91人。與此同時(shí),科學(xué)合作在多個(gè)層面得到加強(qiáng),國(guó)家間的合作占比從原來(lái)的4.1%增加到22.25%,專(zhuān)業(yè)學(xué)術(shù)機(jī)構(gòu)與產(chǎn)業(yè)界的合作比例亦增加到原來(lái)水平的兩倍有余。
3.2? ? ?科學(xué)合作模式呈現(xiàn)異質(zhì)性
在合作規(guī)模持續(xù)增長(zhǎng)的宏大背景下,科學(xué)合作模式在不同主體之間涌現(xiàn)出異質(zhì)性。(1)在合作模式研究方面,陳云偉③利用論文作者合作網(wǎng)絡(luò)社團(tuán)劃分的方法,在量子信息、腦科學(xué)、碳纖維、稀土、大氣灰霾等領(lǐng)域展開(kāi)大量實(shí)證研究。他發(fā)現(xiàn)不同的科研單元呈現(xiàn)迥異的科研工作模式,如在量子信息領(lǐng)域的四個(gè)頂級(jí)科研單元中,我國(guó)科研單元呈現(xiàn)出顯著的集團(tuán)軍式的合作模式,具備明顯的聯(lián)合攻關(guān)特征,而國(guó)外科研單元中的科學(xué)研究者則在論文發(fā)表方面表現(xiàn)出較為疏松的合作網(wǎng)絡(luò);(2)在國(guó)際合作方面,沙特阿拉伯是國(guó)際化程度最高的國(guó)家,約四分之三的論文來(lái)自國(guó)際合作。中國(guó)大陸、土耳其和印度的國(guó)際論文比例則處于相對(duì)靠后的位置;(3)在產(chǎn)學(xué)研合作方面,瑞士以高達(dá)7.26%的產(chǎn)學(xué)研合作論文比例高居全球首位,中國(guó)的產(chǎn)學(xué)研合作則低于世界平均水平。不同學(xué)科內(nèi)部的合作模式也具有差異性,如天文學(xué)與天體物理學(xué)由于研究工作的獨(dú)特性質(zhì),近一半的論文來(lái)自國(guó)際合作;再如石油工程領(lǐng)域的產(chǎn)學(xué)研合作比例遠(yuǎn)高于其他領(lǐng)域④。
3.3? ? ?從合作發(fā)文到基于儀器設(shè)備、基礎(chǔ)設(shè)施的科研協(xié)作
合作發(fā)文的背后是科研相關(guān)人員之間愈發(fā)頻繁的協(xié)同工作,典型代表是以大型科研裝置、設(shè)備、儀器等科學(xué)基礎(chǔ)設(shè)施為中心,吸引越來(lái)越多的科學(xué)工作者投身其中。然而,正如本次會(huì)議上魏家鵬①和顏嘉麒②總結(jié)的,目前科研儀器設(shè)備在科研協(xié)作中發(fā)揮作用還受到一些障礙的影響,如用戶(hù)范圍有限[6]、使用門(mén)檻偏高[7]、共享平臺(tái)缺乏[8]等。他們基于區(qū)塊鏈技術(shù)思想,分別從制度與技術(shù)方面提出一種科研設(shè)備共享平臺(tái)的設(shè)計(jì)方案。在科研設(shè)備的共享過(guò)程中,通過(guò)引入積分、賬戶(hù)等制度,將設(shè)備擁有者、申請(qǐng)者、使用者的權(quán)益與積分進(jìn)行錨定,建立一整套安全、高效、可流轉(zhuǎn)的設(shè)備共享生態(tài)系統(tǒng);在技術(shù)方面,借助區(qū)塊鏈去中心化、可信以及不可篡改的技術(shù)特征,完整嵌入科學(xué)設(shè)備的積分記錄系統(tǒng),從而真實(shí)記錄每一次協(xié)作的發(fā)生。他們指出,該方案的本質(zhì)即是在保證科研設(shè)備所有權(quán)不發(fā)生轉(zhuǎn)移的前提下,通過(guò)Token積分對(duì)科研設(shè)備的使用權(quán)進(jìn)行流轉(zhuǎn)與共享,從而增益科學(xué)價(jià)值,促進(jìn)科研協(xié)作。
3.4? ? 科學(xué)數(shù)據(jù)的保存和利用需要更加規(guī)范化
科學(xué)數(shù)據(jù)集一方面產(chǎn)生于科研發(fā)現(xiàn)與協(xié)作過(guò)程,如今越來(lái)越呈現(xiàn)出數(shù)量大、種類(lèi)多、來(lái)源廣等特征;另一方面,科研工作者對(duì)科學(xué)數(shù)據(jù)的使用需求日益多樣化,對(duì)這些數(shù)據(jù)的挖掘與利用也進(jìn)一步推動(dòng)著科學(xué)發(fā)現(xiàn)與協(xié)作的升級(jí)。與會(huì)者分別從天文學(xué)與地球科學(xué)兩個(gè)學(xué)科角度闡述了這一問(wèn)題。左雨萌③指出天文歷史數(shù)據(jù)的長(zhǎng)期保存是天文數(shù)據(jù)管理中的重要問(wèn)題,原因在于數(shù)據(jù)的未來(lái)復(fù)用往往受到數(shù)據(jù)保存中一系列格式轉(zhuǎn)化的影響,這就需要數(shù)據(jù)生產(chǎn)者、保存者與使用者的多方協(xié)同。哈佛大學(xué)圖書(shū)館與史密森天文臺(tái)的合作項(xiàng)目Phaedra,為天文手稿、文獻(xiàn)、文物等多種實(shí)體包含的珍貴數(shù)據(jù)提供了成功復(fù)用的案例。余厚強(qiáng)等④從地球系統(tǒng)科學(xué)出發(fā),通過(guò)對(duì)數(shù)據(jù)共享平臺(tái)的統(tǒng)計(jì)和內(nèi)容分析,發(fā)現(xiàn)科學(xué)數(shù)據(jù)集的使用方式除了學(xué)術(shù)需求外,還存在教育需求、社會(huì)需求等多樣方式。不過(guò)他們也指出,傳統(tǒng)的數(shù)據(jù)引證方式只能反映不足8%的數(shù)據(jù)集使用需求,因此有必要建立更加規(guī)范化、標(biāo)準(zhǔn)化的科學(xué)數(shù)據(jù)引證、評(píng)價(jià)與共享體系。
3.5? ? 科學(xué)數(shù)據(jù)共享在科研協(xié)作中具有重要位置
如今科學(xué)研究越來(lái)越依賴(lài)于數(shù)據(jù),對(duì)科學(xué)數(shù)據(jù)進(jìn)行共享也成為科研協(xié)作的重要基石與驅(qū)動(dòng)因素[9]。為此,我國(guó)采用建立機(jī)構(gòu)知識(shí)庫(kù)、國(guó)家級(jí)科研數(shù)據(jù)中心等方式,促進(jìn)科研數(shù)據(jù)的跨機(jī)構(gòu)、跨行業(yè)共享與交流??蒲袛?shù)據(jù)需要共享,其原因在于,一方面科研數(shù)據(jù)包含的信息類(lèi)和數(shù)據(jù)項(xiàng)豐富[10], 包括科研人員數(shù)據(jù)、科研資料數(shù)據(jù)、科研技術(shù)數(shù)據(jù)以及科研環(huán)境數(shù)據(jù)等,貫穿于科研的整個(gè)生命周期,價(jià)值巨大;另一方面,科研數(shù)據(jù)的共享有利于減少數(shù)據(jù)的重復(fù)生產(chǎn)、降低數(shù)據(jù)的使用成本、增進(jìn)科研成果的同行評(píng)議[11],進(jìn)一步有助于提高我國(guó)科學(xué)研究成果的產(chǎn)出。然而,顏嘉麒等①②指出,現(xiàn)有的科研數(shù)據(jù)共享平臺(tái)尚未很好地實(shí)現(xiàn)共享交流的效果,主要體現(xiàn)在“不能共享”“不愿共享”和“不敢共享”。其主要原因在于,已有平臺(tái)的接入機(jī)制少、成本高、障礙多;數(shù)據(jù)共享者面臨的風(fēng)險(xiǎn)責(zé)任與權(quán)利收益之間存在矛盾[12];傳統(tǒng)有限防護(hù)機(jī)制未能很好保障數(shù)據(jù)安全。顏嘉麒等同時(shí)認(rèn)為,區(qū)塊鏈中的分布式共享賬本技術(shù)有潛力為構(gòu)建開(kāi)放、安全、可信的科研數(shù)據(jù)共享網(wǎng)絡(luò)提供技術(shù)與制度方面的參考。
3.6? ? 科學(xué)協(xié)作促使科學(xué)家在全球范圍內(nèi)流動(dòng)
大規(guī)??茖W(xué)設(shè)施的投入、科學(xué)資源的配置和科學(xué)數(shù)據(jù)的產(chǎn)生同樣驅(qū)動(dòng)和引導(dǎo)了科學(xué)家的流動(dòng),并激發(fā)出更多的科學(xué)協(xié)作機(jī)會(huì),這尤其體現(xiàn)在科研人員的國(guó)際流動(dòng)上??蒲腥藛T的流動(dòng),一方面在流入國(guó)與流出國(guó)之間建立起聯(lián)系,背后是科學(xué)知識(shí)的流動(dòng)與科學(xué)影響的輸出,另一方面也有可能造成不同地區(qū)科學(xué)人才結(jié)構(gòu)的失衡。這更體現(xiàn)了科學(xué)裝置投入和科學(xué)數(shù)據(jù)產(chǎn)生對(duì)吸引人才的重要作用。李江等⑤基于對(duì)全球范圍科學(xué)家簡(jiǎn)歷數(shù)據(jù)的分析,認(rèn)為科學(xué)人員的流動(dòng)已經(jīng)從某些地區(qū)的人才流失、人才回流發(fā)展到全球范圍內(nèi)的人才環(huán)流。他們構(gòu)建出科學(xué)家流動(dòng)的三維地圖,按照年份、學(xué)科、地區(qū)、機(jī)構(gòu)等條件展示科學(xué)家流動(dòng)的特征與趨勢(shì)。科學(xué)家去新的機(jī)構(gòu)、城市與國(guó)家任職,這一信息反映在其簡(jiǎn)歷信息上,尤其是以O(shè)RCID為代表的大型數(shù)據(jù)集,系統(tǒng)記錄了科學(xué)家流動(dòng)的全球數(shù)據(jù)。當(dāng)然,科學(xué)家流動(dòng)除了受到科研條件與科研資源的影響,還受制于諸多復(fù)雜的因素,如經(jīng)濟(jì)發(fā)展、自然環(huán)境、社會(huì)環(huán)境、子女教育等。
4? ?案例分析:LAMOST科學(xué)數(shù)據(jù)驅(qū)動(dòng)的科研協(xié)作
大科學(xué)裝置是一種在物理上不可分割的科研資源,產(chǎn)生的大規(guī)??茖W(xué)數(shù)據(jù)促使來(lái)自不同團(tuán)體的科學(xué)家組成研究團(tuán)隊(duì)協(xié)同工作,有效降低了科學(xué)合作中的協(xié)調(diào)成本[13-14]。以2008年建成的LAMOST天文望遠(yuǎn)鏡為例,它是中科院國(guó)家天文臺(tái)的國(guó)家重大科技基礎(chǔ)設(shè)施,以大視場(chǎng)、大光譜觀測(cè)等特點(diǎn)居于國(guó)際領(lǐng)先地位。2019年3月,巡天7年的LAMOST望遠(yuǎn)鏡發(fā)布DR6數(shù)據(jù)集,其中包括4902個(gè)觀測(cè)天區(qū)與1125萬(wàn)條光譜,成為世界首個(gè)突破千萬(wàn)量級(jí)的光譜巡天項(xiàng)目[15]。
LAMOST的建造與使用是大科學(xué)裝置促進(jìn)科研協(xié)作在全球范圍內(nèi)開(kāi)展的鮮明案例。Web of Science數(shù)據(jù)庫(kù)與美國(guó)國(guó)家太空總署(NASA)的天體物理數(shù)據(jù)系統(tǒng)ADS顯示,截至2018年,除了中國(guó)以外,美國(guó)、英國(guó)、澳大利亞、德國(guó)、法國(guó)、加拿大、西班牙、日本、意大利、丹麥等國(guó)家均在不同程度上利用LAMOST產(chǎn)出科研論文。這些科研成果隨著LAMOST觀測(cè)數(shù)據(jù)集度過(guò)保護(hù)期后向國(guó)際學(xué)術(shù)界開(kāi)放共享的步伐,在成果數(shù)量上呈現(xiàn)出指數(shù)型快速增長(zhǎng)的態(tài)勢(shì)。相關(guān)的科研協(xié)作主要體現(xiàn)在LAMOST巡天項(xiàng)目與有關(guān)科研計(jì)劃的數(shù)據(jù)發(fā)布、天文觀測(cè)與研究、多種望遠(yuǎn)鏡觀測(cè)結(jié)果的比較等工作上。主要的研究問(wèn)題則包括光譜技術(shù)、恒星豐度與基本參數(shù)、銀河系動(dòng)力學(xué)、數(shù)據(jù)分析方法等眾多方面。
基于LAMOST的科研協(xié)作同樣展現(xiàn)出多樣性的合作來(lái)源與異質(zhì)性的合作模式。在國(guó)際合作層面,有國(guó)外科研機(jī)構(gòu)參與的論文數(shù)量已經(jīng)超過(guò)單純由中國(guó)科研機(jī)構(gòu)完成的論文數(shù)量,并且前者比后者多出25%的可觀比例。其中,在有國(guó)外機(jī)構(gòu)參與的論文中,又有近四分之一是單純由國(guó)外機(jī)構(gòu)自身或者相互合作完成。毫無(wú)疑問(wèn),中國(guó)是國(guó)際合作網(wǎng)絡(luò)的核心,與美國(guó)、德國(guó)、英國(guó)等發(fā)達(dá)國(guó)家之間的合作更加頻繁;而歐洲國(guó)家如法國(guó)、英國(guó)、德國(guó)、比利時(shí)等之間的合作也保持在較高的水平上。在機(jī)構(gòu)合作層面,盡管中科院系統(tǒng)的科研院所具有臨近優(yōu)勢(shì),但是一系列國(guó)外科研機(jī)構(gòu)同樣在使用LAMOST與其開(kāi)放的數(shù)據(jù)從事科學(xué)研究,其中不乏美國(guó)勞倫斯理工學(xué)院、加州理工學(xué)院,意大利國(guó)家天體物理研究所,澳大利亞悉尼大學(xué),以及英國(guó)劍橋大學(xué)等世界著名科研機(jī)構(gòu)。同樣地,中科院國(guó)家天文臺(tái)與南京天文光學(xué)技術(shù)研究所作為機(jī)構(gòu)合作網(wǎng)絡(luò)中的兩個(gè)中心節(jié)點(diǎn),與國(guó)內(nèi)外科研機(jī)構(gòu)在協(xié)同利用LAMOST上起到重要的樞紐與協(xié)調(diào)作用。在科學(xué)家個(gè)人層面,如果將個(gè)人合作關(guān)系繪制成網(wǎng)絡(luò)圖,可以看到某些顯著的合作模式從圖中涌現(xiàn)出來(lái)(見(jiàn)圖2)。整張合作網(wǎng)絡(luò)在微觀上呈現(xiàn)密集的合作狀態(tài),科學(xué)家個(gè)人之間的合作逐步在本地形成了內(nèi)部凝聚的合作群體,這些合作群體的規(guī)模有大有小,散布于整張網(wǎng)絡(luò)的各個(gè)位置。在網(wǎng)絡(luò)中非常顯著的位置,出現(xiàn)了一個(gè)規(guī)模很大的連通分支,它主要是有中國(guó)科學(xué)家群體組成的密集合作網(wǎng)絡(luò),經(jīng)由各種網(wǎng)絡(luò)路徑與其他網(wǎng)絡(luò)節(jié)點(diǎn)(科學(xué)家)產(chǎn)生千絲萬(wàn)縷的合作聯(lián)系。網(wǎng)絡(luò)中還有其他一些內(nèi)部聯(lián)系緊密的子網(wǎng)絡(luò),它們內(nèi)部發(fā)生頻繁的合作,同時(shí)通過(guò)某些橋節(jié)點(diǎn)而與其他子網(wǎng)絡(luò)內(nèi)的科學(xué)家產(chǎn)生聯(lián)系。如比利時(shí)皇家天文臺(tái)的Peter De Cat連接了多個(gè)中外研究群體。LAMOST無(wú)疑為全球天文學(xué)家解決天文學(xué)問(wèn)題提供了良好的觀測(cè)工具與協(xié)作平臺(tái)。
5? ?未來(lái)的研究方向與機(jī)會(huì)
隨著科學(xué)大數(shù)據(jù)的公開(kāi)與普及,科研人員如何合理地分配與利用科學(xué)裝置及其產(chǎn)生的大量科研數(shù)據(jù),以及科研人員在更廣泛的層面上應(yīng)該如何更好地開(kāi)展科研合作,已經(jīng)成為科學(xué)界日益關(guān)注的問(wèn)題。對(duì)此議題的深入探討將推進(jìn)科學(xué)數(shù)據(jù)共享與科研合作朝向高效、高產(chǎn)與高影響的方向發(fā)展。“科學(xué)數(shù)據(jù)驅(qū)動(dòng)的科研協(xié)作”科研論壇,經(jīng)過(guò)研討,與會(huì)專(zhuān)家認(rèn)為科學(xué)數(shù)據(jù)驅(qū)動(dòng)的科研協(xié)作在以下三個(gè)主要方向上展現(xiàn)出豐富的研究機(jī)遇。
5.1? ? 科研協(xié)作的分析與描述
通過(guò)應(yīng)用數(shù)理統(tǒng)計(jì)和計(jì)算技術(shù)等數(shù)學(xué)方法對(duì)科研協(xié)作活動(dòng)的過(guò)程、形式、規(guī)模、影響進(jìn)行定量分析,從中找出科學(xué)數(shù)據(jù)驅(qū)動(dòng)的科研協(xié)作的活動(dòng)規(guī)律性??蒲袇f(xié)作的計(jì)量與描述研究方法主要源于情報(bào)科學(xué)和科學(xué)學(xué),亦包括網(wǎng)絡(luò)計(jì)量學(xué)和替代計(jì)量學(xué)的方法。
(1)非正式科學(xué)交流環(huán)境下的科研協(xié)作模式??茖W(xué)大數(shù)據(jù)環(huán)境下涌現(xiàn)出許多新的科研協(xié)作模式。在正式科學(xué)交流所使用的平臺(tái)和工具之外,研究者通過(guò)非正式科學(xué)交流渠道實(shí)現(xiàn)科研協(xié)作,也在發(fā)揮重要作用。分析和描述非正式科學(xué)交流環(huán)境里的科研協(xié)作模式,包括通過(guò)社交媒體平臺(tái)分享合作信息、推廣科研成果,通過(guò)眾包平臺(tái)實(shí)現(xiàn)數(shù)據(jù)分布式標(biāo)注等,將成為科學(xué)計(jì)量學(xué)領(lǐng)域重要的研究課題。
(2)科研協(xié)作的規(guī)模與網(wǎng)絡(luò)分析??蒲袇f(xié)作規(guī)模是指參與科研協(xié)作的人員數(shù)量、資金投入、時(shí)間投入等要素的規(guī)模,能夠反映科研協(xié)作的整體發(fā)展態(tài)勢(shì)。在科學(xué)大數(shù)據(jù)的環(huán)境下,科研協(xié)作網(wǎng)絡(luò)層次更加豐富,包括國(guó)家層次、機(jī)構(gòu)層次和個(gè)人層次的合作網(wǎng)絡(luò)。未來(lái)科學(xué)計(jì)量研究除了通過(guò)合著關(guān)系構(gòu)建,也可以考慮使用基金項(xiàng)目、會(huì)議組織等其他各種形式豐富的合作聯(lián)系,更加立體的揭示科研協(xié)作的核心人員、合作模式。
(3)區(qū)域間科研協(xié)作發(fā)展趨勢(shì)與影響力。科學(xué)大數(shù)據(jù)環(huán)境下科研協(xié)作是跨國(guó)界跨區(qū)域的合作。國(guó)家之間科研協(xié)作的橫向比較,通過(guò)統(tǒng)計(jì)其科研協(xié)作發(fā)展隨時(shí)間的變化,分析各國(guó)科研協(xié)作的項(xiàng)目、政策,洞察國(guó)家科研協(xié)作的宏觀趨勢(shì)??鐓^(qū)域科研協(xié)作表現(xiàn)在不同的地理層次,洲際、國(guó)際、省際、市際乃至校際之間的科研協(xié)作,呈現(xiàn)出不同的特點(diǎn),在設(shè)計(jì)初衷和目標(biāo)使命方面亦存在不同,分析跨區(qū)域科研協(xié)作項(xiàng)目的影響力,有助于理解地理要素對(duì)科研協(xié)作的作用。
5.2? ? 科研協(xié)作的設(shè)計(jì)與實(shí)現(xiàn)
通過(guò)信息技術(shù)與科學(xué)學(xué)的組合,解決在科學(xué)協(xié)作中遇到的技術(shù)與工程問(wèn)題??蒲袇f(xié)作的設(shè)計(jì)與實(shí)現(xiàn)的研究方法主要借鑒計(jì)算機(jī)科學(xué)和軟件工程等工程學(xué)的研究方法,通過(guò)不斷進(jìn)步的信息通訊技術(shù)實(shí)現(xiàn)和支持科學(xué)數(shù)據(jù)驅(qū)動(dòng)的科研協(xié)作。該方向的主要課題包括但不限于:
(1)科學(xué)數(shù)據(jù)資源共享機(jī)制、科研協(xié)作平臺(tái)框架設(shè)計(jì)。在科學(xué)大數(shù)據(jù)環(huán)境下,科研資源分享方式與傳統(tǒng)科研環(huán)境下的科學(xué)數(shù)據(jù)共享發(fā)生了本質(zhì)的改變。多源、多維與海量的科學(xué)大數(shù)據(jù)需要更加高效的共享機(jī)制和科研協(xié)作平臺(tái)。如何利用人工智能、區(qū)塊鏈、協(xié)同計(jì)算等前沿信息技術(shù),設(shè)計(jì)更能保證隱私和權(quán)益的科學(xué)數(shù)據(jù)資源共享機(jī)制、更有效率的科研協(xié)作平臺(tái),是未來(lái)研究支持科研協(xié)作一個(gè)重要的研究方向。
(2)科研智能協(xié)作具體推薦與分析算法??茖W(xué)大數(shù)據(jù)環(huán)境下,科研工作者在不同項(xiàng)目里的角色更加多樣化,可以參與的科研協(xié)作形式更加豐富,在科研工作可以發(fā)揮的作用越來(lái)越多。通過(guò)機(jī)器學(xué)習(xí)與推薦系統(tǒng)算法,智能推薦與分析科研協(xié)作的模式,可以實(shí)現(xiàn)更有效率的科研協(xié)作服務(wù),并且可以進(jìn)一步通過(guò)數(shù)據(jù)分析驅(qū)動(dòng)創(chuàng)新的科研協(xié)作。
(3)科學(xué)數(shù)據(jù)共享中的質(zhì)量控制和信息安全問(wèn)題研究。科學(xué)數(shù)據(jù)的質(zhì)量控制與信息安全問(wèn)題是指數(shù)據(jù)存儲(chǔ)穩(wěn)定性、數(shù)據(jù)質(zhì)量、防止黑客攻擊等保障科學(xué)數(shù)據(jù)可被安全訪問(wèn)的基本問(wèn)題,是科研協(xié)作得以開(kāi)展的基礎(chǔ)??茖W(xué)大數(shù)據(jù)環(huán)境下,科學(xué)數(shù)據(jù)的內(nèi)容、種類(lèi)、數(shù)量等都發(fā)生了變化。在這種新環(huán)境下,如何通過(guò)各種加密方式、授權(quán)管理、質(zhì)量檢測(cè)和信息安全手段來(lái)控制和保護(hù)科學(xué)數(shù)據(jù)的共享,將會(huì)成為未來(lái)研究的熱點(diǎn)和重點(diǎn)。
5.3? ? 科研協(xié)作的管理與規(guī)劃
通過(guò)社會(huì)學(xué)和管理學(xué)的研究方法,旨在解決科研協(xié)作的管理和規(guī)劃問(wèn)題。科研協(xié)作的管理與規(guī)劃的研究方法主要借鑒管理學(xué)、運(yùn)籌學(xué)和經(jīng)濟(jì)學(xué)等社會(huì)學(xué)的研究方法。該方向的主要課題包括但不限于:
(1)科研協(xié)作相關(guān)科技政策與科學(xué)大數(shù)據(jù)規(guī)范化管理研究。政府和管理部門(mén)為了鼓勵(lì)和支持科研協(xié)作,應(yīng)該如何規(guī)范科學(xué)大數(shù)據(jù)的采集、使用、共享等方面的管理,是在科學(xué)大數(shù)據(jù)背景下科技管理的重要課題??萍颊唧w系實(shí)施上,如何將數(shù)據(jù)管理與科研研究模式相結(jié)合,必然為科技管理的研究者帶來(lái)很多未來(lái)的研究機(jī)會(huì)。
(2)科技資源統(tǒng)籌、利益分配與共享激勵(lì)措施??萍假Y源是創(chuàng)新體系的重要組成要素,決定了創(chuàng)新能力的強(qiáng)弱。在科學(xué)大數(shù)據(jù)環(huán)境下,更加需要統(tǒng)籌科技資源總體狀況。因此,研究如何根據(jù)不同類(lèi)型科技基礎(chǔ)條件資源的發(fā)展特點(diǎn)分配利益,設(shè)計(jì)充分調(diào)動(dòng)參與者積極性的共享激勵(lì)措施政策,也會(huì)是未來(lái)的研究熱點(diǎn)。
(3)科研協(xié)作項(xiàng)目的評(píng)審機(jī)制與經(jīng)濟(jì)和社會(huì)效益評(píng)估??茖W(xué)大數(shù)據(jù)環(huán)境下,對(duì)科學(xué)產(chǎn)出的評(píng)價(jià)更加全面和多樣化。如何設(shè)計(jì)健全科學(xué)協(xié)作項(xiàng)目的評(píng)審機(jī)制,如對(duì)科研協(xié)作項(xiàng)目不僅從科技產(chǎn)出,也從經(jīng)濟(jì)和社會(huì)角度進(jìn)行多角度評(píng)估,會(huì)是未來(lái)科學(xué)評(píng)價(jià)的重點(diǎn)。
6? ?結(jié)語(yǔ)
隨著大規(guī)??茖W(xué)數(shù)據(jù)的增長(zhǎng),基于科學(xué)數(shù)據(jù)驅(qū)動(dòng)的科研協(xié)作成為必然趨勢(shì),呈現(xiàn)出新特點(diǎn)和新模式,構(gòu)成科學(xué)數(shù)據(jù)大會(huì)中的重要議題。可以預(yù)見(jiàn),未來(lái)人與人、人與儀器之間的交互越來(lái)越普遍,科研協(xié)作將更加緊密地圍繞科學(xué)數(shù)據(jù)來(lái)展開(kāi)。但是,科學(xué)數(shù)據(jù)問(wèn)題也存在學(xué)科差異。在自然科學(xué)如高能物理學(xué)、天體物理學(xué)等,基于大科學(xué)裝置產(chǎn)生的大規(guī)??茖W(xué)數(shù)據(jù)十分普遍;在工程技術(shù)領(lǐng)域如物聯(lián)網(wǎng)、森林監(jiān)控體系等,基于海量傳感器產(chǎn)生的海量數(shù)據(jù)得到廣泛積累;在人文社科領(lǐng)域如考古、新聞傳播領(lǐng)域,基于數(shù)字人文、3D建模、社交媒體等的大數(shù)據(jù)引領(lǐng)學(xué)科研究新范式。這些不同學(xué)科的科學(xué)數(shù)據(jù),在屬性特點(diǎn)、存儲(chǔ)傳播和研究路徑方面都表現(xiàn)出差異,需要開(kāi)展針對(duì)性的研究。
參考文獻(xiàn):
[1]? Gregor S.The Nature of Theory in Information Systems[J].MIS Quarterly,2006,30(3):611-642.
[2]? 王赟,魏子晗,沈絲楚,等.世紀(jì)科學(xué)之問(wèn)“合作+行為是如何進(jìn)化的”——中國(guó)學(xué)者的回應(yīng)[J].科學(xué)通報(bào),2016,61(1):20-33.
[3]? 孫建軍,李陽(yáng).科學(xué)大數(shù)據(jù):范式重塑與價(jià)值實(shí)現(xiàn)[J].圖書(shū)與情報(bào),2017(5):20-26.
[4]? Price D J d S.Little science,big science[M].New York: Columbia Univ.Press,1963.
[5]? 劉則淵,陳悅,朱曉宇.普賴(lài)斯對(duì)科學(xué)學(xué)理論的貢獻(xiàn)——紀(jì)念科學(xué)計(jì)量學(xué)之父普賴(lài)斯逝世30周年[J].科學(xué)學(xué)研究,2013,31(12):1761-1772.
[6]? 宋立榮,劉春曉,張薇.我國(guó)大型科學(xué)儀器資源開(kāi)放共享建設(shè)中問(wèn)題及對(duì)策思考[J].情報(bào)雜志,2014,33(11):1-6,13.
[7]? 劉洋,何建佳.大型科學(xué)儀器設(shè)備共享的合作收益分配模型——基于努力因素的分析[J].科技管理研究,2017,37(3):179-184.
[8]? 董誠(chéng),張新民,侯敏.大型科學(xué)儀器共享的三層次模型及實(shí)例分析[J].中國(guó)基礎(chǔ)科學(xué),2012,14(5):55-59.
[9]? 黎建輝,沈志宏,孟小峰.科學(xué)大數(shù)據(jù)管理:概念、技術(shù)與系統(tǒng)[J].計(jì)算機(jī)研究與發(fā)展,2017,54(2):235-247.
[10]? Fischer B A,Zigmond M J.The Essential Nature of Sharing in Science[J].Science & Engineering Ethics,2010,16(4):783-799.
[11]? Tenopir C,Allard S,Douglass K,et al.Data sharing by scientists:practices and perceptions[J].PLoS ONE,2011,6:e21101.
[12]? Christine L.Borgman,青秀玲.科研數(shù)據(jù)共享的挑戰(zhàn)[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2013(5):1-20.
[13]? 黃敏,楊海珍.加強(qiáng)大科學(xué)裝置的管理[J].中國(guó)科學(xué)院院刊,2006(3):41-46.
[14]? 張玲玲,王蝶,張利斌.跨學(xué)科性與團(tuán)隊(duì)合作對(duì)大科學(xué)裝置科學(xué)效益的影響研究[J].管理世界,2019,35(12):199-212.
[15]? 國(guó)家天文臺(tái).LAMOST DR6數(shù)據(jù)集正式發(fā)布[EB/OL].[2019-12-20].http://www.bao.ac.cn/xwzx/gdtpxw/201903/t20190327_5262549.html.