摘要:科學(xué)數(shù)據(jù)是戰(zhàn)略性、基礎(chǔ)性科技資源,深刻影響著各國(guó)的國(guó)家安全、經(jīng)濟(jì)發(fā)展和科技進(jìn)步綜合競(jìng)爭(zhēng)力。在開放科學(xué)背景下,科學(xué)數(shù)據(jù)作為數(shù)據(jù)密集型科學(xué)研究范式的成果及重要支撐的同時(shí),也面臨著安全合規(guī)、可信可靠共享方面嚴(yán)峻的安全挑戰(zhàn)。筆者從我國(guó)科學(xué)數(shù)據(jù)共享面臨的安全挑戰(zhàn)出發(fā),以促進(jìn)科學(xué)數(shù)據(jù)開放共享為目標(biāo),以構(gòu)建動(dòng)態(tài)、細(xì)粒度、領(lǐng)域適用的數(shù)據(jù)分類分級(jí)制度為核心,從政策、管理、技術(shù)、評(píng)估和監(jiān)管等方面,提出科學(xué)數(shù)據(jù)安全戰(zhàn)略,促進(jìn)科學(xué)數(shù)據(jù)安全開發(fā)利用,實(shí)現(xiàn)科技強(qiáng)國(guó)的目標(biāo)。
關(guān)鍵詞:開放科學(xué);科學(xué)數(shù)據(jù);開放共享;安全挑戰(zhàn)及對(duì)策
1 "引言
開放科學(xué)是全球各國(guó)的共同承諾,以公平、共享、創(chuàng)新的理念成為構(gòu)建人類命運(yùn)共同體的重要路徑。傳統(tǒng)科學(xué)是相對(duì)封閉的科研活動(dòng),研究數(shù)據(jù)、過程和成果僅在有限范圍內(nèi)共享。開放科學(xué)實(shí)現(xiàn)科研全過程、科研資源的開放共享,消除信息不對(duì)稱,使得研究成果更易產(chǎn)生廣泛的影響和協(xié)同創(chuàng)新,促進(jìn)科研活動(dòng)、科研成果評(píng)價(jià)與激勵(lì)機(jī)制向公平、透明方向穩(wěn)步邁進(jìn)、開放數(shù)據(jù)、開放研究、開放創(chuàng)新、開放基礎(chǔ)設(shè)施、開放教育、開放同行評(píng)議、開放合作、公眾科學(xué)、開放源代碼和軟件等諸多環(huán)節(jié)。全球范圍內(nèi),聯(lián)合國(guó)教科文組織(UNESCO)致力于踐行開放科學(xué)理念,推動(dòng)科學(xué)活動(dòng)更加開放、透明和包容。2021 年,UNESCO發(fā)布《開放科學(xué)建議書》,成為全球開放科學(xué)的指導(dǎo)性框架,幫助開展開放科學(xué)行動(dòng),促進(jìn)形成可交付成果[1]。經(jīng)過兩年多的跟蹤調(diào)研,UNESCO于2023年12月發(fā)布報(bào)告《開放科學(xué)展望(Open Science Outlook)[1]》顯示,開放科學(xué)在學(xué)術(shù)出版、數(shù)據(jù)共享、開源軟件、開放獲取和開放合作等領(lǐng)域取得重要進(jìn)展?!伴_放科學(xué)”這一術(shù)語于1998年由史蒂夫·曼正式提出,經(jīng)過20多年的發(fā)展,從數(shù)據(jù)、資源、基礎(chǔ)設(shè)施的開放獲取到社會(huì)公眾參與科學(xué)研究,開放科學(xué)內(nèi)涵不斷擴(kuò)展,包括開放獲取研究計(jì)劃等多個(gè)方面取得實(shí)質(zhì)性進(jìn)展,對(duì)科學(xué)研究、技術(shù)創(chuàng)新都產(chǎn)生了重要影響。2012-2021年近十年來,科學(xué)出版物的開放獲取份額保持增長(zhǎng)趨勢(shì),在發(fā)表論文引文中,約42%可公開獲取,在2002-2011年間,這一份額僅為24%。2019年開始的新冠肺炎大流行進(jìn)一步推動(dòng)了全球開放科學(xué)格局的轉(zhuǎn)變,開放基因組數(shù)據(jù)為全球COVID-19研究提供了強(qiáng)大支持,科學(xué)界通力協(xié)作,共享資源、科學(xué)成果,共同應(yīng)對(duì)全球危機(jī),展示了開放數(shù)據(jù)在應(yīng)對(duì)重大公共衛(wèi)生事件中的重要作用,凸顯了開放科學(xué)在科研中的關(guān)鍵價(jià)值。
2 "國(guó)內(nèi)外科學(xué)數(shù)據(jù)開放共享現(xiàn)狀
科學(xué)數(shù)據(jù)作為開放科學(xué)的重要成果及開放形式,在推動(dòng)科研范式變革及“數(shù)據(jù)+人工智能”驅(qū)動(dòng)的科學(xué)知識(shí)發(fā)現(xiàn)方面具有核心及不可替代的作用。
當(dāng)前,全球科學(xué)數(shù)據(jù)開放共享整體水平并不均衡。美國(guó)、歐盟及英國(guó)等國(guó)憑借多年政策推動(dòng)和實(shí)踐積累,表現(xiàn)較為突出。聯(lián)合國(guó)教科文組織(UNESCO)發(fā)布的《2023年開放科學(xué)展望:全球狀態(tài)與趨勢(shì)》報(bào)告指出,全球范圍內(nèi)開放科學(xué)的實(shí)踐并不均衡,在國(guó)家和地區(qū)之間存在差異,在獲取資金、技能和工具方面存在不平等。報(bào)告認(rèn)為,要使開放科學(xué)發(fā)揮其潛力,必須采取集體、協(xié)作和協(xié)調(diào)的行動(dòng)和投資,加速向真正全球、公平的開放科學(xué)的轉(zhuǎn)變。據(jù)報(bào)告統(tǒng)計(jì),目前,西歐和北美開放獲取存儲(chǔ)庫(kù)和開放數(shù)據(jù)存儲(chǔ)庫(kù)占全球總量的近85%。美國(guó)長(zhǎng)期以來一直將數(shù)據(jù)開放共享作為一項(xiàng)重要的國(guó)家戰(zhàn)略。2022年8月25日,美國(guó)白宮科技政策辦公室(OSTP)發(fā)布最新政策指南,所有聯(lián)邦政府資助的研究成果(包括學(xué)術(shù)出版物和科學(xué)數(shù)據(jù)等),最遲于 2025 年 12 月 31 日立即免費(fèi)向公眾開放。美國(guó)自2009年起就開始推動(dòng)政府?dāng)?shù)據(jù)開放,建立了全球首個(gè)多源統(tǒng)一的政府?dāng)?shù)據(jù)開放平臺(tái),在政府?dāng)?shù)據(jù)開放、流通以及開發(fā)應(yīng)用方面走在前列。歐洲開放科學(xué)云(EOSC)提供了面向研究社區(qū)的開放服務(wù),用于存儲(chǔ)、管理、分析和再利用研究數(shù)據(jù),從2015年提出至今,為180萬歐洲研究人員和7000萬科學(xué)技術(shù)領(lǐng)域的專業(yè)人員提供了豐富的資源和工具,包括軟件工具、研究數(shù)據(jù)等,以促進(jìn)創(chuàng)新和教育。歐盟委員會(huì)2023年發(fā)布了《2023-2024年數(shù)字歐洲工作計(jì)劃》,計(jì)劃投入1.13億歐元用于提升數(shù)據(jù)與計(jì)算能力,擴(kuò)大數(shù)據(jù)共享水平等。2023年6月,英國(guó)科研與創(chuàng)新署(UKRI)宣布投資7200萬英鎊用于升級(jí)多項(xiàng)研究基礎(chǔ)設(shè)施,資助來自UKRI的基礎(chǔ)設(shè)施基金和數(shù)字研究基礎(chǔ)設(shè)施計(jì)劃,將重點(diǎn)推動(dòng)科研數(shù)據(jù)的共享和利用。日本政府發(fā)布了“統(tǒng)合創(chuàng)新戰(zhàn)略2023”,開放科學(xué)和數(shù)據(jù)驅(qū)動(dòng)的研究活動(dòng)被作為重要組成部分,強(qiáng)調(diào)促進(jìn)科研數(shù)據(jù)的管理和靈活應(yīng)用。J-STAGE作為日本主流的國(guó)家級(jí)學(xué)術(shù)開放出版平臺(tái),有超過1500家學(xué)/協(xié)會(huì)組織將3000多種期刊的論文、會(huì)議記錄、統(tǒng)計(jì)調(diào)查數(shù)據(jù)以及研究報(bào)告等文獻(xiàn)資料公布在J-STAGE平臺(tái)上,其中絕大部分內(nèi)容可供全世界用戶免費(fèi)獲取,同時(shí),還致力于探索日本開放獲取期刊高質(zhì)量發(fā)展的路徑[2]。2021年,澳大利亞發(fā)布了《政府間數(shù)據(jù)共享協(xié)議》,為澳大利亞聯(lián)邦、州和地區(qū)政府間的數(shù)據(jù)共享行為提供了法律依據(jù)。2022年6月,澳大利亞科學(xué)院發(fā)布《澳大利亞數(shù)據(jù)驅(qū)動(dòng)的未來科研》報(bào)告,進(jìn)一步強(qiáng)調(diào)了數(shù)據(jù)在科研中的基礎(chǔ)作用。我們看到世界各國(guó)政府及機(jī)構(gòu)已經(jīng)開展了大量實(shí)踐,全球科學(xué)數(shù)據(jù)開放共享的趨勢(shì)正在加速,這些趨勢(shì)不僅促進(jìn)了科學(xué)數(shù)據(jù)的開放和利用,而且有助于推動(dòng)開放科學(xué)的文化變革。我國(guó)在推動(dòng)科學(xué)數(shù)據(jù)開放共享方面取得積極進(jìn)展。2018年4月,我國(guó)首次從國(guó)家層面,發(fā)布關(guān)于科學(xué)數(shù)據(jù)開放共享的指導(dǎo)文件——《科學(xué)數(shù)據(jù)管理辦法》,明確指出要促進(jìn)科學(xué)數(shù)據(jù)開放共享。中國(guó)科學(xué)院作為科學(xué)數(shù)據(jù)及相關(guān)基礎(chǔ)設(shè)施開放共享主體,2019年正式發(fā)布《中國(guó)科學(xué)院科學(xué)數(shù)據(jù)管理與開放共享辦法》,指導(dǎo)全院的科學(xué)數(shù)據(jù)共享工作,全力支持國(guó)家大數(shù)據(jù)戰(zhàn)略。2023年11月,國(guó)家數(shù)據(jù)局聯(lián)合17部門共同發(fā)布《數(shù)據(jù)要素×三年行動(dòng)計(jì)劃(2024—2026年)》,旨在推動(dòng)科學(xué)數(shù)據(jù)的有序開放共享,并發(fā)揮科學(xué)數(shù)據(jù)的聚合價(jià)值。2024年,兩會(huì)委員提出建立科研論文及相關(guān)數(shù)據(jù)即時(shí)匯繳共享機(jī)制,以及建立和完善科學(xué)數(shù)據(jù)的管理制度體系。目前,我國(guó)20個(gè)國(guó)家級(jí)科學(xué)數(shù)據(jù)中心和30個(gè)國(guó)家生物種質(zhì)與實(shí)驗(yàn)材料資源庫(kù)已匯聚了大量的科學(xué)數(shù)據(jù)、軟件、工具、方法等資源,形成了開放科學(xué)的土壤。我國(guó)在開放科學(xué)數(shù)據(jù)、數(shù)據(jù)共享領(lǐng)域的積極努力受到了廣泛的認(rèn)可和關(guān)注。由施普林格·自然與中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心共同發(fā)布的《2023中國(guó)開放數(shù)據(jù)白皮書》統(tǒng)計(jì),我國(guó)有50%的對(duì)地觀測(cè)科學(xué)數(shù)據(jù)機(jī)構(gòu)提供免費(fèi)數(shù)據(jù)開放共享服務(wù),免費(fèi)開放數(shù)據(jù)資源占數(shù)據(jù)總量的47%,總用戶數(shù)超過53萬人,服務(wù)機(jī)構(gòu)超過12萬家,總數(shù)據(jù)量超過293PB,其中直接下載使用的數(shù)據(jù)量達(dá)149PB [3]。截至2023年8月,中科院院級(jí)項(xiàng)目科學(xué)數(shù)據(jù)匯交管理平臺(tái)(https://dmp.casdccn/)匯交數(shù)據(jù)資源總量達(dá)到10205 TB,已匯交數(shù)據(jù)開放性達(dá)87.2%(完全公開56.5%,保護(hù)期10.6%,有條件公開20%)。平臺(tái)已覆蓋164家研究機(jī)構(gòu),吸引了2039名科學(xué)家個(gè)人或團(tuán)隊(duì)熟悉開放科學(xué)技能,成為數(shù)據(jù)作者,初步形成由一線科學(xué)家組成的高水平數(shù)據(jù)作者團(tuán)隊(duì),為形成高度活躍和可持續(xù)的科學(xué)數(shù)據(jù)共享生態(tài)奠定基礎(chǔ)[3]。
3 "科學(xué)數(shù)據(jù)安全可信、可靠、合規(guī)開放共享的重要性
科學(xué)數(shù)據(jù)的安全可信、可靠、合規(guī)開放共享是基本的安全需求,對(duì)科學(xué)發(fā)現(xiàn)、決策制定、知識(shí)傳承以及技術(shù)革新起到關(guān)鍵性作用??茖W(xué)數(shù)據(jù)共享的可信性(Trustworthiness)主要指的是確保數(shù)據(jù)及數(shù)據(jù)來源的真實(shí)性、準(zhǔn)確性和完整性,以及可靠性和信譽(yù)。這包括數(shù)據(jù)生成和處理的透明度,以及確保數(shù)據(jù)不被篡改或污染。可靠性(Reliability)主要涉及數(shù)據(jù)的質(zhì)量和穩(wěn)定性,確保數(shù)據(jù)在需要時(shí)可用,并且數(shù)據(jù)共享平臺(tái)能夠持續(xù)運(yùn)行,不受技術(shù)故障或外部攻擊的影響。合規(guī)性(Compliance)主要指的是確保數(shù)據(jù)共享活動(dòng)遵守相關(guān)的法律法規(guī)、政策標(biāo)準(zhǔn)和社會(huì)倫理要求,包括數(shù)據(jù)保護(hù)法律、個(gè)人隱私、知識(shí)產(chǎn)權(quán)法規(guī)、跨境數(shù)據(jù)傳輸規(guī)定等。通過合規(guī)地共享可信、可靠的科學(xué)數(shù)據(jù),促進(jìn)不同國(guó)家、地域、領(lǐng)域、學(xué)科的科研成果協(xié)同創(chuàng)新、互相驗(yàn)證,建立科研誠(chéng)信,推動(dòng)持續(xù)的科研合作與交流,提升科研公信力。決策機(jī)構(gòu)通過獲取可信、可靠的科學(xué)數(shù)據(jù),更加準(zhǔn)確地制定政策或規(guī)劃,提高決策的科學(xué)性和有效性。科學(xué)數(shù)據(jù)作為寶貴的史料資源,其可信、可靠的記錄或傳播,是促進(jìn)知識(shí)的傳承,推動(dòng)人類文明的進(jìn)步的重要途徑。這三個(gè)方面相互關(guān)聯(lián),共同構(gòu)成了科學(xué)數(shù)據(jù)開放共享的安全框架,旨在保護(hù)數(shù)據(jù)、維護(hù)隱私、促進(jìn)公平使用,支持負(fù)責(zé)任的科學(xué)研究。
全球各國(guó)普遍認(rèn)同發(fā)展與安全協(xié)同并進(jìn)是科學(xué)數(shù)據(jù)開放共享的兩個(gè)相輔相成的目標(biāo),也是當(dāng)前在可信、可靠、合規(guī)開放共享等方面面臨的困難和挑戰(zhàn)。法律法規(guī)是規(guī)范科學(xué)數(shù)據(jù)安全有序共享的準(zhǔn)繩。美國(guó)在推動(dòng)科學(xué)數(shù)據(jù)開放共享的同時(shí),非常重視個(gè)人隱私保護(hù)和數(shù)據(jù)安全。2023年3月,美國(guó)OSTP發(fā)布《促進(jìn)數(shù)據(jù)共享與分析中的隱私保護(hù)國(guó)家戰(zhàn)略》,強(qiáng)調(diào)發(fā)展支持隱私保護(hù)的數(shù)據(jù)共享和分析技術(shù)(PPDSA)的重要性,旨在最大化數(shù)據(jù)潛力,同時(shí)降低風(fēng)險(xiǎn)和促進(jìn)信任。2022年6月,歐盟《數(shù)據(jù)治理法案(DGA)》正式生效,旨在通過提高對(duì)數(shù)據(jù)中介的信任,增強(qiáng)整個(gè)歐盟的數(shù)據(jù)共享機(jī)制,從而提升數(shù)據(jù)的可用性、可信性。《通用數(shù)據(jù)保護(hù)條例(GDPR)》對(duì)歐盟各成員國(guó)都產(chǎn)生了深厚的影響,針對(duì)個(gè)人數(shù)據(jù)保護(hù)設(shè)立了嚴(yán)格的標(biāo)準(zhǔn),確保個(gè)人數(shù)據(jù)的安全和隱私得到保護(hù)。英國(guó)政府于2024年提出《數(shù)據(jù)保護(hù)與數(shù)字信息法案(DPDIB)》法案,旨在精細(xì)調(diào)整和明確GDPR原則,更新并簡(jiǎn)化英國(guó)的數(shù)據(jù)保護(hù)框架,同時(shí)保持高數(shù)據(jù)保護(hù)標(biāo)準(zhǔn)。我國(guó)也發(fā)布明確的法規(guī)政策,包括《中華人民共和國(guó)個(gè)人信息保護(hù)法》(2021年)從立法層面提出對(duì)個(gè)人數(shù)據(jù)的保護(hù);《科學(xué)數(shù)據(jù)管理辦法》《中國(guó)科學(xué)院科學(xué)數(shù)據(jù)管理與開放共享辦法》提出科學(xué)數(shù)據(jù)應(yīng)遵循分級(jí)管理原則,確定各級(jí)別/類別數(shù)據(jù)的開放共享?xiàng)l件,強(qiáng)調(diào)了數(shù)據(jù)中心對(duì)科學(xué)數(shù)據(jù)進(jìn)行分級(jí)分類的職責(zé);《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法》《個(gè)人信息保護(hù)法》均明確提出對(duì)數(shù)據(jù)實(shí)行分類分級(jí)保護(hù),確立數(shù)據(jù)分類分級(jí)保護(hù)制度的要求。
研究機(jī)構(gòu)和高校作為開放數(shù)據(jù)的主體,致力于從科學(xué)數(shù)據(jù)安全管理、個(gè)人信息保護(hù)、科研誠(chéng)信、科研倫理、知識(shí)產(chǎn)權(quán)保護(hù)等方面,促進(jìn)科學(xué)數(shù)據(jù)的安全有序開放共享,保障國(guó)家、機(jī)構(gòu)和個(gè)人的合法權(quán)益。耶魯大學(xué)發(fā)布《數(shù)據(jù)分類政策(Data Classification Policy)》,著力從分類分級(jí)保護(hù)入手,實(shí)現(xiàn)數(shù)據(jù)分級(jí)管理方面的有效性。哈佛大學(xué)《通用數(shù)據(jù)保護(hù)條例(GDPR)研究指南(General Data Protection Regulation (GDPR) Research Guidance)》《個(gè)人數(shù)據(jù)保護(hù)人類基因組數(shù)據(jù)共享政策與程序(Policy and Procedures for Human Genomic Data Sharing)》,美國(guó)耶魯大學(xué)《人類研究記錄與生物標(biāo)本保存與轉(zhuǎn)移(Human Research Record and Biological Specimen Retention and Transfer)》,英國(guó)愛丁堡大學(xué)《數(shù)據(jù)保護(hù)指南(Data Protection Handbook)》《數(shù)據(jù)保護(hù)影響評(píng)估指南個(gè)人數(shù)據(jù)保護(hù)(Data Protection Impact Assessment Guidance)》,加拿大多倫多大學(xué)《在調(diào)查研究中個(gè)人隱私保護(hù)最佳實(shí)踐(Best Practices for Protecting Individual Privacy in Conducting Survey Research)》等政策文件,規(guī)范對(duì)發(fā)布或共享涉及人類參與者的科學(xué)數(shù)據(jù)的開放共享工作?!犊蒲杏涗浥c數(shù)據(jù)保存與維護(hù)指南(Research Records and Data Retention and Maintenance Guidance)》從保存范圍、保存期限、分類分級(jí)保管、歸檔處置等方面規(guī)范科研檔案管理工作。國(guó)際大型出版機(jī)構(gòu)和頂尖期刊鼓勵(lì)或要求作者提交研究數(shù)據(jù),并嚴(yán)格把控?cái)?shù)據(jù)的質(zhì)量和可用性,如《Nature》《Science》和《PNAS》等期刊要求作者公開提供數(shù)據(jù)和材料,并確保數(shù)據(jù)的透明度和可重復(fù)性。英國(guó)生物樣本庫(kù)(UK Biobank)和美國(guó)國(guó)家生物技術(shù)信息中心(NCBI)這些平臺(tái)通過共享大量的生物醫(yī)學(xué)數(shù)據(jù),促進(jìn)了新藥研發(fā)和疾病治療的研究,而且通過嚴(yán)格的質(zhì)量控制和標(biāo)準(zhǔn)化的數(shù)據(jù)管理,確保了數(shù)據(jù)的可靠性和可用性[4]。中國(guó)科學(xué)院建成“科學(xué)數(shù)據(jù)銀行”(ScienceDB)這一開放可信的通用型科學(xué)數(shù)據(jù)存儲(chǔ)與發(fā)布平臺(tái),提供多種數(shù)據(jù)共享方式與數(shù)據(jù)許可協(xié)議,并致力于出版符合主流數(shù)據(jù)標(biāo)準(zhǔn)或慣例的科學(xué)數(shù)據(jù)。全球科研、出版機(jī)構(gòu)及高校在促進(jìn)科學(xué)數(shù)據(jù)可信、可靠、合規(guī)共享方面付出積極的實(shí)踐及努力。
4 "科學(xué)數(shù)據(jù)全球開放共享面臨的安全問題與挑戰(zhàn)
面臨著復(fù)雜的國(guó)際形勢(shì)及開放數(shù)據(jù)的全球化需
求,將安全要素貫穿創(chuàng)新全過程實(shí)現(xiàn)科學(xué)數(shù)據(jù)價(jià)值創(chuàng)造,實(shí)現(xiàn)安全與發(fā)展的平衡尤為重要。歐美等國(guó)的長(zhǎng)期實(shí)踐為我們提供了可借鑒的思路,但仍需從我國(guó)國(guó)情出發(fā),深入分析科學(xué)數(shù)據(jù)全球開放共享為我國(guó)帶來的安全問題與挑戰(zhàn)。施普林格·自然與Digital Science公司、Figshare知識(shí)庫(kù)聯(lián)合發(fā)布2023年度《開放數(shù)據(jù)狀況報(bào)告(The State of Open Data 2023)》,從數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)(FAIR原則)、開放數(shù)據(jù)信任度、數(shù)據(jù)管理計(jì)劃等在確保數(shù)據(jù)安全合規(guī)共享中的重要性等方面提出全球面臨的挑戰(zhàn),對(duì)我們給予很大的啟發(fā)。
4.1 "數(shù)據(jù)合規(guī)共享問題
科學(xué)數(shù)據(jù)合規(guī)共享對(duì)于確保數(shù)據(jù)共享活動(dòng)遵守?cái)?shù)據(jù)保護(hù)法律、個(gè)人隱私、知識(shí)產(chǎn)權(quán)法規(guī)、跨境數(shù)據(jù)傳輸規(guī)定等方面相關(guān)的法律法規(guī)、政策標(biāo)準(zhǔn)和社會(huì)倫理要求尤為重要,關(guān)系到國(guó)家安全及人民利益。
4.1.1 "數(shù)據(jù)分類分級(jí)有待面向各學(xué)科領(lǐng)域細(xì)化
有效的數(shù)據(jù)分類分級(jí)是科學(xué)數(shù)據(jù)安全流轉(zhuǎn)的基礎(chǔ)和核心,幫助數(shù)據(jù)中心、科研機(jī)構(gòu)制定安全防護(hù)基線,規(guī)范數(shù)據(jù)安全保護(hù)活動(dòng),支持監(jiān)管部門對(duì)科學(xué)數(shù)據(jù)實(shí)施有效管理。《科學(xué)數(shù)據(jù)管理辦法》《中國(guó)科學(xué)院科學(xué)數(shù)據(jù)管理與開放共享辦法》均提出,科學(xué)數(shù)據(jù)應(yīng)遵循分級(jí)管理原則,確定各級(jí)別/類別數(shù)據(jù)的開放共享?xiàng)l件,強(qiáng)調(diào)了數(shù)據(jù)中心對(duì)科學(xué)數(shù)據(jù)進(jìn)行分級(jí)分類的職責(zé)。當(dāng)前,我國(guó)科學(xué)數(shù)據(jù)分類分級(jí)規(guī)則以學(xué)科領(lǐng)域制定為主。衛(wèi)星對(duì)地觀測(cè)科學(xué)、海洋科學(xué)、能源科學(xué)等領(lǐng)域較早發(fā)布了相關(guān)指導(dǎo)性文件??茖W(xué)數(shù)據(jù)主要來源于各學(xué)科領(lǐng)域的科研活動(dòng),更關(guān)注數(shù)據(jù)的專業(yè)性和學(xué)術(shù)性,因此,需要更適合學(xué)科自身特點(diǎn)的數(shù)據(jù)分類分級(jí)機(jī)制。然而,由于學(xué)科領(lǐng)域眾多及數(shù)據(jù)間差異巨大、交叉學(xué)科的發(fā)展,為數(shù)據(jù)分類分級(jí)帶來巨大的挑戰(zhàn),有待面向多學(xué)科領(lǐng)域提出動(dòng)態(tài)、精細(xì)化的數(shù)據(jù)分類分級(jí)規(guī)范。
4.1.2 "數(shù)據(jù)無序流轉(zhuǎn)引發(fā)重大安全風(fēng)險(xiǎn)
科學(xué)數(shù)據(jù)跨地域、跨國(guó)別共享是開放科學(xué)的基本需求。然而,跨境數(shù)據(jù)流動(dòng)涵蓋數(shù)據(jù)主權(quán)與國(guó)際競(jìng)爭(zhēng)、法律適用及管轄權(quán)、隱私與安全等多種復(fù)雜元素。
數(shù)據(jù)主權(quán)與國(guó)際競(jìng)爭(zhēng)方面,科學(xué)數(shù)據(jù)的無序外流正嚴(yán)重侵害著我國(guó)的數(shù)據(jù)主權(quán)??茖W(xué)數(shù)據(jù)的持續(xù)有序流轉(zhuǎn)以公平性、合理性、共同發(fā)展為重要原則。當(dāng)前,不同國(guó)家和地區(qū)在科學(xué)數(shù)據(jù)的獲取、處理和存儲(chǔ)能力方面的巨大差異造成全球開放科學(xué)發(fā)展不平衡已成為既定事實(shí)。科學(xué)資源、科技成果的“虹吸效應(yīng)”仍在加劇,一些國(guó)家和地區(qū)無法獲得足夠的科學(xué)數(shù)據(jù),甚至自身的有價(jià)值科學(xué)數(shù)據(jù)長(zhǎng)期流失,非對(duì)等共享交換導(dǎo)致數(shù)據(jù)主權(quán)和話語權(quán)的喪失,無法公平地參與全球科學(xué)合作和競(jìng)爭(zhēng)。長(zhǎng)期以來,美國(guó)以“促進(jìn)數(shù)據(jù)自由流動(dòng)”政策形成引流效應(yīng),引發(fā)我國(guó)科學(xué)數(shù)據(jù)及成果的傳播對(duì)其權(quán)威數(shù)據(jù)庫(kù)的嚴(yán)重依賴,科研創(chuàng)新過程對(duì)其數(shù)據(jù)處理軟件的依賴,對(duì)我國(guó)的數(shù)據(jù)主權(quán)、自主創(chuàng)新和科技安全產(chǎn)生深遠(yuǎn)影響。在這一背景下,數(shù)據(jù)的合理使用和利益分配也成為科學(xué)數(shù)據(jù)有序流轉(zhuǎn)的阻礙,需要合理地平衡各方利益和付出。例如,重大理論發(fā)展和科學(xué)突破對(duì)先進(jìn)實(shí)驗(yàn)裝備和重大科技基礎(chǔ)設(shè)施等科研條件提出了更高的要求,科學(xué)大裝置數(shù)據(jù)共享在“非數(shù)據(jù)開放期”內(nèi)泄露或流失,將使科技成果和創(chuàng)新能力遭受損失。我國(guó)在《全球數(shù)據(jù)安全倡議》提出,“各國(guó)有責(zé)任和權(quán)利保護(hù)涉及本國(guó)國(guó)家安全、公共安全、經(jīng)濟(jì)安全和社會(huì)穩(wěn)定的重要數(shù)據(jù)及個(gè)人信息安全”。英國(guó)這一方面通過立法進(jìn)行了規(guī)定,提出“研究數(shù)據(jù)創(chuàng)建者在適當(dāng)且明確的期限內(nèi)擁有合理的首次使用權(quán),但因?qū)W科而異”??茖W(xué)數(shù)據(jù)的無序外流,為我們敲響了警鐘,在全球范圍內(nèi)推動(dòng)科學(xué)數(shù)據(jù)的開放共享需要各方共同努力,需以國(guó)家安全為前提,以合規(guī)為指引,保護(hù)各方合法權(quán)益,促進(jìn)全球科學(xué)數(shù)據(jù)的共同發(fā)展。科學(xué)數(shù)據(jù)的無序外流也體現(xiàn)了我國(guó)在科研創(chuàng)新激勵(lì)政策和制度方面的不健全,亟待提升科研成果本土發(fā)表的國(guó)內(nèi)外認(rèn)可度。
法律適用及管轄權(quán)方面,科學(xué)數(shù)據(jù)全球性開放共享尚未形成統(tǒng)一的規(guī)則,以區(qū)域或領(lǐng)域合作規(guī)則制定為主。我國(guó)對(duì)數(shù)據(jù)出境進(jìn)行安全評(píng)估是保障數(shù)據(jù)合規(guī)跨境流轉(zhuǎn)的主要手段。2023年9月,網(wǎng)信部門發(fā)布《規(guī)范和促進(jìn)數(shù)據(jù)跨境流動(dòng)規(guī)定(征求意見稿)》提出,“國(guó)際貿(mào)易、學(xué)術(shù)合作、跨國(guó)生產(chǎn)制造和市場(chǎng)營(yíng)銷等活動(dòng)中產(chǎn)生的數(shù)據(jù)出境,不包含個(gè)人信息或者重要數(shù)據(jù)的,不需要申報(bào)數(shù)據(jù)出境安全評(píng)估、訂立個(gè)人信息出境標(biāo)準(zhǔn)合同、通過個(gè)人信息保護(hù)認(rèn)證”,為科學(xué)數(shù)據(jù)的跨境共享提供了合規(guī)指引。然而,在個(gè)人信息或者重要數(shù)據(jù)方面,仍存在著評(píng)估及界定不足的情況,包括范圍不明確、分類分級(jí)不清晰準(zhǔn)確、風(fēng)險(xiǎn)管理不充分等問題,使得面臨跨境流轉(zhuǎn)安全風(fēng)險(xiǎn),損害國(guó)家和民眾的利益。2023年12月商務(wù)部、科技部修訂發(fā)布《中國(guó)禁止出口限制出口技術(shù)目錄》,促進(jìn)我國(guó)的技術(shù)進(jìn)步和創(chuàng)新發(fā)展,保護(hù)我國(guó)的合法權(quán)益,提高國(guó)際競(jìng)爭(zhēng)力。其中,新增用于人的細(xì)胞克隆和基因編輯技術(shù)為禁止類技術(shù)條目,新增農(nóng)作物雜交優(yōu)勢(shì)利用技術(shù)、激光雷達(dá)系統(tǒng)等2項(xiàng)限制出口的技術(shù)條目,對(duì)保障我國(guó)科技安全具有重要的意義。
4.1.3 "敏感學(xué)科領(lǐng)域數(shù)據(jù)流轉(zhuǎn)安全有待增強(qiáng)
敏感學(xué)科領(lǐng)域的數(shù)據(jù)涉及國(guó)家安全和民族利益,如航天、核能、生物技術(shù)等敏感領(lǐng)域。習(xí)近平總書記強(qiáng)調(diào)“生物安全關(guān)乎人民生命健康,關(guān)乎國(guó)家長(zhǎng)治久安,關(guān)乎中華民族永續(xù)發(fā)展,是國(guó)家總體安全的重要組成部分,也是影響乃至重塑世界格局的重要力量?!笨茖W(xué)數(shù)據(jù)類別廣泛,往往涉及基因、生物特征、身份識(shí)別、地理位置信息等個(gè)人敏感信息,可能為個(gè)人隱私、道德倫理帶來高度風(fēng)險(xiǎn)。2016年,中國(guó)人類遺傳資源管理辦公室調(diào)查發(fā)現(xiàn)蘇州某藥品開發(fā)公司涉嫌違反人類遺傳資源管理規(guī)定,未經(jīng)許可將5165份人類遺傳資源(人血清)作為犬血漿違規(guī)出境。我國(guó)國(guó)家安全機(jī)關(guān)在一起涉及生物安全領(lǐng)域案件中發(fā)現(xiàn),境外某非政府組織以開展生物物種調(diào)研方式采集各地生物物種分布數(shù)據(jù)信息并源源不斷地傳輸?shù)骄惩猓瑢?duì)我國(guó)生物安全、生態(tài)安全造成潛在危害。李宜展等深入剖析了學(xué)科領(lǐng)域的差異對(duì)科學(xué)數(shù)據(jù)安全邊界的差異性影響,闡述了敏感學(xué)科數(shù)據(jù)限制共享的必要性[5]。目前國(guó)際上對(duì)敏感學(xué)科領(lǐng)域數(shù)據(jù)的共享采取限制政策。例如,歐盟GDPR明確指出“應(yīng)禁止處理揭示種族或民族背景、政治觀念、宗教或哲學(xué)信仰,或工會(huì)成員的個(gè)人數(shù)據(jù)、基因數(shù)據(jù)、以唯一識(shí)別自然人為目的的生物特征數(shù)據(jù)”。美國(guó)提出了《基因組學(xué)支出和國(guó)家安全增強(qiáng)法案(The Genomics Expenditures and National Security Enhancement Act)》與《基因組學(xué)數(shù)據(jù)安全法案(The Genomics Data Security Act)》,限制、監(jiān)管基因數(shù)據(jù)的采集和共享。
4.2 "科學(xué)數(shù)據(jù)可信可靠流轉(zhuǎn)生態(tài)問題
4.2.1 "可信數(shù)據(jù)共享成為主要挑戰(zhàn)
科學(xué)數(shù)據(jù)可信可靠共享是科研人員及科學(xué)機(jī)構(gòu)最關(guān)注的問題之一[6],能夠提升科研效率,促進(jìn)國(guó)際合作,加速科學(xué)知識(shí)和知識(shí)創(chuàng)新的進(jìn)程,也是目前全球的重大挑戰(zhàn)之一。科學(xué)數(shù)據(jù)在各機(jī)構(gòu)、系統(tǒng)流轉(zhuǎn)的過程,從源頭來說,數(shù)據(jù)出處的不透明性、數(shù)據(jù)收集者的專業(yè)性和誠(chéng)信度差,會(huì)影響數(shù)據(jù)使用者對(duì)其來源的信任,數(shù)據(jù)非授權(quán)篡改、偽造、不當(dāng)?shù)拇鎯?chǔ)和管理、缺乏標(biāo)準(zhǔn)化的流程等問題,導(dǎo)致完整性遭到破壞,數(shù)據(jù)收集方法和工具未經(jīng)校準(zhǔn)或使用不當(dāng),數(shù)據(jù)處理和清洗、數(shù)據(jù)集成和融合不當(dāng)會(huì)導(dǎo)致數(shù)據(jù)誤差,可靠性則不能保證。在數(shù)據(jù)采集、處理步驟或關(guān)于數(shù)據(jù)管理信息等可信信息缺乏情況下,科研人員對(duì)數(shù)據(jù)的信任或理解將明顯降低。一方面,如果個(gè)人或機(jī)構(gòu)共享的科學(xué)數(shù)據(jù)不可信,那么基于這些數(shù)據(jù)得出的科研結(jié)果和知識(shí)往往會(huì)受到質(zhì)疑,由此產(chǎn)生的鏈?zhǔn)椒磻?yīng)嚴(yán)重影響領(lǐng)域科研創(chuàng)新及知識(shí)體系的發(fā)展。其次,不可信的科研數(shù)據(jù)將導(dǎo)致科研資源的極大浪費(fèi),不僅包括實(shí)驗(yàn)設(shè)備、材料等物質(zhì)資源,還包括科研人員的時(shí)間和精力等人力資源。更有甚者,個(gè)人或機(jī)構(gòu)發(fā)布的科學(xué)數(shù)據(jù)不可信,將引發(fā)對(duì)個(gè)人學(xué)術(shù)不端行為的質(zhì)疑,影響個(gè)人或機(jī)構(gòu)的學(xué)術(shù)聲譽(yù)。此外,還會(huì)影響決策制定和社會(huì)應(yīng)用,使得科研活動(dòng)的公信度受到損害。
4.2.2 "科學(xué)數(shù)據(jù)的FAIR化程度尚待提升
科學(xué)數(shù)據(jù)的FAIR(Findable,Accessible,Interoperable,Reusable)原則是國(guó)際開放科學(xué)的指導(dǎo)性原則,有助于消除不同學(xué)科領(lǐng)域、不同地域的科學(xué)數(shù)據(jù)存儲(chǔ)格式、元數(shù)據(jù)格式、引用方式等方面的差異,破除科學(xué)數(shù)據(jù)開放獲取的障礙,已成為科學(xué)組織及機(jī)構(gòu)的共識(shí)性原則。2014年,荷蘭萊頓舉辦的洛倫茲研討會(huì)(Lorentz workshop)首次提出FAIR原則理念[7]。2016年,G20杭州峰會(huì)上,G20領(lǐng)導(dǎo)人發(fā)表聲明,支持將FAIR原則應(yīng)用于研究。
FAIR原則是衡量科學(xué)數(shù)據(jù)質(zhì)量和可用性的重要標(biāo)準(zhǔn),為可信可靠共享提供保障。多年來,我國(guó)數(shù)據(jù)倉(cāng)儲(chǔ)的FAIR化程度不斷提升,在空間科學(xué)、基因科學(xué)等領(lǐng)域?qū)崿F(xiàn)了與國(guó)際的接軌。豐富的元數(shù)據(jù)信息是保障數(shù)據(jù)可發(fā)現(xiàn)性的重要手段,我國(guó)國(guó)家青藏高原科學(xué)數(shù)據(jù)中心為研究人員提供描述性、技術(shù)性等豐富的元數(shù)據(jù)信息,從關(guān)鍵詞、時(shí)空范圍、引用方式、項(xiàng)目信息、數(shù)據(jù)貢獻(xiàn)者等多個(gè)方面對(duì)數(shù)據(jù)進(jìn)行了詳細(xì)描述,進(jìn)一步提高了數(shù)據(jù)的可發(fā)現(xiàn)性[8]。中國(guó)-歐盟海洋數(shù)據(jù)互操作系統(tǒng)實(shí)現(xiàn)了中歐異構(gòu)海洋數(shù)據(jù)的共享和互操作,為中歐海洋“藍(lán)色伙伴關(guān)系”貢獻(xiàn)了力量[9]。但需看到的是,眾多學(xué)科領(lǐng)域FAIR化程度尚待提升。目前,國(guó)內(nèi)數(shù)據(jù)倉(cāng)儲(chǔ)的許可方式相對(duì)簡(jiǎn)單,難以滿足多種數(shù)據(jù)可訪問性的需求,需要在數(shù)據(jù)共享許可協(xié)議方式、數(shù)據(jù)長(zhǎng)期保存、免費(fèi)數(shù)據(jù)服務(wù)、專業(yè)詞表、數(shù)據(jù)訪問方式等方面進(jìn)一步提高。數(shù)據(jù)可查找的一個(gè)重要手段是為數(shù)據(jù)(元數(shù)據(jù))分配全球唯一且永久的標(biāo)識(shí)符(DOI),這也被認(rèn)為是FAIR化的重要指標(biāo)?!吨袊?guó)開放數(shù)據(jù)白皮書(2023)》在20個(gè)國(guó)家科學(xué)數(shù)據(jù)中心調(diào)查顯示,有10個(gè)數(shù)據(jù)中心為數(shù)據(jù)分配了DOI,其中6個(gè)僅覆蓋部分?jǐn)?shù)據(jù),占比60%,有14個(gè)數(shù)據(jù)中心為數(shù)據(jù)分配了中國(guó)科技資源標(biāo)識(shí)符(CSTR),占比達(dá)70%,其中3個(gè)僅覆蓋部分?jǐn)?shù)據(jù)CSTR [3]??茖W(xué)數(shù)據(jù)倉(cāng)儲(chǔ)FAIR化程度低可能為開放共享帶來一系列阻礙。數(shù)據(jù)共享和重用受限制、數(shù)據(jù)的準(zhǔn)確性和可靠性難以保證,研究人員可能需要花費(fèi)更多的時(shí)間和精力去獲取、處理和分析數(shù)據(jù),這可能會(huì)導(dǎo)致降低科研效率以及阻礙跨學(xué)科合作等系列問題。
4.2.3 "平臺(tái)和基礎(chǔ)設(shè)施安全有待加強(qiáng)
開放科學(xué)基礎(chǔ)設(shè)施是科學(xué)數(shù)據(jù)的承載主體,數(shù)據(jù)開放獲取及出版的重要途徑,其長(zhǎng)期可靠性及可用性面臨著巨大挑戰(zhàn)。
(1) 本地存儲(chǔ)備份長(zhǎng)期可靠性挑戰(zhàn)
科學(xué)數(shù)據(jù)與一般數(shù)據(jù)的一個(gè)重要區(qū)別是長(zhǎng)期存儲(chǔ),它是開放科學(xué)公平、透明、可復(fù)用的需求。科學(xué)數(shù)據(jù)的有效備份為后續(xù)的研究人員的驗(yàn)證和重復(fù)實(shí)驗(yàn)提供基礎(chǔ)數(shù)據(jù),提高科學(xué)研究的透明度和可重復(fù)性,更有助于研究人員更深入地了解自然現(xiàn)象、揭示科學(xué)規(guī)律、推動(dòng)科學(xué)技術(shù)進(jìn)步。不僅氣候數(shù)據(jù)、天文數(shù)據(jù)、生物多樣性數(shù)據(jù)等對(duì)于環(huán)境監(jiān)測(cè)、氣候變化研究、生態(tài)保護(hù)等方面的工作至關(guān)重要。一些珍貴的科學(xué)實(shí)驗(yàn)數(shù)據(jù)、歷史觀測(cè)數(shù)據(jù)等對(duì)于人類文明的發(fā)展具有重要的意義,需要進(jìn)行傳承。當(dāng)前,海量科學(xué)數(shù)據(jù)的存儲(chǔ)面臨多方面的挑戰(zhàn):技術(shù)方面,存儲(chǔ)設(shè)備可靠性、數(shù)據(jù)定期遷移有效性、備份工具及存儲(chǔ)系統(tǒng)的長(zhǎng)期可用性決定科學(xué)數(shù)據(jù)是否可用、可靠,尚未得到有效解決;管理方面,存在數(shù)據(jù)長(zhǎng)期存儲(chǔ)過程由于資金的不足或管理不善導(dǎo)致數(shù)據(jù)丟失以及對(duì)服務(wù)提供商的過度依賴問題。
(2) 針對(duì)平臺(tái)和基礎(chǔ)設(shè)施的攻擊日益嚴(yán)峻
開放科學(xué)基礎(chǔ)設(shè)施聚集了存儲(chǔ)、算力、網(wǎng)絡(luò)的數(shù)據(jù)流轉(zhuǎn)及處理環(huán)境,使其成為數(shù)據(jù)高度匯聚、跨域頻繁流動(dòng)節(jié)點(diǎn),極易成為網(wǎng)絡(luò)攻擊利益最大化的目標(biāo)。近年來,全球關(guān)鍵信息基礎(chǔ)設(shè)施頻繁受到勒索軟件攻擊、DDOS攻擊及供應(yīng)鏈攻擊,導(dǎo)致數(shù)據(jù)大規(guī)模泄露、可用性受到極大影響,據(jù)不完全統(tǒng)計(jì),僅2022年,全球主要關(guān)鍵基礎(chǔ)設(shè)施安全事件高達(dá)60余件,呈逐年增加的趨勢(shì)。此外,基礎(chǔ)設(shè)施之間及其與數(shù)據(jù)處理使用者之間交互的增強(qiáng),導(dǎo)致數(shù)據(jù)開放接口增多,從而帶來了數(shù)據(jù)濫用、篡改的安全風(fēng)險(xiǎn)。
4.3 "科學(xué)數(shù)據(jù)內(nèi)容安全問題
科學(xué)數(shù)據(jù)內(nèi)容安全涉及數(shù)據(jù)交叉融合安全及AI for science引發(fā)的安全風(fēng)險(xiǎn)等方面。
4.3.1 "數(shù)據(jù)交叉融合安全存在高隱藏性風(fēng)險(xiǎn)
多源、多學(xué)科、多時(shí)空的科學(xué)數(shù)據(jù)不斷匯集帶來數(shù)據(jù)交叉融合方面的問題。數(shù)據(jù)的規(guī)模、精度呈現(xiàn)動(dòng)態(tài)的變化,原有的安全邊界不斷被打破,導(dǎo)致隱私信息、隱私屬性及隱私關(guān)聯(lián)的泄露,失去對(duì)數(shù)據(jù)安全的控制。李宜展等分析了數(shù)據(jù)規(guī)模匯聚、精度變化對(duì)數(shù)據(jù)敏感性的影響,引發(fā)我們對(duì)數(shù)據(jù)交叉融合后內(nèi)容敏感性的重視[5]?!秱€(gè)人數(shù)據(jù)保護(hù)法》給出相關(guān)規(guī)定,“處理個(gè)人信息達(dá)到國(guó)家網(wǎng)信部門規(guī)定數(shù)量的個(gè)人信息處理者應(yīng)當(dāng)指定個(gè)人信息保護(hù)負(fù)責(zé)人,負(fù)責(zé)對(duì)個(gè)人信息處理活動(dòng)以及采取的保護(hù)措施等進(jìn)行監(jiān)督?!边@一安全威脅往往是高度隱藏的,難于發(fā)現(xiàn)和評(píng)估。此外,原本不具有敏感性的數(shù)據(jù),由于使用者的背景知識(shí)及推理能力,敏感性呈動(dòng)態(tài)變化的趨勢(shì)。例如,基于行蹤軌跡背景知識(shí)信息,獲取高精度位置信息,導(dǎo)致個(gè)人空間位置信息等泄露,侵犯?jìng)€(gè)人隱私。
4.3.2 "AI for science為數(shù)據(jù)安全帶來新的風(fēng)險(xiǎn)
人工智能、量子技術(shù)主導(dǎo)的推理能力的提升是導(dǎo)致科學(xué)數(shù)據(jù)所承載的隱私、關(guān)鍵信息泄露的關(guān)鍵因素。由于融合、關(guān)聯(lián)、挖掘能力的提升,算法加速能力與深度學(xué)習(xí)、自然語言處理等技術(shù)相結(jié)合,能夠從科學(xué)數(shù)據(jù)中準(zhǔn)確挖掘、關(guān)聯(lián)并提取更多的隱含信息。而被認(rèn)為具有極大潛力的隱私計(jì)算等先進(jìn)安全技術(shù),也面臨著算法漏洞、數(shù)據(jù)污染、可信性難以驗(yàn)證、可解釋性差等自身的安全問題。以生成式人工智能為例,ChatGPT發(fā)布以來對(duì)科學(xué)研究活動(dòng)產(chǎn)生重要影響,眾多科研工作者利用其進(jìn)行文獻(xiàn)梳理、分析甚至寫作。麻省理工在Science上的最新刊文顯示,其通過實(shí)驗(yàn)發(fā)現(xiàn)ChatGPT顯著提高生產(chǎn)力,對(duì)于科研人員的寫作任務(wù),平均耗時(shí)減少40%,產(chǎn)出質(zhì)量提高18% [10]。然而,ChatGPT在提升科研效率的同時(shí),通過與人類不斷交互,針對(duì)性收集各學(xué)科領(lǐng)域的海量信息,對(duì)于安全意識(shí)薄弱的科研人員,甚至?xí)孤睹舾械目茖W(xué)信息。此外,人工智能算法的公平性、可解釋性、魯棒性、隱私性均無法得到保障,從而引發(fā)可能導(dǎo)致巨大的數(shù)據(jù)及個(gè)人隱私泄露的風(fēng)險(xiǎn)。最新發(fā)表在安全頂刊USENIX上的論文顯示,被稱為人工智能未來的“合成數(shù)據(jù)”,其隱私保護(hù)效果尚未得到有效證實(shí)[11]。
5 "科學(xué)數(shù)據(jù)安全戰(zhàn)略思考及對(duì)策研究
目前,尚沒有對(duì)科學(xué)數(shù)據(jù)安全的明確定義。即將發(fā)布的國(guó)家標(biāo)準(zhǔn)《科學(xué)數(shù)據(jù)安全要求通則》將科學(xué)數(shù)據(jù)安全定義為通過管理和技術(shù)措施,針對(duì)國(guó)家安全、科技安全、社會(huì)公共利益和他人合法權(quán)益,確??茖W(xué)數(shù)據(jù)持續(xù)得到有效保護(hù)和合規(guī)利用的狀態(tài)。科學(xué)數(shù)據(jù)的安全目標(biāo)應(yīng)以國(guó)家安全、人民利益為底線,實(shí)現(xiàn)科學(xué)數(shù)據(jù)創(chuàng)新發(fā)展與安全的平衡,兼顧個(gè)人信息的保護(hù)??茖W(xué)數(shù)據(jù)安全規(guī)劃對(duì)確??茖W(xué)數(shù)據(jù)的可信性、可靠性和合規(guī)流轉(zhuǎn)具有重要意義。應(yīng)從政策法規(guī)、技術(shù)、風(fēng)險(xiǎn)評(píng)估與管理、監(jiān)督審計(jì)和持續(xù)改進(jìn)等多個(gè)方面進(jìn)行全面考慮。這些方面相互關(guān)聯(lián),共同構(gòu)建了一個(gè)全面的科學(xué)數(shù)據(jù)安全框架,有效地應(yīng)對(duì)科學(xué)數(shù)據(jù)安全所面臨的挑戰(zhàn),促進(jìn)科學(xué)研究的可持續(xù)發(fā)展。
5.1 "以完善的政策體系踐行我國(guó)科學(xué)數(shù)據(jù)安全觀,建設(shè)科學(xué)數(shù)據(jù)安全合規(guī)流轉(zhuǎn)支撐體系
當(dāng)前,我國(guó)基本形成“邊共享、邊保護(hù)”“以保護(hù)促共享”的科學(xué)數(shù)據(jù)安全觀,但在相關(guān)政策及實(shí)施指南的發(fā)布上仍顯不足,無法支撐我國(guó)構(gòu)建開放、有序、安全的創(chuàng)新科研場(chǎng)景及開放創(chuàng)新生態(tài)。楊衛(wèi)等[12]對(duì)全球開放科學(xué)的調(diào)研顯示,相較于歐美等國(guó)家政策文件逐年增加的趨勢(shì),我國(guó)的政策無論從數(shù)量、增長(zhǎng)速度上均處于落后狀態(tài)。當(dāng)前,我國(guó)主要基于《數(shù)據(jù)安全法》《網(wǎng)絡(luò)安全法》等指導(dǎo)科學(xué)數(shù)據(jù)安全合規(guī)實(shí)踐,尚無面向科學(xué)數(shù)據(jù)的安全法規(guī)及實(shí)施標(biāo)準(zhǔn)、指南等。我國(guó)近年來在標(biāo)準(zhǔn)體系研究、制定、發(fā)布方面取得顯著的進(jìn)展。朱艷華等[13]深入分析了科學(xué)數(shù)據(jù)安全的特點(diǎn)與特征,提出了科學(xué)數(shù)據(jù)安全標(biāo)準(zhǔn)的五個(gè)重點(diǎn)研究方向,即科學(xué)數(shù)據(jù)安全框架、科學(xué)數(shù)據(jù)安全分級(jí)分類、科學(xué)數(shù)據(jù)權(quán)益保護(hù)、科學(xué)數(shù)據(jù)全生命周期安全以及領(lǐng)域科技資源安全,對(duì)我國(guó)科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)體系的形成提供了良好的理論基礎(chǔ)。廖方宇等[14]深度研究我國(guó)科學(xué)數(shù)據(jù)安全現(xiàn)狀,提出缺乏科學(xué)有效的數(shù)據(jù)安全標(biāo)準(zhǔn)規(guī)范是實(shí)現(xiàn)“保護(hù)-共享”平衡的關(guān)鍵短板。此外,我國(guó)多項(xiàng)科學(xué)數(shù)據(jù)相關(guān)標(biāo)準(zhǔn)獲得立項(xiàng)和發(fā)布實(shí)施。2019年國(guó)家重點(diǎn)研發(fā)計(jì)劃“國(guó)家質(zhì)量基礎(chǔ)的共性技術(shù)研究與應(yīng)用”重點(diǎn)專項(xiàng)設(shè)立“科學(xué)數(shù)據(jù)安全技術(shù)及基礎(chǔ)技術(shù)標(biāo)準(zhǔn)研究”項(xiàng)目,提出適合我國(guó)且貫穿全生存周期的科學(xué)數(shù)據(jù)安全框架及安全標(biāo)準(zhǔn)體系,包括了科學(xué)數(shù)據(jù)安全通則、安全分類分級(jí)、權(quán)益保護(hù)、溯源描述和安全審計(jì)等5項(xiàng)國(guó)家標(biāo)準(zhǔn),科學(xué)數(shù)據(jù)安全管理指南、安全能力成熟度模型、安全防護(hù)技術(shù)要求、傳輸安全技術(shù)要求等10余項(xiàng)團(tuán)體標(biāo)準(zhǔn),科學(xué)數(shù)據(jù)安全標(biāo)準(zhǔn)體系建設(shè)成效初顯。
我國(guó)應(yīng)該在現(xiàn)有政策基礎(chǔ)上,進(jìn)一步加強(qiáng)頂層設(shè)計(jì),制定國(guó)家科學(xué)數(shù)據(jù)安全戰(zhàn)略或行動(dòng)計(jì)劃,指導(dǎo)實(shí)現(xiàn)學(xué)科、交叉及跨境科學(xué)數(shù)據(jù)安全開放共享,推進(jìn)開放共享考核激勵(lì)機(jī)制,進(jìn)一步推動(dòng)我國(guó)開放科學(xué)的進(jìn)程。
5.2 "以高質(zhì)量的數(shù)據(jù)安全管理建立開放共享生態(tài),推進(jìn)科學(xué)數(shù)據(jù)可信可靠共享
高質(zhì)量的數(shù)據(jù)安全管理措施能夠增強(qiáng)數(shù)據(jù)的可信性、可靠性及可用性,推動(dòng)我國(guó)科研成果、數(shù)據(jù)庫(kù)的公信度和權(quán)威性。
數(shù)據(jù)安全管理體系通過規(guī)劃組織的安全戰(zhàn)略方針、總體目標(biāo),制定組織的安全管理制度、合規(guī)基線,解決科學(xué)數(shù)據(jù)數(shù)據(jù)安全“誰來管、管什么、怎么管”的問題,是落實(shí)科學(xué)數(shù)據(jù)安全責(zé)任的需求。以數(shù)據(jù)生命周期為主線進(jìn)行安全管理,能夠把科學(xué)數(shù)據(jù)處理活動(dòng)中相關(guān)的人員、系統(tǒng)、設(shè)備串聯(lián)在一起,從指導(dǎo)、評(píng)估、監(jiān)督三方面實(shí)現(xiàn)數(shù)據(jù)安全的頂層規(guī)劃,有效地指導(dǎo)并落實(shí)數(shù)據(jù)安全保護(hù)責(zé)任。一方面,相關(guān)組織機(jī)構(gòu)應(yīng)根據(jù)自身安全目標(biāo),從安全策略、組織建設(shè)、人力資源管理、管理監(jiān)督等幾個(gè)方面,構(gòu)建對(duì)科學(xué)數(shù)據(jù)全生存周期安全防護(hù)目標(biāo)的指導(dǎo)性原則,明確數(shù)據(jù)安全相關(guān)角色、責(zé)任及權(quán)限,并確保從資源、財(cái)務(wù)等方面給予相應(yīng)的支持,確保能有效指導(dǎo)對(duì)完整性、可用性的需求。另一方面,應(yīng)從分類分級(jí)管理、風(fēng)險(xiǎn)管理、內(nèi)部監(jiān)管等方面進(jìn)一步落實(shí)數(shù)據(jù)安全的頂層規(guī)劃,確保合規(guī)性、可靠性方面的需求。分類分級(jí)管理作為安全管理的最重要環(huán)節(jié)之一,是后續(xù)采取相應(yīng)安全控制措施的依據(jù)及合規(guī)性的硬性要求。風(fēng)險(xiǎn)管理是對(duì)風(fēng)險(xiǎn)識(shí)別、風(fēng)險(xiǎn)分析、風(fēng)險(xiǎn)評(píng)價(jià)和風(fēng)險(xiǎn)處置進(jìn)行指導(dǎo)和監(jiān)督,保障風(fēng)險(xiǎn)可識(shí)別、可控、可度量。內(nèi)部監(jiān)管是從審計(jì)的角度,定期進(jìn)行管理監(jiān)督評(píng)審評(píng)價(jià),保障數(shù)據(jù)安全管理體系的高效運(yùn)行和持續(xù)優(yōu)化。
5.3 "以安全可控的先進(jìn)技術(shù)貫穿數(shù)據(jù)流轉(zhuǎn)全程,建設(shè)科學(xué)數(shù)據(jù)安全可信流通環(huán)境
科學(xué)數(shù)據(jù)開放共享的目標(biāo)是通過協(xié)作促進(jìn)科技創(chuàng)新發(fā)展及賦能。重視新興技術(shù)在促流動(dòng)、促共享方面的作用,積極推動(dòng)數(shù)據(jù)隱私計(jì)算等新技術(shù)、新應(yīng)用的實(shí)施與落地,構(gòu)建自主可控的技術(shù)與產(chǎn)品體系,是實(shí)現(xiàn)賦能我國(guó)經(jīng)濟(jì)、科技的重要技術(shù)需求。
涉及個(gè)人和敏感領(lǐng)域的科學(xué)數(shù)據(jù)流轉(zhuǎn)和使用一直是關(guān)注的重點(diǎn)。當(dāng)前,制約科學(xué)數(shù)據(jù)持有主體開放數(shù)據(jù)的一個(gè)重要原因是對(duì)數(shù)據(jù)控制權(quán)缺失的擔(dān)憂。除從基礎(chǔ)安全的角度,加強(qiáng)個(gè)人和重要科學(xué)數(shù)據(jù)的訪問控制、存儲(chǔ)保護(hù)外,應(yīng)充分利用先進(jìn)技術(shù)的優(yōu)勢(shì),真正建立以數(shù)據(jù)為核心,超越時(shí)間、空間限制的防護(hù)體系,促進(jìn)數(shù)據(jù)流通的同時(shí),增強(qiáng)科研人員及機(jī)構(gòu)對(duì)數(shù)據(jù)共享的可控性、可信性。一方面,利用零信任技術(shù)等對(duì)科學(xué)數(shù)據(jù)的訪問行為進(jìn)行動(dòng)態(tài)控制,通過對(duì)人、設(shè)備、系統(tǒng)的全面、動(dòng)態(tài)、智能的細(xì)粒度授權(quán)、持續(xù)風(fēng)險(xiǎn)評(píng)估和動(dòng)態(tài)權(quán)限控制,為科學(xué)數(shù)據(jù)建立以身份為中心的安全邊界,實(shí)現(xiàn)數(shù)據(jù)隱私安全的延伸控制,使其能夠更加安全、有序流轉(zhuǎn),促進(jìn)科學(xué)數(shù)據(jù)應(yīng)用與安全的平衡。另一方面,利用隱私計(jì)算技術(shù)保障數(shù)據(jù)“可用不可見,可用可計(jì)量”,能夠?qū)崿F(xiàn)對(duì)數(shù)據(jù)所有權(quán)、使用權(quán)的延伸控制,即在確保數(shù)據(jù)所有權(quán)、釋放數(shù)據(jù)使用權(quán)的前提下,進(jìn)一步保障數(shù)據(jù)的控制權(quán)和管轄權(quán),應(yīng)對(duì)科學(xué)數(shù)據(jù)的泄露及濫用風(fēng)險(xiǎn)。主流的隱私計(jì)算技術(shù)包括同態(tài)加密[15]、多方安全計(jì)算[16]、差分隱私[17]、聯(lián)邦學(xué)習(xí)[18]及可信計(jì)算環(huán)境[19]。從是否出域角度,差分隱私、同態(tài)加密通過對(duì)數(shù)據(jù)加噪或加密的方式,使得數(shù)據(jù)的流轉(zhuǎn)過程的隱私性受到保護(hù),同時(shí)能夠滿足數(shù)據(jù)使用的需求,多方安全計(jì)算、聯(lián)邦學(xué)習(xí)則能在數(shù)據(jù)不出本地的前提下,實(shí)現(xiàn)多方數(shù)據(jù)的聯(lián)合分析及建模。盡管上述技術(shù)在實(shí)際落地的過程中仍受到成熟度、性能方面的限制,但其在保障數(shù)據(jù)安全性及合規(guī)性方面具有巨大潛力和應(yīng)用價(jià)值。
5.4 "加強(qiáng)開放數(shù)據(jù)基礎(chǔ)設(shè)施的建設(shè)力度及認(rèn)證評(píng)價(jià)體系,實(shí)現(xiàn)安全可度量、可控的權(quán)威保障
開放數(shù)據(jù)基礎(chǔ)設(shè)施的安全、可靠需從軟、硬實(shí)力兩方面進(jìn)行綜合考慮和實(shí)施。一方面,加強(qiáng)基礎(chǔ)設(shè)施的“硬實(shí)力”建設(shè),以《關(guān)鍵信息基礎(chǔ)設(shè)施安全保護(hù)條例》為法律依據(jù),以《關(guān)鍵信息基礎(chǔ)設(shè)施安全保護(hù)要求》為實(shí)施指引,從物理安全、網(wǎng)絡(luò)安全、系統(tǒng)安全、應(yīng)用安全等方面完善數(shù)據(jù)中心建設(shè),以等級(jí)保護(hù)測(cè)評(píng)和密碼測(cè)評(píng)等為評(píng)價(jià)體系,建設(shè)硬件可靠的數(shù)據(jù)倉(cāng)儲(chǔ)及數(shù)據(jù)服務(wù)平臺(tái)。數(shù)據(jù)存儲(chǔ)備份方面,重視數(shù)據(jù)長(zhǎng)期存儲(chǔ)的可靠性建設(shè),以自主可控的存儲(chǔ)技術(shù)、完善的長(zhǎng)期存儲(chǔ)機(jī)制提供保障。在軟實(shí)力方面,應(yīng)積極在數(shù)據(jù)匯交、規(guī)范管理、可信存儲(chǔ)、權(quán)益保護(hù)、長(zhǎng)期保存和持續(xù)服務(wù)方面,提升開放數(shù)據(jù)基礎(chǔ)設(shè)施開放獲取、開放出版服務(wù)能力,打造高公信度、權(quán)威的數(shù)據(jù)開放平臺(tái)。在此基礎(chǔ)上,順應(yīng)國(guó)際形勢(shì)和需求,應(yīng)加強(qiáng)數(shù)據(jù)中心的FAIR化程度,包括“FAIR化元數(shù)據(jù)”“FAIR化有限開放數(shù)據(jù)”“FAIR化開放數(shù)據(jù)”和“FAIR化增強(qiáng)版開放數(shù)據(jù)” 等形式,增強(qiáng)科學(xué)數(shù)據(jù)的可查找、可訪問、可互操作和可重用程度,提升國(guó)際話語權(quán)和影響力。此外,開放數(shù)據(jù)基礎(chǔ)設(shè)施作為開放創(chuàng)新的重要設(shè)施,應(yīng)積極探索開放創(chuàng)新、合作及公眾科學(xué)領(lǐng)域的發(fā)展路徑,以數(shù)據(jù)眾包等形式積極尋求與企業(yè)單位、社會(huì)公眾的創(chuàng)新合作,賦能我國(guó)經(jīng)濟(jì)的發(fā)展。
5.5 "構(gòu)建動(dòng)態(tài)的開放科學(xué)數(shù)據(jù)共享及監(jiān)管體系,促進(jìn)合規(guī)有序流轉(zhuǎn)
針對(duì)國(guó)際數(shù)據(jù)安全政策的差異,國(guó)際科技合作數(shù)據(jù)共享規(guī)范的不明朗性及新興技術(shù)安全威脅的高隱藏性,建議構(gòu)建動(dòng)態(tài)的開放科學(xué)數(shù)據(jù)共享及監(jiān)管體系,積極探索學(xué)科領(lǐng)域及交叉領(lǐng)域的細(xì)粒度、多維度分類分級(jí)工作,以科學(xué)數(shù)據(jù)的完全共享、限制共享等分級(jí)共享方式,實(shí)現(xiàn)動(dòng)態(tài)監(jiān)管。
(1) 跨境交換監(jiān)管
科學(xué)數(shù)據(jù)的跨境流轉(zhuǎn)是實(shí)現(xiàn)國(guó)際科技合作,提升中國(guó)科技實(shí)力和國(guó)際影響力的重要渠道,我國(guó)也在積極參與國(guó)際創(chuàng)新網(wǎng)絡(luò),確??茖W(xué)數(shù)據(jù)協(xié)同創(chuàng)新應(yīng)用與國(guó)家安全、社會(huì)公眾利益的平衡是一項(xiàng)重要議題。
建議從科學(xué)數(shù)據(jù)的分類分級(jí)管理、積極尋求國(guó)際數(shù)據(jù)跨境共享的合作機(jī)制、建設(shè)跨境基礎(chǔ)設(shè)施等方面實(shí)現(xiàn)科學(xué)數(shù)據(jù)的跨境共享、共用、共創(chuàng)。在分類分級(jí)管理方面,應(yīng)強(qiáng)化基于學(xué)科領(lǐng)域特征,實(shí)現(xiàn)細(xì)粒度、動(dòng)態(tài)的分級(jí)管理措施。強(qiáng)化對(duì)個(gè)人數(shù)據(jù)和核心數(shù)據(jù)的評(píng)估、細(xì)化定級(jí)、識(shí)別及監(jiān)管,保障我國(guó)的核心權(quán)益不受損害。在各國(guó)數(shù)據(jù)跨境法規(guī)迥異甚至相互矛盾的現(xiàn)實(shí)下,積極尋求數(shù)據(jù)跨境共享的國(guó)際合作機(jī)制,建設(shè)完善的數(shù)據(jù)跨境共享平臺(tái),實(shí)現(xiàn)從領(lǐng)域數(shù)據(jù)到交叉領(lǐng)域等多源數(shù)據(jù)的統(tǒng)一獲取、統(tǒng)一監(jiān)管。
(2) 新技術(shù)使用的監(jiān)管
對(duì)于新興技術(shù)的使用,需在政策層面制定明確的指引來規(guī)范其發(fā)展、應(yīng)用和管理,高度重視其在數(shù)據(jù)隱私安全及決策的嚴(yán)謹(jǐn)性方面帶來的挑戰(zhàn)。自2019年11月起,我國(guó)先后出臺(tái)《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》等文件,對(duì)生成合成類內(nèi)容提出不同程度的監(jiān)管要求。國(guó)家互聯(lián)網(wǎng)信息辦公室起草了《生成式人工智能服務(wù)管理辦法(征求意見稿)》,并向社會(huì)公開征求意見??茖W(xué)領(lǐng)域尚未出臺(tái)針對(duì)性的指導(dǎo)文件。確??蒲羞^程各環(huán)節(jié)的詳細(xì)記錄的可溯性和可驗(yàn)證性是對(duì)新興技術(shù)實(shí)施有效監(jiān)管,保障可信度的重要思路。因此,需對(duì)用于重要科學(xué)數(shù)據(jù)處理及分析的新工具、新技術(shù)進(jìn)行充分的評(píng)估,以確保技術(shù)的可靠、可信及安全性。另一方面,也需要關(guān)注軟件供應(yīng)鏈安全,加強(qiáng)技術(shù)研發(fā)的監(jiān)管,確保技術(shù)的原創(chuàng)性,充分認(rèn)識(shí)到生成式人工智能[20]技術(shù)帶來的軟件供應(yīng)鏈安全問題。
6 "結(jié)語
科學(xué)數(shù)據(jù)關(guān)乎國(guó)家安全、科技安全、社會(huì)公共利益和他人合法權(quán)益,在開放科學(xué)背景下,更加凸顯安全與發(fā)展相平衡的重要性。從全球開放科學(xué)發(fā)展趨勢(shì)現(xiàn)狀出發(fā),筆者探討了我國(guó)科學(xué)數(shù)據(jù)開放共享在數(shù)據(jù)安全合規(guī)、可信共享交換、內(nèi)容安全及平臺(tái)和基礎(chǔ)設(shè)施安全方面面臨的問題與挑戰(zhàn),提出以總體國(guó)家安全觀為指引,以促進(jìn)科學(xué)數(shù)據(jù)安全、可信、合規(guī)共享為目標(biāo)的科學(xué)數(shù)據(jù)安全戰(zhàn)略建議,助力科學(xué)機(jī)構(gòu)、團(tuán)體及組織建立可信、高效的科學(xué)數(shù)據(jù)安全流通環(huán)境。具體地,提出構(gòu)建健全的政策體系和管理體系、安全可控的先進(jìn)技術(shù)體系、公信度高的認(rèn)證評(píng)價(jià)體系、完善高效的監(jiān)管體系等方面的建議??茖W(xué)數(shù)據(jù)安全是一項(xiàng)復(fù)雜系統(tǒng)工程,學(xué)科領(lǐng)域眾多、開放數(shù)據(jù)進(jìn)程各異,不同學(xué)科領(lǐng)域尚需根據(jù)各自的發(fā)展現(xiàn)狀,建立更具領(lǐng)域適用性的安全戰(zhàn)略規(guī)劃,從而更好支撐國(guó)家科技創(chuàng)新、經(jīng)濟(jì)社會(huì)發(fā)展。
參考文獻(xiàn)
[1] Persic A, Tiffany S. Open science for all: Implementing the UNESCO Recommendation on Open Science for an equitable and just transition to open science[N]. College amp; Research Libraries News, 2023,84(10): 377-381.DOI:10.5860/crln.84.10.377.
[2] 蔡忠偉. 國(guó)家政策驅(qū)動(dòng)下的日本開放獲取實(shí)踐進(jìn)展[J]. 科技與出版, 2023, 42(9): 97-106.
[3] Chen R S, Zhou Y C, Jiang L L, et al. China State of Open Data Report 2023[R]. Digital Science. Report. 2023.
[4] 萬佳林,賈曉峰,胡志民.基于多案例研究的生物醫(yī)學(xué)科學(xué)數(shù)據(jù)開放共享策略分析[J].醫(yī)學(xué)信息學(xué)雜志,2024,45(2):20-25.
[5] 李宜展,劉細(xì)文,李澤霞,等.科學(xué)數(shù)據(jù)安全邊界概念模型研究——基于利益相關(guān)者視角[J].中國(guó)科學(xué)基金,2022,36(2):339-347.
[6] 莊倩,何琳.科學(xué)數(shù)據(jù)共享中科研人員共享行為的演化博弈分析[J]. 情報(bào)雜志, 2015, 34(8): 152-157+168.
[7] Mons B, Schultes E A, Liu F, et al. The FAIR Principles: First generation implementation choices and challenges[J]. Data Intelligence, 2020(2): 1-9.DOI:10.1162/dint_e_00023.
[8] 李騏安,孟憲飛,張書華,等. 基于FAIR原則的中國(guó)科學(xué)數(shù)據(jù)資源現(xiàn)狀分析及啟示[J]. 數(shù)字圖書館論壇,2023,19(1):50-57.
[9] 王漪,徐墨庚,童心,等.國(guó)家海洋科學(xué)數(shù)據(jù)中心建設(shè)與發(fā)展實(shí)踐[J].自然資源信息化, 2024, 2(3):1-9.
[10] Shakked N, Zhang W. Experimental evidence on the productivity effects of generative artificial intelligence[J]. Science, 2023, 381(6654): 187 - 192. DOI: 10.1126/science.adh2586.
[11] Stadler T, Oprisanu B, Troncoso C. Synthetic data–anonymization groundhog day[C]// 31st USENIX Security Symposium (USENIX Security 22). 2022:1451–1468. https://www.usenix.org/system/files/ sec22-stadler.pdf.
[12] 楊衛(wèi),劉細(xì)文,黃金霞,等.我國(guó)開放科學(xué)政策體系構(gòu)建研究[J].中國(guó)科學(xué)院院刊,2023,38(6):829-844.
[13] 朱艷華,廖方宇,胡良霖,等. 科學(xué)數(shù)據(jù)安全標(biāo)準(zhǔn)規(guī)范關(guān)鍵問題探索[J].信息網(wǎng)絡(luò)安全,2021, 21(11):1-8.
[14] 廖方宇,胡良霖,王健,等.科學(xué)數(shù)據(jù)安全標(biāo)準(zhǔn)研究與工作建議[J].科學(xué)通報(bào), 2024:1-7.
[15] Ducas L, Micciancio D. FHEW: bootstrapping homomorphic encryption in less than a second[C]. in EUROCRYPT 2015, Sofifia, Bulgaria, 2015:617-640.
[16] Resende A, Railsback D, Dowsley R, et al. Fast privacy-preserving text classification based on secure multiparty computation[J]. IEEE Transactions on Information Forensics and Security, 2021, 17: 428-442. DOI: 10.1109/TIFS.2022.3144007.
[17] Lin W, Li B, Wang C. Towards private learning on decentralized graphs with local differential privacy[J]. IEEE Transactions on Information Forensics and Security, 2022, 17: 2936-2946. DOI: 10.1109/TIFS.2022.3198283.
[18] Ghosh A, Chung J, Yin D, et al. An efficient framework for clustered federated learning[J]. IEEE Transactions on Information Theory, 2022, 68: 8076-8091.DOI: 10.1109/TIT.2022.3192506.
[19] 馮登國(guó),劉敬彬,秦宇,等.創(chuàng)新發(fā)展中的可信計(jì)算理論與技術(shù)[J].中國(guó)科學(xué):信息科學(xué),2020,50(8):1127-1147.
[20] Stokel-Walker C, van Noorden R. What ChatGPT and generative AI mean for science[J]. Nature, 2023, 614: 214-216. https://doi.org/10. 1038/d41586-023-00340-6.
引用格式:廖方宇,李婧,龍春,楊帆,袁梓萌.開放科學(xué)背景下科學(xué)數(shù)據(jù)開放共享安全挑戰(zhàn)及我國(guó)對(duì)策思考[J].農(nóng)業(yè)大數(shù)據(jù)學(xué)報(bào),2024,6(2):146-155. DOI: 10.19788/j.issn.2096-6369.000027.
CITATION: LIAO FangYu1, LI Jing, LONG Chun, YANG Fan, YUAN ZiMeng. Security Challenges and Countermeasures on Open Sharing of Scientific Data in the Context of Open Science[J]. Journal of Agricultural Big Data,2024,6(2):146-155. DOI: 10.19788/j.issn.2096-6369.000027.
Security Challenges and Countermeasures on Open Sharing of Scientific Data in the Context of Open Science
LIAO FangYu1*, LI Jing1, LONG Chun1,2, YANG Fan1, YUAN ZiMeng1,2
1. Computer Network Information Center, Chinese Academy of Sciences, Beijing 100083, China; 2. University of Chinese Academy of Sciences, Beijing 100190, China
Abstract: Scientific data is a strategic and fundamental scientific and technological resource, profoundly impacting national security, economic development and technological progress. In the context of open science, scientific data, as the outcome and important support of data-intensive scientific research paradigms, also faces severe security challenges in terms of security and compliance, trusted and reliable sharing exchange. Focus on these challenges and aims to promote the open sharing of scientific data, the author propose several feasible strategies from the aspects of policy, management, technology, evaluation, and supervision, where the core is to construct a dynamic, fine-grained, and domain-applicable security classification and grading system, to promote the secure development and utilization of scientific data and accelerate transformation into a scientific and technological powerhouse.
Keywords: open science; scientific data; open sharing; security challenges and countermeasures
農(nóng)業(yè)大數(shù)據(jù)學(xué)報(bào)2024年2期