關(guān)鍵詞: 大數(shù)據(jù)政策; 政策生態(tài)鏈; 科學(xué)數(shù)據(jù); 大模型; 政策再生; 政策計(jì)量
DOI:10.3969 / j.issn.1008-0821.2024.10.004
〔中圖分類(lèi)號(hào)〕G203 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821 (2024) 10-0041-11
大模型即規(guī)?;⒅悄芑?、自動(dòng)化的深度學(xué)習(xí)模型, 是“大數(shù)據(jù)+大算力+強(qiáng)算法” 相結(jié)合的產(chǎn)物, 已經(jīng)成為一種新的時(shí)代趨勢(shì)并引起多國(guó)關(guān)注。大模型技術(shù)加速了大數(shù)據(jù)生產(chǎn), 在數(shù)據(jù)量呈幾何式增長(zhǎng)的背景下, 大數(shù)據(jù)成為重要的戰(zhàn)略要素, 得到多國(guó)重視并頒發(fā)多項(xiàng)政策, 《國(guó)家大數(shù)據(jù)戰(zhàn)略綱要》《科學(xué)數(shù)據(jù)管理辦法》等在大數(shù)據(jù)作為新型生產(chǎn)要素輔助科技戰(zhàn)略布局的時(shí)代背景下, 用于規(guī)范大數(shù)據(jù)開(kāi)放、共享、治理等的大數(shù)據(jù)相關(guān)政策如雨后春筍般涌出[1] 。從大數(shù)據(jù)政策生態(tài)角度看, 數(shù)據(jù)是基礎(chǔ)、政策是保障, 而技術(shù)則為動(dòng)力, 諸如ChatGPT、LLaMA 等大模型技術(shù)[2] 不僅催生了大數(shù)據(jù)的生成新方式, 其更高效、更強(qiáng)大、更準(zhǔn)確的性能可應(yīng)對(duì)更復(fù)雜、更龐大的應(yīng)用場(chǎng)景, 為政策生態(tài)提供了“工具紅利”, 注入了新鮮血液, 使在大數(shù)據(jù)政策生態(tài)內(nèi)部形成人智融合的大數(shù)據(jù)政策生態(tài)鏈成為可能。
無(wú)論大數(shù)據(jù)發(fā)展戰(zhàn)略亦或是人工智能發(fā)展規(guī)劃,都對(duì)大數(shù)據(jù)政策生態(tài)提出了前所未有的要求。然而鮮有學(xué)者將大模型技術(shù)應(yīng)用于大數(shù)據(jù)政策場(chǎng)景, 以解決數(shù)智化時(shí)代的新問(wèn)題。即便是有一些研究也多集中在智能化推動(dòng)政府治理變革[3] 、建設(shè)類(lèi)案檢索智慧平臺(tái)[4] 、公共政策知識(shí)圖譜[5] 、人工智能參與公共政策執(zhí)行[6] 等方面。大模型技術(shù)如何賦能大數(shù)據(jù)政策生態(tài)鏈、改善大數(shù)據(jù)政策生態(tài)鏈動(dòng)力模式,分析人智融合在大數(shù)據(jù)政策生態(tài)鏈演化中如何發(fā)揮作用, 成為當(dāng)今亟須解決的問(wèn)題。面對(duì)上述形勢(shì),本文基于大模型時(shí)代大數(shù)據(jù)政策新特點(diǎn), 結(jié)合生態(tài)學(xué)理論、大數(shù)據(jù)生命周期理論與政策生命周期理論,闡述了大數(shù)據(jù)政策生態(tài)鏈內(nèi)涵, 以科學(xué)數(shù)據(jù)政策為例, 在節(jié)點(diǎn)層、鏈條層、網(wǎng)絡(luò)層總結(jié)出大數(shù)據(jù)政策生態(tài)鏈面臨的新挑戰(zhàn), 針對(duì)新時(shí)代、新特點(diǎn)和新挑戰(zhàn), 在政策體系、人才培養(yǎng)、技術(shù)融合、平臺(tái)建造4 個(gè)層面推理出大數(shù)據(jù)政策生態(tài)鏈的優(yōu)化策略, 旨在提升大數(shù)據(jù)政策效能, 繼而促進(jìn)大數(shù)據(jù)共享。
1大數(shù)據(jù)政策生態(tài)鏈
生態(tài)(Ecology)是研究生物與環(huán)境之間相互關(guān)系和生物群落動(dòng)態(tài)變化的科學(xué)[7] 。它不僅研究生態(tài)鏈、生態(tài)群落、生態(tài)圈和生態(tài)系統(tǒng)的結(jié)構(gòu)、功能和演化, 還關(guān)注生物與環(huán)境之間的相互作用影響, 旨在理解多主體、多客體與環(huán)境之間的復(fù)雜關(guān)系, 以便幫助人類(lèi)理解、管理環(huán)境, 為制定更加合理的生態(tài)政策提供科學(xué)依據(jù)[8-9] 。如圖1 所示, 生態(tài)演化并不囿于生物學(xué)亦或是自然學(xué)科領(lǐng)域, 其技術(shù)逐漸現(xiàn)代化、應(yīng)用逐漸廣泛化, “生態(tài)” 在社會(huì)學(xué)、政治學(xué)、經(jīng)濟(jì)學(xué)、情報(bào)學(xué)等領(lǐng)域的新理解, 促使其成為一門(mén)跨學(xué)科、跨領(lǐng)域的研究[10] 。社會(huì)生態(tài)涉及政治、經(jīng)濟(jì)、文化、社會(huì)公平、社會(huì)行為、資源利用等多個(gè)方面, 著眼于人與環(huán)境之間的關(guān)聯(lián)、影響與依存, 強(qiáng)調(diào)社會(huì)和環(huán)境的整體性與不可分離性,倡導(dǎo)建設(shè)的和諧性、共生性、綠色性與可持續(xù)發(fā)展性[11-12] 。政治生態(tài)指政治主體在政治環(huán)境下的生存方式、政治習(xí)性和生存與發(fā)展的狀態(tài), 是一個(gè)涉及制度、經(jīng)濟(jì)、文化等多個(gè)領(lǐng)域, 包括政治關(guān)系、政治行為、政治監(jiān)督等多個(gè)維度, 涵蓋政治主體、權(quán)力運(yùn)行和政治環(huán)境等多個(gè)層面交織互動(dòng)的復(fù)雜系統(tǒng)[13-14] 。政治生態(tài)內(nèi)涵的外延催生了政策生態(tài)。政策生態(tài)是政策、人員、環(huán)境三大生態(tài)因子良性互動(dòng)的新機(jī)制[15-16] , 著眼于政策過(guò)程中各主體間關(guān)系[17] , 聚焦于動(dòng)態(tài)平衡、多元共治與自我創(chuàng)新[18] ,強(qiáng)調(diào)的是多主體和諧共生的交互式發(fā)展[19] , 是一項(xiàng)政策的規(guī)劃、決策、執(zhí)行、評(píng)估與終結(jié)[20] , 是政策自發(fā)調(diào)整、修正完善、循環(huán)更新的類(lèi)生態(tài)模式[21] 。大數(shù)據(jù)政策生態(tài)作為政策生態(tài)的子系統(tǒng), 是以大數(shù)據(jù)政策為核心, 結(jié)合政策環(huán)境、主體人員構(gòu)成的多元協(xié)同的復(fù)雜動(dòng)態(tài)系統(tǒng)。大數(shù)據(jù)政策生態(tài)鏈?zhǔn)谴髷?shù)據(jù)政策生態(tài)的下級(jí)單元, 是以政策為媒介連接政策場(chǎng)進(jìn)而形成的政策流的鏈條。大數(shù)據(jù)政策生態(tài)鏈作為大數(shù)據(jù)生態(tài)鏈的映射鏈[22-23] , 貫穿大數(shù)據(jù)全生命周期, 串聯(lián)政策頒發(fā)、傳遞、接受、反饋、改革眾多政策節(jié)點(diǎn)。
綜合以上分析, 本文認(rèn)為大數(shù)據(jù)政策生態(tài)鏈(Big Data Policy Ecological Chain, BDPEC)是生態(tài)學(xué)、社會(huì)生態(tài)、政治生態(tài)交叉子生態(tài)的下級(jí)單元,是大數(shù)據(jù)背景下衍生貫穿于大數(shù)據(jù)生產(chǎn)、傳播、消費(fèi)、分解、再生全數(shù)據(jù)生命周期, 串聯(lián)政策頒發(fā)、傳遞、接受、反饋、改革眾多政策節(jié)點(diǎn), 以配置大數(shù)據(jù)資源、監(jiān)管大數(shù)據(jù)生態(tài)活動(dòng)為工作內(nèi)容, 以控制數(shù)據(jù)質(zhì)量、保障數(shù)據(jù)安全、促進(jìn)數(shù)據(jù)共享為目標(biāo)的, 具有互動(dòng)性、循環(huán)性、價(jià)值性、權(quán)威性、合法性、專(zhuān)有性、科學(xué)性的雙螺旋鏈?zhǔn)缴鷳B(tài)結(jié)構(gòu)。
2BDPEC 雙螺旋結(jié)構(gòu)分析
2.1節(jié)點(diǎn)的構(gòu)成
對(duì)于BDPEC 節(jié)點(diǎn)的劃分, 如圖2 所示, 從政策生命周期視角[24] 可以將其劃分為大數(shù)據(jù)政策生產(chǎn)者、運(yùn)營(yíng)者、接受者、分解者, 從大數(shù)據(jù)生命周期的視角[25] 可以將其劃分為大數(shù)據(jù)生產(chǎn)政策、傳播政策、消費(fèi)政策、分解政策、再生政策, 且兩種鏈條之間相互交織、映射。具體分析如下: ①政策生命周期視角。生產(chǎn)者由政府、專(zhuān)家、大數(shù)據(jù)機(jī)構(gòu)多方協(xié)同, 政府部門(mén)保障了政策的權(quán)威性與合法性,專(zhuān)家的參與保障了政策的科學(xué)性, 大數(shù)據(jù)機(jī)構(gòu)的參與保障了政策制定的民主性。運(yùn)營(yíng)者主要由政府部門(mén)構(gòu)成, 負(fù)責(zé)具體政策的執(zhí)行, 確保政策價(jià)值的實(shí)現(xiàn)。大數(shù)據(jù)人員、平臺(tái)、中介等主體在數(shù)據(jù)流轉(zhuǎn)過(guò)程中依據(jù)相關(guān)政策與準(zhǔn)則的具體規(guī)范進(jìn)行數(shù)據(jù)交易與共享等活動(dòng), 組成接受者。大數(shù)據(jù)政策下發(fā)后,分解者對(duì)政策內(nèi)容進(jìn)行解讀, 并反饋大數(shù)據(jù)政策文本與現(xiàn)實(shí)問(wèn)題的不對(duì)稱(chēng)[26] , 為政策改革提供建議。②數(shù)據(jù)生命周期視角。大數(shù)據(jù)生產(chǎn)階段的大數(shù)據(jù)確權(quán)政策保障生產(chǎn)者主權(quán), 傳播階段的數(shù)據(jù)共享政策促進(jìn)數(shù)據(jù)流轉(zhuǎn), 消費(fèi)階段的數(shù)據(jù)交易政策促進(jìn)數(shù)據(jù)使用, 分解階段的數(shù)據(jù)分解政策保障數(shù)據(jù)回籠, 再生階段的數(shù)據(jù)再生政策煥發(fā)數(shù)據(jù)新生。研究認(rèn)為,以學(xué)界關(guān)于數(shù)據(jù)生命周期和政策生命周期等研究為基礎(chǔ), 針對(duì)大數(shù)據(jù)政策內(nèi)涵, 將“大數(shù)據(jù)政策生態(tài)鏈節(jié)點(diǎn)” 作為上述兩種鏈條的交融概念。
2.2節(jié)點(diǎn)間的關(guān)聯(lián)關(guān)系
各節(jié)點(diǎn)鏈?zhǔn)较嗦?lián)。大數(shù)據(jù)政策生產(chǎn)者提供政策規(guī)范相關(guān)人員行為, 運(yùn)營(yíng)者將生產(chǎn)者產(chǎn)出的政策按類(lèi)發(fā)布, 接受者在應(yīng)用大數(shù)據(jù)過(guò)程中遵守政策, 分解者對(duì)政策進(jìn)行細(xì)致解讀并為接受者提供政策咨詢(xún)服務(wù)。在數(shù)據(jù)生命周期角度看大數(shù)據(jù)生產(chǎn)政策、傳播政策、消費(fèi)政策、分解政策、再生政策以數(shù)據(jù)生命周期為紐帶相關(guān)聯(lián)。
各節(jié)點(diǎn)流轉(zhuǎn)互動(dòng)。生產(chǎn)者是大數(shù)據(jù)政策的源出方, 運(yùn)營(yíng)者起到橋梁紐帶作用, 從生產(chǎn)者手中獲取政策進(jìn)行傳遞。接受者遵循生產(chǎn)者所發(fā)布的政策,并向其提出反饋參與政策的制定, 分解者對(duì)生產(chǎn)者產(chǎn)出的政策進(jìn)行解讀, 向接受者提供政策咨詢(xún)服務(wù),并將政策落實(shí)情況反饋給運(yùn)營(yíng)者, 此外還會(huì)向生產(chǎn)者提供政策改革建議。
各節(jié)點(diǎn)相互轉(zhuǎn)化。政府部門(mén)參與政策的制定與運(yùn)營(yíng)實(shí)現(xiàn)大數(shù)據(jù)政策生產(chǎn)者向大數(shù)據(jù)政策運(yùn)營(yíng)者的轉(zhuǎn)化, 大數(shù)據(jù)機(jī)構(gòu)、科研人員、企業(yè)參與政策民主制定實(shí)現(xiàn)大數(shù)據(jù)政策接受者向大數(shù)據(jù)政策生產(chǎn)者轉(zhuǎn)化, 政策咨詢(xún)機(jī)構(gòu)對(duì)政策解讀為其他機(jī)構(gòu)提供咨詢(xún)服務(wù)的同時(shí)為相關(guān)部門(mén)提供改革建議, 實(shí)現(xiàn)大數(shù)據(jù)政策分解者向大數(shù)據(jù)政策生產(chǎn)者轉(zhuǎn)化。
3“大模型”環(huán)境對(duì)BDPEC發(fā)展的要求
大模型環(huán)境與大數(shù)據(jù)政策生態(tài)鏈相輔相成, 大模型技術(shù)優(yōu)化大數(shù)據(jù)政策生態(tài)鏈的同時(shí), 也對(duì)其發(fā)展提出了新要求。大模型環(huán)境存在技術(shù)風(fēng)險(xiǎn)、資源風(fēng)險(xiǎn)、倫理風(fēng)險(xiǎn)等多種風(fēng)險(xiǎn)。大模型技術(shù)風(fēng)險(xiǎn)是指大模型所使用的算法模型可能存在不穩(wěn)定的情況影響項(xiàng)目運(yùn)行。大模型資源風(fēng)險(xiǎn)是指模型的運(yùn)行依賴(lài)大量的數(shù)據(jù)資源, 但若存在數(shù)據(jù)缺失、數(shù)據(jù)劣質(zhì)等情況, 會(huì)影響模型訓(xùn)練結(jié)果。此外, 大模型還受儲(chǔ)存資源、計(jì)算設(shè)備等硬件的影響。大模型倫理風(fēng)險(xiǎn)指政策主體的倫理人格、倫理責(zé)任意識(shí)、人文素養(yǎng)、科技素養(yǎng)等可能存在與技術(shù)發(fā)展不匹配的情況。大模型環(huán)境風(fēng)險(xiǎn)對(duì)BDEPC 的節(jié)點(diǎn)、鏈條與網(wǎng)絡(luò)提出了“強(qiáng)節(jié)點(diǎn)、長(zhǎng)鏈條、密網(wǎng)絡(luò)” 的要求。具體分析如下: ①自然生態(tài)的平衡得益于物種多樣性, 生態(tài)節(jié)點(diǎn)能力弱會(huì)導(dǎo)致生態(tài)斷層, 進(jìn)而造成生態(tài)體系崩潰, 因此大數(shù)據(jù)政策生態(tài)強(qiáng)有力的節(jié)點(diǎn)對(duì)于系統(tǒng)的穩(wěn)定具有促進(jìn)作用, 可以應(yīng)對(duì)大模型環(huán)境潛在風(fēng)險(xiǎn)。從數(shù)據(jù)生命周期視角看, 政策的完善可為大數(shù)據(jù)生產(chǎn)、傳播、消費(fèi)、分解、再生保駕護(hù)航; 從政策生命周期視角看, 高素養(yǎng)人員具有更高的能力應(yīng)對(duì)頒發(fā)、執(zhí)行、接收、改革等階段風(fēng)險(xiǎn)。②生態(tài)鏈越長(zhǎng),主體之間、政策之間、主體與政策之間交互越多,關(guān)系越復(fù)雜, 各政策的維度與層次也隨之增加。維度與層次的增加使政策體系更加完善。政策生態(tài)鏈短易造成鏈條斷裂, 不能形成完整閉環(huán)回路, 且政策的缺失本身便是一種潛在風(fēng)險(xiǎn)。③大數(shù)據(jù)政策多重網(wǎng)由發(fā)文合作網(wǎng)與發(fā)文引用網(wǎng)組成。發(fā)文合作網(wǎng)指的是多部門(mén)共同合作頒發(fā)同一項(xiàng)政策, 發(fā)文引用網(wǎng)指文中出現(xiàn)貫徹落實(shí)等明確引用某項(xiàng)政策。高密度網(wǎng)絡(luò)主體間合作更多、協(xié)同性更強(qiáng), 在應(yīng)對(duì)風(fēng)險(xiǎn)時(shí), 可以資源共享得到資源補(bǔ)給, 多樣化主體更容易適應(yīng)環(huán)境變化, 同時(shí)多鏈條可分擔(dān)風(fēng)險(xiǎn)從而降低整體風(fēng)險(xiǎn)的影響。
4大模型環(huán)境下BDPEC發(fā)展問(wèn)題域——以科學(xué)數(shù)據(jù)政策為例
科學(xué)數(shù)據(jù)隸屬于大數(shù)據(jù), 是技術(shù)進(jìn)步與經(jīng)濟(jì)發(fā)展的先導(dǎo)[27] ??茖W(xué)數(shù)據(jù)政策是大數(shù)據(jù)背景下衍生的以促進(jìn)科學(xué)數(shù)據(jù)治理為目標(biāo)的, 以科學(xué)數(shù)據(jù)管控規(guī)制為呈現(xiàn)方式的科技政策[28-29] 。科學(xué)數(shù)據(jù)政策生態(tài)鏈可以看作是BDEPC 子系統(tǒng), BDEPC 是其上位集。借鑒已有政策計(jì)量數(shù)據(jù)樣本收集方法[30-31] ,通過(guò)國(guó)務(wù)院及我國(guó)31個(gè)省級(jí)行政區(qū)劃單位政府門(mén)戶(hù)網(wǎng)站, 以“科學(xué)數(shù)據(jù)” 為檢索詞進(jìn)行政策主題檢索并篩選, 收集自大數(shù)據(jù)元年(2013 年)至2023年與科學(xué)數(shù)據(jù)緊密相關(guān)的政策39 項(xiàng), 部分政策如表1所示。本研究以科學(xué)數(shù)據(jù)政策為例, 對(duì)BDEPC 的節(jié)點(diǎn)、鏈條、網(wǎng)絡(luò)進(jìn)行分析, 探究得出科學(xué)數(shù)據(jù)政策生態(tài)鏈發(fā)展存在節(jié)點(diǎn)弱、鏈條短、網(wǎng)絡(luò)疏等問(wèn)題,與大模型環(huán)境要求的“強(qiáng)節(jié)點(diǎn)、長(zhǎng)鏈條、密網(wǎng)絡(luò)”的新要求相悖。
4.1節(jié)點(diǎn)弱
從數(shù)據(jù)生命周期視角對(duì)BDEPC節(jié)點(diǎn)進(jìn)行劃分,并利用NVivo軟件對(duì)政策條款進(jìn)行編碼標(biāo)注, 統(tǒng)計(jì)各政策節(jié)點(diǎn)占比情況。39項(xiàng)政策中, 與科學(xué)數(shù)據(jù)治理不同階段密切相關(guān)的政策編碼827條, 由圖3可知, 科學(xué)數(shù)據(jù)生產(chǎn)政策161條, 占比19.47%; 傳播政策444 條, 占比53.69%; 消費(fèi)政策140條,占比16.93%; 分解政策44條,占比5.32%;再生政策38條,占比4.59%。統(tǒng)計(jì)得出政策生態(tài)鏈各節(jié)點(diǎn)占比不均衡,現(xiàn)有政策多聚焦于科學(xué)數(shù)據(jù)的傳播共享, 對(duì)科學(xué)數(shù)據(jù)的分解再利用的關(guān)注較少, 即數(shù)據(jù)分解政策、數(shù)據(jù)再生政策等節(jié)點(diǎn)能力較弱。
從政策生命周期視角看。①由圖3 可知, 目前科學(xué)數(shù)據(jù)政策共39 項(xiàng), 近年來(lái)新發(fā)政策數(shù)量下降,科學(xué)數(shù)據(jù)政策生產(chǎn)動(dòng)力漸弱。地方層級(jí)政策17 項(xiàng),雖政策發(fā)文主體眾多, 但各地參差且有多地未制定科學(xué)數(shù)據(jù)專(zhuān)項(xiàng)政策。已發(fā)文地區(qū)僅云南、四川、甘肅等地政策數(shù)目大于等于兩項(xiàng)。國(guó)家層級(jí)科學(xué)數(shù)據(jù)政策22 項(xiàng), 中國(guó)科協(xié)參與程度較高, 共參與4 項(xiàng)政策制定。綜合以上分析可以看出, 科學(xué)數(shù)據(jù)政策生產(chǎn)者節(jié)點(diǎn)活躍性有待提高。②科學(xué)數(shù)據(jù)政策具有強(qiáng)專(zhuān)業(yè)性, 但科學(xué)數(shù)據(jù)政策由生產(chǎn)者印發(fā)給相關(guān)部門(mén), 即政府是科學(xué)數(shù)據(jù)政策運(yùn)營(yíng)的主體, 科學(xué)數(shù)據(jù)維度復(fù)雜, 政策與數(shù)據(jù)的相關(guān)性難以判斷, 科學(xué)數(shù)據(jù)政策運(yùn)營(yíng)者在各領(lǐng)域的專(zhuān)業(yè)性亟需提升。③科學(xué)數(shù)據(jù)政策接受者以科學(xué)技術(shù)人員、科研院所、高校院所、科學(xué)技術(shù)協(xié)會(huì)和科學(xué)技術(shù)社會(huì)團(tuán)體為主。大模型環(huán)境下面臨著新技術(shù)、新倫理的挑戰(zhàn), 且對(duì)大模型驅(qū)動(dòng)科學(xué)數(shù)據(jù)政策檢索的運(yùn)用能力有待進(jìn)一步提高, 易忽略跨地區(qū)、跨學(xué)科、跨領(lǐng)域的政策關(guān)聯(lián)分析。④大數(shù)據(jù)驅(qū)動(dòng)有效擴(kuò)展了科學(xué)數(shù)據(jù)的維度。然而, 科學(xué)數(shù)據(jù)政策分解者往往聚焦于單學(xué)科的政策挖掘分析, 阻斷了科學(xué)數(shù)據(jù)政策跨場(chǎng)景流通, 導(dǎo)致對(duì)數(shù)據(jù)政策的理解不全面。無(wú)論是政策的缺失還是相關(guān)人員素養(yǎng)有待提高, 節(jié)點(diǎn)能力弱將會(huì)降低BDEPC的抗風(fēng)險(xiǎn)能力, 無(wú)法滿(mǎn)足大模型環(huán)境對(duì)BDEPC 提出的“強(qiáng)節(jié)點(diǎn)” 的要求。
4.2鏈條短
從數(shù)據(jù)生命周期視角出發(fā), 面向科學(xué)數(shù)據(jù)要素流通應(yīng)構(gòu)建與之匹配的政策生態(tài)鏈, 但對(duì)現(xiàn)有39項(xiàng)科學(xué)數(shù)據(jù)政策的統(tǒng)計(jì)分析可知, 目前我國(guó)科學(xué)數(shù)據(jù)政策主要集中在數(shù)據(jù)共享、數(shù)據(jù)安全等方面, 且部分政策缺乏具體細(xì)則??茖W(xué)數(shù)據(jù)權(quán)屬政策、科學(xué)數(shù)據(jù)交易政策、科學(xué)數(shù)據(jù)分解政策、科學(xué)數(shù)據(jù)再生政策鮮有提及。明確界定數(shù)據(jù)權(quán)屬、保護(hù)數(shù)據(jù)產(chǎn)權(quán)可規(guī)范數(shù)據(jù)市場(chǎng), 如2018年歐盟出臺(tái)的《通用數(shù)據(jù)保護(hù)條例》就數(shù)據(jù)產(chǎn)權(quán)問(wèn)題進(jìn)行了詳細(xì)討論。數(shù)據(jù)交易處于政策灰色領(lǐng)域, 致使科學(xué)數(shù)據(jù)集進(jìn)行黑市交易, 給數(shù)據(jù)治理造成困難??茖W(xué)數(shù)據(jù)分解再生政策的缺失, 大量數(shù)據(jù)堆積可造成數(shù)據(jù)冗余, 增加數(shù)據(jù)治理成本。
從政策生命周期視角看科學(xué)數(shù)據(jù)政策生態(tài)鏈,政策生產(chǎn)、運(yùn)行、監(jiān)管、再生都是必不可少的一環(huán),且科研環(huán)境日益復(fù)雜, 傳統(tǒng)的頒發(fā)執(zhí)行模式難以應(yīng)對(duì)日益變化的科學(xué)環(huán)境,也難以適應(yīng)截然不同的地域文化?!翱茖W(xué)數(shù)據(jù)政策再生產(chǎn)” 即“科學(xué)數(shù)據(jù)政策再生” 是“再生政策” 匹配地域、領(lǐng)域特征對(duì)“元政策” 清晰且明確的細(xì)化。以國(guó)務(wù)院2018年頒發(fā)的《科學(xué)數(shù)據(jù)管理辦法》為例,陜西省、黑龍江省、甘肅省、云南省、湖北省、安徽省、內(nèi)蒙古自治區(qū)、廣西壯族自治區(qū)、重慶市、江蘇省、山東省、四川省、寧夏回族自治區(qū)等省級(jí)行政單位先后頒發(fā)相關(guān)實(shí)施細(xì)則, 具體政策名稱(chēng)如表2 所示。其中, 僅四川省巴中市印發(fā)《巴中市科學(xué)數(shù)據(jù)管理實(shí)施方案》、廣安市印發(fā)《廣安市科學(xué)數(shù)據(jù)管理實(shí)施細(xì)則》, 云南省昆明市印發(fā)《昆明市科學(xué)數(shù)據(jù)管理實(shí)施辦法》實(shí)現(xiàn)了科學(xué)數(shù)據(jù)政策市級(jí)再生產(chǎn),有效延長(zhǎng)了科學(xué)數(shù)據(jù)政策生態(tài)鏈。省級(jí)科學(xué)數(shù)據(jù)政策的頒發(fā)延長(zhǎng)了科學(xué)數(shù)據(jù)政策生態(tài)鏈, 但仍有多地區(qū)無(wú)政策再生環(huán)節(jié), 再生政策的缺失致使科學(xué)數(shù)據(jù)政策生態(tài)鏈出現(xiàn)短鏈或斷鏈。
各地區(qū)科技基礎(chǔ)條件存在差異、科技資源配置情況不同,省級(jí)科學(xué)數(shù)據(jù)政策需要考慮區(qū)域具體科技資源稟賦, 重視地方科技發(fā)展特性、利益差異,均勻配置科技資源, 因此, 更有具體性、針對(duì)性。文本相似度計(jì)算可用于政策相似度比較, 分析各項(xiàng)政策共性和差異[32], 將13項(xiàng)省級(jí)科學(xué)數(shù)據(jù)政策與《科學(xué)數(shù)據(jù)管理辦法》導(dǎo)入自建語(yǔ)料庫(kù), 利用Py?thon語(yǔ)言Gensim 工具中的BOW模型、TF-IDF模型和余弦相似度對(duì)各政策進(jìn)行橫向相似度(省與省之間)、縱向相似度(省級(jí)政策與《科學(xué)數(shù)據(jù)管理辦法》之間)計(jì)算[33] ,構(gòu)建相似度矩陣并進(jìn)行可視化, 從而分析再生鏈發(fā)展?fàn)顩r。研究發(fā)現(xiàn), 各省政策與《科學(xué)數(shù)據(jù)管理辦法》之間相似度較高, 最高相似度為97.41%, 最低值為81.78%。相似度過(guò)高的地方科學(xué)數(shù)據(jù)政策未做到對(duì)國(guó)家級(jí)政策有針對(duì)地、具體地細(xì)化, 并不能起到有效延長(zhǎng)數(shù)據(jù)政策生態(tài)鏈的作用。圖4 相似度熱力圖中橫縱相交節(jié)點(diǎn)越大, 表明政策內(nèi)容越相似, 由此可以看出, 多地區(qū)間再生政策相似度過(guò)高, 政策相似度超過(guò)90%。政策再生力弱會(huì)使得整個(gè)國(guó)家或地區(qū)的科技缺乏多樣性, 成為科學(xué)數(shù)據(jù)政策生態(tài)鏈形成閉環(huán)回路的阻力。BDEPC短鏈與斷鏈的情況將會(huì)導(dǎo)致政策資源供應(yīng)不足, 使生態(tài)鏈崩潰, 加大大數(shù)據(jù)政策生態(tài)風(fēng)險(xiǎn),進(jìn)而使大數(shù)據(jù)生產(chǎn)進(jìn)入停滯, 無(wú)法滿(mǎn)足大模型環(huán)境提出的“長(zhǎng)鏈條” 要求。
4.3網(wǎng)絡(luò)疏
利用多重網(wǎng)絡(luò)分析方法將各部門(mén)與各項(xiàng)政策分別作為節(jié)點(diǎn), 對(duì)收集到的39項(xiàng)科學(xué)數(shù)據(jù)政策根據(jù)政策間部門(mén)合作、相互引用等關(guān)系進(jìn)行預(yù)處理構(gòu)建關(guān)系矩陣, 并讀入Ucinet測(cè)度國(guó)家層、地方層及全局科學(xué)數(shù)據(jù)政策發(fā)文主體網(wǎng)與政策引用網(wǎng)的網(wǎng)絡(luò)密度并進(jìn)行可視化, 對(duì)科學(xué)數(shù)據(jù)政策合作網(wǎng)絡(luò)與引用網(wǎng)絡(luò)進(jìn)一步分析, 得到科學(xué)數(shù)據(jù)政策生態(tài)網(wǎng)特征。
如圖5所示, 科學(xué)數(shù)據(jù)政策多重網(wǎng)由發(fā)文合作網(wǎng)與發(fā)文引用網(wǎng)組成。發(fā)文合作網(wǎng)指的是多部門(mén)共同合作頒發(fā)同一項(xiàng)政策, 發(fā)文引用網(wǎng)指文中出現(xiàn)貫徹落實(shí)等明確引用某項(xiàng)政策。將發(fā)文合作網(wǎng)劃分為國(guó)家層面合作網(wǎng)與地方層面合作網(wǎng)進(jìn)行分別分析后再對(duì)整體網(wǎng)絡(luò)進(jìn)行研究。計(jì)算得知, 全局科學(xué)數(shù)據(jù)政策合作發(fā)文網(wǎng)的網(wǎng)絡(luò)密度為0.095, 網(wǎng)絡(luò)密度值低表明全國(guó)范圍內(nèi)相關(guān)部門(mén)并未形成緊密聯(lián)系。地方層網(wǎng)絡(luò)密度為0.2215, 地方層面跨部門(mén)合作較少,還未實(shí)現(xiàn)跨區(qū)域合作。國(guó)家層科學(xué)數(shù)據(jù)部門(mén)合作網(wǎng)絡(luò)密度為0.1429,國(guó)家層面跨部門(mén)合作較多,主要參與部門(mén)有國(guó)務(wù)院、工信部、國(guó)家發(fā)展改革委、教育部、科技部、中國(guó)科協(xié)、中國(guó)科學(xué)院等??茖W(xué)數(shù)據(jù)政策引文網(wǎng)絡(luò)密度為0.0447,其中國(guó)務(wù)院辦公廳出臺(tái)的《科學(xué)數(shù)據(jù)管理辦法》被多項(xiàng)政策引用,其他政策聯(lián)系最為緊密、出現(xiàn)頻次最高。綜合以上分析,科研大數(shù)據(jù)政策國(guó)家層合作發(fā)文網(wǎng)絡(luò)密度、地方層合作發(fā)文網(wǎng)絡(luò)、整體合作網(wǎng)絡(luò)密度、引文網(wǎng)絡(luò)密度低, 表明部門(mén)之間、地區(qū)之間缺乏有效溝通與合作, 降低了整體生態(tài)網(wǎng)中各主體間關(guān)聯(lián)性, 易出現(xiàn)信息孤島。低密度網(wǎng)絡(luò)不利于資金、技術(shù)、人才等資源共享, 在應(yīng)對(duì)挑戰(zhàn)時(shí)缺乏靈活性與多變性, 不利于風(fēng)險(xiǎn)分散, 整體抗風(fēng)險(xiǎn)能力受到影響,與大模型環(huán)境對(duì)BDEPC 提出的高密度政策生態(tài)網(wǎng)絡(luò)要求不符。
5BDPEC優(yōu)化策略
綜合前文分析,針對(duì)節(jié)點(diǎn)弱、鏈條短、網(wǎng)絡(luò)疏等問(wèn)題, 提出共建頂層設(shè)計(jì), 完善政策體系; 轉(zhuǎn)變?nèi)瞬排囵B(yǎng), 深化人機(jī)協(xié)同; 創(chuàng)新數(shù)智賦能, 加強(qiáng)技術(shù)融合; 推動(dòng)多方聯(lián)動(dòng), 筑牢政策平臺(tái)等優(yōu)化策略,具體分析如下。
5.1共建頂層設(shè)計(jì),完善政策體系
數(shù)據(jù)資產(chǎn)要素化使數(shù)據(jù)成為科技競(jìng)爭(zhēng)焦點(diǎn), 當(dāng)前數(shù)據(jù)治理面臨著數(shù)據(jù)主權(quán)不明、黑市交易泛濫等眾多倫理問(wèn)題, 政策體系不完善, 多地未形成縱向中央省市三級(jí)、橫向全數(shù)據(jù)生命周期的數(shù)據(jù)政策體系, 從而導(dǎo)致節(jié)點(diǎn)能力弱是數(shù)據(jù)政策生態(tài)鏈易斷的弱點(diǎn), 為此優(yōu)化BDEPC 首要解決的是應(yīng)建立數(shù)據(jù)政策規(guī)范體系。
以科學(xué)數(shù)據(jù)為例, 科學(xué)數(shù)據(jù)治理要涵蓋數(shù)據(jù)的生產(chǎn)、傳播、消費(fèi)、分解、再生等各環(huán)節(jié), 科學(xué)數(shù)據(jù)政策要融入科學(xué)數(shù)據(jù)的全生命周期串聯(lián)中央省市三級(jí)。從突破經(jīng)驗(yàn)空間, 擴(kuò)展政策維度; 泛化新型倫理, 應(yīng)對(duì)政策滯后; 匯聚地方特色, 政策因地制宜3個(gè)方面推進(jìn)大模型賦能科學(xué)數(shù)據(jù)政策體系完善。將大模型技術(shù)應(yīng)用至政策的全生命周期, 著重加強(qiáng)政策協(xié)同生產(chǎn)、加密政策網(wǎng)絡(luò), 強(qiáng)調(diào)政策適應(yīng)性再生, 合理延長(zhǎng)政策生態(tài)鏈條, 避免政策生態(tài)鏈短鏈、斷鏈, 實(shí)現(xiàn)科學(xué)數(shù)據(jù)治理的全局性與安全性。第一,突破經(jīng)驗(yàn)空間, 擴(kuò)展政策維度: 借助大模型突破經(jīng)驗(yàn)限制, 基于大規(guī)模數(shù)據(jù)治理相關(guān)數(shù)據(jù), 學(xué)習(xí)科學(xué)數(shù)據(jù)治理規(guī)律, 進(jìn)行科學(xué)數(shù)據(jù)政策的自主創(chuàng)新, 擴(kuò)展科學(xué)數(shù)據(jù)政策生產(chǎn)者思考, 拓寬科學(xué)數(shù)據(jù)政策維度, 使科學(xué)數(shù)據(jù)政策涵蓋更多維度更為趨優(yōu), 以政策維度的增加來(lái)強(qiáng)化政策節(jié)點(diǎn)的效能。第二, 泛化新型倫理, 應(yīng)對(duì)政策滯后: 科學(xué)數(shù)據(jù)政策服務(wù)于科技創(chuàng)新活動(dòng), 科研環(huán)境日新月異, 政策在所難免滯后于科技的發(fā)展, 給數(shù)據(jù)定價(jià)、數(shù)據(jù)交易等活動(dòng)帶來(lái)一定負(fù)面影響。大模型的強(qiáng)泛化性對(duì)于新數(shù)據(jù)具有較強(qiáng)的適應(yīng)能力, 對(duì)未知數(shù)據(jù)進(jìn)行預(yù)測(cè), 并根據(jù)預(yù)測(cè)結(jié)果對(duì)大數(shù)據(jù)政策進(jìn)行擴(kuò)充與細(xì)化。同時(shí)大模型泛化能力可預(yù)見(jiàn)未來(lái)技術(shù)可能導(dǎo)致的科學(xué)數(shù)據(jù)治理新問(wèn)題, 提前做好充足準(zhǔn)備, 提高大數(shù)據(jù)政策生態(tài)鏈抵抗未知風(fēng)險(xiǎn)的能力。第三, 匯聚地方特色,政策因地制宜: 區(qū)域科技創(chuàng)新活動(dòng)倒逼科學(xué)數(shù)據(jù)政策體系完善, 但不同省市的科技稟賦、態(tài)勢(shì)不同,地方政府制定科學(xué)數(shù)據(jù)政策匯聚地方特色提高政策針對(duì)性。因地制宜除了考慮不同地域, 還要充分考慮數(shù)據(jù)生產(chǎn)、傳播、消費(fèi)、分解的政策差異性, 爭(zhēng)取各階段政策均衡完善, 適應(yīng)科學(xué)數(shù)據(jù)發(fā)展規(guī)律和數(shù)據(jù)分級(jí)特征(如數(shù)據(jù)保密分級(jí))。大模型技術(shù)可跨域、跨場(chǎng)景總結(jié)科學(xué)數(shù)據(jù)治理要素, 根據(jù)科學(xué)數(shù)據(jù)治理目標(biāo), 提出多種科學(xué)數(shù)據(jù)政策方案, 并復(fù)雜關(guān)聯(lián)政策效果提供各種政策的適應(yīng)性分析。
5.2轉(zhuǎn)變?nèi)瞬排囵B(yǎng),深化人機(jī)協(xié)同
數(shù)智化時(shí)代傳統(tǒng)的人才培養(yǎng)體系無(wú)法滿(mǎn)足復(fù)雜多變的科研環(huán)境, 轉(zhuǎn)變?nèi)瞬排囵B(yǎng)模式,進(jìn)行人才體系的大模型賦能, 即培養(yǎng)“復(fù)合型AI 人才”,可提升政策生態(tài)鏈節(jié)點(diǎn)性能,有效解決BDEPC節(jié)點(diǎn)弱的問(wèn)題。
以科學(xué)數(shù)據(jù)政策領(lǐng)域?yàn)槔?“復(fù)合型AI 人才”不僅應(yīng)了解數(shù)據(jù)科學(xué)領(lǐng)域的進(jìn)展, 并遵守相應(yīng)的法律規(guī)范與科學(xué)數(shù)據(jù)倫理, 提供符合新時(shí)代、新倫理、新要求的政策建議, 除此之外, 因大模型技術(shù)為科學(xué)數(shù)據(jù)政策生態(tài)鏈運(yùn)行提供了新路徑, 人類(lèi)的情感價(jià)值搭配大模型計(jì)算推理能力, 促進(jìn)從原來(lái)的生態(tài)鏈“機(jī)器輔助” 模式向“人機(jī)協(xié)同” 模式轉(zhuǎn)變, 在人機(jī)協(xié)同模式下, 相關(guān)人員可借助高效智能的大模型技術(shù)進(jìn)行科學(xué)數(shù)據(jù)政策的全生命周期活動(dòng)。
“人機(jī)協(xié)同” 模式下培養(yǎng)“復(fù)合型AI 人才”,首先應(yīng)建立完善的科學(xué)數(shù)據(jù)政策人才庫(kù)并進(jìn)行精細(xì)化管理, 為生態(tài)鏈進(jìn)化提供人才基礎(chǔ), 面對(duì)智慧涌現(xiàn),高質(zhì)量人才可鑒別決策的客觀性、合理性、準(zhǔn)確性與完備性; 其次應(yīng)優(yōu)化人才庫(kù)結(jié)構(gòu)適應(yīng)大模型環(huán)境,加大模型訓(xùn)練人員、模型維護(hù)人員、模型反饋人員比重, 提升大模型運(yùn)用實(shí)力; 最后應(yīng)培養(yǎng)科學(xué)數(shù)據(jù)政策“復(fù)合型AI 人才” 多模態(tài)對(duì)齊訓(xùn)練能力(訓(xùn)練模型科學(xué)數(shù)據(jù)政策知識(shí), 進(jìn)行有監(jiān)督微調(diào), 將“通用智慧” 轉(zhuǎn)化為“科學(xué)數(shù)據(jù)政策智慧”)、反饋優(yōu)化能力(利用大模型反饋技術(shù)高精度模擬政策生態(tài)動(dòng)態(tài)進(jìn)化過(guò)程收集反饋數(shù)據(jù), 并將反饋數(shù)據(jù)再次輸入模型學(xué)習(xí)進(jìn)一步優(yōu)化政策結(jié)構(gòu))、場(chǎng)景轉(zhuǎn)化能力(通過(guò)大模型提供的推演數(shù)據(jù)及反饋數(shù)據(jù), 優(yōu)化決策精度后轉(zhuǎn)換到真實(shí)場(chǎng)景中進(jìn)行試點(diǎn), 減少試錯(cuò)成本)、多元協(xié)同能力(能夠跨域、跨場(chǎng)景、跨部門(mén)學(xué)習(xí)案例知識(shí), 形成目標(biāo)場(chǎng)景的最優(yōu)科學(xué)數(shù)據(jù)政策設(shè)計(jì), 避免單一知識(shí)依賴(lài), 減少?zèng)Q策偏差)?!皬?fù)合型AI人才” 能提供關(guān)于科學(xué)數(shù)據(jù)交易市場(chǎng)需求與技術(shù)發(fā)展相關(guān)的信息, 為科學(xué)數(shù)據(jù)政策制定帶來(lái)新思路、引入新理念。同時(shí),“復(fù)合型AI 人才” 還可以參與科學(xué)數(shù)據(jù)政策的實(shí)施和監(jiān)督, 確保政策有效執(zhí)行, 從而起到優(yōu)化大數(shù)據(jù)政策生態(tài)鏈的目的。
5.3創(chuàng)新數(shù)智賦能,加強(qiáng)技術(shù)融合
技術(shù)是驅(qū)動(dòng)BDEPC進(jìn)化的燃料, 在政策畫(huà)像構(gòu)建、政策個(gè)性化推薦、政策適應(yīng)性診斷、政策倉(cāng)儲(chǔ)等方面加強(qiáng)與多模態(tài)大模型技術(shù)深度融合,可有效提升節(jié)點(diǎn)性能, 延長(zhǎng)政策鏈條。
以科學(xué)數(shù)據(jù)政策為例, ①在賦能科學(xué)數(shù)據(jù)政策畫(huà)像構(gòu)建方面, 針對(duì)科學(xué)數(shù)據(jù)場(chǎng)景收集相關(guān)信息,將多個(gè)模態(tài)的政策信息映射到同一表示空間中進(jìn)行融合, 獲取全域知識(shí),比如融合AIGC技術(shù)與自動(dòng)化識(shí)別技術(shù)能夠?qū)崿F(xiàn)政策全要素測(cè)度, MineCLIP模型中對(duì)比損失函數(shù)計(jì)算政策間相似性和差異進(jìn)行文本分類(lèi)。此外, 大模型還可對(duì)政策摘要, 即讓計(jì)算機(jī)能夠自動(dòng)地對(duì)長(zhǎng)篇政策文本進(jìn)行摘要, 以快速地了解政策的主要內(nèi)容、理解政策信息, 進(jìn)而設(shè)置政策標(biāo)簽描述政策畫(huà)像。②在賦能科學(xué)數(shù)據(jù)政策個(gè)性化推薦方面, 大模型時(shí)代的政策檢索與咨詢(xún)系統(tǒng)更加注重用戶(hù)行為的分析。政策檢索與咨詢(xún)系統(tǒng)不再是簡(jiǎn)單地基于算法的政策文本推薦, 而是通過(guò)深度學(xué)習(xí)等人工智能技術(shù)對(duì)用戶(hù)行為進(jìn)行分析。大模型將大量用戶(hù)知識(shí)與科學(xué)數(shù)據(jù)政策知識(shí)存儲(chǔ)在參數(shù)化模型中, 精準(zhǔn)鏈接用戶(hù)畫(huà)像與政策畫(huà)像, 自動(dòng)地回答用戶(hù)的問(wèn)題, 使得大數(shù)據(jù)政策人員節(jié)點(diǎn)可以更加方便地獲取政策, 從而為其提供更加精準(zhǔn)、個(gè)性化的推薦。比如利用CLIP對(duì)用戶(hù)的政策問(wèn)題進(jìn)行分析回答并根據(jù)用戶(hù)反饋優(yōu)化政策檢索結(jié)果。此外,多模態(tài)大模型可預(yù)測(cè)用戶(hù)下步需求方向, 如BEIT-3模型使用多任務(wù)學(xué)習(xí)方法, 將多個(gè)科學(xué)數(shù)據(jù)政策檢索歷史一起學(xué)習(xí), 產(chǎn)生滿(mǎn)足用戶(hù)偏好的智能化推薦, 解決信息過(guò)載問(wèn)題。③在賦能科學(xué)數(shù)據(jù)政策適應(yīng)性診斷方面, 多模態(tài)大模型具有強(qiáng)大的表征能力、情景理解能力與邏輯推理能力, 其儲(chǔ)存的大量知識(shí)可多維度、全方面、長(zhǎng)鏈條地對(duì)科學(xué)數(shù)據(jù)政策應(yīng)用場(chǎng)景進(jìn)行動(dòng)態(tài)化建模, 并刻畫(huà)政策節(jié)點(diǎn)與政策生態(tài)環(huán)境間的交互關(guān)系, 利用“思維鏈” 方法逐步推理科學(xué)數(shù)據(jù)政策與科研大環(huán)境間的因果關(guān)系,從而準(zhǔn)確、客觀、科學(xué)地進(jìn)行政策改革優(yōu)化以延長(zhǎng)政策再生鏈。此外, 大模型具有高度可解釋性, 可改進(jìn)現(xiàn)有評(píng)估方法, 例如通過(guò)基于大數(shù)據(jù)共享、交易行為模擬的政策評(píng)估模型、基于行為分析的政策跟蹤模型, 提高政策評(píng)估結(jié)果的可靠性、穩(wěn)定性,以及評(píng)估方法的可擴(kuò)展性、可移植性。④在賦能科學(xué)數(shù)據(jù)政策智能化倉(cāng)儲(chǔ)方面, 多模態(tài)大模型從系統(tǒng)視角出發(fā), 通過(guò)自動(dòng)化數(shù)據(jù)管理技術(shù)與知識(shí)鏈接能力跨域調(diào)整科學(xué)數(shù)據(jù)政策庫(kù)系統(tǒng)參數(shù)、內(nèi)存參數(shù)、網(wǎng)絡(luò)參數(shù), 增加并發(fā)連接數(shù), 提升科學(xué)數(shù)據(jù)政策庫(kù)工作效率的同時(shí)減少錯(cuò)誤。例如, 采用模型并行手段, 將大數(shù)據(jù)政策主體網(wǎng)絡(luò)分割并分配到多單元計(jì)算, 提升大數(shù)據(jù)政策主體分類(lèi)速度; 采用知識(shí)蒸餾技術(shù)提升大數(shù)據(jù)政策主體識(shí)別精度的同時(shí)降低時(shí)延, 壓縮大數(shù)據(jù)政策主體網(wǎng)絡(luò)參數(shù); 采用自動(dòng)化監(jiān)控技術(shù), 定期進(jìn)行科學(xué)數(shù)據(jù)政策庫(kù)備份和測(cè)試, 確保政策庫(kù)數(shù)據(jù)完整性; 同時(shí), 智能防火墻技術(shù)可自適應(yīng)網(wǎng)絡(luò)流量變化, 科學(xué)控制訪問(wèn)權(quán)限, 精準(zhǔn)識(shí)別并自動(dòng)屏蔽病毒。
5.4推動(dòng)多方聯(lián)動(dòng),牢筑政策平臺(tái)
彌合“節(jié)點(diǎn)鴻溝”、加大網(wǎng)絡(luò)協(xié)同度、提高網(wǎng)絡(luò)凝聚力最關(guān)鍵的是固化平臺(tái)支撐, 主要包括提供門(mén)戶(hù)服務(wù)、產(chǎn)品服務(wù)、模型服務(wù)、工具服務(wù)等多樣化的服務(wù)形式與敏捷的服務(wù)能力。大模型賦能科學(xué)數(shù)據(jù)政策平臺(tái)服務(wù)主要有以下3個(gè)方面:
一是跨模態(tài)信息關(guān)聯(lián)構(gòu)建多模態(tài)數(shù)據(jù)基座, 實(shí)現(xiàn)跨模態(tài)關(guān)聯(lián)。首先, 采集政策文本、圖像等多模態(tài)數(shù)據(jù), 并利用自然語(yǔ)言處理等技術(shù)構(gòu)建多模態(tài)模型, 將不同模態(tài)的科學(xué)數(shù)據(jù)政策文本信息進(jìn)行融合處理; 其次, 將不同模態(tài)的科學(xué)數(shù)據(jù)政策文本信息轉(zhuǎn)換為統(tǒng)一文本格式; 最后, 根據(jù)具體的科研場(chǎng)景選擇基座模型, 滿(mǎn)足特定需求。二是對(duì)接科學(xué)數(shù)據(jù)中心, 嵌入專(zhuān)業(yè)知識(shí)。數(shù)據(jù)驅(qū)動(dòng)可解決政策文本收集倉(cāng)儲(chǔ)的基本問(wèn)題, 但是面對(duì)不同領(lǐng)域科學(xué)數(shù)據(jù)的生產(chǎn)、確權(quán)、交易等具體需求, 需考慮科學(xué)數(shù)據(jù)的分級(jí)、結(jié)構(gòu)、屬性等, 單純的數(shù)據(jù)驅(qū)動(dòng)無(wú)法解決,需要融合專(zhuān)業(yè)知識(shí), 即在數(shù)據(jù)大模型架構(gòu)上, 嵌入科學(xué)數(shù)據(jù)領(lǐng)域知識(shí)的AI 模型。例如, 大模型通過(guò)建模識(shí)別文本中的關(guān)鍵詞和短語(yǔ), 對(duì)科學(xué)數(shù)據(jù)政策文本的語(yǔ)義結(jié)構(gòu)進(jìn)行深度理解, 進(jìn)而推斷政策思想,捕捉政策邏輯信息, 以專(zhuān)業(yè)知識(shí)強(qiáng)化大數(shù)據(jù)政策平臺(tái)建設(shè), 進(jìn)而優(yōu)化大數(shù)據(jù)政策生態(tài)鏈。三是多模塊互聯(lián), 快捷式服務(wù)。服務(wù)平臺(tái)多模塊互聯(lián)指通過(guò)匹配科研場(chǎng)景、建立用戶(hù)連接、融入智能技術(shù)以及提供情境性、個(gè)性化的便捷式服務(wù), 以達(dá)到保安全、穩(wěn)質(zhì)量、降成本的目的。大規(guī)模模型模擬人類(lèi)的認(rèn)知, 處理復(fù)雜互動(dòng)性問(wèn)題, 能夠更好地適應(yīng)大數(shù)據(jù)政策主體交流、互動(dòng)、整合、轉(zhuǎn)化的應(yīng)用場(chǎng)景。大模型技術(shù)可根據(jù)不同情境提供政策組合, 在面對(duì)小樣本、低情景時(shí), 以用戶(hù)為中心依賴(lài)大模型計(jì)算框架, 對(duì)當(dāng)前的模塊跨域、跨場(chǎng)景挖掘處理向外拓展和泛化, 提高價(jià)值信息并形成有效策略。通過(guò)提高大數(shù)據(jù)政策平臺(tái)的服務(wù)性來(lái)優(yōu)化大數(shù)據(jù)政策生態(tài)鏈。
6研究小結(jié)
本文以“促進(jìn)數(shù)據(jù)共享” 為導(dǎo)向, 以“科學(xué)數(shù)據(jù)政策” 為依托, 以“大模型環(huán)境” 為支撐, 剖析了BDEPC內(nèi)涵, 識(shí)別出雙螺旋大數(shù)據(jù)政策生態(tài)鏈節(jié)點(diǎn)構(gòu)成,分析了大模型環(huán)境對(duì)BDEPC的新要求與對(duì)BDEPC的可優(yōu)化性,探析了科學(xué)數(shù)據(jù)政策生態(tài)鏈內(nèi)節(jié)點(diǎn)弱、鏈條短、網(wǎng)絡(luò)疏等問(wèn)題,并依此給出共建頂層設(shè)計(jì), 完善政策體系; 轉(zhuǎn)變?nèi)瞬排囵B(yǎng),深化人機(jī)協(xié)同; 創(chuàng)新數(shù)智賦能,加強(qiáng)技術(shù)融合;推動(dòng)多方聯(lián)動(dòng),筑牢政策平臺(tái)等優(yōu)化策略。與已有研究相比, 本文價(jià)值貢獻(xiàn)主要體現(xiàn)在以下兩個(gè)方面。
1)理論價(jià)值。從雙螺旋視角出發(fā), 研究得出BDEPC是生態(tài)學(xué)、社會(huì)生態(tài)、政治生態(tài)交叉子生態(tài)的下級(jí)單元, 是大數(shù)據(jù)背景下衍生貫穿于數(shù)據(jù)生產(chǎn)、傳播、消費(fèi)、分解、再生全生命周期, 串聯(lián)政策頒發(fā)、傳遞、接受、反饋、改革眾多政策過(guò)程,以配置大數(shù)據(jù)資源、監(jiān)管大數(shù)據(jù)生態(tài)活動(dòng)為工作內(nèi)容, 以控制數(shù)據(jù)質(zhì)量、保障數(shù)據(jù)安全、促進(jìn)數(shù)據(jù)共享為目標(biāo), 具有互動(dòng)性、循環(huán)性、價(jià)值性、權(quán)威性、合法性、專(zhuān)有性、科學(xué)性的雙螺旋鏈?zhǔn)缴鷳B(tài)結(jié)構(gòu),豐富了大數(shù)據(jù)治理與政策生態(tài)的理論體系。
2)實(shí)踐價(jià)值。①在國(guó)家戰(zhàn)略層面, 科學(xué)數(shù)據(jù)作為新型科技生產(chǎn)要素是國(guó)家基礎(chǔ)性戰(zhàn)略資源, 完善其政策體系對(duì)于國(guó)家數(shù)據(jù)資產(chǎn)管理具有重要意義;②在數(shù)據(jù)治理層面,本文可為解決科學(xué)數(shù)據(jù)政策生態(tài)鏈節(jié)點(diǎn)弱、鏈條短、網(wǎng)絡(luò)疏等問(wèn)題提供參考, 為科學(xué)數(shù)據(jù)治理提供制度保障, 降低數(shù)據(jù)風(fēng)險(xiǎn), 提升創(chuàng)新效率;③在技術(shù)賦能層面, 將大模型技術(shù)與政策生態(tài)深度融合, 不僅為BDEPC進(jìn)化提供了技術(shù)支撐, 還拓寬了大模型技術(shù)應(yīng)用領(lǐng)域。