国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

主題聚類視域下地方公共數(shù)據(jù)管理政策完備性分析

2024-04-14 11:38:43王勁孫瑞英
知識(shí)管理論壇 2024年1期
關(guān)鍵詞:公共數(shù)據(jù)聚類分析

王勁 孫瑞英

摘要:[目的/意義]調(diào)查分析我國(guó)市級(jí)以上的公共數(shù)據(jù)管理政策,對(duì)比國(guó)家級(jí)數(shù)據(jù)政策對(duì)相關(guān)工作建設(shè)發(fā)展的要求,試圖發(fā)現(xiàn)當(dāng)前地方政策與國(guó)家要求的匹配程度。[方法/過(guò)程]獲取28份我國(guó)地市級(jí)以上的公共數(shù)據(jù)管理政策,通過(guò)對(duì)內(nèi)容進(jìn)行加工整理,利用LDA算法進(jìn)行主題內(nèi)容識(shí)別,將其與國(guó)家層面的數(shù)據(jù)發(fā)展綱要進(jìn)行比較。[結(jié)果/結(jié)論]當(dāng)前各地制定的公共數(shù)據(jù)管理政策主題集中、目的明確,但總體上處于初級(jí)建設(shè)階段,未能對(duì)公共數(shù)據(jù)的深度應(yīng)用起到引導(dǎo)和管理的作用,與國(guó)家頂層設(shè)計(jì)要求仍有一定差距。

關(guān)鍵詞:主題模型;公共數(shù)據(jù);聚類分析;政策比較

分類號(hào):G203

引用格式:王勁, 孫瑞英. 主題聚類視域下地方公共數(shù)據(jù)管理政策完備性分析[J/OL]. 知識(shí)管理論壇, 2024, 9(1): 65-78 [引用日期]. http://www.kmf.ac.cn/p/378/. (Citation: Wang Jin, Sun Ruiying. Analysis of the Completeness of Local Public Data Management Policies from the Perspective of Topic Clustering[J/OL]. Knowledge Management Forum, 2024, 9(1): 65-78 [cite date]. http://www.kmf.ac.cn/p/378/.)

1? 引言/Introduction

黨中央、國(guó)務(wù)院高度重視大數(shù)據(jù)的發(fā)展和公共數(shù)據(jù)的開(kāi)放利用,依據(jù)大數(shù)據(jù)發(fā)展和應(yīng)用的實(shí)際情況不斷發(fā)布相關(guān)政策進(jìn)行工作指導(dǎo)。2014年大數(shù)據(jù)首次被寫(xiě)入政府工作報(bào)告;2015年9月,國(guó)務(wù)院發(fā)布《促進(jìn)大數(shù)據(jù)發(fā)展的行動(dòng)綱要》,正式將大數(shù)據(jù)上升至國(guó)家戰(zhàn)略層面,促進(jìn)了大數(shù)據(jù)在各新興領(lǐng)域的延伸應(yīng)用;十九大報(bào)告中強(qiáng)調(diào)大數(shù)據(jù)與實(shí)體經(jīng)濟(jì)的深度融合;2020年4月9日,中共中央、國(guó)務(wù)院印發(fā)《關(guān)于構(gòu)建更加完善的要素市場(chǎng)化配置體制機(jī)制的意見(jiàn)》,將數(shù)據(jù)納入第五大生產(chǎn)要素,數(shù)據(jù)成為推動(dòng)社會(huì)經(jīng)濟(jì)發(fā)展的核心動(dòng)能;2021年3月“十四五”規(guī)劃將大數(shù)據(jù)標(biāo)準(zhǔn)體系的完善作為發(fā)展重點(diǎn)。除上述政策外,國(guó)家層面還出臺(tái)了《全國(guó)一體化政務(wù)大數(shù)據(jù)體系建設(shè)指南》等宏觀規(guī)劃。為響應(yīng)國(guó)家戰(zhàn)略的相關(guān)要求,各地陸續(xù)頒布公共數(shù)據(jù)管理的政策,以求促進(jìn)公共數(shù)據(jù)的管理和使用。筆者利用LDA(Latent Dirichlet Allocation,LDA)主題模型對(duì)省、地區(qū)、市級(jí)公共數(shù)據(jù)政策文本進(jìn)行主題聚類分析,以發(fā)現(xiàn)地方公共數(shù)據(jù)政策是否完備?并將實(shí)驗(yàn)結(jié)果與國(guó)家頂層規(guī)劃的主旨要求進(jìn)行對(duì)比,以確定是否符合國(guó)家戰(zhàn)略要求?期望研究成果為各地區(qū)公共數(shù)據(jù)管理和利用提供建議。

2? 研究綜述與本研究的邏輯思路/Literature review and logic of this study

2.1? 研究綜述

隨著國(guó)家層面對(duì)公共數(shù)據(jù)蘊(yùn)含價(jià)值的重視和引導(dǎo),近幾年各省市陸續(xù)頒布公共數(shù)據(jù)管理辦法,體現(xiàn)出地方政府對(duì)開(kāi)發(fā)公共數(shù)據(jù)的高度關(guān)注,這也推動(dòng)了學(xué)術(shù)界對(duì)公共數(shù)據(jù)政策的研究熱潮,學(xué)者們從制定框架、政策實(shí)施效果和社會(huì)影響等方面展開(kāi)各類探討[1]。研究工具方面,有學(xué)者通過(guò)三維分析框架[2]、可視化分析工具[3]、社會(huì)網(wǎng)絡(luò)分析法[4]、NVivo質(zhì)性分析軟件[5]等工具對(duì)我國(guó)數(shù)據(jù)政策進(jìn)行分析,并針對(duì)問(wèn)題提出相應(yīng)建議。

在國(guó)家層面政策的研究中,有針對(duì)政策制定問(wèn)題的思考:黃如花等[6]、趙洋等[7]利用內(nèi)容分析工具對(duì)國(guó)家層面開(kāi)放數(shù)據(jù)政策進(jìn)行分析,發(fā)現(xiàn)了政策缺乏政府?dāng)?shù)據(jù)共享體系的設(shè)計(jì),忽視數(shù)據(jù)開(kāi)放質(zhì)量監(jiān)管、對(duì)供需求雙方關(guān)注不足等問(wèn)題;白獻(xiàn)陽(yáng)等[8]通過(guò)構(gòu)建我國(guó)數(shù)據(jù)開(kāi)放體系框架,梳理我國(guó)開(kāi)放數(shù)據(jù)的相關(guān)政策,發(fā)現(xiàn)我國(guó)政策體系不完善、規(guī)范性和操作性不夠、政策保障能力缺乏等問(wèn)題。有針對(duì)政策實(shí)施角度的研究:陳玲等[1]利用二維理論分析模型,從政策實(shí)施角度對(duì)我國(guó)政府開(kāi)放數(shù)據(jù)政策實(shí)施特點(diǎn)進(jìn)行分析。有針對(duì)未來(lái)發(fā)展方向的研究:張濤等[9]、張會(huì)平等[10]利用主體聚類和知識(shí)圖譜等工具對(duì)大量大數(shù)據(jù)政策進(jìn)行綜合實(shí)驗(yàn)分析,厘清了我國(guó)大數(shù)據(jù)政策主題的發(fā)展和內(nèi)在邏輯,對(duì)未來(lái)發(fā)展趨勢(shì)進(jìn)行研判。

省市層面政策研究較多覆蓋在政策設(shè)計(jì)角度,雷浩偉等[11]提出省級(jí)大數(shù)據(jù)發(fā)展應(yīng)用政策存在進(jìn)程過(guò)快、支撐性不足、政策內(nèi)部協(xié)調(diào)性不足、需求回應(yīng)缺失等問(wèn)題;周文泓[12]提出我國(guó)地方政府應(yīng)立足本地實(shí)際需求進(jìn)行政策體系的完善;譚海波等[13]從大數(shù)據(jù)產(chǎn)業(yè)政策出發(fā),利用內(nèi)容分析法發(fā)掘政策未來(lái)發(fā)展方向。也有學(xué)者試圖將地方性政策與國(guó)家層面的要求進(jìn)行對(duì)比,張濤等[14]將22個(gè)地區(qū)政策與《綱要》進(jìn)行對(duì)比,并分析各地區(qū)政策的特征;王長(zhǎng)政等[15]利用扎根理論和社會(huì)網(wǎng)絡(luò)分析法,對(duì)地方政府層面的262份政策進(jìn)行研究,試圖發(fā)現(xiàn)大數(shù)據(jù)治理政策關(guān)注點(diǎn)的變化??梢钥闯觯簭闹黝}相似視角,對(duì)數(shù)據(jù)政策研究的成果較少,筆者從這一視角出發(fā),對(duì)地方性公共數(shù)據(jù)管理文件進(jìn)行分析研究。

2.2 研究邏輯框架

筆者選取28份我國(guó)地市級(jí)以上的公共數(shù)據(jù)管理政策,利用Python程序?qū)ζ溥M(jìn)行LDA建模處理,政策文本聚類的研究過(guò)程包括數(shù)據(jù)采集、文本停用詞處理、計(jì)算困惑度以確定主題數(shù)、形成主題等環(huán)節(jié)(見(jiàn)圖1),最后將LDA分析結(jié)果可視化并對(duì)其進(jìn)行分析,與國(guó)家政策中對(duì)于公共數(shù)據(jù)的建設(shè)要求進(jìn)行對(duì)比,對(duì)未來(lái)政策優(yōu)化提供建議。

3? 基于LDA模型的地方公共數(shù)據(jù)管理政策分析/Analysis of local public data management policies based on LDA model

3.1? 數(shù)據(jù)采集

選取地、市級(jí)以上的關(guān)于公共數(shù)據(jù)管理的政策文件為研究對(duì)象。因現(xiàn)階段公共數(shù)據(jù)政策發(fā)展還處于起步階段,大部分地區(qū)的數(shù)據(jù)管理政策仍停留在政府?dāng)?shù)據(jù)管理政策上。為保障研究的準(zhǔn)確性,避免受到類似“大數(shù)據(jù)”“政府?dāng)?shù)據(jù)”等近義政策文件干擾,本文檢索關(guān)鍵詞限制在“公共數(shù)據(jù)政策”“公共數(shù)據(jù)辦法”“開(kāi)放公共數(shù)據(jù)”等,文獻(xiàn)均來(lái)自各地區(qū)政府或大數(shù)據(jù)管理局官方網(wǎng)站,最終得到政策文件28份,文件名見(jiàn)表1。

3.2? 建模過(guò)程

筆者采用LDA主題模型進(jìn)行主題聚類分析,LDA模型是一種非監(jiān)督的機(jī)器學(xué)習(xí)手段,能夠處理詞匯、主題、文本之間的關(guān)聯(lián),展現(xiàn)聚類中的語(yǔ)義關(guān)系,發(fā)掘大規(guī)模文檔中暗含的主題信息[16]。其主要原理具體如下:某篇文本以一定概率暗含著某種主題,該主題又以一定概率由某些詞匯而構(gòu)成,即文本是某些主題的概率分布組合,而主題又是某些詞匯的概率分布組合,LDA模型能夠體現(xiàn)“文本—主題”和“主題—詞匯”兩種概率關(guān)系,在某一文本中,主題權(quán)重越高代表該文本與該主題的關(guān)系越高,“主題-詞匯”關(guān)系同理[17]。LDA模型可以通過(guò)多種計(jì)算機(jī)語(yǔ)言進(jìn)行實(shí)現(xiàn),筆者利用Python進(jìn)行建模,然后對(duì)文本做進(jìn)一步處理。具體步驟包括:①獲取政策文本對(duì)象匯聚成文本集;②對(duì)文本中的特殊符號(hào)進(jìn)行去除,并利用Jieba工具對(duì)文本集進(jìn)行分詞、詞性篩選、去停用詞。去停用詞的意義在于去除文本中量大但沒(méi)有實(shí)際意義的詞匯,例如“應(yīng)當(dāng)”“比如”“但是”等,使產(chǎn)生的主題詞匯更有研究?jī)r(jià)值;③計(jì)算困惑度以確定主題數(shù)量,主題數(shù)量選擇的合理程度決定了主題聚類準(zhǔn)確性;④詞匯向量化并形成矩陣;⑤聚類結(jié)果可視化輸出。

3.3? 分析結(jié)果

3.3.1? 確定主題數(shù)

LDA模型建模過(guò)程中需要設(shè)定主題數(shù)目,通常文本集合量越大則主題數(shù)目越多。大量的實(shí)踐研究證明,LDA模型的主題聚類效果與潛在的主題數(shù)量K直接相關(guān)。主題數(shù)會(huì)直接影響聚類文檔集的質(zhì)量。筆者采用困惑度(perplexity)這一公認(rèn)指標(biāo),對(duì)最優(yōu)主題數(shù)目進(jìn)行判定。困惑度是模型在區(qū)分主題時(shí)進(jìn)行的確定性判定指標(biāo),反映模型對(duì)新樣本是否適用,是否能正確

區(qū)分主題劃分[18]。其計(jì)算公式為:

其中,M為文本集中的文本數(shù),Nm為文檔m的長(zhǎng)度。為第m篇文檔中詞的概率值。若模型對(duì)新樣本的分類效果越好,泛化能力越強(qiáng),則困惑度值就越小,反之亦然。通過(guò)公式(1)進(jìn)行計(jì)算,當(dāng)主題數(shù)約等于11時(shí)模型的困惑度出現(xiàn)拐點(diǎn),故確定主題數(shù)為11,如圖2所示:

3.3.2? 主題強(qiáng)度分布

主題強(qiáng)度是描述主題在一定時(shí)間窗口內(nèi)受關(guān)注程度的指標(biāo),在某個(gè)時(shí)間窗口內(nèi)包含該主題的文檔數(shù)目越多,其主題強(qiáng)度越大,則其越有可能是熱點(diǎn)主題。主題強(qiáng)度計(jì)算公式如下:

其中,為文檔d中主題z所占比例,Dt為時(shí)間窗口t上的文本集合。將所有主題的主體強(qiáng)度計(jì)算完畢后,根據(jù)主題強(qiáng)度的大小降序排列,設(shè)定主題強(qiáng)度閾值以得到關(guān)注度較高的主題。主題閾值的計(jì)算公式如下:

若一個(gè)主題的主題強(qiáng)度大于這個(gè)閾值T時(shí),說(shuō)明該主題k屬于熱點(diǎn)主題[18]。主題強(qiáng)度可以利用pyLDAvis進(jìn)行可視化,體現(xiàn)各地公共數(shù)據(jù)政策對(duì)某些領(lǐng)域的覆蓋程度,主題強(qiáng)度高則代表著政策更重視該領(lǐng)域,并利用距離展示各主題之間的關(guān)系(見(jiàn)圖3)。每個(gè)圓代表著一個(gè)主題,圓的大小體現(xiàn)主題出現(xiàn)的強(qiáng)度,圓心間距離代表主題之間相似的程度。由圖3可見(jiàn),各主題間雖略有重復(fù),但大部分主題能夠保證一定的獨(dú)特性,得到了比較好的主題分類效果。由圖3可知,主題1有著較高的強(qiáng)度,主題2—5強(qiáng)度差距略有差異。展示出公共數(shù)據(jù)管理政策主題聚攏度較好,同時(shí)又能涉及多種領(lǐng)域,展現(xiàn)了政策制定的多樣化。

3.3.3? 主題領(lǐng)域分析

主題領(lǐng)域能夠從政策文本中詞頻數(shù)的強(qiáng)弱展示出來(lái),經(jīng)由詞頻統(tǒng)計(jì)工具形成詞頻詞云圖(見(jiàn)圖4),可以清晰地反應(yīng)公共數(shù)據(jù)政策涉及的重點(diǎn)。除去“公共數(shù)據(jù)”“數(shù)據(jù)”二詞外,公共數(shù)據(jù)政策更多將“管理”視角投向數(shù)據(jù)“資源”、公共數(shù)據(jù)的“開(kāi)放”“應(yīng)用”“治理”“服務(wù)”“創(chuàng)新”等角度??梢钥闯龈鞯卣哧P(guān)注推動(dòng)公共數(shù)據(jù)的開(kāi)放利用和參與政府治理,力求通過(guò)開(kāi)發(fā)公共數(shù)據(jù)資源來(lái)滿足當(dāng)前國(guó)家發(fā)展的實(shí)際需求。而“高端”“深度”“能力”“協(xié)同”等詞頻則相對(duì)較少,顯示出當(dāng)前政策制定仍處于初級(jí)階段,沒(méi)有著更深層次的公共數(shù)據(jù)管理規(guī)劃。

3.3.4? 主題構(gòu)成分析

通過(guò)LDA模型聚類得到公共數(shù)據(jù)政策的11個(gè)主題和構(gòu)成每種主題的特征詞匯,將每種主題中的特征詞所占比重由高到低排列,選取前10個(gè)特征詞進(jìn)行整理和總結(jié)歸納,通過(guò)高頻特征詞呈現(xiàn)出每種主題所蘊(yùn)含的政策議題,顯示出公共數(shù)據(jù)政策總體上的側(cè)重點(diǎn)和重點(diǎn)要求,主題的特征詞分布結(jié)果詳見(jiàn)表2。由于“公共數(shù)據(jù)”“數(shù)據(jù)”二詞在每個(gè)主題中都有出現(xiàn),則拋開(kāi)二詞對(duì)每個(gè)主題中其他高頻主題詞進(jìn)行總結(jié),利用人工篩查對(duì)相關(guān)度較高且可以形成具體含義的特征詞進(jìn)行集合,總結(jié)提取每個(gè)主題名稱。例如在主題1中,“開(kāi)放”“管理”較為高頻且關(guān)系密切,則可以將該主題總結(jié)為“開(kāi)放管理”;主題5中“部門”“管理”“資源”“服務(wù)”等詞可以總結(jié)為相關(guān)部門對(duì)數(shù)據(jù)資源服務(wù)進(jìn)行管理,故將該主題總結(jié)為資源服務(wù)管理,以此類推對(duì)聚類的11大主題進(jìn)行依次歸納,確定主題名稱。

通過(guò)模型分析可得到主題特征詞的分布,每個(gè)詞在主題中的概率能夠反映出該詞對(duì)主題的影響程度,概率越高則支持程度越大,全部特征詞構(gòu)成了每個(gè)主題蘊(yùn)含的主旨思想。圖5以主題1為例展示主題內(nèi)占比較高的前30個(gè)特征詞的比重,更為詳細(xì)地展示了每個(gè)主題所包含的獨(dú)有涵義。

由于研究對(duì)象是公共數(shù)據(jù)管理的相關(guān)政策,可以看出各主題的特征詞有一定程度上的趨同,但是每個(gè)主題都有一定程度的獨(dú)特性。通過(guò)對(duì)各主題的總結(jié)可以看出,當(dāng)前地方公共數(shù)據(jù)管理政策側(cè)重點(diǎn)集中于以下幾個(gè)方面:

(1)提升公共數(shù)據(jù)管理水平。提出公共數(shù)據(jù)管理目標(biāo),例如,促進(jìn)全社會(huì)的數(shù)字化轉(zhuǎn)型,利用公共數(shù)據(jù)加快數(shù)字政府建設(shè),利用公共數(shù)據(jù)加強(qiáng)社會(huì)、經(jīng)濟(jì)、城市治理的智慧化轉(zhuǎn)型;利用公共數(shù)據(jù)促進(jìn)公共服務(wù)的數(shù)字化轉(zhuǎn)型,提高民生服務(wù)及商業(yè)應(yīng)用的智慧化建設(shè);利用公共數(shù)據(jù)推動(dòng)工業(yè)制造向智能制造轉(zhuǎn)型,提高生產(chǎn)效率和研發(fā)能力。同時(shí)應(yīng)加強(qiáng)大數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè),保證數(shù)據(jù)研發(fā)和技術(shù)的高速發(fā)展[19]。政策同時(shí)要求相關(guān)部門應(yīng)明確管理目標(biāo)和責(zé)任,統(tǒng)籌本行政區(qū)內(nèi)的數(shù)據(jù)管理,指定采集清單編制同一目錄、核準(zhǔn)采集的公共數(shù)據(jù)質(zhì)量,保持?jǐn)?shù)據(jù)更新頻率等[20-21]。

(2)保障公共數(shù)據(jù)開(kāi)放共享和服務(wù)。公共數(shù)據(jù)開(kāi)放是公共管理和服務(wù)機(jī)構(gòu)向自然人、法人和其他組織(以下簡(jiǎn)稱數(shù)據(jù)利用主體)提供具有原始性、可機(jī)器讀取、可供社會(huì)化利用的數(shù)據(jù)集的行為[22]。對(duì)數(shù)據(jù)開(kāi)放條件、數(shù)據(jù)開(kāi)放手段、申請(qǐng)和利用方式提出相關(guān)要求,社會(huì)公眾、企業(yè)、團(tuán)體等廣泛參與公共數(shù)據(jù)應(yīng)用、價(jià)值挖掘、技術(shù)開(kāi)發(fā)等工作[23-24]。公共數(shù)據(jù)服務(wù)是指將公共數(shù)據(jù)提供給社會(huì)用戶的過(guò)程和方式,有政策要求應(yīng)保障無(wú)償向社會(huì)公眾提供數(shù)據(jù)服務(wù),應(yīng)提高數(shù)據(jù)服務(wù)質(zhì)量和水平,拓展服務(wù)模式,開(kāi)發(fā)高質(zhì)量的數(shù)據(jù)服務(wù)產(chǎn)品[24]。

(3)強(qiáng)調(diào)公共數(shù)據(jù)的資源作用。公共數(shù)據(jù)應(yīng)被視作新型公共資源,不得被私人侵占而阻礙開(kāi)放利用。公共數(shù)據(jù)資源也包括對(duì)數(shù)據(jù)進(jìn)行加工處理、分析研究所形成的,能發(fā)揮數(shù)據(jù)價(jià)值的產(chǎn)品,包括:數(shù)據(jù)模型、分析報(bào)告、可視化、檢索引擎、智慧服務(wù)等。應(yīng)保證公共數(shù)據(jù)資源得到充分的開(kāi)發(fā)和應(yīng)用,促進(jìn)公共數(shù)據(jù)資源在城市治理、公共服務(wù)中起到重要作用;建設(shè)數(shù)據(jù)交易超市,并對(duì)數(shù)據(jù)資源開(kāi)發(fā)出來(lái)的數(shù)據(jù)產(chǎn)品交易做出規(guī)定[24-26]。

(4)強(qiáng)調(diào)公共數(shù)據(jù)主管部門責(zé)任和義務(wù)。以大數(shù)據(jù)中心統(tǒng)籌公共數(shù)據(jù)管理,加快公共數(shù)據(jù)開(kāi)放平臺(tái)的建設(shè),各部門應(yīng)各盡其責(zé)相互協(xié)調(diào),鼓勵(lì)各單位設(shè)立首席數(shù)據(jù)官對(duì)數(shù)據(jù)工作進(jìn)行領(lǐng)導(dǎo)[19]。各部門有責(zé)任主動(dòng)收集和向大數(shù)據(jù)平臺(tái)歸集公共數(shù)據(jù),有責(zé)任保證數(shù)據(jù)的原始、完整、時(shí)效性;有責(zé)任建立完善的數(shù)據(jù)質(zhì)量管理制度,加強(qiáng)數(shù)據(jù)治理的把控;有責(zé)任形成監(jiān)督機(jī)制并自覺(jué)接受監(jiān)管評(píng)價(jià)。數(shù)據(jù)管理部門應(yīng)根據(jù)本地區(qū)實(shí)際需要,協(xié)同政府制定重點(diǎn)開(kāi)放公共數(shù)據(jù)目錄,保證民生優(yōu)先、經(jīng)濟(jì)優(yōu)先[19,23,25,28]。

(5)對(duì)違反相關(guān)規(guī)定的行為做出處理。為保障公共數(shù)據(jù)有效開(kāi)發(fā)利用,各地政策制定了違反條例規(guī)定的制裁方式,如未能保護(hù)數(shù)據(jù)安全、個(gè)人隱私的,未能保證數(shù)據(jù)質(zhì)量且按時(shí)歸集數(shù)據(jù)的,不通過(guò)數(shù)據(jù)開(kāi)放平臺(tái)而擅自提供數(shù)據(jù)資源的,利用公共數(shù)據(jù)非法獲利等相關(guān)行為將受到行政處分或法律追責(zé),保障了各地在公共數(shù)據(jù)開(kāi)放利用過(guò)程中的行為合規(guī)。

4? 地方公共數(shù)據(jù)政策的完備性分析/Analysis of the completeness of local public data policies

國(guó)家高度重視政府?dāng)?shù)據(jù)與公共數(shù)據(jù)的開(kāi)放利用,接連出臺(tái)相關(guān)政策,為地方公共數(shù)據(jù)管理政策的制定確立了行動(dòng)綱領(lǐng)和行為指南,為地方開(kāi)展公共數(shù)據(jù)共享利用、制定公共數(shù)據(jù)管理辦法和政策法規(guī)建設(shè)等指明了方向。通過(guò)對(duì)《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》《關(guān)于構(gòu)建更加完善的要素市場(chǎng)化配置體制機(jī)制的意見(jiàn)》《全國(guó)一體化政務(wù)大數(shù)據(jù)體系建設(shè)指南》等政策進(jìn)行精讀,利用內(nèi)容分析法對(duì)政策的共性要求進(jìn)行發(fā)掘,梳理《促進(jìn)大數(shù)據(jù)發(fā)展的行動(dòng)綱要》中對(duì)公共數(shù)據(jù)資源開(kāi)發(fā)利用的規(guī)劃設(shè)計(jì),將其與各地政策主題進(jìn)行比較,試圖發(fā)現(xiàn)當(dāng)前地方政策內(nèi)容的完備性和差距。

4.1? 形式完備性分析

筆者根據(jù)來(lái)自各地區(qū)政府或大數(shù)據(jù)管理局官方網(wǎng)站獲得的28份政策文件(見(jiàn)表1),展示了全國(guó)各地發(fā)布公共數(shù)據(jù)政策的現(xiàn)狀,能夠體現(xiàn)當(dāng)前我國(guó)各地對(duì)于公共數(shù)據(jù)相關(guān)工作的規(guī)劃成果。

4.1.1? 地區(qū)結(jié)構(gòu)性失衡

根據(jù)調(diào)研結(jié)果可以看出:發(fā)布“公共數(shù)據(jù)政策”“公共數(shù)據(jù)辦法”“開(kāi)放公共數(shù)據(jù)”等地方文件的省市集中在東南沿海地區(qū),西部的新疆、西藏、甘肅、青海、云南、寧夏、四川、貴州、內(nèi)蒙古,中部的山西、陜西、河南、河北、湖南、湖北、安徽等都沒(méi)有發(fā)布相關(guān)的公共數(shù)據(jù)管理政策,呈現(xiàn)東、中、西部公共數(shù)據(jù)管理政策結(jié)構(gòu)性失衡。

4.1.2? 區(qū)域馬太效應(yīng)明顯

公共數(shù)據(jù)政策來(lái)源結(jié)果展示山東省、浙江省、江蘇省、廣東省這幾個(gè)省份發(fā)布了省級(jí)公共數(shù)據(jù)管理相關(guān)政策,可見(jiàn)發(fā)布“公共數(shù)據(jù)政策”“公共數(shù)據(jù)辦法”“開(kāi)放公共數(shù)據(jù)”等地方文件的省市集中在經(jīng)濟(jì)發(fā)達(dá)地區(qū),展示出區(qū)域數(shù)字化管理呈現(xiàn)“好的更好”的趨勢(shì),馬太效應(yīng)明顯。

4.1.3? 全國(guó)一體化勢(shì)在必行

《新型數(shù)據(jù)中心發(fā)展三年行動(dòng)計(jì)劃(2021—2023年)》提出:2021年底,全國(guó)數(shù)據(jù)中心平均利用率要提升到55%,2023年提升到60%。《關(guān)于加快構(gòu)建全國(guó)一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系的指導(dǎo)意見(jiàn)》提出,2025年,全國(guó)范圍內(nèi)數(shù)據(jù)中心要形成:“布局合理”“綠色集約”的基礎(chǔ)設(shè)施一體化格局,彌補(bǔ)東西部公共數(shù)據(jù)管理結(jié)構(gòu)性平衡和區(qū)域馬太效應(yīng)明顯的問(wèn)題。

4.2? 內(nèi)容完備性分析

4.2.1? 國(guó)家頂層設(shè)計(jì)任務(wù)梳理

通過(guò)對(duì)政策文本的分析梳理,發(fā)現(xiàn)國(guó)家針對(duì)大數(shù)據(jù)發(fā)展建設(shè)提出A、B、C 3項(xiàng)任務(wù),政策中明確提出“穩(wěn)步推進(jìn)公共數(shù)據(jù)資源開(kāi)放”,彼時(shí)對(duì)公共數(shù)據(jù)尚未形成完整的定義,政策制定也將政府?dāng)?shù)據(jù)、工業(yè)數(shù)據(jù)、農(nóng)業(yè)數(shù)據(jù)等與公共數(shù)據(jù)區(qū)分開(kāi)來(lái)。根據(jù)各地發(fā)布政策中的公共數(shù)據(jù)定義,可以認(rèn)為公共數(shù)據(jù)囊括國(guó)家設(shè)計(jì)中提到的大部分?jǐn)?shù)據(jù)類型,故3項(xiàng)任務(wù)均可視作對(duì)公共數(shù)據(jù)建設(shè)的要求,具體要求如表3所示:

除了主要任務(wù)之外,國(guó)家還對(duì)大數(shù)據(jù)發(fā)展政策機(jī)制提出了完善要求,包括完善與實(shí)施與相關(guān)機(jī)制、完善法規(guī)與標(biāo)準(zhǔn)制度、加大金融支持、促進(jìn)人才培養(yǎng)和國(guó)際交流合作等。各地在制定相關(guān)政策時(shí),應(yīng)當(dāng)在國(guó)家的總體規(guī)劃布局基礎(chǔ)上進(jìn)行發(fā)展和完善,制定符合本地實(shí)際發(fā)展的公共數(shù)據(jù)政策方案。

4.2.2? 地方政策總體上符合《綱要》戰(zhàn)略要求

(1)地方政策關(guān)注數(shù)據(jù)資源開(kāi)放整合及治理,促進(jìn)了相關(guān)部門和負(fù)責(zé)人員對(duì)該項(xiàng)工作的重視程度。國(guó)家設(shè)計(jì)強(qiáng)調(diào):(A1)政府?dāng)?shù)據(jù)資源一體化、(A3)數(shù)據(jù)資源的歸集、(A4)治理精準(zhǔn)化;地方政策主題詞頻統(tǒng)計(jì)的高頻詞也包括“數(shù)據(jù)”“服務(wù)”“開(kāi)放”等,說(shuō)明地方數(shù)據(jù)政策強(qiáng)調(diào)開(kāi)放機(jī)制、開(kāi)放平臺(tái)建設(shè),并且對(duì)開(kāi)放利用方式及開(kāi)放安全監(jiān)管等方面都進(jìn)行了說(shuō)明,在思想上為地方數(shù)據(jù)開(kāi)放服務(wù)確立了思想基礎(chǔ)。

(2)地方政策明確相關(guān)部門職責(zé)及管理責(zé)任。國(guó)家要求:(B2)建立數(shù)據(jù)開(kāi)放審批制度、(A5)數(shù)據(jù)治理系統(tǒng)、(C3)安全保障一體化,明確指出應(yīng)形成責(zé)任明晰、強(qiáng)化資源統(tǒng)籌管理,要求各部門統(tǒng)一思想,認(rèn)真履行職責(zé)。各地的政策也對(duì)這項(xiàng)要求做出相應(yīng)的規(guī)劃,地方政策要求公共數(shù)據(jù)資源開(kāi)放管理,以各地大數(shù)據(jù)管理中心為核心,承擔(dān)數(shù)據(jù)統(tǒng)籌協(xié)調(diào)、組織數(shù)據(jù)采集、維護(hù)平臺(tái)運(yùn)營(yíng)、對(duì)數(shù)據(jù)開(kāi)放進(jìn)行監(jiān)管的職責(zé)。地方政策在明確責(zé)任的同時(shí),也提出違反規(guī)定應(yīng)承擔(dān)的法律責(zé)任,為公共數(shù)據(jù)開(kāi)放提供了法制保障。

(3)地方政策推動(dòng)公共數(shù)據(jù)資源共享利用,提升公共數(shù)據(jù)利用效果。國(guó)家政策要求:(B1)構(gòu)建數(shù)據(jù)開(kāi)放體系、(B3)關(guān)注重點(diǎn)開(kāi)放領(lǐng)域。數(shù)據(jù)資源的共享和開(kāi)放應(yīng)是公共數(shù)據(jù)價(jià)值實(shí)現(xiàn)的核心方式。地方政策主題詞頻統(tǒng)計(jì)的高頻詞也包括“開(kāi)放”“共享”“資源”等特征詞,說(shuō)明地方政策對(duì)數(shù)據(jù)開(kāi)放與共享做出了豐富的規(guī)劃,體現(xiàn)出數(shù)據(jù)資源開(kāi)放共享在地方公共數(shù)據(jù)管理中的核心地位。

5? 地方政策亟待完善之處/Areas in Need of Improvement in Local Policies

《促進(jìn)大數(shù)據(jù)發(fā)展的行動(dòng)綱要》是國(guó)家戰(zhàn)略,為地方公共數(shù)據(jù)管理政策的制定確立了行動(dòng)綱領(lǐng)和行為指南,各地方公共數(shù)據(jù)管理政策的制定也應(yīng)該以《促進(jìn)大數(shù)據(jù)發(fā)展的行動(dòng)綱要》的3大任務(wù)的實(shí)現(xiàn)為目標(biāo),因此,各地方公共數(shù)據(jù)管理政策的內(nèi)容應(yīng)該遵循目標(biāo)管理的SMART(specific、measurable、attainable、relevant、time-bound)原則。SMART原則是由管理學(xué)大師德魯克在其1954年出版的《管理的實(shí)踐》一書(shū)中提出的[29]?;赟MART原則,各地方公共數(shù)據(jù)管理政策不能內(nèi)容籠統(tǒng),缺乏切入解決實(shí)際問(wèn)題的作用,如果這樣會(huì)導(dǎo)致各地方公共數(shù)據(jù)管理政策缺乏有效的引導(dǎo)性,不利于行為主體依據(jù)政策開(kāi)展更深層次的數(shù)據(jù)管理和利用。只有遵循SMART原則,才能更加明確高效地工作,明確目標(biāo)設(shè)定和公共數(shù)據(jù)管理工作效果有利于管理者對(duì)相關(guān)數(shù)據(jù)工作人員的工作實(shí)施績(jī)效考核,能夠?yàn)橄嚓P(guān)考核提供考核目標(biāo)和考核標(biāo)準(zhǔn),使考核更加科學(xué)化、規(guī)范化,更能保證績(jī)效考核的公正、公開(kāi)與公平。因此,筆者依據(jù)SMART原則衡量地方公共數(shù)據(jù)管理政策的內(nèi)容,看其是否具備實(shí)現(xiàn)公共數(shù)據(jù)開(kāi)放國(guó)家政策設(shè)計(jì)3大任務(wù)的明確性、衡量性、實(shí)現(xiàn)性、相關(guān)性、時(shí)限性。

5.1? 提升任務(wù)目標(biāo)精準(zhǔn)度(specific)

國(guó)家規(guī)劃強(qiáng)調(diào)治理精準(zhǔn)化(A4),《綱要》中對(duì)政府、醫(yī)療、社保、教育、農(nóng)業(yè)、科研等領(lǐng)域的數(shù)據(jù)應(yīng)用做出了應(yīng)用設(shè)計(jì),強(qiáng)調(diào)建設(shè)“公共服務(wù)大數(shù)據(jù)工程”“工業(yè)和新興產(chǎn)業(yè)大數(shù)據(jù)工程”“農(nóng)業(yè)大數(shù)據(jù)工程”及“創(chuàng)新大數(shù)據(jù)工程”等數(shù)據(jù)開(kāi)放管理項(xiàng)目,并對(duì)不同領(lǐng)域的數(shù)據(jù)工程建設(shè)做出具體詳實(shí)的說(shuō)明,規(guī)劃了數(shù)據(jù)工程的發(fā)展方向和具體應(yīng)用模式。從表2和圖5的地方政策主題聚類結(jié)果中可以看出,各地聚焦于宏觀層面引導(dǎo),但各地政策對(duì)具體領(lǐng)域缺乏具體精準(zhǔn)的實(shí)踐指導(dǎo),各地區(qū)的政策盡管對(duì)公共數(shù)據(jù)資源的開(kāi)放領(lǐng)域做出了闡述,但絕大多數(shù)僅僅說(shuō)明某類數(shù)據(jù)的利用方向,具體實(shí)施過(guò)程和方式不夠詳盡。主題特征詞“利用”“應(yīng)用”“制定”等比較抽象,如 “利用”一詞,僅出現(xiàn)在主題3中,比重僅占0.011,而“開(kāi)放”“共享”等概括性詞匯幾乎出現(xiàn)在所有的主題中,有較高的主題支持度,這說(shuō)明各地政策思想上注重公共數(shù)據(jù)開(kāi)放利用,但在具體的實(shí)踐層面,指導(dǎo)不明確、不具體,沒(méi)有滿足SMART原則的specific指標(biāo),政策內(nèi)容不夠精準(zhǔn)詳細(xì)、實(shí)踐操作性不足。各地政策內(nèi)容應(yīng)該更加明確精準(zhǔn)對(duì)接各實(shí)踐領(lǐng)域,這樣才能有利于引導(dǎo)政府、醫(yī)療、社保、教育、農(nóng)業(yè)、科研等具體領(lǐng)域公共數(shù)據(jù)的持續(xù)開(kāi)發(fā)和利用。

5.2? 建立統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范(measurable)

國(guó)家規(guī)劃強(qiáng)調(diào)(C2)標(biāo)準(zhǔn)規(guī)范一體化,建立國(guó)家宏觀調(diào)控?cái)?shù)據(jù)體系,及時(shí)發(fā)布有關(guān)統(tǒng)計(jì)指標(biāo)和數(shù)據(jù),提高宏觀調(diào)控的科學(xué)性、預(yù)見(jiàn)性和有效性。國(guó)家政策要求地方政府依據(jù)自身實(shí)際情況制定多層次的大數(shù)據(jù)政策,確立完善的數(shù)據(jù)資源管理辦法和制度。從政策主題詞表(見(jiàn)表2)中可以看出,“法規(guī)”“標(biāo)準(zhǔn)”“制度”等關(guān)鍵詞對(duì)主題產(chǎn)生影響較弱,體現(xiàn)出當(dāng)前各地出臺(tái)的數(shù)據(jù)管理政策未能響應(yīng)國(guó)家的相關(guān)要求,建立可以統(tǒng)計(jì)衡量的各級(jí)指標(biāo)體系,沒(méi)有把用戶滿意度、公共數(shù)據(jù)網(wǎng)站行為“標(biāo)準(zhǔn)”等進(jìn)行規(guī)范化、數(shù)值化處理,各地政策僅從執(zhí)行部門角度出發(fā),要求其在各自職能范圍內(nèi)做好數(shù)據(jù)管理和開(kāi)放工作,缺少公共數(shù)據(jù)開(kāi)放的各級(jí)標(biāo)準(zhǔn),導(dǎo)致主體工作無(wú)據(jù)可依,應(yīng)該完善公共數(shù)據(jù)處理的各級(jí)標(biāo)準(zhǔn)規(guī)范體系,為開(kāi)放公共數(shù)據(jù)提供可衡量的行為準(zhǔn)則。

5.3? 加強(qiáng)各類保障制度(attainable)

國(guó)家政策強(qiáng)調(diào)政府?dāng)?shù)據(jù)資源的技術(shù)支持,加強(qiáng)政府預(yù)算投入進(jìn)行科研支持,國(guó)家強(qiáng)調(diào)集中資金攻克大數(shù)據(jù)核心技術(shù),支持重大應(yīng)用項(xiàng)目和公共數(shù)據(jù)開(kāi)放平臺(tái)的建設(shè),完善政府采購(gòu)數(shù)據(jù)應(yīng)用的配套制度等。而實(shí)驗(yàn)結(jié)果顯示(見(jiàn)表2和圖5):各主題中都缺乏“資金”“技術(shù)”相關(guān)特征詞的支持,更加沒(méi)有關(guān)于二者要求的主題項(xiàng)目,體現(xiàn)出地方政策在保障支持方面缺乏詳細(xì)的規(guī)劃,而公共數(shù)據(jù)的收集、管理和開(kāi)放都需要一定程度的技術(shù)予以支持,這使得公共數(shù)據(jù)開(kāi)放和管理活動(dòng)缺乏最基礎(chǔ)的能力保障,使得相關(guān)工作難以深入進(jìn)行,無(wú)法提高相關(guān)部門的積極性,工作任務(wù)難以實(shí)現(xiàn)(not attainable)。

5.4? 增強(qiáng)各部門工作協(xié)同(relevant)

國(guó)家政策強(qiáng)調(diào)(C1)算力設(shè)施一體化、(C2)標(biāo)準(zhǔn)規(guī)范一體化、(C3)安全保障一體化。要推動(dòng)構(gòu)建智能防控、綜合治理的公共安全體系,形成全鏈條的數(shù)據(jù)管理政策生態(tài)。從表2和圖5可知,各主題中都缺乏“協(xié)同”相關(guān)特征詞的支持,更加沒(méi)有關(guān)于“協(xié)同”要求的主題項(xiàng)目,圖8的地方政策高頻詞中,雖然出現(xiàn)“部門”責(zé)任、公共數(shù)據(jù)開(kāi)放“機(jī)構(gòu)”的“共享”與“服務(wù)”,但“部門”與“機(jī)構(gòu)”之間如何共享?地方政策中為實(shí)現(xiàn)“共享”而進(jìn)行的區(qū)域協(xié)同、部門之間的協(xié)同、工作的長(zhǎng)、中、短期目標(biāo)之間的協(xié)同等很少被涉及,協(xié)同效應(yīng)不明顯(not relevant)。地方政策要協(xié)同考慮相關(guān)的區(qū)域、部門、各級(jí)工作,工作之間彼此不能沖突,這樣才能促進(jìn)數(shù)據(jù)綜合治理、區(qū)域和產(chǎn)業(yè)聯(lián)盟的形成。

5.5? 增強(qiáng)工作部署時(shí)限性(time-bound)

《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》指出,2017年底要形成跨部門數(shù)據(jù)資源共享共用格局,2018年底前建成國(guó)家政府?dāng)?shù)據(jù)統(tǒng)一開(kāi)放平臺(tái)。在主題聚類分析中發(fā)現(xiàn),地方政策中各項(xiàng)工作的時(shí)間限制很少被提及,政策內(nèi)容少了實(shí)際的期限,還停留在“想做”的階段,對(duì)各項(xiàng)工作付諸行動(dòng)的指導(dǎo)和期限約束不足,對(duì)工作進(jìn)度考核不可控,會(huì)造成公共數(shù)據(jù)開(kāi)放利用的拖延。

6? 結(jié)語(yǔ)/Conclusion

本文以各地公共數(shù)據(jù)管理政策為研究對(duì)象,利用LDA主題聚類分析工具對(duì)其進(jìn)行主題挖掘,并將結(jié)果與國(guó)務(wù)院為加強(qiáng)數(shù)據(jù)資源利用而頒布的3項(xiàng)定策設(shè)計(jì)展開(kāi)比較分析。研究結(jié)果顯示,各地政策對(duì)公共數(shù)據(jù)資源開(kāi)發(fā)做出了宏觀把控,規(guī)劃了數(shù)據(jù)開(kāi)放的發(fā)展方向,明確了各主體的職責(zé)和義務(wù),為公共數(shù)據(jù)價(jià)值深度挖掘做出了基礎(chǔ)部署,但由于我國(guó)公共數(shù)據(jù)資源開(kāi)放處于初級(jí)階段,各地政策的完備程度還存在不足,還需進(jìn)一步修訂改進(jìn)。

參考文獻(xiàn)/References:

[1] 陳玲, 段堯清. 我國(guó)政府開(kāi)放數(shù)據(jù)政策的實(shí)施現(xiàn)狀和特點(diǎn)研究: 基于政府公報(bào)文本的量化分析[J]. 情報(bào)學(xué)報(bào), 2020, 39(7): 698-709. (CHEN L, DUAN Y Q. Analyzing implementation of the Chinese government open data policy using government bulletin text as example [J]. Journal of the China Society for Scientific and Technical Information, 2020, 39(7): 698-709.)

[2] 李樵. 我國(guó)促進(jìn)大數(shù)據(jù)發(fā)展政策工具選擇體系結(jié)構(gòu)及其優(yōu)化策略研究[J]. 圖書(shū)情報(bào)工作, 2018, 62(11): 5-15. (LI Q. Research on the architecture and optimization strategy of policy instrument selection for the development of big data in China[J]. Library and information service, 2018, 62(11): 5-15.)

[3] 徐蕾, 李慶, 肖相澤. 基于扎根理論的大數(shù)據(jù)政策共詞網(wǎng)絡(luò)研究[J]. 現(xiàn)代情報(bào), 2018, 38(6): 157-164. (XU L, LI Q, XIAO X Z. The co-word network analysis of big data policies based on ground theory[J]. Journal of modern information, 2018, 38(6): 157-164.)

[4] 段堯清, 尚婷, 周密. 我國(guó)政務(wù)大數(shù)據(jù)政策擴(kuò)散特征與主題分析[J]. 圖書(shū)情報(bào)工作, 2020, 64(13): 133-139. (DUAN R Q, SHANG T, ZHOU M. Analysis on the characteristics and subjects of Chinas government big data policy diffusion[J]. Library and information service, 2020, 64(13): 133-139.)

[5] 陳蘭杰, 趙元晨. 政策工具視角下我國(guó)開(kāi)放政府?dāng)?shù)據(jù)政策文本分析[J]. 情報(bào)資料工作, 2020, 41(6): 46-53. (CHEN L J, ZHAO Y C. Analysis of open government data policy text in China from the perspective of policy tools[J]. Information and documentation services, 2020, 41(6): 46-53.)

[6] 黃如花, 溫芳芳. 我國(guó)政府?dāng)?shù)據(jù)開(kāi)放共享的政策框架與內(nèi)容:國(guó)家層面政策文本的內(nèi)容分析[J]. 圖書(shū)情報(bào)工作, 2017, 61(20): 12-25. (HUANG R H, WEN F F. Policy framework and content of opening and sharing government data in China: a content analysis of policy documents at the national level[J]. Library and information service, 2017, 61(20): 12-25.)

[7] 趙洋, 程雪涓. 政策工具視域下我國(guó)開(kāi)放數(shù)據(jù)政策研究[J]. 圖書(shū)館雜志, 2021, 40(11): 31-38,47. (ZHAO Y, CHENG X J. Research on open data policy from the perspective of policy instruments in China[J], Library journal, 2021, 40(11): 31-38, 47.)

[8] 白獻(xiàn)陽(yáng), 孫夢(mèng)皎, 安小米. 大數(shù)據(jù)環(huán)境下我國(guó)政府?dāng)?shù)據(jù)開(kāi)放政策體系研究[J]. 圖書(shū)館學(xué)研究, 2018(24): 48-56, 47. (BAI X Y, SUN M J, AN X M. On Chinas open government data policy system under the background of big data[J]. Research on library science, 2018(24): 48-56, 47.)

[9] 張濤, 馬海群. 我國(guó)大數(shù)據(jù)政策主題分析及發(fā)展動(dòng)向研判[J]. 情報(bào)理論與實(shí)踐, 2022, 45(3): 72-80. (ZHANG T, MA H Q. Top analysis and developing trends of big data policy in China[J]. Information studies: theory & application, 2022, 45(3): 72-80.)

[10] 張會(huì)平, 郭寧, 湯璽楷. 推進(jìn)邏輯與未來(lái)進(jìn)路:我國(guó)政務(wù)大數(shù)據(jù)政策的文本分析[J]. 情報(bào)雜志, 2018, 37(3): 152-157, 192. (ZHANG H P, GUO N, TANG X K. Promoting logic and future directions: a textual analysis of Chinas government big data policy[J]. Journal of intelligence, 2018, 37(3): 152-157, 192.)

[11] 雷浩偉, 廖秀健. 省級(jí)政府大數(shù)據(jù)發(fā)展應(yīng)用政策的規(guī)制導(dǎo)向與執(zhí)行優(yōu)化研究——基于政策文本的分析[J]. 公共管理與政策評(píng)論, 2022, 11(2): 114-134. (LEI H W, LIAO X J. Research on the regulatory guidance and implementation optimization of big data development and application policies of provincial governments: based on the analysis of policy texts[J]. Public administration and policy review, 2022, 11(2): 114-134.)

[12] 周文泓. 面向資產(chǎn)化利用的我國(guó)地方政府開(kāi)放數(shù)據(jù)政策調(diào)查及其啟示[J]. 情報(bào)理論與實(shí)踐, 2022, 45(6): 48-54, 16. (ZHOU W H, Research on government open data policy of local government for asset-orient utilization and its enlightenment[J]. Information studies: theory & application, 2022, 45(6): 48-54, 16.)

[13] 譚海波, 鄭清清, 王海函. 地方政府大數(shù)據(jù)產(chǎn)業(yè)政策:工具偏好及其匹配——基于貴州省政策文本的分析[J]. 中國(guó)行政管理, 2021(1): 52-58. (TAN H B, ZHENG Q Q, WANG H H. Local government big data industry policy: tool preferences and compatibility ——analysis based on the text of Guizhou policy[J]. Chinese public administration, 2021(1): 52-58.)

[14] 張濤, 馬海群, 易揚(yáng). 文本相似度視角下我國(guó)大數(shù)據(jù)政策比較研究[J]. 圖書(shū)情報(bào)工作, 2020, 64(12): 26-37. (ZHANG T, MA H Q, YI Y. Comparative analysis of Chinas big data policies from the perspective of text similarity[J]. Library and information service, 2020, 64(12): 26-37.)

[15] 王長(zhǎng)征, 彭小兵, 彭洋. 地方政府大數(shù)據(jù)治理政策的注意力變遷——基于政策文本的扎根理論與社會(huì)網(wǎng)絡(luò)分析[J]. 情報(bào)雜志, 2020, 39(12): 111-118. (WANG C Z, PENG X B, PENG Y. Attention evolution of big data governance policies of local government——Based on grounded theory and social network[J]. Journal of intelligence, 2020, 39(12): 111-118.)

[16] 王鵬, 高鋮, 陳曉美. 基于LDA模型的文本聚類研究[J]. 情報(bào)科學(xué), 2015, 33(1): 63-68. (WANG P, GAO C, CHEN X M. Research on LDA model based on text clustering[J]. Information science, 2015, 33(1): 63-68.)

[17] 李倩, 王帥. LDA模型下我國(guó)公共圖書(shū)館微信平臺(tái)閱讀推廣內(nèi)容主題研究[J]. 圖書(shū)情報(bào)工作, 2022, 66(8): 72-83. (LI Q, WANG S. A study on the topic of WeChat platforms reading promotion contents in public libraries by using LDA model in China[J]. Library and information service, 2022, 66(8): 72-83.)

[18] ARUN R, SURESH V, MADHAVAN C E V, et al. On finding the natural number of topics with latent Dirichlet allocation: some observations[C]∥Pacific-Asia conference on knowledge discovery and data mining. Berlin: Springer, 2010: 391-402.

[19] 上海市人民政府. 上海市數(shù)據(jù)條例[EB/OL]. [2023-10-30]. https://www.shanghai.gov.cn/nw12344/20211129/a1a38c3dfe8b4f8f8fcba5e79fbe9251.html. (PEOPLES GOVERNMENT OF SHANGHAI. Shanghai data regulations[EB/OL]. [2023-10-30]. https://www.shanghai.gov.cn/nw12344/20211129/a1a38c3dfe8b4f8f8fcba5e79fbe9251.html.)

[20] 廣東省人民政府. 廣東省公共數(shù)據(jù)管理辦法[EB/OL]. [2023-10-30]. https://www.gd.gov.cn/zwgk/wjk/qbwj/yfl/content/post_3584932.html (PEOPLES GOVERNMENT OF GUANGDONG PROVINCE. Guangdong Provincial public data management measures[EB/OL]. [2023-10-30]. https://www.gd.gov.cn/zwgk/wjk/qbwj/yfl/content/post_3584932.html.)

[21] 浙江省人民政府.浙江省公共數(shù)據(jù)條例[EB/OL]. [2023-10-30]. https://jgj.hangzhou.gov.cn/art/2023/5/30/art_1229717029_1832012.html. (PEOPLES GOVERNMENT OF ZHEJIANG PROVINCE. Zhejiang Province public data regulations[EB/OL]. [2023-10-30]. https://jgj.hangzhou.gov.cn/art/2023/5/30/art_1229717029_1832012.html.)

[22] 重慶市人民政府. 重慶市公共數(shù)據(jù)開(kāi)放管理暫行辦法[EB/OL]. [2023-10-30]. http://www.cq.gov.cn/zwgk/zfxxgkml/szfwj/xzgfxwj/szfbgt/202009/t20200918_8837781.html. (CHONGQING MUNICIPAL PEOPLES GOVERNMENT. Interim measures for open management of public data in Chongqing [EB/OL]. [2023-10-30]. http://www.cq.gov.cn/zwgk/zfxxgkml/szfwj/xzgfxwj/szfbgt/202009/t20200918_8837781.html.)

[23] 山東省人民政府. 山東省公共數(shù)據(jù)開(kāi)放辦法[EB/OL]. [2023-10-30]. http://www.shandong.gov.cn/art/2022/2/9/art_107851_117339.html. (PEOPLES GOVERNMENT OF SHANDONG PROVINCE. Shandong Province public data open approach [EB/OL]. [2023-10-30]. http://www.shandong.gov.cn/art/2022/2/9/art_107851_117339.html.)

[24] 海南省大數(shù)據(jù)管理局. 海南省公共數(shù)據(jù)產(chǎn)品開(kāi)發(fā)利用暫行管理辦法[EB/OL]. [2023-10-30]. https://dsj.hainan.gov.cn/tzgg/zcgg/202109/t20210918_3055961.html. (BIG DATA ADMINISTRATION OF HAINAN PROVINCE. Interim management measures for the development and utilization of public data products in Hainan Province [EB/OL]. [2023-10-30]. https://dsj.hainan.gov.cn/tzgg/zcgg/202109/t20210918_3055961.html.)

[25] 廣西省人民政府. 廣西公共數(shù)據(jù)開(kāi)放管理辦法[EB/OL]. [2023-10-30]. http://www.gxzf.gov.cn/html/zfgb/2020nzfgb/d17q_zfgb/zfgb20200702/t7241433.shtml. (PEOPLES GOVERNMENT OF GUANGXI PROVINCE. Guangxi public data open management approach [EB/OL]. [2023-10-30]. http://www.gxzf.gov.cn/html/zfgb/2020nzfgb/d17q_zfgb/zfgb20200702/t7241433.shtml.)

[26] 吉林省人民政府. 吉林省公共數(shù)據(jù)和一網(wǎng)通辦管理辦法(試行)[EB/OL]. [2023-10-30]. https://xxgk.jl.gov.cn/szf/gkml/201901/t20190117_5486564.html. (PEOPLES GOVERNMENT OF JILIN PROVINCE. Jilin Province public data and one-network management approach (for trial implementation) [EB/OL]. [2023-10-30]. https://xxgk.jl.gov.cn/szf/gkml/201901/t20190117_5486564.html.)

[27] 江蘇省人民政府. 江蘇省公共數(shù)據(jù)管理辦法[EB/OL]. [2023-10-30]. https://www.jiangsu.gov.cn/art/2021/12/24/art_46143_10224944.html. (PEOPLES GOVERNMENT OF JIANGSU PROVINCE. Measures for public data management in Jiangsu Province[EB/OL]. [2023-10-30]. https://www.jiangsu.gov.cn/art/2021/12/24/art_46143_10224944.html.)

[28] 德魯克. 管理的實(shí)踐[M]. 齊若蘭, 譯. 北京: 機(jī)械工業(yè)出版社, 2018. (DRUCKER P. The practice of management[M]. QI R L, trans. Beijing: China Machine Press, 2018.)

作者貢獻(xiàn)說(shuō)明/ Author contributions:

王? 勁:負(fù)責(zé)相關(guān)資料收集、數(shù)據(jù)分析、框架設(shè)計(jì)、論文撰寫(xiě);

孫瑞英:負(fù)責(zé)論文觀點(diǎn)提煉、修改與撰寫(xiě)。

Analysis of the Completeness of Local Public Data Management Policies from the Perspective of Topic Clustering

Wang Jin? Sun Ruiying

School of Information Management, Heilongjiang University, Harbin 150080

Abstract: [Objective/Significance] This study investigates and analyzes the public data management policies at or above the municipal level in China, comparing them with the requirements of national-level data policies on relevant work development, and attempts to identify the degree of alignment between current local policies and national requirements. [Methods/Processes] Twenty-eight public data management policies at or above the municipal level in China were collected. After processing and organizing the content, the LDA algorithm was used for topic identification, and these policies were compared with the national-level data development outline. [Results/Conclusions] The themes of the current public data management policies formulated by various regions are focused, with clear objectives, but overall, they are still in the early stages of development. They have not been able to guide and manage the deep application of public data effectively, and there is still a certain gap with the requirements of the national top-level design.

Keywords: topic model? ? public data? ? cluster analysis? ? policy comparison

Fund project(s): This work is supported by the 2021 Major Project of the National Social Science Fund of China titled “Research on the System and Capacity Building of Public Data Open and Utilization for Digital Development” (Grant No. 21&ZD336), and the General Research Project on Higher Education Teaching Reform in Heilongjiang Province titled “Research on Promoting the Connotation Development of Universities through Innovation and Entrepreneurship Education Reform in the New Era” (Grant No. SJGY20210720).

Author(s): Wang Jin, PhD candidate, E-mail: 809630403@qq.com; Sun Ruiying, professor, postdoctoral fellow, doctoral supervisor.

Received: 2023-09-19? ? Published: 2024-02-27

猜你喜歡
公共數(shù)據(jù)聚類分析
公共數(shù)據(jù)使用的路徑探尋
——訪工信部信息通信經(jīng)濟(jì)專家委員會(huì)委員、中國(guó)科協(xié)決策咨詢首席專家王春暉
人民周刊(2023年15期)2023-09-27 07:39:40
制定中國(guó)公共數(shù)據(jù)開(kāi)發(fā)利用法規(guī)的建議
公共數(shù)據(jù)商業(yè)利用邊界研究
公共數(shù)據(jù)授權(quán)運(yùn)營(yíng)機(jī)制探索
論公共數(shù)據(jù)管控權(quán)的規(guī)范建構(gòu)
公共數(shù)據(jù)開(kāi)放許可的規(guī)范建構(gòu)
基于聚類分析研究貴州省各地區(qū)經(jīng)濟(jì)發(fā)展綜合評(píng)價(jià)
商情(2016年39期)2016-11-21 08:45:54
新媒體用戶行為模式分析
農(nóng)村居民家庭人均生活消費(fèi)支出分析
基于省會(huì)城市經(jīng)濟(jì)發(fā)展程度的實(shí)證分析
肇源县| 宝应县| 德庆县| 巫溪县| 英山县| 黑龙江省| 云霄县| 西盟| 郓城县| 铜川市| 乌拉特后旗| 佛教| 孙吴县| 罗山县| 定边县| 乌审旗| 泰州市| 泰顺县| 桐城市| 丹东市| 二连浩特市| 湖南省| 江源县| 普洱| 万年县| 和平区| 长沙市| 壶关县| 白河县| 邵阳县| 渭南市| 安溪县| 古浪县| 马尔康县| 凤阳县| 德阳市| 临江市| 如东县| 孟州市| 吴川市| 石狮市|