王騰飛?李宏
摘要:在大數(shù)據(jù)時(shí)代,建立用 Python 預(yù)測(cè)公共安全事件發(fā)展研究,可實(shí)現(xiàn)對(duì)公共安全事件防控全面、客觀的感知和認(rèn)識(shí),為做出符合實(shí)際的科學(xué)決策提供實(shí)證支撐。另一方面,大數(shù)據(jù)不僅是一項(xiàng)具有革命性的信息技術(shù),也是一種思維、資源和能力。在新冠肺炎公共安全事件防控的大背景下,面對(duì)突發(fā)性公共衛(wèi)生事件,如何運(yùn)用大數(shù)據(jù)提升政府治理能力,增強(qiáng)治理效能,進(jìn)行科學(xué)決策、思想引導(dǎo)和精準(zhǔn)施策,需要相關(guān)人員深入研究并提出相關(guān)措施。
關(guān)鍵詞:Python 預(yù)測(cè);公共安全事件;發(fā)展研究
基金項(xiàng)目:本文系“可視化計(jì)算與虛擬現(xiàn)實(shí)四川省重點(diǎn)實(shí)驗(yàn)室”單位項(xiàng)目《大數(shù)據(jù)在重大疫情防控中的應(yīng)用研究》 (課題編號(hào):SCVCVR2021.04VS);課題所取得的研究成果受“可視化計(jì)算與虛擬現(xiàn)實(shí)四川省重點(diǎn)實(shí)驗(yàn)室”資助。
王騰飛(1986.11-),男,漢族,重慶開州,碩士學(xué)位,助教,研究方向:大數(shù)據(jù)技術(shù)與應(yīng)用;
李宏(1964.04-),男,漢族,重慶開州,學(xué)士學(xué)位,教授,研究方向:計(jì)算機(jī)應(yīng)用技術(shù)。
一、背景
突發(fā)性公共事件,是現(xiàn)代社會(huì)風(fēng)險(xiǎn)治理的重要課題。其中重點(diǎn)包括了“防范化解重大風(fēng)險(xiǎn)體制機(jī)制不斷健全,突發(fā)公共事件應(yīng)急能力顯著增強(qiáng)”。
在大數(shù)據(jù)時(shí)代,建立用 Python 預(yù)測(cè)公共安全事件發(fā)展研究,可實(shí)現(xiàn)對(duì)公共安全事件防控全面、客觀的感知和認(rèn)識(shí),為做出符合實(shí)際的科學(xué)決策提供實(shí)證支撐。另一方面,大數(shù)據(jù)不僅是一項(xiàng)具有革命性的信息技術(shù),也是一種思維、資源和能力。
二、原則及方法
①運(yùn)用大數(shù)據(jù)實(shí)時(shí)數(shù)據(jù)治理,促進(jìn)公共安全事件防控治理網(wǎng)絡(luò)化、制度化和規(guī)范。在大數(shù)據(jù)時(shí)代,社會(huì)結(jié)構(gòu)和治理模式正在發(fā)生變革,如社會(huì)構(gòu)成復(fù)雜化、權(quán)力機(jī)制扁平化、社會(huì)治理多元化等。
②運(yùn)用大數(shù)據(jù)實(shí)施整體性治理,提升公共安全事件防控把控能力和科學(xué)決策力。需要建立公共安全事件防控中利用大數(shù)據(jù)“采集——分析——反饋”的制度規(guī)范,確保和提高行政運(yùn)行效率。
③運(yùn)用大數(shù)據(jù)實(shí)施精準(zhǔn)治理,提升應(yīng)對(duì)公共安全事件防控的態(tài)勢(shì)感知力、資源匹配供給力和差異化服務(wù)能力。
既能體現(xiàn)以人民為中心的根本立場(chǎng),又能在應(yīng)急處置中激發(fā)人們主動(dòng)參與,減少治理成本,增強(qiáng)治理效能,提升廣大民眾對(duì)黨和政府的信任感和信賴度[3]。
三、案例
(一)Python 預(yù)測(cè)案例
作為TF-IDF結(jié)果的一個(gè)例子,來(lái)看看這些句子。"Im traveling to Paris this week","There will be so many journeys to Paris next week","Paris is supposed to receive a lot of tourists"。實(shí)際案例簡(jiǎn)單的案例,使用TF-IDF來(lái)識(shí)別。數(shù)據(jù)集從2009年至2020年的英文文本中抽取了一組新聞和觀點(diǎn) [1]。數(shù)據(jù)集包含了日期、標(biāo)題、新聞?wù)暮捅惶峒暗年P(guān)鍵詞。
將該詞還原為詞根同義詞。由于De輸入 "POS",詞根是來(lái)自形容詞、動(dòng)詞還是名詞。刪除常見的詞,如Wall street、 Market、Stock、Share等。
模型是創(chuàng)建符合目的的模型。因此,使用Python中的Sklearn庫(kù)。由于想知道每個(gè)日期的關(guān)鍵信息,使用 TfidfVectorizer模型,可以幫助識(shí)別每個(gè)日期的關(guān)鍵信息??梢栽O(shè)置關(guān)鍵特征的數(shù)量來(lái)控制輸出結(jié)果的數(shù)量,設(shè)置為8個(gè)特征。
from sklearn.feature_extraction.text importTfidfVectorizer
tf_idf_model = TfidfVectorizer(max_features=8)
processed_text_tf = tf_idf_model.fit_transform(preprocessed_texts)
tf_idf_values = tf_idf_model.idf_
tf_idf_names = tf_idf_model.get_feature_names()
接下來(lái),用當(dāng)天數(shù)據(jù)集中的新聞片段來(lái)應(yīng)用這個(gè)模型。通過(guò)這種方式,得到一組8個(gè)代表當(dāng)天關(guān)鍵信息的詞,每個(gè)詞都有一個(gè)TF-IDF值,表示在當(dāng)天的重要性。
(二)用Python預(yù)測(cè)公共安全事件發(fā)展
首先對(duì)SIR模型做一個(gè)簡(jiǎn)單的介紹,SIR全稱就是Susceptible—Infected—Recovered,易感—感染—康復(fù),即易感人群Susceptible有α概率被某種疾病感染,成為感染人群Infected,而感染人群Infected又有β概率康復(fù),成為康復(fù)人群Recovered。這次用到的圖論方面的庫(kù)是networkx,這是Python中最常用的圖論分析的庫(kù)。下面還是直接用代碼來(lái)具體說(shuō)明一下。先導(dǎo)入各種包。
import matplotlib.pyplot as plt
import numpy.random as rdm
import networkx as nx
接下來(lái)定義兩個(gè)變量n和g。n是總?cè)藬?shù),nx.erdos_renyi_graph則是一種隨機(jī)網(wǎng)絡(luò)圖,著名的E-R隨機(jī)圖理論(Random graph theory),復(fù)雜網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的系統(tǒng)性分析。而這個(gè)E-R圖也是本文應(yīng)用的基礎(chǔ)[2]。而nx.erdos_renyi_graph(n, 0.01)的意思就是以概率0.01來(lái)連接100個(gè)節(jié)點(diǎn)。然后是三個(gè)string類型的變量susceptible、infected和recovered,分別代表“易感”“感染”和“康復(fù)”人群。
第一個(gè)函數(shù)Onset,在這里把每個(gè)節(jié)點(diǎn)的狀態(tài)都設(shè)置為“S”,也就是易感狀態(tài),感染函數(shù)是Infect_prop,Prop是Proportion,這個(gè)函數(shù)是感染比例,這里用到了Numpy.Random.Random方法,也就是返回一個(gè)均勻分布,數(shù)值大小在0-1之間,不包含1,當(dāng)Rdm.random()<= Proportion時(shí),就讓這樣的人群變?yōu)楦腥救巳海@樣讓感染人群更加均勻一些。第三個(gè)函數(shù)是Build_model,是一個(gè)嵌套函數(shù),有兩個(gè)參數(shù),PInfect和PRecover,分別代表感染概率和康復(fù)概率,而這里的G.Neighbors(I)的意思是節(jié)點(diǎn)I的相鄰的節(jié)點(diǎn),而G是生成的圖(Graph),是Class。在這些感染人群中,相鄰節(jié)點(diǎn)的狀態(tài)是 “Susceptible”時(shí),讓這些節(jié)點(diǎn)(人群)以概率PInfect來(lái)進(jìn)行感染;感染人群中,以PRecover的概率進(jìn)行康復(fù)。這就是感染—康復(fù)過(guò)程。而后面的兩個(gè)函數(shù)Model_Run和Model_Iter則是將這個(gè)模型運(yùn)行多次,分別用來(lái)模擬一個(gè)循環(huán)和多個(gè)循環(huán)。
fig, ax= plt.subplots(figsize=(12, 10))
ax.set_xticks([])
ax.set_yticks([])
pos = nx.spring_layout(g, k=0.2)
nx.draw_networkx_edges(g, pos, alpha=0.5, width = 1)
nx.draw_networkx_nodes(g, pos, node_size=80)
plt.show()
首先設(shè)置圖片的大小,并去掉坐標(biāo)軸,然后設(shè)置網(wǎng)絡(luò)圖的位置,Nx.Spring_layout設(shè)置網(wǎng)絡(luò)圖的位置的方法,其中參數(shù)K是節(jié)點(diǎn)間的最佳距離,這個(gè)可以隨意設(shè)置,值越大節(jié)點(diǎn)越分散,接下來(lái)繪制節(jié)點(diǎn)和連線,Nx.draw_Networkx_Nodes(G, POS,Node_Size=80)用來(lái)繪制節(jié)點(diǎn),POS就是剛才設(shè)置的位置參數(shù),再設(shè)置一下節(jié)點(diǎn)的大小,而Nx.Draw_Networkx_Edges(G, POS,Alpha=0.5,Width = 1)用來(lái)繪制連線,同樣要傳入位置參數(shù),再設(shè)置透明度和線寬。
Networkx使用的繪圖算法是隨機(jī)的,同時(shí)使用的參數(shù)也是隨機(jī)的,所以這個(gè)圖每次生成的結(jié)果都不同,可以看到這里面已經(jīng)有部分節(jié)點(diǎn)相連,疾病也就是通過(guò)他們開始傳播,最后就是計(jì)算感染率。
n = 100onset(g)
infect_prop(g, 0.05)
model = build_model(0.2, 0.8)
model_iter(g, model, 10)
infected = [ v for (v, attr) in g.nodes(data = True)
if attr['state'] == recovered ]
infection_rate = len(infected)/n
print(infection_rate)
這當(dāng)中Onset(g)中的G就是前面用G = Nx.erdos_renyi_graph(n, 0.01)生成的圖,這是一個(gè)類的實(shí)例,Infect_prop(g, 0.05)中的0.05就是設(shè)置人群初始感染率為0.05,Model = Build_model(0.2, 0.8)中的感染概率和康復(fù)概率分別設(shè)置為0.2和0.8,而Model_iter(g, model, 10)中讓這個(gè)模擬過(guò)程重復(fù)10次,最后計(jì)算出感染人數(shù),并得出最終穩(wěn)定的感染率Infection_rate。
新冠肺炎公共安全事件是對(duì)國(guó)家治理體系和治理能力的一次大考,既考察著國(guó)家政治、經(jīng)濟(jì)等各方面工作的應(yīng)急能力和處置水平,也檢驗(yàn)著國(guó)家大數(shù)據(jù)、人工智能、云計(jì)算等新技術(shù)的應(yīng)用程度和社會(huì)成效。
四、結(jié)束語(yǔ)
公共安全事件防控既需要大數(shù)據(jù)技術(shù)支持,也需要新時(shí)代公民的大局意識(shí)和擔(dān)當(dāng)意識(shí)。自覺(jué)服從黨和國(guó)家實(shí)施的管理規(guī)定與制度,服從大局、團(tuán)結(jié)一心,戰(zhàn)勝公共安全事件。
作者單位:王騰飛 四川化工職業(yè)技術(shù)學(xué)院數(shù)字經(jīng)濟(jì)學(xué)院
李宏 可視化計(jì)算與虛擬現(xiàn)實(shí)四川省重點(diǎn)實(shí)驗(yàn)室
參? 考? 文? 獻(xiàn)
[1]王曉飛.新冠疫情下消費(fèi)券政策效應(yīng)測(cè)度研究——基于Python軟件獲取新浪微博發(fā)博量與關(guān)注度數(shù)據(jù)的分析[J].價(jià)格理論與實(shí)踐,2020(11):61-63.
[2]王思遠(yuǎn),譚瀚霖,李東杰.基于改進(jìn)傳染病動(dòng)力學(xué)易感-暴露-感染-恢復(fù)(SEIR)模型預(yù)測(cè)新型冠狀病毒肺炎疫情[J].第二軍醫(yī)大學(xué)學(xué)報(bào),2020,41(06):637-641.
[3]耿輝,徐安定,王曉艷等.基于SEIR模型分析相關(guān)干預(yù)措施在新型冠狀病毒肺炎疫情中的作用[J].暨南大學(xué)學(xué)報(bào)(自然科學(xué)與醫(yī)學(xué)版),2020,41(02):175-180.
[4]趙明靜. 基于公共安全視角的城市物流風(fēng)險(xiǎn)分析及預(yù)測(cè)研究[D].北京交通大學(xué),2021.
[5]邱凌峰,胡嘯峰, 周睿,等. 基于機(jī)器學(xué)習(xí)的典型社會(huì)安全事件發(fā)生規(guī)律研究及對(duì)雄安新區(qū)的啟示[J].中國(guó)安全生產(chǎn)科學(xué)技術(shù),2018,14(10):11-17.
[6]丁晴.基于Python的人臉識(shí)別技術(shù)應(yīng)用研究[J].數(shù)字技術(shù)與應(yīng)用, 2021,39(5):75-78.
[7]范維澄,劉奕,翁文國(guó).公共安全科技的幾點(diǎn)思考[C]// 中國(guó)突發(fā)公共事件防范與快速處置2008優(yōu)秀成果選編.2008:54.
[8]夏冰冰.基于Python的安全檢測(cè)的研究與實(shí)現(xiàn)[J].現(xiàn)代信息科技,2019,3(10):155-157.
[9]孫宗緣,馬秀峰,李奇.突發(fā)公共安全事件網(wǎng)絡(luò)輿情演化分析——基于文本挖掘與情感分析兩個(gè)視角[J].河北科技圖苑,2021,34(05):65-75.
[10]于路遙,宋瑾鈺.基于Python的天氣信息可視化分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].軟件工程與應(yīng)用,2022,11(6):1394-1403.