国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

新冠輿情、民眾情感與城市公共交通

2021-04-23 07:25趙彥勇周家靜趙洪宸
統(tǒng)計學(xué)報 2021年1期

趙彥勇,周家靜,厲 海,趙洪宸

(南京審計大學(xué) 統(tǒng)計與數(shù)學(xué)學(xué)院,江蘇 南京211815)

一、引言

2019 年12 月底,武漢市疾控中心經(jīng)過檢測發(fā)現(xiàn)了一種原因不明的肺炎病例。2020 年1 月11 日,我國出現(xiàn)首個新冠肺炎患者死亡病例。2 月3 日,武漢市正式實施《傳染病防治法》規(guī)定的“甲類傳染病疫區(qū)封鎖”措施,各類公共交通停止運營,此時全國累計確診病例已超過2 萬人。2 月16 日,全國累計確診病例超過7 萬人。2 月20 日,武漢市新增治愈病例首次大于新增確診病例。4 月8 日,武漢正式解除離漢通道管控,逐步恢復(fù)各類交通的正常運行。6月11 日,北京市新增1 例本土病例,結(jié)束了連續(xù)五十多天無新增病例的現(xiàn)狀。6 月14 日,北京新增本土確診病例36 例。7 月8 日,北京單日治愈人數(shù)創(chuàng)新高。7 月中下旬以來,遼寧省大連市與新疆自治區(qū)烏魯木齊市相繼發(fā)生了聚集性疫情。截至7 月底,全國確診病例714 例,累計治愈出院病例78 989 例,累計報告確診病例84 337 例。新冠肺炎發(fā)生以來,疫情變動成為了每個中國人關(guān)心的話題,引起了社會各階層民眾的關(guān)注。隨著網(wǎng)絡(luò)的普及,網(wǎng)絡(luò)交流軟件成為人們了解新冠肺炎疫情、自由發(fā)表言論的平臺,“疫情”“確診”“防控”等話題屢屢被推上關(guān)注的制高點。2020 年2 月份以來,為了打贏這場“戰(zhàn)疫”,黨中央和國務(wù)院、省市各級政府均要求企業(yè)延遲復(fù)工,并采取了嚴(yán)格的交通管制措施。各省市不僅嚴(yán)格控制外來車輛的進(jìn)入,而且城市內(nèi)部也停止了大部分公共交通的運營。城市軌道交通作為便利、快速、安全的交通工具,具有覆蓋面廣、站點多、客流密集的特點,更容易引起疫情的傳播。為此,10 個城市采取了不同程度的交通管控措施,上海、重慶、南京等關(guān)閉部分站點。交通運輸部門采取班次停運或車次調(diào)整的措施,來控制因公共交通出行而引發(fā)的病毒交叉感染。

民眾對新冠肺炎疫情的高熱情和長時間討論,對于研究疫情輿情有重要的意義。通過對大眾情感進(jìn)行分時段研究,能夠很好地了解社會心理變化,預(yù)測未來的民眾情緒,對各級政府部署防控工作具有重要的現(xiàn)實意義。國內(nèi)已有許多關(guān)于輿情數(shù)據(jù)的分析,例如,陳興蜀等(2020)[1]通過抓取微博評論,研究了與“新冠肺炎數(shù)據(jù)”話題相關(guān)的輿情時空演化。孫宇婷等(2020)[2]利用網(wǎng)絡(luò)指數(shù),運用空間計量、可視化與回歸分析等方法研究得出,東、西部地區(qū)民眾對疫情的關(guān)注度差異較大,人口流動、社會經(jīng)濟等因素在不同程度上影響著民眾對疫情的關(guān)注度。此外,特定時間出現(xiàn)的有關(guān)疫情的新聞也會引起公眾情緒的波動,存在“情緒脈沖效應(yīng)”(張放、甘浩辰,2020)[3]。本次突發(fā)性事件引起了城市交通運輸?shù)耐途用癯鲂械牟槐?,但也推動了運輸部門遠(yuǎn)程辦公的廣泛應(yīng)用,并增加了小汽車的限購配額(王宇、許定源、石琳,2020)[4]。種鵬云和尹惠(2020)[5]通過建立系統(tǒng)動力學(xué)模型、張毅等(2020)[6]通過構(gòu)建病毒易感度評估模型研究了交通運輸對疫情傳播的反饋作用。馮旭杰等(2020)[7]分別對運輸服務(wù)、企業(yè)經(jīng)營和應(yīng)急處置進(jìn)行了定性分析,提出恢復(fù)城市軌道交通面臨的挑戰(zhàn)。其中,周艾燕等(2020)[8]指出在常態(tài)化防控下,如何提升交通運輸綜合執(zhí)法能力就是一項挑戰(zhàn)。

通過有關(guān)新冠肺炎疫情的文獻(xiàn)梳理可知,大多數(shù)學(xué)者在對輿情進(jìn)行時空分析時很少結(jié)合當(dāng)下的熱點話題,并且在對交通出行的分析中傾向于使用文獻(xiàn)調(diào)查的研究方法。本文綜合以往研究,在輿情分析中結(jié)合微博熱點時事,關(guān)注現(xiàn)實話題。此外,關(guān)于新冠肺炎疫情對交通出行影響的大多研究缺少定量分析,而本文不僅直觀分析了各市研究時段的出行變化情況,而且將新冠肺炎疫情期間網(wǎng)絡(luò)輿情與交通出行二者相結(jié)合,建立了計量模型進(jìn)行研究。

本文主要使用Python 軟件抓取了2020 年1 月1 日至7 月31 日微博新冠肺炎話題下的用戶評論數(shù)據(jù)和城市軌道交通日客流量數(shù)據(jù)進(jìn)行研究。首先,我們對爬取的文本進(jìn)行jieba 分詞。接著,采用SnowNLP 庫進(jìn)行情感分析,得出10 個城市的日平均情感得分圖,再使用數(shù)據(jù)可視化工具pyecharts,將各城市的微博評論情感得分圖與地鐵日客流量分布圖進(jìn)行比對。在輿情演化分析和交通出行特征分析的基礎(chǔ)上,建立面板回歸模型,探討網(wǎng)絡(luò)輿情對交通出行的影響。網(wǎng)絡(luò)輿情分析得出,各城市居民在研究時段內(nèi)對新冠肺炎疫情基本持積極態(tài)度,2020 年2 月民眾情緒最低迷,與“新冠肺炎”“確診病例”等相關(guān)的搜索詞獲得了較高的關(guān)注度。交通出行分析得出,2020 年1 月23 日后各城市日客流量均出現(xiàn)劇降,此后上海地鐵運營在各城市中恢復(fù)速度最快。城市日客流量的增速對民眾的平均情感得分具有顯著的積極作用,日客流量的上漲側(cè)面反映出交通出行的自由靈活,長期被“封閉”的情緒得以釋放,民眾情感得分顯著提高。

二、數(shù)據(jù)挖掘與分析

(一)理論研究

網(wǎng)絡(luò)爬蟲,是一個按照事先給定的規(guī)則,自動地、循環(huán)地抓取網(wǎng)頁數(shù)據(jù)信息的腳本或者程序。由于它們能根據(jù)限制條件自動采集所訪問頁面的信息,以供搜索引擎做進(jìn)一步的處理,從而讓用戶能更方便快捷地獲得需要的信息,因此目前應(yīng)用比較廣泛。許多網(wǎng)站的運維人員常常用它來更新網(wǎng)站內(nèi)容,也有一些數(shù)據(jù)分析人員或者專家學(xué)者使用網(wǎng)絡(luò)爬蟲來進(jìn)行數(shù)據(jù)的分析和挖掘。

網(wǎng)絡(luò)爬蟲整個工作由控制器、解析器和資源庫配合完成??刂破骺刂浦麄€爬取活動的進(jìn)行,它根據(jù)從URL 棧中獲取的網(wǎng)頁鏈接,給各爬蟲線程分配工作任務(wù)。解析器主要用來下載網(wǎng)頁,并對下載后的頁面做進(jìn)一步處理,承擔(dān)了爬蟲工作的主要部分。資源庫主要用來存取網(wǎng)絡(luò)爬蟲爬取到的數(shù)據(jù)信息,當(dāng)數(shù)據(jù)量比較大時一般用數(shù)據(jù)庫來存儲,并提供生成索引的目標(biāo)源。

網(wǎng)絡(luò)爬蟲爬取的網(wǎng)頁鏈接集合一般由兩部分組成:一是由人工準(zhǔn)備的、比較重要的目標(biāo)網(wǎng)站鏈接集;二是從第一部分的鏈接中獲取的子鏈接,因為一個網(wǎng)站中往往包含許多鏈接。但是,在對這部分鏈接進(jìn)行篩選時需要非常嚴(yán)格,互聯(lián)網(wǎng)絡(luò)龐大復(fù)雜,一旦出錯將導(dǎo)致整個爬蟲程序失敗。有了初始的URL 集后,網(wǎng)絡(luò)爬蟲便可以開始數(shù)據(jù)的抓取。前面提到網(wǎng)頁中一般含有其他的鏈接,從現(xiàn)有的網(wǎng)頁便可以獲取一些新的鏈接,那么可以把這種網(wǎng)頁之間的結(jié)構(gòu)關(guān)系看成是一個森林,每個種子鏈接URL 就是森林中相應(yīng)樹的根節(jié)點。這樣,爬蟲系統(tǒng)就可以使用各種搜索算法遍歷整個網(wǎng)頁,通常爬蟲工作者會使用廣度優(yōu)先搜索算法來收集網(wǎng)頁信息。首先網(wǎng)絡(luò)爬蟲系統(tǒng)會把種子URL 存放在下載隊列中,然后依次從隊列首部取出一個URL 并用解析器下載該鏈接的網(wǎng)頁。這時候還會獲得一些新的URL,將這些新獲取的URL 加入到下載隊列中。接著再從下載隊列首部取出一個URL,進(jìn)行網(wǎng)頁的下載和信息收集,之后取URL 再解析,如此反復(fù)進(jìn)行,直到遍歷了下載隊列中所有鏈接或者滿足某種限制條件后就結(jié)束整個爬蟲過程。

(二)數(shù)據(jù)采集

微博作為網(wǎng)民分享簡短實時信息的重要網(wǎng)絡(luò)平臺,數(shù)據(jù)開放程度較高。基于此,本文決定爬取微博新冠疫情話題下的用戶評論,并對其進(jìn)行情感分析。目前,微博一共有三個站點,分別是“https://weibo.cn”“https://m.weibo.com”“https://weibo.com”,三個網(wǎng)站的爬取難度由易到難。由于爬取新冠疫情話題下的用戶評論需要用到微博中的高級搜索功能,而“https://m.weibo.com”網(wǎng)站并不包含該功能,所以予以排除?!癶ttps://weibo.com”的高級搜索入口為“https://s.weibo.com”,篩選條件包括類型、用戶、時間、地區(qū),這里的時間是以小時為單位的。鑒于可得微博的數(shù)量,“https://weibo.com”在一天時間內(nèi)獲得的最大微博數(shù)量為24 000 條,是“https://weibo.cn”的24 倍。此外,由于本文需要獲取不同城市用戶的微博評論,因此最終選擇對“https://weibo.com”進(jìn)行爬取。

通過高級搜索功能,以“新冠疫情”為關(guān)鍵詞,并按照本文選擇的10 個主要城市對搜索結(jié)果進(jìn)行劃分,分別得到了10 個城市微博用戶對新冠疫情的評論。在爬取過程中,本文對2020 年1 月1 日至7 月31 日(共計213 天)的評論按照熱度由高到低,以每一天為一段,共計213 段,進(jìn)行爬取。每個城市每一天可以爬取評論1 000 條,每個城市共計爬取用戶評論213 000 條。

本文使用Python 語言的request 庫對頁面信息進(jìn)行獲取,要抓取到微博的數(shù)據(jù),首先要登陸微博,而微博檢測用戶是否登陸,就是檢查用戶這次request 請求攜帶的cookie。為此,本文通過登陸微博,獲取了cookie 并保存,在request 中加入包含微博賬號cookie 信息的headers 以實現(xiàn)模擬登陸,即可實現(xiàn)對微博頁面的爬取?;趓equest 庫所獲取的頁面信息,本文通過BeautifulSoup 庫和正則表達(dá)式相結(jié)合的方式,提取了頁面中的所有評論,并將每條評論以天為單位依次存儲在csv 文件中,經(jīng)過去重,得到最終的評論信息,部分評論如表1 所示。

表1 抓取微博的部分評論

(三)研究內(nèi)容與結(jié)果分析

1.微博用戶綜合情感。情感分析是指利用自然語言處理方法和文本挖掘技術(shù),對帶有情感色彩的主觀性文本進(jìn)行分析、處理和抽取的過程。因特網(wǎng)上產(chǎn)生了大量對于人物、事件、產(chǎn)品等的評論信息,從中可以提取到用戶的情感態(tài)度,包括贊成和否定。對于微博博文的內(nèi)容,本文采用Python 的SnowNLP 庫進(jìn)行情感分析。SnowNLP 庫自帶了一些訓(xùn)練好的字典,可以方便地處理中文文本內(nèi)容。SnowNLP 的分析過程是先讀取已分好類的文本,再對文本去停用詞和分詞,計算每個詞出現(xiàn)的頻數(shù)。然后通過bayes 定理計算正面和負(fù)面的先驗概率,對要進(jìn)行判斷的文本進(jìn)行切分,計算每個詞的后驗概率,最后選擇概率較大的類別。由此可以對大量的微博文本進(jìn)行情感分析,得到10 個城市每天的平均情感得分,再用matplotlib 進(jìn)行繪制,從而更加清晰地反映民眾對于新冠肺炎疫情的態(tài)度變化。

使用SnowNLP 分析得到的結(jié)果在0~1 之間,如圖1 所示。若結(jié)果大于0.5,則表明情感偏向正面;若結(jié)果小于0.5,則表明情感偏向負(fù)面。

圖1 綜合平均情感得分折線圖

由圖1 可知,2020 年1 月1 日至7 月31 日期間,民眾對于新冠肺炎疫情整體持正面態(tài)度。從得分的走勢來看,民眾對新冠肺炎疫情的情感態(tài)度大致可以分為五個階段。第一階段為2020 年1 月1 日至2 月9 日,該時期內(nèi)民眾情緒波動較大,但情感得分都在0.5 以上。1 月1 日“華南海鮮批發(fā)市場休市整治”的信息居于微博熱議話題中,前兩日的情感得分有小幅下降。隨后“不明原因肺炎未有發(fā)現(xiàn)明確人傳人證據(jù)”等信息緩和了民眾的情緒,情感得分逐步上升。1 月23 日,“武漢封城”登上微博熱搜榜首,此舉措令民眾意識到問題的嚴(yán)重性。之后農(nóng)歷新年到來,“疫情拐點將出現(xiàn)”的信息再一次緩和了民眾的情緒。第二階段為2 月9 日至2 月29 日,該時期內(nèi)民眾情緒略呈現(xiàn)負(fù)面,情感得分一直維持在0.5 以下。2 月初每日公布的新增感染病例逼近萬人,并且各城市陸續(xù)采取交通和外出限制,長期封閉在居所是導(dǎo)致民眾產(chǎn)生負(fù)面和恐慌情緒最主要的原因。第三階段為3 月1 日至6 月13 日,該時期內(nèi)民眾情感得分在0.5 以上,波動較小。3 月國內(nèi)疫情逐漸好轉(zhuǎn),且部分地區(qū)解封的消息讓民眾情緒趨向正面。然而,5月29 日召開的兩會沒有確定GDP 增長的量化指標(biāo),這可能導(dǎo)致民眾對未來經(jīng)濟發(fā)展缺乏信心,情感得分因而大幅下跌。第四階段為6 月13 日至6 月21 日,該時期內(nèi)民眾情緒略偏向負(fù)面,情感得分在0.5 周圍波動。6 月12 日北京發(fā)生的疫情讓情感得分下降到0.5 以下,隨后在0.5 左右出現(xiàn)波動。隨著疫情迅速受到控制,情感得分也逐漸回升。第五階段為6 月21 日至7 月31 日,該時期內(nèi)民眾情緒波動較大,但情感得分都在0.5 以上。7 月中旬烏魯木齊發(fā)生疫情時,我國居民對疫情已經(jīng)能夠以平常心對待,因而情感得分變化不大。同時可以看出,北京作為首都,發(fā)生疫情對全國民眾的情緒影響較大,而其他地區(qū)發(fā)生疫情對全國民眾的情緒影響相對較小。總的來說,民眾對于新冠肺炎疫情的態(tài)度大致經(jīng)歷了五個階段,情緒狀態(tài)大體偏向正面,可以推測未來也會持續(xù)地趨于正面。

2.各城市微博用戶的平均情感得分。本文對2020年1 月1 日至7 月31 日各城市網(wǎng)民的情感值取平均值,得出各城市網(wǎng)民的平均情感得分,具體見表2。

表2 各城市網(wǎng)民的平均情感得分

由表2 可知,武漢、成都、重慶等城市的情感得分均值較低,處于0.548~0.566 之間??梢钥闯?,情感得分較低的城市大多數(shù)處于我國的中西部地區(qū),原因可能是這些地區(qū)經(jīng)濟發(fā)展程度相對較低,民眾對外交流機會少,武漢市作為中西部地區(qū)的交通樞紐,與這些城市的交通聯(lián)系更為便捷。

武漢“封城”時間為2020 年1 月23 日,僅用1月1 日至7 月31 日期間的平均情感得分不能夠準(zhǔn)確地反映出疫情初次爆發(fā)時民眾的情緒變化。為此,本文以1 月23 日武漢“封城”的時間作為起始日期,2 月10 日全國各地開始啟動復(fù)工的日期作為結(jié)束日期,再次計算了19 天內(nèi)網(wǎng)民的平均情感得分,相關(guān)結(jié)果見表3。

表3 武漢“封城”事件下各城市網(wǎng)民的平均情感得分

由表3 可知,在這段時期內(nèi),新冠肺炎疫情受到大眾的廣泛關(guān)注,其中武漢作為疫情爆發(fā)的城市,受疫情影響最為嚴(yán)重,市民的情感得分最低,為0.541 1。其他城市在該時期內(nèi)的情感得分均高于全時期內(nèi)的情感得分,可能是因為,該階段民眾雖然已經(jīng)意識到疫情的嚴(yán)重性,但此時正處于農(nóng)歷新年,過新年的快樂氛圍高于人們對疫情的擔(dān)憂,此時武漢市以外的其他市民可能仍未意識到此次疫情的威脅性和嚴(yán)重性。

3.微博用戶關(guān)注話題。為了解疫情期間熱度較高的話題,本文將2020 年1 月1 日至7 月31 日微博關(guān)于新冠肺炎疫情的評論經(jīng)過分詞后得到詞頻,將詞頻位列前十的高頻關(guān)鍵詞繪制成柱狀圖進(jìn)行展示,如圖2 所示。

圖2 微博評論高頻關(guān)鍵詞

如圖2 所示,出現(xiàn)頻數(shù)最高的是“肺炎”一詞,此外出現(xiàn)頻數(shù)較高的還有“新冠”“疫情”“病例”等詞匯,這些詞匯直接反映了民眾對于此次疫情發(fā)展變化的高度關(guān)注。同時,關(guān)注度排名第六位的詞為“防控”,反映了民眾對戰(zhàn)勝疫情的迫切心情。雖然目前國內(nèi)的疫情得到了控制,但從國內(nèi)外疫情發(fā)展來看,依然不能松懈。

圖3 微博評論詞云圖

為了更直觀地分析民眾對于新冠肺炎疫情的關(guān)注度,本文繪制了詞云圖,如圖3 所示,詞頻由字體的大小體現(xiàn)?!胺窝住薄靶鹿凇薄耙咔椤薄按_診”“病例”等詞突出,說明關(guān)于此次疫情的話題以新冠肺炎為核心,民眾非常關(guān)心每天確診了多少病例。其次,“市場供應(yīng)”“人均收入”“權(quán)益”“底層”“工作崗位”等詞語得到清晰呈現(xiàn),表明市場需求不足導(dǎo)致供給市場中商品滯銷,企業(yè)出現(xiàn)虧損,失業(yè)現(xiàn)象加重,收入減少,引發(fā)了大眾對民生權(quán)益的關(guān)注?!懊绹薄皞惗亍焙汀胺鹆_里達(dá)州”等詞語的出現(xiàn),說明了我國居民對國外疫情的持續(xù)關(guān)注。

4.文本聚類。首先本文基于TF-IDF 對微博評論文本進(jìn)行K 均值聚類。TF-IDF 的主要思想是,如果某個詞或短語在一篇文章中出現(xiàn)的頻率高,并且在其他文章中很少出現(xiàn),則認(rèn)為此詞或者短語具有很好的類別區(qū)分能力,適合用來分類。

TF-IDF 實際上是TF*IDF。TF 是指詞頻(Term Frequency),表示詞條在文檔d 中出現(xiàn)的頻率。IDF是指逆向文件頻率(Inverse Document Frequency),其主要思想是,如果包含詞條t 的文檔越少,也就是n 越小,IDF 就越大,說明詞條t 具有很好的類別區(qū)分能力。

K 均值聚類是迭代動態(tài)聚類算法中的一種,其中K 表示類別數(shù)。K 均值聚類算法通過預(yù)先設(shè)定的K 值及每個類別的初始質(zhì)心對相似的數(shù)據(jù)點進(jìn)行劃分,并通過劃分后的均值迭代優(yōu)化獲得最優(yōu)的聚類結(jié)果。

圖4 聚類結(jié)果圖

圖4 是設(shè)定K=5 并通過聚類得到的結(jié)果,一行代表一個類別,每行中的詞是此類別的關(guān)鍵詞??梢钥吹剑旱谝活惖年P(guān)鍵詞包括“新冠病毒”“武漢”“世衛(wèi)”“美國”等,說明這個類別下的評論可能是在討論新冠肺炎病毒起源的問題;第三類的關(guān)鍵詞包括“病例”“確診”“新增”“報告”等,說明這個類別下的評論可能是在討論新冠肺炎每日新增的數(shù)量;第二、四、五類的關(guān)鍵詞包括“時間”“瀏覽器”“手機”等,這可能是微博評論中顯示的發(fā)布時間以及發(fā)布微博評論所采用的方式,包括電腦瀏覽器、手機客戶端等。

從上述結(jié)果來看,聚類的效果不是很好,因此接下來本文使用LDA 模型生成文本主題。LDA(Latent Dirichlet Allocation)是一種文檔主題生成模型,也稱為三層貝葉斯概率模型,包含詞、主題和文檔三層結(jié)構(gòu)。所謂生成模型是指文章的每個詞都是通過“以一定概率選擇了某個主題,并從這個主題中以一定概率選擇某個詞語”這樣一個過程得到的。

LDA 可以用來識別大規(guī)模文檔集或語料庫中潛藏的主題信息,它采用了詞袋(bag of words)的方法,這種方法將每一篇文檔視為一個詞頻向量,從而將文本信息轉(zhuǎn)化為易于建模的數(shù)字信息。每一篇文檔代表了一些主題所構(gòu)成的一個概率分布,而每一個主題又代表了很多單詞所構(gòu)成的一個概率分布。

圖5 LDA 模型圖

圖5 是使用LDA 模型生成的微博評論文本中重要性排名前十的主題,其中關(guān)鍵詞前面的系數(shù)代表此關(guān)鍵詞在該主題中的重要性程度,程度越高,系數(shù)越大??梢钥吹剑旱谝粋€主題應(yīng)該是呼吁民眾在新冠肺炎疫情肆虐的情況下戴好口罩;第七個主題應(yīng)該是每天有多少境外輸入的確診病例;第八個主題關(guān)注的是美國新冠肺炎的確診病例數(shù)量;第九個主題表明新冠肺炎疫情下中國在行動,即我國政府在疫情下發(fā)揮了巨大的動員能力,將國內(nèi)疫情控制好并向國外提供了必要的援助;第十個主題與剛才聚類得到的第一類結(jié)果相似,可能是在討論新冠肺炎病毒起源的問題。

總體來看,我國民眾在新冠肺炎大流行時關(guān)注的話題主要有新冠肺炎起源、戴好口罩做好自身防護(hù)、我國在抗擊疫情中的表現(xiàn)、國外疫情發(fā)展。

三、城市交通出行特征分析

(一)數(shù)據(jù)采集

新冠疫情爆發(fā)期間,市民的日常公共交通出行受到了嚴(yán)重影響。2020 年1 月23 日,武漢實施了“封城”措施,城市內(nèi)的各類公共交通停運,客運、火車、飛機也暫時關(guān)閉了對外的通道。同一時間內(nèi),全國其他各個城市也對其下轄的公共交通部門進(jìn)行了嚴(yán)格管制,城市公共汽車、出租車、網(wǎng)約車經(jīng)營企業(yè)是城市公共交通疫情防控的第一責(zé)任單位。

在這樣的情形下,為保障必要的外出,地鐵成為了民眾快捷出行的最佳選擇?;诖耍疚臎Q定采用地鐵客流量來反映疫情期間的公共出行狀況。受限于交通信息每日數(shù)據(jù)的可獲得性和公開性,本文最終獲取了國內(nèi)10 個城市在2020 年1 月1 日至7 月31 日期間的地鐵日客流量信息(杭州市地鐵客流信息僅搜集到1 月1 日至4 月30 日的數(shù)據(jù)),信息來源于各個城市軌道交通微博賬號的每日客流量披露,包括北京、南京、重慶、西安、成都、武漢、上海、杭州、廣州、鄭州10 個城市。

(二)研究內(nèi)容與結(jié)果分析

為了更加直觀地反映出本文所選取的10 個城市在2020 年1 月1 日至7 月31 日的客流量變化情況,本文將此期間內(nèi)各個城市的地鐵客流量繪制成折線圖,如圖6 所示。

從圖6 可以清晰地看出,在疫情爆發(fā)前的2020年1 月上旬,上海、廣州、北京作為10 個城市中人口最密集的3 個城市,地鐵開通的線路最多,地鐵客流量明顯高于其他7 個城市。1 月下旬,恰逢春節(jié)返鄉(xiāng),新冠肺炎確診病例開始大幅增加,而1 月23 日的武漢“封城”事件則是媒體與公眾對新冠肺炎疫情引發(fā)關(guān)注的重要標(biāo)志。折線圖中所反映的地鐵客流變化情況也與疫情的發(fā)展?fàn)顩r大致趨同,所有城市的地鐵客流同時從1 月21 日開始呈現(xiàn)墜崖式下跌,并于1 月23 日跌至谷底。

2020 年1 月23 日,武漢“封城”措施實施后,全國各地的民眾都對新冠疫情的嚴(yán)重性有了更清醒的認(rèn)識。隨后不久,各省市政府下達(dá)了交通管制、出行限制的指示,城市交通幾近癱瘓,日客流量急劇下降。雖然只有武漢市的地鐵停運,但從圖6 中可以看出,所有城市的地鐵客流量都出現(xiàn)了明顯下降。3 月初到4 月底,國內(nèi)疫情得到有效控制,民眾對戰(zhàn)勝新冠肺炎疫情的態(tài)度更加積極,社會復(fù)工復(fù)產(chǎn),各城市的地鐵開始穩(wěn)步運營。在3 個地鐵交通最發(fā)達(dá)的城市(上海、廣州、北京)中,上海的地鐵運營恢復(fù)最快,明顯高于其他兩個城市。武漢作為重點防疫城市,雖然3 月27 日以后地鐵恢復(fù)營運,但高強度交通管制使其日客流量恢復(fù)情況在全部10 個城市中仍處于較低的位次。6 月11 日,北京市在50 多天沒有發(fā)現(xiàn)新的本地感染病例的情況下,突然確診了1 例本地感染病例。6 月17 日,北京市提升應(yīng)急響應(yīng)至二級,關(guān)閉多個農(nóng)貿(mào)市場,同時調(diào)整公共交通限流比例。由于政府相關(guān)措施的出臺以及市民對新冠肺炎的警惕,6 月11 日以后北京市的地鐵客流量出現(xiàn)大幅下降。截至6 月底,北京每個周末的地鐵日客流量均少于200 萬人,這在圖6 中有明顯的體現(xiàn)。7 月7 日之后,北京疫情得到較好控制,再無本土病例出現(xiàn),地鐵也開始逐漸恢復(fù)至正常的運營狀態(tài),但客流量相對之前明顯減少,北京市需要時間來恢復(fù)居民的外出信心。

圖6 各城市地鐵日客流量變化折線圖

四、輿情演化對城市交通出行的影響

民眾情感得分與地鐵日客流量的分析顯示,二者之間存在內(nèi)在的聯(lián)系。接下來我們對其進(jìn)行建模實證分析,民眾情感得分和各城市的地鐵日客流量數(shù)據(jù)前文已做了詳細(xì)闡述,各城市的總?cè)丝诤蜕a(chǎn)總值數(shù)據(jù)分別來自各市統(tǒng)計局公布的月度統(tǒng)計數(shù)據(jù)。

(一)數(shù)據(jù)預(yù)處理

考慮到部分變量存在少量缺失值,本文以線性插值方法來填補缺失數(shù)據(jù)。該方法假設(shè)變量是線性勻速變化的。假如與x(通常為時間)相對應(yīng)的y缺失,而最臨近的兩個點分別為(x0,y0)與(x1,y1),且x0<x<x1,則y對x的線性插值為由于武漢市地鐵停運期間,日客流量為零,取對數(shù)無意義,因此本文采取對所有數(shù)據(jù)加1 后再取對數(shù)的處理方法,然后使用線性插值補齊缺失值。

(二)誤差相關(guān)性檢驗

本文獲取的研究數(shù)據(jù)是典型n小T大(n=9,T=213)的長面板數(shù)據(jù)。在短面板模型中,一般假設(shè){εit}獨立同分布,也就是不存在隨機擾動項的自相關(guān)。但是對于長面板模型,因為T較大,所包含的信息量較多,{εit}很可能存在異方差和自相關(guān)。記個體i的擾動項方差為,那么我們考慮{εit}的以下三種情形:(1)如果,那么{εit}存在組間異方差;(2)如果存在Cov(εit,εis)≠0(t≠s,?i),那么{εit}存在組內(nèi)自相關(guān);(3)如果存在Cov(εit,εjt)≠0(i≠j,?t),那么{εit}存在組間同期相關(guān)。因此,我們需要針對這些情況對數(shù)據(jù)進(jìn)行檢驗。

1.組間異方差檢驗。Wald 檢驗原假設(shè)為“不同個體的擾動項方差均相等如果原假設(shè)成立,那么其中為σ2的一致估計量為的一致估計量,eit為εit的殘差。如果每個個體的擾動項相互獨立,那么構(gòu)造如下的Wald 統(tǒng)計量:

組間異方差檢驗結(jié)果如表4 所示,可以看出,沃爾德統(tǒng)計量為110.84,P 值接近于零,因此強烈拒絕同方差的原假設(shè),即面板模型的隨機擾動項存在組間異方差。

表4 組間異方差檢驗結(jié)果

2.組內(nèi)自相關(guān)檢驗。組內(nèi)自相關(guān)Wald 檢驗的原假設(shè)為“不存在組內(nèi)自相關(guān)(Cov(εit,εis)=0;t≠s,?i)”。給定個體i,首先對面板回歸方程進(jìn)行一階差分,如果擾動項εit不存在組內(nèi)自相關(guān),那么我們可以推導(dǎo)得出Δεit的方差為,自協(xié)方差為,那么自相關(guān)系數(shù)為-0.5。我們也可以說Wald 檢驗的原假設(shè)為“ρ=-0.5”。檢驗結(jié)果見表5。

表5 組內(nèi)自相關(guān)檢驗結(jié)果

分析表5 的檢驗結(jié)果可知,由于P 值近似為零,在1%的水平上顯著,故拒絕原假設(shè),認(rèn)為該數(shù)據(jù)的隨機擾動項存在組內(nèi)自相關(guān)。

3.組間同期相關(guān)。組間同期相關(guān)LM 檢驗的原假設(shè)為“不存在組間同期相關(guān)(Cov(εit,εjt)=0;i≠j,?t)”。根據(jù)殘差計算的不同個體擾動項的相關(guān)系數(shù)矩陣見式(1)。

如果該矩陣非主對角線元素均接近于零,我們就可以認(rèn)為{εit}不存在組間同期相關(guān)。相關(guān)系數(shù)矩陣如式(2)所示,檢驗結(jié)果在表6 中給出。

表6 組間同期相關(guān)檢驗結(jié)果

分析相關(guān)系數(shù)矩陣可知,非主對角線元素的值偏離零值較遠(yuǎn),這說明不同個體在同期的擾動項存在顯著的相關(guān)性,并且LM 檢驗的結(jié)果也拒絕了不存在組間同期相關(guān)的原假設(shè)。

(三)模型建立

由前文對各城市居民情感得分的分析可知,2020 年2 月9 日至2 月29 日,居民的整體情感得分均值一直處于0.5 以下,2 月份民眾情感達(dá)到最低谷。同樣,前文對各城市地鐵日客流量的研究也顯示,各城市的地鐵客流量從1 月20 日開始大幅滑落,1 月24 日至2 月24 日達(dá)到最低谷,之后雖然有所上升,但增速緩慢。截至2 月末,各城市的地鐵客流量仍遠(yuǎn)低于疫情爆發(fā)前。鑒于客流量與情感得分處于低谷的時期高度重合,本文提出假設(shè):疫情期間,居民的出行狀況會直接影響其情緒變化。

在前文數(shù)據(jù)處理的基礎(chǔ)上,本文首先繪制了各城市2020 年1 月1 日至7 月31 日微博用戶的情感得分與地鐵日客流量的散點圖,結(jié)果如圖7 所示。

圖7 民眾情感得分與日客流量散點圖

由圖7 可知,隨著情感得分的提高,大部分城市的地鐵日客流量存在遞增的趨勢,因此,本文建立長面板回歸模型來研究民眾情感得分和地鐵日客流量的關(guān)系。模型中選取被解釋變量為各城市的民眾情感得分(scoreit),核心解釋變量為各城市的地鐵日客流量對數(shù)值(lnpassenit),控制變量為各城市取對數(shù)后的總?cè)丝冢╨npeopleit)與生產(chǎn)總值(lngdpit),i表示城市,t表示時間。面板回歸模型表示為:

其中:ui為個體固定效應(yīng),體現(xiàn)各城市異質(zhì)性的不可觀測項;εit是既隨時間又隨個體改變的隨機擾動項。

(四)模型檢驗和結(jié)果分析

1.單位根檢驗。存在單位根的面板數(shù)據(jù)通常是不平穩(wěn)序列,會導(dǎo)致偽回歸和t 檢驗不再有效。在常用的面板單位根檢驗方法中,HT 檢驗適合短面板數(shù)據(jù),LLC 和Breitung 檢驗要求每位個體的自回歸系數(shù)相同,但在前文的檢驗中,組間同期相關(guān)的自回歸系數(shù)并不相等。綜合考慮,本文選取IPS 檢驗和費雪式檢驗分別對各變量進(jìn)行單位根檢驗,相關(guān)檢驗結(jié)果見表7。表7 的單位根檢驗結(jié)果表明,不論是IPS檢驗還是費雪式檢驗,日客流量對數(shù)和民眾情感得分均在1%的水平上為平穩(wěn)時間序列。

表7 單位根檢驗結(jié)果

2.協(xié)整檢驗。協(xié)整檢驗考察變量間是否存在長期均衡關(guān)系。本文采用Kao 檢驗、Pedroni 檢驗兩種方法分別進(jìn)行協(xié)整檢驗。表8 的檢驗結(jié)果表明,無論Kao 檢驗還是Pedroni 檢驗,研究變量均通過了1%的顯著性水平檢驗,表明可以拒絕原假設(shè),認(rèn)為變量間存在長期穩(wěn)定的協(xié)整關(guān)系。

表8 協(xié)整檢驗結(jié)果

3.結(jié)果分析。由前文的檢驗可知,該模型的隨機擾動項存在組間異方差、組內(nèi)自相關(guān)和組間同期相關(guān),為此,本文使用更為全面的可行廣義最小二乘估計(Feasible Generalized Least Squares,F(xiàn)GLS)進(jìn)行分析。首先對模型(3)進(jìn)行最小二乘估計,然后使用殘差{eit}來估計εit的協(xié)方差矩陣,以此進(jìn)行FGLS 估計,結(jié)果見表9。

表9 回歸分析結(jié)果

由表9 可以看出,地鐵日客流量每上漲1%,民眾的情感得分平均提高0.01 分,并且該結(jié)果在1%的水平上顯著。民眾對于疫情情感態(tài)度的變化最直接地體現(xiàn)在是否可以外出,能否實現(xiàn)外出自由。隔離封閉的環(huán)境與單調(diào)的工作生活均會增加民眾內(nèi)心的孤獨感,甚至導(dǎo)致抑郁、焦慮,所以,交通出行的自由反映在日客流量的增加上,將變成情緒釋放的“閘口”。城市地鐵日客流量的增加,也側(cè)面反映了民眾“敢出門”的心理,而“敢出門”是百姓對于國家疫情防控工作的信任。通過控制變量的分析可以得出,城市生產(chǎn)總值每增加1%,民眾情感得分會平均提高0.03 分;城市總?cè)丝诿吭黾?%,居民對新冠肺炎疫情的情感得分會平均降低0.04 分。GDP 反映一個地區(qū)的綜合經(jīng)濟實力,隨著GDP 的增加,大眾對于應(yīng)對疫情會更加積極。相反,如果城市居民過多或者說一個城市的居民數(shù)量在疫情期間不斷上升,那么人口流動的不確定性將會帶來居民的恐慌情緒,并且人口越密集的城市,感染肺炎的概率越大,情感得分越低。

(五)進(jìn)一步分析

本文使用爬取的民眾情感得分代表大眾面對疫情時的情感態(tài)度,使用地鐵日客流量數(shù)據(jù)反映城市交通狀況,分析發(fā)現(xiàn),在研究時段內(nèi),外出通行對公眾情感態(tài)度的變化產(chǎn)生了積極影響。由于疫情防控的逐漸常態(tài)化,前文的分析不易把握情感態(tài)度與交通出行間更為具體的關(guān)系,因此接下來我們將進(jìn)行分時段研究。

2020 年6 月7 日,中國發(fā)布《抗擊新冠肺炎疫情的中國行動》白皮書,其中指出,中國抗擊疫情的艱辛歷程分為五個階段。第一階段:迅即應(yīng)對突發(fā)疫情(2019 年12 月27 日至2020 年1 月19 日)。湖北省武漢市監(jiān)測發(fā)現(xiàn)不明原因肺炎病例,第一時間報告疫情,中國迅速采取行動,開展病因?qū)W和流行學(xué)調(diào)查。第二階段:初步遏制疫情蔓延(2020 年1 月20日至2 月20 日)。全國新增確診病例快速增加,中國采取阻斷病毒傳播的關(guān)鍵一招,堅決果斷關(guān)閉離漢離鄂通道,武漢保衛(wèi)戰(zhàn)、湖北保衛(wèi)戰(zhàn)全面打響。第三階段:本土新增病例數(shù)逐步下降至個位數(shù)(2020 年2月21 日至3 月17 日)。中共中央作出統(tǒng)籌疫情防控和經(jīng)濟社會發(fā)展、有序復(fù)工復(fù)產(chǎn)的重大決策。第四階段:取得武漢保衛(wèi)戰(zhàn)、湖北保衛(wèi)戰(zhàn)決定性勝利(3 月18 日至4 月28 日)。以武漢市為主戰(zhàn)場的全國本土疫情傳播基本阻斷,離漢離鄂通道管控措施解除,武漢市在院新冠肺炎患者清零。第五階段:全國疫情防控進(jìn)入常態(tài)化(4 月29 日以來)。境內(nèi)疫情總體呈零星散發(fā)狀態(tài),局部地區(qū)出現(xiàn)散發(fā)病例引起的聚集性疫情,境外輸入病例基本得到控制。

白皮書發(fā)布的“抗擊疫情”五個階段同本文的情感得分和交通日客流量階段劃分相呼應(yīng),隨著國家抗擊疫情的舉措越來越完善,城市交通出行也在慢慢恢復(fù),民眾情感漸趨穩(wěn)定?;诖?,本文進(jìn)一步分析了五個階段內(nèi)情感得分與民眾交通出行之間的關(guān)系。

將疫情爆發(fā)時間劃分為五個階段,由于各階段T值仍大于n,我們研究的各階段數(shù)據(jù)依舊是長面板數(shù)據(jù),{εit}很可能存在異方差和自相關(guān)。因此,對各階段的數(shù)據(jù)進(jìn)行組間異方差檢驗、組內(nèi)自相關(guān)檢驗和組間同期相關(guān)檢驗,檢驗結(jié)果分別見表10、表11和表12。

表10 分階段組間異方差檢驗結(jié)果

表10 的檢驗結(jié)果可知,有且僅有疫情蔓延初步遏制階段的P 值大于10%,檢驗結(jié)果接受原假設(shè),即不存在組間異方差。其他階段的P 值接近于零,均拒絕原假設(shè)。

表11 分階段組內(nèi)自相關(guān)的檢驗結(jié)果

由表11 的檢驗結(jié)果可知,國家采取措施迅速應(yīng)對突發(fā)疫情階段的P 值為0.3,遠(yuǎn)大于10%的顯著性水平,因此接受隨機擾動項不存在組內(nèi)自相關(guān)的原假設(shè)。其他四個階段的P 值近乎為零,拒絕原假設(shè)。由表12 的LM 檢驗結(jié)果可知,各階段卡方統(tǒng)計量對應(yīng)的P 值均近似等于零,因此拒絕隨機擾動項不存在組間同期相關(guān)的原假設(shè)。

表12 分階段組間同期相關(guān)的檢驗結(jié)果

由上述檢驗結(jié)果可知,不同階段模型的隨機擾動項具有不同的特征,因此,在建模時所采用的估計方法也存在差異。當(dāng)模型(3)的擾動項存在組間異方差或組間同期相關(guān)時,最小二乘估計依然是一致的,因此只要使用面板校正標(biāo)準(zhǔn)誤(Panel-Corrected Standard Error,PCSE)進(jìn)行估計即可。本文的第一階段模型使用PCSE 方法進(jìn)行參數(shù)估計,其他階段模型使用全面的FGLS 方法進(jìn)行估計。全面的可行廣義最小二乘估計(Feasible Generalized Least Squares,F(xiàn)GLS)同時考慮了組間異方差、組內(nèi)自相關(guān)和組間同期相關(guān),結(jié)果如表13 所示。

表13 分階段回歸結(jié)果

(續(xù)表13)

表13 的回歸結(jié)果反映了不同階段地鐵日客流量與民眾平均情感得分之間的關(guān)系。分析得出,2020年1 月1 日至3 月17 日,地鐵日客流量并未對市民的情感得分產(chǎn)生顯著影響,這是由于第一階段為疫情爆發(fā)的初期階段,絕大多數(shù)民眾對疫情的重視程度還不夠,日常出行作為一種生活常態(tài)對情感態(tài)度的影響并不顯著。在第二階段和第三階段,各省市政府下達(dá)了交通管制、出行限制的指示,城市交通幾近癱瘓,日客流量急劇下降。在禁止出行的情形下,地鐵日客流量寥寥無幾,交通出行對居民情感態(tài)度的影響不顯著。自第四階段開始,地鐵日客流量每上漲1%,城市居民的情感得分平均增加0.01 分和0.02分??箵粢咔榈暮笃?,我國已經(jīng)積累了不少經(jīng)驗,居民在應(yīng)對疫情方面也更加自覺和自律。3 月中旬到4月底,國內(nèi)疫情得到有效控制,社會復(fù)工復(fù)產(chǎn),離漢離鄂通道管控措施解除,各城市的地鐵乘次逐漸恢復(fù)穩(wěn)步運營。封閉了近兩個月的民眾在國家復(fù)工復(fù)產(chǎn)的號召下,外出意愿較為強烈,并且對抗擊疫情的態(tài)度更加積極。第五階段全國疫情防控進(jìn)入常態(tài)化,境內(nèi)疫情總體呈零星散發(fā)狀態(tài),境外輸入病例基本得到控制。這意味著外出通行再次恢復(fù)成生活常態(tài),隨著地鐵日客流量的提升,大眾的情感也更為積極。此外,第五階段的影響程度要高于第四階段,這是因為在3、4 月份,雖然工作開始恢復(fù),但民眾對于疫情仍有擔(dān)憂和顧慮。然而,隨著連續(xù)每日新增病例為零,防控工作進(jìn)入常態(tài)化,我們對戰(zhàn)勝疫情的信心明顯增加了,外出通行對情感得分的影響程度達(dá)到最大。

五、主要結(jié)論

本文主要探究了2020 年1 月1 日至7 月31 日全國主要10 個疫情爆發(fā)城市的民眾情感趨勢、關(guān)注話題和城市交通狀況,并探討了網(wǎng)絡(luò)輿情與交通出行之間的聯(lián)系,得出了四個主要結(jié)論。

第一,民眾的情感經(jīng)歷了起伏,但是大部分時段仍持積極態(tài)度。第一階段為2020 年1 月1 日至2 月9 日,前期國內(nèi)居民對于此次疫情了解較少,雖然情緒存在波動,但是均高于0.5,大部分人還未意識到這次疫情的嚴(yán)重性。第二階段為2 月9 日至2 月29日,隨著確診和死亡病例的劇增,各級政府實施交通管制,大部分居民被限制在固定的區(qū)域內(nèi)活動,導(dǎo)致社會產(chǎn)生了更多的消極情緒。第三階段為3 月1 日至6 月13 日,該時期國內(nèi)疫情好轉(zhuǎn),各城市陸續(xù)解封。第四階段為6 月13 日至6 月27 日,北京突發(fā)確診病例,再次引起社會關(guān)注,人們因擔(dān)心疫情反彈而釋放出更多負(fù)面情緒。第五階段為6 月27 日至7 月31 日,整體情感得分大于0.5,居民對待疫情的態(tài)度更加從容。研究還得出,我國中西部省份在研究時段內(nèi)的情感得分更低。從武漢“封城”到各城市啟動復(fù)工這段時期內(nèi),由于農(nóng)歷新年的影響,我國居民仍持有較高的情感得分。

第二,城市地鐵日客流量與微博輿情的時段劃分相一致。武漢“封城”后不久,各省市政府下達(dá)了交通管制的指示,城市交通幾近癱瘓,日客流量急劇下降,這種情況一直持續(xù)到2020 年2 月底。3 月初到4月底,社會復(fù)工復(fù)產(chǎn)穩(wěn)步開展,各城市的地鐵乘次開始有序運營,其中上海的地鐵運營恢復(fù)最快。6 月11日北京市新增確診病例,隨后,北京市恢復(fù)社區(qū)封閉管理,調(diào)整公共交通限流比例,控制上座率,地鐵客流量出現(xiàn)大幅下降。

第三,研究期內(nèi),交通出行對大眾情感產(chǎn)生了積極影響。地鐵日客流量每上漲1%,民眾的情感得分平均提高0.01 分。日客流量的上漲側(cè)面反映出交通出行的自由靈活,長期被“封閉”的居民壓抑的情緒得以釋放。城市生產(chǎn)總值越多,居民情感得分越高,表明政府會花費更多的人力、財力用于疫情防控,讓居民居住在放心的環(huán)境中。城市人口越多,越容易引發(fā)民眾恐慌,表明人口密度的增加和人口流動會加大感染疫情的風(fēng)險。

第四,依據(jù)《抗擊新冠肺炎疫情的中國行動》白皮書,本文將2020 年1 月1 日至7 月31 日劃分為五個階段。前三個階段(1 月1 日至3 月17 日)的地鐵日客流量對民眾情感得分的影響不顯著,可能的原因是疫情初期,交通封閉,居民外出受限。在第四階段和第五階段(3 月18 日至7 月31 日),地鐵日客流量平均每增長1%,居民情感得分平均上升0.01分和0.02 分。隨著疫情防控常態(tài)化,民眾更注重日常防范,城市交通有序恢復(fù),居民外出也越來越放心,大眾對于戰(zhàn)勝疫情越來越有信心。越到后期,地鐵日客流量反映的交通出行情況對居民情感的影響越大。

仁布县| 瓮安县| 琼海市| 图片| 张北县| 彰武县| 科技| 德昌县| 天柱县| 常宁市| 龙岩市| 瑞丽市| 扶沟县| 清水县| 清流县| 海丰县| 靖远县| 杨浦区| 始兴县| 理塘县| 黄陵县| 昌平区| 武安市| 中西区| 满城县| 辛集市| 南川市| 民权县| 永吉县| 阿图什市| 三原县| 浦北县| 浙江省| 乌鲁木齐市| 河东区| 会同县| 南京市| 清丰县| 昭觉县| 洛浦县| 明星|