云計(jì)算環(huán)境下基于深度學(xué)習(xí)的人群流量預(yù)測(cè)框架

2023-03-07 01:24:58蔣春林

無線電工程 2023年2期

蔣春林，佘磊

(四川省人工智能研究院，四川宜賓 644000)

0 引言

隨著全球定位系統(tǒng)、移動(dòng)智能設(shè)備以及遙感通信裝置等各種定位技術(shù)的飛速發(fā)展，移動(dòng)用戶的位置信息比以往任何時(shí)候都要更加豐富。通過用戶的時(shí)空行為數(shù)據(jù)預(yù)測(cè)人群流量對(duì)智慧城市建設(shè)有重要意義，進(jìn)而為人類移動(dòng)模式挖掘、交通事故預(yù)測(cè)以及城市規(guī)劃提供輔助決策支持[1]。然而，以下3個(gè)方面的問題導(dǎo)致傳統(tǒng)方法(如線性回歸)很難實(shí)現(xiàn)理想的預(yù)測(cè)性能：① 傳統(tǒng)的路邊檢測(cè)儀器包括視頻圖像處理技術(shù)、環(huán)形線圈檢測(cè)器和超聲波檢測(cè)器等，經(jīng)常會(huì)受到環(huán)境的干擾，對(duì)外界因素較為敏感[2]；② 現(xiàn)有檢測(cè)方法均需要較高的安裝成本和復(fù)雜的基礎(chǔ)設(shè)施[3]，例如需要安裝在地下的環(huán)形線圈檢測(cè)器，經(jīng)常會(huì)受到道路上重型車輛碾壓而損壞，增加了維修費(fèi)用；③ 時(shí)空行為數(shù)據(jù)大多是多模態(tài)數(shù)據(jù)[4]，包含時(shí)間、空間以及專題屬性等信息，這些數(shù)據(jù)蘊(yùn)含著非常復(fù)雜的時(shí)空依賴關(guān)系及上下文語義，淺層模型一般很難捕獲深層次關(guān)系和語義。

云計(jì)算技術(shù)在諸多領(lǐng)域已經(jīng)取得了巨大的成果并廣泛應(yīng)用于日常生活中，尤其在智慧城市建設(shè)方面取得了顯著的成果，主要涉及智慧環(huán)境、智慧交通和智慧安防等領(lǐng)域，并且推進(jìn)了一系列云平臺(tái)的成功發(fā)展，如公共信息數(shù)據(jù)服務(wù)平臺(tái)、智慧城市網(wǎng)絡(luò)傳輸平臺(tái)和基礎(chǔ)設(shè)施信息交流平臺(tái)等。云計(jì)算技術(shù)利用云中廣泛分布的計(jì)算資源對(duì)大量的數(shù)據(jù)信息進(jìn)行收集、分析和存儲(chǔ)，在智慧城市建設(shè)中發(fā)揮關(guān)鍵支撐作用。利用云服務(wù)器豐富的虛擬資源和較高的計(jì)算速度，將復(fù)雜的計(jì)算任務(wù)卸載到云服務(wù)器上，是緩解本地基礎(chǔ)設(shè)施計(jì)算壓力并且提升系統(tǒng)性能的有效方法[5]。正因?yàn)樵朴?jì)算技術(shù)具備良好的計(jì)算能力，所以能夠滿足日益增長(zhǎng)的數(shù)據(jù)分析需求，為用戶提供高效的數(shù)據(jù)管理方式。

傳統(tǒng)方法處理海量數(shù)據(jù)時(shí)通常使用啟發(fā)式算法，這類算法處理大規(guī)模數(shù)據(jù)時(shí)性能表現(xiàn)較差，并且需要額外的計(jì)算力來執(zhí)行流量預(yù)測(cè)，不滿足智慧城市建設(shè)中延遲容忍的要求[6]。然而，當(dāng)數(shù)據(jù)規(guī)模增加時(shí)，深度學(xué)習(xí)算法得益于其標(biāo)記數(shù)據(jù)并提供解決問題的能力，會(huì)有較明顯的性能提升。針對(duì)智慧城市中應(yīng)用程序通信量和計(jì)算量的增長(zhǎng)，深度學(xué)習(xí)驅(qū)動(dòng)的方法可以幫助減輕決策、動(dòng)態(tài)資源分配和內(nèi)容緩存的負(fù)擔(dān)。然而，如何為云環(huán)境下的人群流量預(yù)測(cè)定制深度學(xué)習(xí)技術(shù)仍然是一個(gè)挑戰(zhàn)。

為了解決上述問題，本文提出一種云計(jì)算環(huán)境下基于深度學(xué)習(xí)的人群流量預(yù)測(cè)框架(Deep Learning-based Crowd Flow Prediction Framework in Cloud Computing，DL-CFP)。DL-CFP集成一種新的雙區(qū)域相關(guān)機(jī)制捕捉空間相關(guān)性，鄰近單元和擴(kuò)張單元分別負(fù)責(zé)相鄰區(qū)域和偏遠(yuǎn)區(qū)域的空間相關(guān)性。然后，利用卷積長(zhǎng)短期記憶(Convolutional Long Short-Term Memory，ConvLSTM) 模型捕獲時(shí)間相關(guān)性，并且設(shè)計(jì)了一種區(qū)域增強(qiáng)注意力機(jī)制，以更廣泛地捕獲數(shù)據(jù)的時(shí)空相關(guān)性。最后，將多層輸出串聯(lián)并經(jīng)過卷積處理得到最終預(yù)測(cè)結(jié)果。

綜上所述，本文的主要貢獻(xiàn)包括：

① 提出了云計(jì)算環(huán)境下利用深度學(xué)習(xí)模型預(yù)測(cè)人群流量問題；

② 利用鄰近單元和擴(kuò)張單元分別捕獲相鄰區(qū)域和偏遠(yuǎn)區(qū)域的空間相關(guān)性；

③ 提出了區(qū)域增強(qiáng)注意力機(jī)制，使模型能夠捕獲更豐富的時(shí)空相關(guān)性，提高預(yù)測(cè)的質(zhì)量；

④ 在2個(gè)真實(shí)出行數(shù)據(jù)集上通過大量對(duì)比實(shí)驗(yàn)評(píng)估了DL-CFP模型，其時(shí)間性能和準(zhǔn)確率均優(yōu)于當(dāng)前主流方法。

1 相關(guān)工作

與傳統(tǒng)的人群流量預(yù)測(cè)方法不同，本文主要涉及云計(jì)算技術(shù)和深度學(xué)習(xí)2個(gè)方面，下文將分別介紹這2個(gè)方面的研究現(xiàn)狀。

1.1 云計(jì)算技術(shù)

隨著智能設(shè)備的升級(jí)與發(fā)展，云計(jì)算技術(shù)迅速拓展到更廣泛的領(lǐng)域。得益于廣泛部署的云計(jì)算平臺(tái)，用戶可以輕松實(shí)現(xiàn)數(shù)據(jù)的在線存儲(chǔ)和計(jì)算，并在分布式部署的基礎(chǔ)上進(jìn)行快速的數(shù)據(jù)傳輸與分享。郎大鵬等[7]針對(duì)云計(jì)算技術(shù)暴露出的脆弱性，提出了一套可用于抵御樣本攻擊并實(shí)現(xiàn)防御檢測(cè)的攻防驗(yàn)證體系。該體系通過系統(tǒng)內(nèi)部自動(dòng)生成樣本對(duì)抗算法，進(jìn)而測(cè)試云應(yīng)用的安全性，并且借助內(nèi)置的評(píng)估模塊，用戶可以對(duì)自定義的攻擊手段進(jìn)行自主評(píng)估和迭代驗(yàn)證。陳勇等[8]針對(duì)云計(jì)算平臺(tái)中并行數(shù)據(jù)挖掘研究提出了一個(gè)大數(shù)據(jù)關(guān)聯(lián)規(guī)律挖掘分析模型，該方法為彌補(bǔ)傳統(tǒng)數(shù)據(jù)挖掘算法效率低下的缺陷，通過挖掘大規(guī)模數(shù)據(jù)集中的取值規(guī)律并加以計(jì)算，確保云平臺(tái)能夠準(zhǔn)確完成相應(yīng)的數(shù)據(jù)分析任務(wù)。Bilal等[9]提出了一種基于云計(jì)算的多視圖視頻捕獲方法，該方法通過收集多個(gè)參與者為同一場(chǎng)景捕獲的不同視圖，通過分配可用資源將視圖進(jìn)行代碼轉(zhuǎn)換，最大限度地提高觀眾的整體滿意度，將其組合成多視圖視頻，觀眾可以從不同角度觀察同一場(chǎng)景，這一工作將云應(yīng)用提升到一個(gè)新的沉浸式水平，用戶的體驗(yàn)更好。

1.2 深度學(xué)習(xí)

深度學(xué)習(xí)屬于機(jī)器學(xué)習(xí)的一個(gè)子集，由于具備處理海量數(shù)據(jù)的能力，許多研究者已經(jīng)將其應(yīng)用于時(shí)空預(yù)測(cè)任務(wù)中并取得了優(yōu)異的研究成果。孫炯寧等[10]提出一種結(jié)合時(shí)空預(yù)測(cè)和深度學(xué)習(xí)的單目標(biāo)視頻跟蹤模型，該模型以SiamMask深度學(xué)習(xí)網(wǎng)絡(luò)為基礎(chǔ)加入了興趣目標(biāo)識(shí)別技術(shù)，在模型中融入時(shí)空目標(biāo)跟蹤技術(shù)，實(shí)現(xiàn)了目標(biāo)的快速識(shí)別與跟蹤，有效地解決了復(fù)雜環(huán)境中目標(biāo)視頻跟蹤的穩(wěn)定性問題。王港等[11]提出了一種基于深度學(xué)習(xí)網(wǎng)絡(luò)的遙感目標(biāo)檢測(cè)及特征提取模型，該模型利用卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Network，CNN)的成像特性來研究目標(biāo)遙感影像，結(jié)合卷積結(jié)構(gòu)提取目標(biāo)模型特征，提高了遙感影像執(zhí)行目標(biāo)檢測(cè)任務(wù)時(shí)的深層次網(wǎng)絡(luò)設(shè)計(jì)能力。Yao等[12]提出了一種新的時(shí)空動(dòng)態(tài)網(wǎng)絡(luò)，該方法引入了門控機(jī)制來學(xué)習(xí)時(shí)空位置之間的動(dòng)態(tài)相似性，并設(shè)計(jì)了周期性轉(zhuǎn)移注意力機(jī)制來處理時(shí)間周期較長(zhǎng)的問題，該方法有效應(yīng)對(duì)了時(shí)空預(yù)測(cè)問題中復(fù)雜的空間相關(guān)性和時(shí)間動(dòng)態(tài)性問題。Zhou等[13]提出了一個(gè)基于深度神經(jīng)網(wǎng)絡(luò)的車輛調(diào)度預(yù)測(cè)模型，該方法采用基于卷積和ConvLSTM單元的編碼解碼器框架來識(shí)別復(fù)雜特征，通過捕捉用戶需求對(duì)時(shí)空的影響來提升上下文感知交互能力，并且加入注意力模型來強(qiáng)化人群遷移規(guī)律存在的潛在影響，該研究有利于解決需求與服務(wù)不匹配問題，為制定有效的車輛分配計(jì)劃提供了保障。

云計(jì)算技術(shù)和深度學(xué)習(xí)已經(jīng)取得了諸多研究成果，本文目的是找到一種在資源豐富的云環(huán)境下進(jìn)行深度學(xué)習(xí)的方法，將云計(jì)算應(yīng)用于任務(wù)卸載，并進(jìn)一步解決時(shí)空預(yù)測(cè)任務(wù)中人群流量的預(yù)測(cè)問題，與已有工作相比，本文提出的框架延遲更低并且容錯(cuò)率更高。

1.3 總體框架

本文提出一個(gè)云計(jì)算環(huán)境下基于深度學(xué)習(xí)的人群流量預(yù)測(cè)框架，通過智能移動(dòng)設(shè)備(如智能手機(jī)、便攜式電腦和多媒體播放器等)收集用戶的位置數(shù)據(jù)，主要包括行人數(shù)量、行進(jìn)速度、行進(jìn)方向、當(dāng)前位置信息以及當(dāng)前時(shí)間信息，聚合后發(fā)送到云端服務(wù)器，以便分析人群分布情況，模型總體框架如圖1所示。

圖1 模型總體框架Fig.1 Framework of the proposed model

提出一個(gè)3層的系統(tǒng)架構(gòu)，從下到上分別是數(shù)據(jù)收集層、網(wǎng)絡(luò)傳輸層和云服務(wù)層。在數(shù)據(jù)收集層，通過智能設(shè)備群、互聯(lián)網(wǎng)設(shè)備群、工業(yè)設(shè)備群收集與位置有關(guān)的數(shù)據(jù)，包括速度、方向和位置。在網(wǎng)絡(luò)層傳輸層，使用5G技術(shù)實(shí)現(xiàn)設(shè)備群和云平臺(tái)之間數(shù)據(jù)的傳輸。在云服務(wù)層，提出了一種基于深度學(xué)習(xí)的人群流量預(yù)測(cè)算法，實(shí)現(xiàn)移動(dòng)人群的實(shí)時(shí)流量預(yù)測(cè)。

2 問題表述及模型

2.1 相關(guān)定義

定義1 區(qū)域單元。將城市C按照經(jīng)緯度劃分為m×n的網(wǎng)格地圖，每一個(gè)網(wǎng)格被定義為一個(gè)區(qū)域單元，所有的區(qū)域單元可以用集合的形式進(jìn)行定義，即：D={d1,1,…,di,j,…,dm,n}，其中，di,j表示網(wǎng)格地圖中第i行、第j列的區(qū)域單元。

定義2 流量圖。給定一個(gè)區(qū)域單元D以及該區(qū)域單元的時(shí)空流量值(包括人群流入量和流出量)，則區(qū)域單元D在時(shí)間戳t內(nèi)的時(shí)空流量值被定義為一個(gè)流量圖，用矩陣形式表示為Xt∈Dm×n。

2.2 基于深度學(xué)習(xí)的人群流量預(yù)測(cè)模型

本文提出了DL-CFP模型，該模型使用卷積操作來捕獲不同區(qū)域間的空間相關(guān)性，并利用ConvLSTM模型計(jì)算時(shí)間相關(guān)性。DL-CFP的網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。首先，將整個(gè)城市視為一個(gè)圖像，將時(shí)空?qǐng)D分別輸入到鄰近單元和擴(kuò)張單元，用于計(jì)算相鄰區(qū)域的空間相關(guān)性和偏遠(yuǎn)區(qū)域的空間相關(guān)性。其次，將2個(gè)模塊的輸出通過ConvLSTM模型對(duì)序列中的時(shí)間相關(guān)性進(jìn)行建模。然后，利用區(qū)域增強(qiáng)注意力機(jī)制描述空間相關(guān)性的重要程度。最后，將輸出串聯(lián)并通過一個(gè)1×1卷積層和tanh函數(shù)得到最終預(yù)測(cè)結(jié)果。

圖2 DL-CFP網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Structure of the DL-CFP network

2.3 空間相關(guān)性

傳統(tǒng)基于ConvLSTM神經(jīng)網(wǎng)絡(luò)的研究通常利用幾個(gè)局部卷積來捕獲相鄰區(qū)域之間的空間相關(guān)性，導(dǎo)致較遠(yuǎn)距離區(qū)域之間的空間相關(guān)性容易被忽略。Lin等[14]的研究表明，區(qū)域分布相似的2個(gè)地區(qū)，即使它們?cè)诘乩砦恢蒙喜唤咏部梢猿尸F(xiàn)出非常相似的時(shí)空數(shù)據(jù)模型。因此，本文提出一種雙區(qū)域相關(guān)的機(jī)制，該機(jī)制分別考慮相鄰區(qū)域的強(qiáng)相關(guān)性和偏遠(yuǎn)區(qū)域的弱相關(guān)性，通過鄰近模塊捕獲附近地區(qū)的空間相關(guān)性以及擴(kuò)張模塊捕獲偏遠(yuǎn)地區(qū)的空間相關(guān)性，將2個(gè)模塊的輸出合并得到目標(biāo)區(qū)域的空間表示。

2.3.1 鄰近單元

定義4 鄰近單元。通過多個(gè)局部卷積來捕獲相鄰區(qū)域的空間相關(guān)性，在相鄰區(qū)域相關(guān)性捕獲模塊中，鄰近單元包括3個(gè)3×3卷積層，用于捕獲附近7×7區(qū)域的空間相關(guān)性。3×3卷積層定義如下：

(1)

空間特征的相關(guān)性可以通過共享權(quán)重的周期核來提取，通過調(diào)整卷積模式來融合多尺度特征的語義，而不需要引入額外的參數(shù)，降低了計(jì)算復(fù)雜性，通過鄰近單元計(jì)算相鄰區(qū)域的空間相似性是一種新穎而高效的方法。

2.3.2 擴(kuò)張單元

定義5 擴(kuò)張單元。通過3×3的擴(kuò)張卷積來學(xué)習(xí)偏遠(yuǎn)區(qū)域之間的相互作用，旨在擴(kuò)大視野感受，彌補(bǔ)固定大小的卷積核無法收集偏遠(yuǎn)區(qū)域空間相關(guān)性的缺點(diǎn)，從不同尺度提取空間相關(guān)性。定義如下：

(2)

通過改變擴(kuò)張因子的值，可以在不改變特征圖尺寸的同時(shí)擴(kuò)大感受野。

圖3分別例舉了k取1，2，3的擴(kuò)張卷積，更直觀地說明不同擴(kuò)張因子所帶來的感受野?？梢灾庇^地發(fā)現(xiàn)，通過改變擴(kuò)張因子可以有效捕獲較遠(yuǎn)區(qū)域的空間相關(guān)性，并且不會(huì)增加卷積層的數(shù)量。因此，考慮到每個(gè)城市區(qū)域的大小不同，可以使用含有不同擴(kuò)張因子的擴(kuò)張卷積處理不同距離區(qū)域之間的空間相關(guān)性。

圖3 不同擴(kuò)張因子的擴(kuò)張卷積Fig.3 Dilated convolutions with different factors

綜上所述，利用式(3)將鄰近模塊捕獲附近地區(qū)的空間相關(guān)性和擴(kuò)張模塊捕獲偏遠(yuǎn)地區(qū)的空間相關(guān)性動(dòng)態(tài)合并：

(3)

式中，Wc表示鄰近單元的權(quán)重矩陣；Wf表示擴(kuò)張單元的權(quán)重矩陣。

2.4 時(shí)間依賴性

ConvLSTM網(wǎng)絡(luò)模型是一種循環(huán)神經(jīng)網(wǎng)絡(luò)架構(gòu)，本文將其用于處理高維的空間序列數(shù)據(jù)并對(duì)序列中的時(shí)間依賴性進(jìn)行建模。

ConvLSTM模塊逐個(gè)相連，每個(gè)ConvLSTM模塊均有2個(gè)輸入與權(quán)重矩陣進(jìn)行卷積計(jì)算(首個(gè)模塊除外)，分別是當(dāng)前模塊輸入xt以及上一個(gè)模塊輸出的隱藏狀態(tài)ht-1，其網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。

圖4 ConvLSTM網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 Structure of the ConvLSTM network

ConvLSTM包括以下4個(gè)單元：記憶單元ct負(fù)責(zé)存儲(chǔ)信息，屬于長(zhǎng)時(shí)記憶；輸入門it負(fù)責(zé)控制判斷在存儲(chǔ)單元是否包含新的信息；遺忘門ft負(fù)責(zé)過濾上一時(shí)刻的信息；輸出門ot控制輸出更新后的信息，上述單元計(jì)算如下：

it=σ(C/(wxi,xt)+C/(whi,ht-1)+bi)，

(4)

ft=σ(C/(wxf,xt)+C/(whf,ht-1)+bf)，

(5)

ot=σ(C/(wxo,xt)+C/(who,ht-1)+bo)，

(6)

ct=ft⊙ct-1+it⊙tanh(C/(wxc,xt)+C/(whc,ht-1)+bc)，

(7)

式中，wxi，wxf，wxo，wxc分別表示輸入門、遺忘門、輸出門和記憶單元的權(quán)重矩陣；bi，bf，bo，bc分別表示輸入門、遺忘門、輸出門和記憶單元對(duì)應(yīng)的偏執(zhí)向量；σ表示Sigmoid激活函數(shù)，將輸入的變量映射到[0, 1]，作為控制各個(gè)門的開關(guān)；C/表示卷積操作；⊙表示哈達(dá)瑪乘積。

2.5 區(qū)域增強(qiáng)注意力機(jī)制

多頭注意力機(jī)制已廣泛應(yīng)用于神經(jīng)網(wǎng)絡(luò)模型，用于識(shí)別每個(gè)特征的屬性權(quán)重并篩選數(shù)據(jù)中關(guān)鍵的特征，過濾無效的輸入數(shù)據(jù)，以此突出數(shù)據(jù)的重要性。Vishnu等[15]的研究表明，當(dāng)給定相同的查詢、鍵和值時(shí)，多頭注意力機(jī)制可以學(xué)習(xí)到不同的特征，彌補(bǔ)了單頭注意力機(jī)制在訓(xùn)練時(shí)容易過度集中單個(gè)位置的缺陷。為了更廣泛地捕獲空間相關(guān)性，提出了一種區(qū)域增強(qiáng)注意力機(jī)制，用于描述不同時(shí)間步長(zhǎng)幀之間的空間相關(guān)性，具體計(jì)算如下：

score(Xt,q)=tanh(Ws·Xt+Ws·q)，

(8)

A(q,k,v)=softmax(score(Xt,q))=

(9)

MA(q,k,v)=Wm·[A1,A2, …,At]，

(10)

式中，score(·)表示注意力得分函數(shù)；Ws表示學(xué)習(xí)參數(shù)；A(·)表示單頭注意力機(jī)制的輸出；q表示查詢向量；k表示鍵向量；v表示值向量；MA(·)表示多頭注意力機(jī)制的輸出；Wm表示學(xué)習(xí)參數(shù)。

將所學(xué)特征的注意力得分進(jìn)行加權(quán)計(jì)算，捕獲不同時(shí)間步長(zhǎng)之間的空間相關(guān)性，計(jì)算如下：

(11)

將注意力機(jī)制的輸出與卷積層輸出串聯(lián)，通過1×1的卷積層，形成自注意增強(qiáng)卷積，最終的輸出定義如下：

(12)

3 實(shí)驗(yàn)結(jié)果與分析

3.1 實(shí)驗(yàn)設(shè)置

為了評(píng)估DL-CFP模型的性能，在2組真實(shí)數(shù)據(jù)集上進(jìn)行對(duì)比實(shí)驗(yàn)：

① 滴滴出行數(shù)據(jù)集：該數(shù)據(jù)集包含中國成都600多萬次出租車出行記錄，選用2016年7—10月的數(shù)據(jù)，將區(qū)域大小設(shè)置為20×20，時(shí)間間隔設(shè)置為20 min，數(shù)據(jù)集被劃分為6 624個(gè)時(shí)間片段。

② 紐約出行數(shù)據(jù)集：該數(shù)據(jù)集包含紐約市1 300多萬次出租車出行記錄，選用2015年5月—2016年9月的數(shù)據(jù)，將區(qū)域大小設(shè)置為30×40，時(shí)間間隔設(shè)置為20 min，數(shù)據(jù)集被劃分為8 784個(gè)時(shí)間片段。

本文的實(shí)驗(yàn)環(huán)境描述如表1所示。

表1 實(shí)驗(yàn)環(huán)境描述Tab.1 Description of experimental environments

為了保證實(shí)驗(yàn)結(jié)果的公平并避免不確定性，本文使用不同數(shù)據(jù)集時(shí)間片最后20 d的數(shù)據(jù)作為測(cè)試數(shù)據(jù)，剩余的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。

3.2 評(píng)價(jià)指標(biāo)

本文使用均方根誤差(Root Mean Squared Error, RMSE)和平均絕對(duì)誤差(Mean Absolute Error，MAE)來評(píng)價(jià)DL-CFP模型收斂后的準(zhǔn)確度情況，計(jì)算如下：

(13)

(14)

本文使用一種基于網(wǎng)格的準(zhǔn)確率計(jì)算方法來衡量模型預(yù)測(cè)的準(zhǔn)確性：將二維數(shù)據(jù)空間分為|M|個(gè)相等大小的網(wǎng)格，通過對(duì)比每個(gè)單元網(wǎng)格中的預(yù)測(cè)值和實(shí)際值可以得到準(zhǔn)確率(ACC)，計(jì)算如下：

(15)

3.3 基準(zhǔn)方法

為了驗(yàn)證DL-CFP模型的各方面性能，本文引入以下基準(zhǔn)方法進(jìn)行對(duì)比實(shí)驗(yàn):

① CNN模型[16]是基于卷積層的深度學(xué)習(xí)模型，能夠?qū)W習(xí)局部空間相關(guān)性。

② RNN模型[17]是基于遞歸結(jié)構(gòu)的深度學(xué)習(xí)模型，能夠捕獲時(shí)間依賴性。

③ ConvLSTM模型[18]是LSTM的變體，它在LSTM單元內(nèi)包含卷積操作。ConvLSTM考慮了時(shí)空數(shù)據(jù)的空間與時(shí)間依賴性，廣泛應(yīng)用于時(shí)空預(yù)測(cè)任務(wù)。

④ DeepST模型[19]是一種用于城市人群流量預(yù)測(cè)的深度學(xué)習(xí)模型，通過分析時(shí)間變化引起的人流變化趨勢(shì)對(duì)時(shí)間依賴性進(jìn)行建模，并通過CNN來計(jì)算城市的空間相關(guān)性。

3.4 實(shí)驗(yàn)結(jié)果分析

3.4.1 預(yù)測(cè)誤差對(duì)比

首先，本文比較了不同方法在滴滴數(shù)據(jù)集上的預(yù)測(cè)性能，其RMSE和MAE比較結(jié)果如圖5所示。

(a)不同方法的RMSE比較

(b)不同方法的MAE比較圖5 不同方法在滴滴數(shù)據(jù)集上預(yù)測(cè)誤差比較Fig.5 Prediction error comparison of different methods on Didi dataset

由圖5可以看出，傳統(tǒng)RNN方法在所有方法中性能最差，這是因?yàn)镽NN僅關(guān)注每個(gè)區(qū)域的時(shí)間關(guān)系，而忽略了空間相關(guān)性。ConvLSTM模型是一種流行的時(shí)空數(shù)據(jù)特征學(xué)習(xí)模型，其性能較高于其他傳統(tǒng)模型，然而，它的表現(xiàn)不如本文所提DL-CFP模型，原因在于所提出的雙區(qū)域相關(guān)機(jī)制提高了預(yù)測(cè)的準(zhǔn)確性。

為了測(cè)試所提出的區(qū)域增強(qiáng)注意力機(jī)制是否有效，將DL-CFP模型與DeepST模型進(jìn)行比較。DeepST模型考慮到近距離和遠(yuǎn)距離的空間相關(guān)性，但未引入注意力機(jī)制，實(shí)驗(yàn)結(jié)果表明，DL-CFP模型的RMSE和MAE均低于DeepST模型，說明本文提出的注意力機(jī)制更好地捕獲了不同區(qū)域之間的空間相關(guān)性。DL-CFP模型的RMSE值比CNN值降低了約15.7%，MAE值降低了9.2%，說明同時(shí)使用卷積的情況下，綜合考慮相鄰區(qū)域和偏遠(yuǎn)區(qū)域的DL-CFP模型的預(yù)測(cè)結(jié)果與實(shí)際結(jié)果擬合更好，更接近真實(shí)值。

進(jìn)一步，比較了不同方法在紐約出行數(shù)據(jù)集上的預(yù)測(cè)性能，其RMSE和MAE比較結(jié)果如圖6所示。

(a)不同方法的RMSE比較

(b)不同方法的MAE比較圖6 不同方法在紐約出行數(shù)據(jù)集上預(yù)測(cè)誤差比較Fig.6 Prediction error comparison of different methods on NYC-taxi dataset

由圖6可以看出，傳統(tǒng)的深度學(xué)習(xí)模型在處理規(guī)模較大的紐約出行數(shù)據(jù)集時(shí)性能較差，ConvLSTM模型由于具備提取空間特征和時(shí)間特征的神經(jīng)單元結(jié)構(gòu)和神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)，其性能優(yōu)于CNN和RNN模型，較CNN模型RMSE和MAE分別降低了16.3%和13.9%，較RNN模型RMSE和MAE分別降低了13.1%和6.7%。此外，當(dāng)數(shù)據(jù)集規(guī)模較大時(shí)，DeepST模型可能將不確定的數(shù)據(jù)映射到高維空間，無法充分利用空間和周期特征進(jìn)行流量預(yù)測(cè)，導(dǎo)致預(yù)測(cè)性能較差。在處理大規(guī)模數(shù)據(jù)集時(shí)，DL-CFP模型的性能均優(yōu)于上述所有算法。相比于其他模型，本文所提DL-CFP模型不僅可以提取空間特征，還可以提取時(shí)間特征，因?yàn)樵撃Ｐ徒⒃谝粋€(gè)混合深度神經(jīng)網(wǎng)絡(luò)之上，包括了CNN和LSTM神經(jīng)網(wǎng)絡(luò)，可以更有效地提取空間特征和時(shí)間特征。具體來說，DL-CFP模型利用一種雙區(qū)域相關(guān)的機(jī)制分別捕獲相鄰區(qū)域和偏遠(yuǎn)區(qū)域的空間相關(guān)性，借助ConvLSTM模型對(duì)時(shí)間依賴性進(jìn)行建模，特別地，由于區(qū)域增強(qiáng)注意力機(jī)制的存在，隨著預(yù)測(cè)范圍的增加，DL-CFP模型的預(yù)測(cè)性能與其他模型的性能相比，性能優(yōu)勢(shì)越明顯。

3.4.2 準(zhǔn)確率分析

為了研究訓(xùn)練集規(guī)模變化對(duì)預(yù)測(cè)準(zhǔn)確率的影響，本文通過改變訓(xùn)練集大小來驗(yàn)證不同算法的性能，訓(xùn)練集的大小取值分別為20%，40%，60%，80%，100%，實(shí)驗(yàn)結(jié)果如圖7和圖8所示。

圖7 滴滴數(shù)據(jù)集中不同訓(xùn)練集規(guī)模下預(yù)測(cè)準(zhǔn)確性比較Fig.7 Prediction accuracy comparison at different scales of training sets on Didi dataset

圖8 紐約數(shù)據(jù)集中不同訓(xùn)練集規(guī)模下預(yù)測(cè)準(zhǔn)確性比較Fig.8 Prediction accuracy comparison at different scales of training sets on NYC-taxi dataset

由圖7可以看出，隨著訓(xùn)練集規(guī)模的增大，5種方法的準(zhǔn)確率均有不同程度的提升，這表明訓(xùn)練集規(guī)模越大，模型的預(yù)測(cè)性能越好，DL-CFP模型的準(zhǔn)確率在訓(xùn)練集規(guī)模20%～100%高于其他4種基準(zhǔn)方法，平均準(zhǔn)確率大約穩(wěn)定在75.6%。DeepST模型的預(yù)測(cè)準(zhǔn)確率在訓(xùn)練集規(guī)模擴(kuò)大過程中增長(zhǎng)幅度較為緩慢，而DL-CFP模型增幅較高，因?yàn)镈L-CFP模型可以更深層次挖掘不同區(qū)域之間的空間依賴性。CNN模型和RNN模型預(yù)測(cè)效果均不佳，原因在于模型對(duì)于空間特征的提取不完全。此外，ConvLSTM模型的預(yù)測(cè)準(zhǔn)確率大約穩(wěn)定在67.3%，這表明綜合考慮時(shí)間和空間對(duì)預(yù)測(cè)的影響是非常必要的，也證明本文所提方法的實(shí)際意義。

由圖8可以看出，5種方法在紐約數(shù)據(jù)集上的準(zhǔn)確率均低于滴滴數(shù)據(jù)集上的準(zhǔn)確率，這是由紐約城市場(chǎng)景的交通條件比成都城市場(chǎng)景更加復(fù)雜導(dǎo)致的，而本文所提DL-CFP模型的預(yù)測(cè)準(zhǔn)確率仍明顯優(yōu)于其他4種模型。CNN和RNN仍然是預(yù)測(cè)性能最差的2個(gè)模型，這是因?yàn)榱髁款A(yù)測(cè)場(chǎng)景具有很強(qiáng)的時(shí)空相關(guān)性，而僅考慮單一元素的深度神經(jīng)網(wǎng)絡(luò)并不適用于變化較大的流量預(yù)測(cè)。ConvLSTM模型比DeepST模型準(zhǔn)確率更高，因?yàn)镃onvLSTM模型可以更好地學(xué)習(xí)到序列中的時(shí)間相關(guān)性。人群流量的變化不僅取決于給定區(qū)域流量隨時(shí)間的演變，還取決于其他區(qū)域流量隨時(shí)間的演變。因此，綜合考慮了遠(yuǎn)近區(qū)域的空間相關(guān)性的DL-CFP模型受數(shù)據(jù)集規(guī)模變化的影響較小，在紐約數(shù)據(jù)集上平均預(yù)測(cè)準(zhǔn)確率達(dá)到73.6%，優(yōu)于其他主流方法。

4 結(jié)束語

本文提出了一種云計(jì)算環(huán)境下用于人群流量預(yù)測(cè)的DL-CFP模型，DL-CFP模型綜合考慮了空間相關(guān)性和時(shí)間依賴性，分別利用鄰近單元和擴(kuò)張單元捕獲相鄰區(qū)域以及偏遠(yuǎn)區(qū)域的空間相關(guān)性，并且利用ConvLSTM模型對(duì)時(shí)間依賴性進(jìn)行建模。為了有效地捕獲復(fù)雜的空間相關(guān)性，設(shè)計(jì)了一種區(qū)域增強(qiáng)注意力機(jī)制。實(shí)驗(yàn)結(jié)果表明，DL-CFP模型在預(yù)測(cè)性能和預(yù)測(cè)準(zhǔn)確率上均優(yōu)于其他基準(zhǔn)方法。未來的工作包括：如何將DL-CFP模型擴(kuò)展到更多的時(shí)空預(yù)測(cè)任務(wù)中以及如何利用特征豐富的異構(gòu)地圖信息解決數(shù)據(jù)稀缺的問題。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡