蔣春林,佘 磊
(四川省人工智能研究院,四川 宜賓 644000)
隨著全球定位系統(tǒng)、移動(dòng)智能設(shè)備以及遙感通信裝置等各種定位技術(shù)的飛速發(fā)展,移動(dòng)用戶的位置信息比以往任何時(shí)候都要更加豐富。通過用戶的時(shí)空行為數(shù)據(jù)預(yù)測(cè)人群流量對(duì)智慧城市建設(shè)有重要意義,進(jìn)而為人類移動(dòng)模式挖掘、交通事故預(yù)測(cè)以及城市規(guī)劃提供輔助決策支持[1]。然而,以下3個(gè)方面的問題導(dǎo)致傳統(tǒng)方法(如線性回歸)很難實(shí)現(xiàn)理想的預(yù)測(cè)性能:① 傳統(tǒng)的路邊檢測(cè)儀器包括視頻圖像處理技術(shù)、環(huán)形線圈檢測(cè)器和超聲波檢測(cè)器等,經(jīng)常會(huì)受到環(huán)境的干擾,對(duì)外界因素較為敏感[2];② 現(xiàn)有檢測(cè)方法均需要較高的安裝成本和復(fù)雜的基礎(chǔ)設(shè)施[3],例如需要安裝在地下的環(huán)形線圈檢測(cè)器,經(jīng)常會(huì)受到道路上重型車輛碾壓而損壞,增加了維修費(fèi)用;③ 時(shí)空行為數(shù)據(jù)大多是多模態(tài)數(shù)據(jù)[4],包含時(shí)間、空間以及專題屬性等信息,這些數(shù)據(jù)蘊(yùn)含著非常復(fù)雜的時(shí)空依賴關(guān)系及上下文語義,淺層模型一般很難捕獲深層次關(guān)系和語義。
云計(jì)算技術(shù)在諸多領(lǐng)域已經(jīng)取得了巨大的成果并廣泛應(yīng)用于日常生活中,尤其在智慧城市建設(shè)方面取得了顯著的成果,主要涉及智慧環(huán)境、智慧交通和智慧安防等領(lǐng)域,并且推進(jìn)了一系列云平臺(tái)的成功發(fā)展,如公共信息數(shù)據(jù)服務(wù)平臺(tái)、智慧城市網(wǎng)絡(luò)傳輸平臺(tái)和基礎(chǔ)設(shè)施信息交流平臺(tái)等。云計(jì)算技術(shù)利用云中廣泛分布的計(jì)算資源對(duì)大量的數(shù)據(jù)信息進(jìn)行收集、分析和存儲(chǔ),在智慧城市建設(shè)中發(fā)揮關(guān)鍵支撐作用。利用云服務(wù)器豐富的虛擬資源和較高的計(jì)算速度,將復(fù)雜的計(jì)算任務(wù)卸載到云服務(wù)器上,是緩解本地基礎(chǔ)設(shè)施計(jì)算壓力并且提升系統(tǒng)性能的有效方法[5]。正因?yàn)樵朴?jì)算技術(shù)具備良好的計(jì)算能力,所以能夠滿足日益增長(zhǎng)的數(shù)據(jù)分析需求,為用戶提供高效的數(shù)據(jù)管理方式。
傳統(tǒng)方法處理海量數(shù)據(jù)時(shí)通常使用啟發(fā)式算法,這類算法處理大規(guī)模數(shù)據(jù)時(shí)性能表現(xiàn)較差,并且需要額外的計(jì)算力來執(zhí)行流量預(yù)測(cè),不滿足智慧城市建設(shè)中延遲容忍的要求[6]。然而,當(dāng)數(shù)據(jù)規(guī)模增加時(shí),深度學(xué)習(xí)算法得益于其標(biāo)記數(shù)據(jù)并提供解決問題的能力,會(huì)有較明顯的性能提升。針對(duì)智慧城市中應(yīng)用程序通信量和計(jì)算量的增長(zhǎng),深度學(xué)習(xí)驅(qū)動(dòng)的方法可以幫助減輕決策、動(dòng)態(tài)資源分配和內(nèi)容緩存的負(fù)擔(dān)。然而,如何為云環(huán)境下的人群流量預(yù)測(cè)定制深度學(xué)習(xí)技術(shù)仍然是一個(gè)挑戰(zhàn)。
為了解決上述問題,本文提出一種云計(jì)算環(huán)境下基于深度學(xué)習(xí)的人群流量預(yù)測(cè)框架(Deep Learning-based Crowd Flow Prediction Framework in Cloud Computing,DL-CFP)。DL-CFP集成一種新的雙區(qū)域相關(guān)機(jī)制捕捉空間相關(guān)性,鄰近單元和擴(kuò)張單元分別負(fù)責(zé)相鄰區(qū)域和偏遠(yuǎn)區(qū)域的空間相關(guān)性。然后,利用卷積長(zhǎng)短期記憶(Convolutional Long Short-Term Memory,ConvLSTM) 模型捕獲時(shí)間相關(guān)性,并且設(shè)計(jì)了一種區(qū)域增強(qiáng)注意力機(jī)制,以更廣泛地捕獲數(shù)據(jù)的時(shí)空相關(guān)性。最后,將多層輸出串聯(lián)并經(jīng)過卷積處理得到最終預(yù)測(cè)結(jié)果。
綜上所述,本文的主要貢獻(xiàn)包括:
① 提出了云計(jì)算環(huán)境下利用深度學(xué)習(xí)模型預(yù)測(cè)人群流量問題;
② 利用鄰近單元和擴(kuò)張單元分別捕獲相鄰區(qū)域和偏遠(yuǎn)區(qū)域的空間相關(guān)性;
③ 提出了區(qū)域增強(qiáng)注意力機(jī)制,使模型能夠捕獲更豐富的時(shí)空相關(guān)性,提高預(yù)測(cè)的質(zhì)量;
④ 在2個(gè)真實(shí)出行數(shù)據(jù)集上通過大量對(duì)比實(shí)驗(yàn)評(píng)估了DL-CFP模型,其時(shí)間性能和準(zhǔn)確率均優(yōu)于當(dāng)前主流方法。
與傳統(tǒng)的人群流量預(yù)測(cè)方法不同,本文主要涉及云計(jì)算技術(shù)和深度學(xué)習(xí)2個(gè)方面,下文將分別介紹這2個(gè)方面的研究現(xiàn)狀。
隨著智能設(shè)備的升級(jí)與發(fā)展,云計(jì)算技術(shù)迅速拓展到更廣泛的領(lǐng)域。得益于廣泛部署的云計(jì)算平臺(tái),用戶可以輕松實(shí)現(xiàn)數(shù)據(jù)的在線存儲(chǔ)和計(jì)算,并在分布式部署的基礎(chǔ)上進(jìn)行快速的數(shù)據(jù)傳輸與分享。郎大鵬等[7]針對(duì)云計(jì)算技術(shù)暴露出的脆弱性,提出了一套可用于抵御樣本攻擊并實(shí)現(xiàn)防御檢測(cè)的攻防驗(yàn)證體系。該體系通過系統(tǒng)內(nèi)部自動(dòng)生成樣本對(duì)抗算法,進(jìn)而測(cè)試云應(yīng)用的安全性,并且借助內(nèi)置的評(píng)估模塊,用戶可以對(duì)自定義的攻擊手段進(jìn)行自主評(píng)估和迭代驗(yàn)證。陳勇等[8]針對(duì)云計(jì)算平臺(tái)中并行數(shù)據(jù)挖掘研究提出了一個(gè)大數(shù)據(jù)關(guān)聯(lián)規(guī)律挖掘分析模型,該方法為彌補(bǔ)傳統(tǒng)數(shù)據(jù)挖掘算法效率低下的缺陷,通過挖掘大規(guī)模數(shù)據(jù)集中的取值規(guī)律并加以計(jì)算,確保云平臺(tái)能夠準(zhǔn)確完成相應(yīng)的數(shù)據(jù)分析任務(wù)。Bilal等[9]提出了一種基于云計(jì)算的多視圖視頻捕獲方法,該方法通過收集多個(gè)參與者為同一場(chǎng)景捕獲的不同視圖,通過分配可用資源將視圖進(jìn)行代碼轉(zhuǎn)換,最大限度地提高觀眾的整體滿意度,將其組合成多視圖視頻,觀眾可以從不同角度觀察同一場(chǎng)景,這一工作將云應(yīng)用提升到一個(gè)新的沉浸式水平,用戶的體驗(yàn)更好。
深度學(xué)習(xí)屬于機(jī)器學(xué)習(xí)的一個(gè)子集,由于具備處理海量數(shù)據(jù)的能力,許多研究者已經(jīng)將其應(yīng)用于時(shí)空預(yù)測(cè)任務(wù)中并取得了優(yōu)異的研究成果。孫炯寧等[10]提出一種結(jié)合時(shí)空預(yù)測(cè)和深度學(xué)習(xí)的單目標(biāo)視頻跟蹤模型,該模型以SiamMask深度學(xué)習(xí)網(wǎng)絡(luò)為基礎(chǔ)加入了興趣目標(biāo)識(shí)別技術(shù),在模型中融入時(shí)空目標(biāo)跟蹤技術(shù),實(shí)現(xiàn)了目標(biāo)的快速識(shí)別與跟蹤,有效地解決了復(fù)雜環(huán)境中目標(biāo)視頻跟蹤的穩(wěn)定性問題。王港等[11]提出了一種基于深度學(xué)習(xí)網(wǎng)絡(luò)的遙感目標(biāo)檢測(cè)及特征提取模型,該模型利用卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Network,CNN)的成像特性來研究目標(biāo)遙感影像,結(jié)合卷積結(jié)構(gòu)提取目標(biāo)模型特征,提高了遙感影像執(zhí)行目標(biāo)檢測(cè)任務(wù)時(shí)的深層次網(wǎng)絡(luò)設(shè)計(jì)能力。Yao等[12]提出了一種新的時(shí)空動(dòng)態(tài)網(wǎng)絡(luò),該方法引入了門控機(jī)制來學(xué)習(xí)時(shí)空位置之間的動(dòng)態(tài)相似性,并設(shè)計(jì)了周期性轉(zhuǎn)移注意力機(jī)制來處理時(shí)間周期較長(zhǎng)的問題,該方法有效應(yīng)對(duì)了時(shí)空預(yù)測(cè)問題中復(fù)雜的空間相關(guān)性和時(shí)間動(dòng)態(tài)性問題。Zhou等[13]提出了一個(gè)基于深度神經(jīng)網(wǎng)絡(luò)的車輛調(diào)度預(yù)測(cè)模型,該方法采用基于卷積和ConvLSTM單元的編碼解碼器框架來識(shí)別復(fù)雜特征,通過捕捉用戶需求對(duì)時(shí)空的影響來提升上下文感知交互能力,并且加入注意力模型來強(qiáng)化人群遷移規(guī)律存在的潛在影響,該研究有利于解決需求與服務(wù)不匹配問題,為制定有效的車輛分配計(jì)劃提供了保障。
云計(jì)算技術(shù)和深度學(xué)習(xí)已經(jīng)取得了諸多研究成果,本文目的是找到一種在資源豐富的云環(huán)境下進(jìn)行深度學(xué)習(xí)的方法,將云計(jì)算應(yīng)用于任務(wù)卸載,并進(jìn)一步解決時(shí)空預(yù)測(cè)任務(wù)中人群流量的預(yù)測(cè)問題,與已有工作相比,本文提出的框架延遲更低并且容錯(cuò)率更高。
本文提出一個(gè)云計(jì)算環(huán)境下基于深度學(xué)習(xí)的人群流量預(yù)測(cè)框架,通過智能移動(dòng)設(shè)備(如智能手機(jī)、便攜式電腦和多媒體播放器等)收集用戶的位置數(shù)據(jù),主要包括行人數(shù)量、行進(jìn)速度、行進(jìn)方向、當(dāng)前位置信息以及當(dāng)前時(shí)間信息,聚合后發(fā)送到云端服務(wù)器,以便分析人群分布情況,模型總體框架如圖1所示。
圖1 模型總體框架Fig.1 Framework of the proposed model
提出一個(gè)3層的系統(tǒng)架構(gòu),從下到上分別是數(shù)據(jù)收集層、網(wǎng)絡(luò)傳輸層和云服務(wù)層。在數(shù)據(jù)收集層,通過智能設(shè)備群、互聯(lián)網(wǎng)設(shè)備群、工業(yè)設(shè)備群收集與位置有關(guān)的數(shù)據(jù),包括速度、方向和位置。在網(wǎng)絡(luò)層傳輸層,使用5G技術(shù)實(shí)現(xiàn)設(shè)備群和云平臺(tái)之間數(shù)據(jù)的傳輸。在云服務(wù)層,提出了一種基于深度學(xué)習(xí)的人群流量預(yù)測(cè)算法,實(shí)現(xiàn)移動(dòng)人群的實(shí)時(shí)流量預(yù)測(cè)。
定義1 區(qū)域單元。將城市C按照經(jīng)緯度劃分為m×n的網(wǎng)格地圖,每一個(gè)網(wǎng)格被定義為一個(gè)區(qū)域單元,所有的區(qū)域單元可以用集合的形式進(jìn)行定義,即:D={d1,1,…,di,j,…,dm,n},其中,di,j表示網(wǎng)格地圖中第i行、第j列的區(qū)域單元。
定義2 流量圖。給定一個(gè)區(qū)域單元D以及該區(qū)域單元的時(shí)空流量值(包括人群流入量和流出量),則區(qū)域單元D在時(shí)間戳t內(nèi)的時(shí)空流量值被定義為一個(gè)流量圖,用矩陣形式表示為Xt∈Dm×n。
本文提出了DL-CFP模型,該模型使用卷積操作來捕獲不同區(qū)域間的空間相關(guān)性,并利用ConvLSTM模型計(jì)算時(shí)間相關(guān)性。DL-CFP的網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。首先,將整個(gè)城市視為一個(gè)圖像,將時(shí)空?qǐng)D分別輸入到鄰近單元和擴(kuò)張單元,用于計(jì)算相鄰區(qū)域的空間相關(guān)性和偏遠(yuǎn)區(qū)域的空間相關(guān)性。其次,將2個(gè)模塊的輸出通過ConvLSTM模型對(duì)序列中的時(shí)間相關(guān)性進(jìn)行建模。然后,利用區(qū)域增強(qiáng)注意力機(jī)制描述空間相關(guān)性的重要程度。最后,將輸出串聯(lián)并通過一個(gè)1×1卷積層和tanh函數(shù)得到最終預(yù)測(cè)結(jié)果。
圖2 DL-CFP網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Structure of the DL-CFP network
傳統(tǒng)基于ConvLSTM神經(jīng)網(wǎng)絡(luò)的研究通常利用幾個(gè)局部卷積來捕獲相鄰區(qū)域之間的空間相關(guān)性,導(dǎo)致較遠(yuǎn)距離區(qū)域之間的空間相關(guān)性容易被忽略。Lin等[14]的研究表明,區(qū)域分布相似的2個(gè)地區(qū),即使它們?cè)诘乩砦恢蒙喜唤咏部梢猿尸F(xiàn)出非常相似的時(shí)空數(shù)據(jù)模型。因此,本文提出一種雙區(qū)域相關(guān)的機(jī)制,該機(jī)制分別考慮相鄰區(qū)域的強(qiáng)相關(guān)性和偏遠(yuǎn)區(qū)域的弱相關(guān)性,通過鄰近模塊捕獲附近地區(qū)的空間相關(guān)性以及擴(kuò)張模塊捕獲偏遠(yuǎn)地區(qū)的空間相關(guān)性,將2個(gè)模塊的輸出合并得到目標(biāo)區(qū)域的空間表示。
2.3.1 鄰近單元
定義4 鄰近單元。通過多個(gè)局部卷積來捕獲相鄰區(qū)域的空間相關(guān)性,在相鄰區(qū)域相關(guān)性捕獲模塊中,鄰近單元包括3個(gè)3×3卷積層,用于捕獲附近7×7區(qū)域的空間相關(guān)性。3×3卷積層定義如下:
(1)
空間特征的相關(guān)性可以通過共享權(quán)重的周期核來提取,通過調(diào)整卷積模式來融合多尺度特征的語義,而不需要引入額外的參數(shù),降低了計(jì)算復(fù)雜性,通過鄰近單元計(jì)算相鄰區(qū)域的空間相似性是一種新穎而高效的方法。
2.3.2 擴(kuò)張單元
定義5 擴(kuò)張單元。通過3×3的擴(kuò)張卷積來學(xué)習(xí)偏遠(yuǎn)區(qū)域之間的相互作用,旨在擴(kuò)大視野感受,彌補(bǔ)固定大小的卷積核無法收集偏遠(yuǎn)區(qū)域空間相關(guān)性的缺點(diǎn),從不同尺度提取空間相關(guān)性。定義如下:
(2)
通過改變擴(kuò)張因子的值,可以在不改變特征圖尺寸的同時(shí)擴(kuò)大感受野。
圖3分別例舉了k取1,2,3的擴(kuò)張卷積,更直觀地說明不同擴(kuò)張因子所帶來的感受野??梢灾庇^地發(fā)現(xiàn),通過改變擴(kuò)張因子可以有效捕獲較遠(yuǎn)區(qū)域的空間相關(guān)性,并且不會(huì)增加卷積層的數(shù)量。因此,考慮到每個(gè)城市區(qū)域的大小不同,可以使用含有不同擴(kuò)張因子的擴(kuò)張卷積處理不同距離區(qū)域之間的空間相關(guān)性。
圖3 不同擴(kuò)張因子的擴(kuò)張卷積Fig.3 Dilated convolutions with different factors
綜上所述,利用式(3)將鄰近模塊捕獲附近地區(qū)的空間相關(guān)性和擴(kuò)張模塊捕獲偏遠(yuǎn)地區(qū)的空間相關(guān)性動(dòng)態(tài)合并:
(3)
式中,Wc表示鄰近單元的權(quán)重矩陣;Wf表示擴(kuò)張單元的權(quán)重矩陣。
ConvLSTM網(wǎng)絡(luò)模型是一種循環(huán)神經(jīng)網(wǎng)絡(luò)架構(gòu),本文將其用于處理高維的空間序列數(shù)據(jù)并對(duì)序列中的時(shí)間依賴性進(jìn)行建模。
ConvLSTM模塊逐個(gè)相連,每個(gè)ConvLSTM模塊均有2個(gè)輸入與權(quán)重矩陣進(jìn)行卷積計(jì)算(首個(gè)模塊除外),分別是當(dāng)前模塊輸入xt以及上一個(gè)模塊輸出的隱藏狀態(tài)ht-1,其網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。
圖4 ConvLSTM網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 Structure of the ConvLSTM network
ConvLSTM包括以下4個(gè)單元:記憶單元ct負(fù)責(zé)存儲(chǔ)信息,屬于長(zhǎng)時(shí)記憶;輸入門it負(fù)責(zé)控制判斷在存儲(chǔ)單元是否包含新的信息;遺忘門ft負(fù)責(zé)過濾上一時(shí)刻的信息;輸出門ot控制輸出更新后的信息,上述單元計(jì)算如下:
it=σ(C/(wxi,xt)+C/(whi,ht-1)+bi),
(4)
ft=σ(C/(wxf,xt)+C/(whf,ht-1)+bf),
(5)
ot=σ(C/(wxo,xt)+C/(who,ht-1)+bo),
(6)
ct=ft⊙ct-1+it⊙tanh(C/(wxc,xt)+C/(whc,ht-1)+bc),
(7)
式中,wxi,wxf,wxo,wxc分別表示輸入門、遺忘門、輸出門和記憶單元的權(quán)重矩陣;bi,bf,bo,bc分別表示輸入門、遺忘門、輸出門和記憶單元對(duì)應(yīng)的偏執(zhí)向量;σ表示Sigmoid激活函數(shù),將輸入的變量映射到[0, 1],作為控制各個(gè)門的開關(guān);C/表示卷積操作;⊙表示哈達(dá)瑪乘積。
多頭注意力機(jī)制已廣泛應(yīng)用于神經(jīng)網(wǎng)絡(luò)模型,用于識(shí)別每個(gè)特征的屬性權(quán)重并篩選數(shù)據(jù)中關(guān)鍵的特征,過濾無效的輸入數(shù)據(jù),以此突出數(shù)據(jù)的重要性。Vishnu等[15]的研究表明,當(dāng)給定相同的查詢、鍵和值時(shí),多頭注意力機(jī)制可以學(xué)習(xí)到不同的特征,彌補(bǔ)了單頭注意力機(jī)制在訓(xùn)練時(shí)容易過度集中單個(gè)位置的缺陷。為了更廣泛地捕獲空間相關(guān)性,提出了一種區(qū)域增強(qiáng)注意力機(jī)制,用于描述不同時(shí)間步長(zhǎng)幀之間的空間相關(guān)性,具體計(jì)算如下:
score(Xt,q)=tanh(Ws·Xt+Ws·q),
(8)
A(q,k,v)=softmax(score(Xt,q))=
(9)
MA(q,k,v)=Wm·[A1,A2, …,At],
(10)
式中,score(·)表示注意力得分函數(shù);Ws表示學(xué)習(xí)參數(shù);A(·)表示單頭注意力機(jī)制的輸出;q表示查詢向量;k表示鍵向量;v表示值向量;MA(·)表示多頭注意力機(jī)制的輸出;Wm表示學(xué)習(xí)參數(shù)。
將所學(xué)特征的注意力得分進(jìn)行加權(quán)計(jì)算,捕獲不同時(shí)間步長(zhǎng)之間的空間相關(guān)性,計(jì)算如下:
(11)
將注意力機(jī)制的輸出與卷積層輸出串聯(lián),通過1×1的卷積層,形成自注意增強(qiáng)卷積,最終的輸出定義如下:
(12)
為了評(píng)估DL-CFP模型的性能,在2組真實(shí)數(shù)據(jù)集上進(jìn)行對(duì)比實(shí)驗(yàn):
① 滴滴出行數(shù)據(jù)集:該數(shù)據(jù)集包含中國成都600多萬次出租車出行記錄,選用2016年7—10月的數(shù)據(jù),將區(qū)域大小設(shè)置為20×20,時(shí)間間隔設(shè)置為20 min,數(shù)據(jù)集被劃分為6 624個(gè)時(shí)間片段。
② 紐約出行數(shù)據(jù)集:該數(shù)據(jù)集包含紐約市1 300多萬次出租車出行記錄,選用2015年5月—2016年9月的數(shù)據(jù),將區(qū)域大小設(shè)置為30×40,時(shí)間間隔設(shè)置為20 min,數(shù)據(jù)集被劃分為8 784個(gè)時(shí)間片段。
本文的實(shí)驗(yàn)環(huán)境描述如表1所示。
表1 實(shí)驗(yàn)環(huán)境描述Tab.1 Description of experimental environments
為了保證實(shí)驗(yàn)結(jié)果的公平并避免不確定性,本文使用不同數(shù)據(jù)集時(shí)間片最后20 d的數(shù)據(jù)作為測(cè)試數(shù)據(jù),剩余的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。
本文使用均方根誤差(Root Mean Squared Error, RMSE)和平均絕對(duì)誤差(Mean Absolute Error,MAE)來評(píng)價(jià)DL-CFP模型收斂后的準(zhǔn)確度情況,計(jì)算如下:
(13)
(14)
本文使用一種基于網(wǎng)格的準(zhǔn)確率計(jì)算方法來衡量模型預(yù)測(cè)的準(zhǔn)確性:將二維數(shù)據(jù)空間分為|M|個(gè)相等大小的網(wǎng)格,通過對(duì)比每個(gè)單元網(wǎng)格中的預(yù)測(cè)值和實(shí)際值可以得到準(zhǔn)確率(ACC),計(jì)算如下:
(15)
為了驗(yàn)證DL-CFP模型的各方面性能,本文引入以下基準(zhǔn)方法進(jìn)行對(duì)比實(shí)驗(yàn):
① CNN模型[16]是基于卷積層的深度學(xué)習(xí)模型,能夠?qū)W習(xí)局部空間相關(guān)性。
② RNN模型[17]是基于遞歸結(jié)構(gòu)的深度學(xué)習(xí)模型,能夠捕獲時(shí)間依賴性。
③ ConvLSTM模型[18]是LSTM的變體,它在LSTM單元內(nèi)包含卷積操作。ConvLSTM考慮了時(shí)空數(shù)據(jù)的空間與時(shí)間依賴性,廣泛應(yīng)用于時(shí)空預(yù)測(cè)任務(wù)。
④ DeepST模型[19]是一種用于城市人群流量預(yù)測(cè)的深度學(xué)習(xí)模型,通過分析時(shí)間變化引起的人流變化趨勢(shì)對(duì)時(shí)間依賴性進(jìn)行建模,并通過CNN來計(jì)算城市的空間相關(guān)性。
3.4.1 預(yù)測(cè)誤差對(duì)比
首先,本文比較了不同方法在滴滴數(shù)據(jù)集上的預(yù)測(cè)性能,其RMSE和MAE比較結(jié)果如圖5所示。
(a)不同方法的RMSE比較
(b)不同方法的MAE比較圖5 不同方法在滴滴數(shù)據(jù)集上預(yù)測(cè)誤差比較Fig.5 Prediction error comparison of different methods on Didi dataset
由圖5可以看出,傳統(tǒng)RNN方法在所有方法中性能最差,這是因?yàn)镽NN僅關(guān)注每個(gè)區(qū)域的時(shí)間關(guān)系,而忽略了空間相關(guān)性。ConvLSTM模型是一種流行的時(shí)空數(shù)據(jù)特征學(xué)習(xí)模型,其性能較高于其他傳統(tǒng)模型,然而,它的表現(xiàn)不如本文所提DL-CFP模型,原因在于所提出的雙區(qū)域相關(guān)機(jī)制提高了預(yù)測(cè)的準(zhǔn)確性。
為了測(cè)試所提出的區(qū)域增強(qiáng)注意力機(jī)制是否有效,將DL-CFP模型與DeepST模型進(jìn)行比較。DeepST模型考慮到近距離和遠(yuǎn)距離的空間相關(guān)性,但未引入注意力機(jī)制,實(shí)驗(yàn)結(jié)果表明,DL-CFP模型的RMSE和MAE均低于DeepST模型,說明本文提出的注意力機(jī)制更好地捕獲了不同區(qū)域之間的空間相關(guān)性。DL-CFP模型的RMSE值比CNN值降低了約15.7%,MAE值降低了9.2%,說明同時(shí)使用卷積的情況下,綜合考慮相鄰區(qū)域和偏遠(yuǎn)區(qū)域的DL-CFP模型的預(yù)測(cè)結(jié)果與實(shí)際結(jié)果擬合更好,更接近真實(shí)值。
進(jìn)一步,比較了不同方法在紐約出行數(shù)據(jù)集上的預(yù)測(cè)性能,其RMSE和MAE比較結(jié)果如圖6所示。
(a)不同方法的RMSE比較
(b)不同方法的MAE比較圖6 不同方法在紐約出行數(shù)據(jù)集上預(yù)測(cè)誤差比較Fig.6 Prediction error comparison of different methods on NYC-taxi dataset
由圖6可以看出,傳統(tǒng)的深度學(xué)習(xí)模型在處理規(guī)模較大的紐約出行數(shù)據(jù)集時(shí)性能較差,ConvLSTM模型由于具備提取空間特征和時(shí)間特征的神經(jīng)單元結(jié)構(gòu)和神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),其性能優(yōu)于CNN和RNN模型,較CNN模型RMSE和MAE分別降低了16.3%和13.9%,較RNN模型RMSE和MAE分別降低了13.1%和6.7%。此外,當(dāng)數(shù)據(jù)集規(guī)模較大時(shí),DeepST模型可能將不確定的數(shù)據(jù)映射到高維空間,無法充分利用空間和周期特征進(jìn)行流量預(yù)測(cè),導(dǎo)致預(yù)測(cè)性能較差。在處理大規(guī)模數(shù)據(jù)集時(shí),DL-CFP模型的性能均優(yōu)于上述所有算法。相比于其他模型,本文所提DL-CFP模型不僅可以提取空間特征,還可以提取時(shí)間特征,因?yàn)樵撃P徒⒃谝粋€(gè)混合深度神經(jīng)網(wǎng)絡(luò)之上,包括了CNN和LSTM神經(jīng)網(wǎng)絡(luò),可以更有效地提取空間特征和時(shí)間特征。具體來說,DL-CFP模型利用一種雙區(qū)域相關(guān)的機(jī)制分別捕獲相鄰區(qū)域和偏遠(yuǎn)區(qū)域的空間相關(guān)性,借助ConvLSTM模型對(duì)時(shí)間依賴性進(jìn)行建模,特別地,由于區(qū)域增強(qiáng)注意力機(jī)制的存在,隨著預(yù)測(cè)范圍的增加,DL-CFP模型的預(yù)測(cè)性能與其他模型的性能相比,性能優(yōu)勢(shì)越明顯。
3.4.2 準(zhǔn)確率分析
為了研究訓(xùn)練集規(guī)模變化對(duì)預(yù)測(cè)準(zhǔn)確率的影響,本文通過改變訓(xùn)練集大小來驗(yàn)證不同算法的性能,訓(xùn)練集的大小取值分別為20%,40%,60%,80%,100%,實(shí)驗(yàn)結(jié)果如圖7和圖8所示。
圖7 滴滴數(shù)據(jù)集中不同訓(xùn)練集規(guī)模下預(yù)測(cè)準(zhǔn)確性比較Fig.7 Prediction accuracy comparison at different scales of training sets on Didi dataset
圖8 紐約數(shù)據(jù)集中不同訓(xùn)練集規(guī)模下預(yù)測(cè)準(zhǔn)確性比較Fig.8 Prediction accuracy comparison at different scales of training sets on NYC-taxi dataset
由圖7可以看出,隨著訓(xùn)練集規(guī)模的增大,5種方法的準(zhǔn)確率均有不同程度的提升,這表明訓(xùn)練集規(guī)模越大,模型的預(yù)測(cè)性能越好,DL-CFP模型的準(zhǔn)確率在訓(xùn)練集規(guī)模20%~100%高于其他4種基準(zhǔn)方法,平均準(zhǔn)確率大約穩(wěn)定在75.6%。DeepST模型的預(yù)測(cè)準(zhǔn)確率在訓(xùn)練集規(guī)模擴(kuò)大過程中增長(zhǎng)幅度較為緩慢,而DL-CFP模型增幅較高,因?yàn)镈L-CFP模型可以更深層次挖掘不同區(qū)域之間的空間依賴性。CNN模型和RNN模型預(yù)測(cè)效果均不佳,原因在于模型對(duì)于空間特征的提取不完全。此外,ConvLSTM模型的預(yù)測(cè)準(zhǔn)確率大約穩(wěn)定在67.3%,這表明綜合考慮時(shí)間和空間對(duì)預(yù)測(cè)的影響是非常必要的,也證明本文所提方法的實(shí)際意義。
由圖8可以看出,5種方法在紐約數(shù)據(jù)集上的準(zhǔn)確率均低于滴滴數(shù)據(jù)集上的準(zhǔn)確率,這是由紐約城市場(chǎng)景的交通條件比成都城市場(chǎng)景更加復(fù)雜導(dǎo)致的,而本文所提DL-CFP模型的預(yù)測(cè)準(zhǔn)確率仍明顯優(yōu)于其他4種模型。CNN和RNN仍然是預(yù)測(cè)性能最差的2個(gè)模型,這是因?yàn)榱髁款A(yù)測(cè)場(chǎng)景具有很強(qiáng)的時(shí)空相關(guān)性,而僅考慮單一元素的深度神經(jīng)網(wǎng)絡(luò)并不適用于變化較大的流量預(yù)測(cè)。ConvLSTM模型比DeepST模型準(zhǔn)確率更高,因?yàn)镃onvLSTM模型可以更好地學(xué)習(xí)到序列中的時(shí)間相關(guān)性。人群流量的變化不僅取決于給定區(qū)域流量隨時(shí)間的演變,還取決于其他區(qū)域流量隨時(shí)間的演變。因此,綜合考慮了遠(yuǎn)近區(qū)域的空間相關(guān)性的DL-CFP模型受數(shù)據(jù)集規(guī)模變化的影響較小,在紐約數(shù)據(jù)集上平均預(yù)測(cè)準(zhǔn)確率達(dá)到73.6%,優(yōu)于其他主流方法。
本文提出了一種云計(jì)算環(huán)境下用于人群流量預(yù)測(cè)的DL-CFP模型,DL-CFP模型綜合考慮了空間相關(guān)性和時(shí)間依賴性,分別利用鄰近單元和擴(kuò)張單元捕獲相鄰區(qū)域以及偏遠(yuǎn)區(qū)域的空間相關(guān)性,并且利用ConvLSTM模型對(duì)時(shí)間依賴性進(jìn)行建模。為了有效地捕獲復(fù)雜的空間相關(guān)性,設(shè)計(jì)了一種區(qū)域增強(qiáng)注意力機(jī)制。實(shí)驗(yàn)結(jié)果表明,DL-CFP模型在預(yù)測(cè)性能和預(yù)測(cè)準(zhǔn)確率上均優(yōu)于其他基準(zhǔn)方法。未來的工作包括:如何將DL-CFP模型擴(kuò)展到更多的時(shí)空預(yù)測(cè)任務(wù)中以及如何利用特征豐富的異構(gòu)地圖信息解決數(shù)據(jù)稀缺的問題。