国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于SVD 和ARIMA 的時(shí)空序列分解與預(yù)測(cè)

2021-03-18 08:03:12楊立寧李艷婷
計(jì)算機(jī)工程 2021年3期
關(guān)鍵詞:時(shí)空基站建模

楊立寧,李艷婷

(上海交通大學(xué)機(jī)械與動(dòng)力工程學(xué)院,上海 200240)

0 概述

時(shí)空數(shù)據(jù)是指同時(shí)具有時(shí)間和空間維度的數(shù)據(jù)[1],傳感器、移動(dòng)電話(huà)、射頻識(shí)別(RFID)和智能電網(wǎng)等智能設(shè)備的發(fā)展促進(jìn)了實(shí)時(shí)時(shí)空數(shù)據(jù)流的采集。考慮一個(gè)時(shí)空隨機(jī)過(guò)程,時(shí)空建模的目標(biāo)是基于時(shí)空數(shù)據(jù)構(gòu)建時(shí)空模型以對(duì)給定時(shí)刻所有位置的行為進(jìn)行預(yù)測(cè)[2]。若不考慮時(shí)間因素,可以采用單純的空間模型進(jìn)行建模,如kriging 方法[3],但是其準(zhǔn)確性較低,添加時(shí)間維度可以提高預(yù)測(cè)的準(zhǔn)確性。隨著時(shí)空數(shù)據(jù)流采集難度的降低,時(shí)空序列建模逐漸成為學(xué)者們的研究熱點(diǎn)之一。

目前,關(guān)于時(shí)空序列預(yù)測(cè)主要分為基于物理模型、基于統(tǒng)計(jì)模型和基于機(jī)器學(xué)習(xí)的3 種方法?;谖锢砟P偷姆椒ㄊ紫葘?duì)時(shí)空序列的機(jī)理進(jìn)行研究,尋找其內(nèi)在的系統(tǒng)動(dòng)力學(xué)規(guī)律并構(gòu)建系統(tǒng)動(dòng)力學(xué)模型,然后對(duì)時(shí)空序列進(jìn)行表達(dá)進(jìn)而預(yù)測(cè)。其中,JONES 等人[4]提出隨機(jī)偏微分方程以描述連續(xù)型時(shí)空隨機(jī)過(guò)程?;诮y(tǒng)計(jì)模型的方法主要分為描述型時(shí)空模型和動(dòng)態(tài)時(shí)空模型兩類(lèi)。前者利用統(tǒng)計(jì)學(xué)中的描述型統(tǒng)計(jì)量表達(dá)時(shí)空模型的性質(zhì),并對(duì)統(tǒng)計(jì)量進(jìn)行建模以消除隨機(jī)誤差;后者考慮時(shí)間和空間的自相關(guān)性并利用過(guò)去和其他地區(qū)的數(shù)據(jù)對(duì)當(dāng)前數(shù)據(jù)進(jìn)行建模,然后實(shí)現(xiàn)迭代更新預(yù)測(cè)。近年來(lái),隨著機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的不斷發(fā)展,人工智能技術(shù)被廣泛應(yīng)用于時(shí)空序列建模和預(yù)測(cè)任務(wù)。通過(guò)機(jī)器學(xué)習(xí)模型能夠提取時(shí)空序列中復(fù)雜的特征模式,也可以對(duì)高維時(shí)空序列進(jìn)行降維和聚類(lèi)從而使得分析更簡(jiǎn)便。

本文提出一種分離時(shí)空數(shù)據(jù)中的時(shí)間模式和空間模式并分別建模的方法。對(duì)原始數(shù)據(jù)進(jìn)行平穩(wěn)性檢驗(yàn)并中心化,利用奇異值分解(SVD)分解中心化的數(shù)據(jù)集,通過(guò)時(shí)間序列模型中經(jīng)典的ARIMA 模型對(duì)時(shí)間模式建模并檢驗(yàn)其有效性,然后利用ARIMA 模型預(yù)測(cè)時(shí)間序列,將預(yù)測(cè)結(jié)果與空間模式相結(jié)合并對(duì)真實(shí)時(shí)空序列進(jìn)行重建,以得到各個(gè)地理觀測(cè)點(diǎn)的預(yù)測(cè)值。

1 相關(guān)工作

描述型時(shí)空模型較早以時(shí)空協(xié)方差為研究對(duì)象,通過(guò)對(duì)樣本協(xié)方差值進(jìn)行曲面擬合獲得協(xié)方差函數(shù),然后利用協(xié)方差函數(shù)分析時(shí)空模式的演變。時(shí)空kriging 方法[5-7]基于時(shí)空過(guò)程的協(xié)方差函數(shù)給出未知地區(qū)給定時(shí)刻的最優(yōu)線性無(wú)偏估計(jì)。但是,由于時(shí)空協(xié)方差是一種描述型統(tǒng)計(jì)量,很難解釋時(shí)空模式的內(nèi)在動(dòng)態(tài)變化。描述型時(shí)空模型在數(shù)學(xué)上更通用,但是動(dòng)態(tài)時(shí)空模型在科學(xué)上有更強(qiáng)的解釋性[8]。動(dòng)態(tài)時(shí)空模型基于條件概率分布進(jìn)行建模,其中最主要的動(dòng)態(tài)時(shí)空模型為層次時(shí)空模型。層次時(shí)空模型可分為2 個(gè)主要類(lèi)別:一類(lèi)是經(jīng)驗(yàn)層次模型,其認(rèn)為觀測(cè)到的時(shí)空過(guò)程是真實(shí)時(shí)空過(guò)程的演變以及真實(shí)過(guò)程通過(guò)某種函數(shù)作用產(chǎn)生觀測(cè)過(guò)程,其機(jī)制類(lèi)似于隱馬爾可夫過(guò)程;另一類(lèi)是貝葉斯層次模型,和經(jīng)驗(yàn)層次模型的主要區(qū)別在于,貝葉斯層次模型認(rèn)為真實(shí)過(guò)程中的參數(shù)也是動(dòng)態(tài)變化的,其在經(jīng)驗(yàn)層次模型的基礎(chǔ)上增加了底層的參數(shù)過(guò)程,因此,貝葉斯層次時(shí)空模型將時(shí)空序列過(guò)程分解為參數(shù)過(guò)程、真實(shí)過(guò)程和數(shù)據(jù)過(guò)程3 個(gè)層次并分別建模[8-10]。

無(wú)論經(jīng)驗(yàn)層次模型還是貝葉斯層次模型,真實(shí)過(guò)程都是最重要的,其對(duì)理解時(shí)空動(dòng)態(tài)變化模式具有重要意義。因此,時(shí)空模型的一個(gè)研究重點(diǎn)在于真實(shí)過(guò)程的模型構(gòu)建。統(tǒng)計(jì)時(shí)空模型的構(gòu)建主要來(lái)源于時(shí)間模型和空間模型的結(jié)合。CLIFF 和ORD 較早將時(shí)間序列模型應(yīng)用于空間分析中,提出空間自回歸模型(SAR)、空間移動(dòng)平均模型(SMA)和空間回歸模型(SR)等[11]。MARTIN 和OEPPEN 將空間信息整合到傳統(tǒng)的ARIMA 模型[12]中,提出STARMA模型[12]。STARMA 定義了空間階次的概念并在真實(shí)應(yīng)用中產(chǎn)生了良好效果[13-15]。但是,隨著時(shí)空數(shù)據(jù)的概念外延,STARMA 模型中關(guān)于歐式距離越小則空間階次越低的假設(shè)越來(lái)越難以滿(mǎn)足,使得其在一些未知空間相關(guān)性結(jié)構(gòu)的數(shù)據(jù)集中表現(xiàn)較差。BESSA等人結(jié)合其他地區(qū)的歷史數(shù)據(jù)和待預(yù)測(cè)地區(qū)的數(shù)據(jù),構(gòu)建向量自回歸模型VAR[16]以對(duì)時(shí)空序列進(jìn)行建模描述。但是,VAR 模型中的待估計(jì)參數(shù)空間較大,一方面需要消耗極大的計(jì)算資源,另一方面可能由于樣本量不足而引起過(guò)擬合問(wèn)題。因此,基于Lasso 的VAR(Lasso-VAR)模型被廣泛應(yīng)用[17],盡管Lasso-VAR 在一定程度上解決了模型過(guò)擬合問(wèn)題,但是其優(yōu)化模型變得更難求解,計(jì)算成本過(guò)高。

BAHADORI 等人[18]通過(guò)將時(shí)空數(shù)據(jù)作為張量進(jìn)行處理,提出一種低秩張量學(xué)習(xí)框架以進(jìn)行多元時(shí)空序列分析。BAROCIO 等人[19]通過(guò)動(dòng)態(tài)模式分解的方式對(duì)時(shí)空數(shù)據(jù)進(jìn)行降維并提取時(shí)空特征。LI[20]利用梯度提升回歸樹(shù)(Gradient Boosting Regression Tree,GBRT)算法對(duì)城市共享單車(chē)的時(shí)空數(shù)據(jù)進(jìn)行建模并預(yù)測(cè)數(shù)量。在深度學(xué)習(xí)方法中,遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neutral Network,RNN)和深度神經(jīng)網(wǎng)絡(luò)(Deep Neutral Network,DNN)被廣泛應(yīng)用于時(shí)空序列模型構(gòu)建任務(wù)。SHI[21]利用RNN 模型的一個(gè)變體,即長(zhǎng)短時(shí)記憶(Long and Short Term Memory,LSTM)網(wǎng)絡(luò)對(duì)地區(qū)的降雨量進(jìn)行預(yù)測(cè)。CHE 等人[22]將傳統(tǒng)的RNN 拓展到時(shí)空領(lǐng)域,提出時(shí)空遞歸神經(jīng)網(wǎng)絡(luò)(Spatio-Temporal Recurrent Neural Network,ST-RNN),以對(duì)時(shí)空序列進(jìn)行建模預(yù)測(cè)。類(lèi)似地,在深度學(xué)習(xí)方面,ZHANG 等人[23]將深度殘差網(wǎng)絡(luò)拓展到時(shí)空領(lǐng)域,提出時(shí)空深度殘差模型(ST-ResNet)以對(duì)人流量進(jìn)行預(yù)測(cè)。

2 算法描述

2.1 時(shí)空數(shù)據(jù)的奇異值分解

SVD 是一種矩陣分解技術(shù),其在信號(hào)處理和統(tǒng)計(jì)學(xué)中有很多應(yīng)用[24]。給定一個(gè)秩為l的時(shí)空數(shù)據(jù)矩陣YD×T,其中,D表示空間中觀測(cè)點(diǎn)的個(gè)數(shù),T表示采樣時(shí)間點(diǎn)的個(gè)數(shù)。時(shí)空數(shù)據(jù)矩陣YD×T的奇異值分解如下:

其中,U=(u1,u2,…,ul),V=(v1,v2,…,vl),S=diag{s1,s2,…,sl},且s1≥s2≥…≥sl?0。向量是左奇異矩陣的列向量,向量vi′(i=1,2,…,l)是右奇異矩陣的行向量,標(biāo)量si稱(chēng)為奇異值。

假設(shè){cm:m=1,2,…,T}是矩陣YD×T的列向量,cm代表給定的m時(shí)刻D中所有空間單元的觀測(cè)值,YY′表達(dá)了D空間單元之間的相關(guān)性,這里假定YD×T已經(jīng)去中心化為零均值矩陣。矩陣YD×T的ui事實(shí)上是相關(guān)矩陣YY′的特征向量,u1表示相關(guān)矩陣YY′對(duì)應(yīng)特征值最大的特征向量,包含了空間相關(guān)性最多的信息量,或被稱(chēng)為“空間模態(tài)”,表征了空間相關(guān)性的模式。ui的第j個(gè)分量uij表示第j地區(qū)對(duì)第i空間模態(tài)的“貢獻(xiàn)”。類(lèi)似地,假定{r′n:n=1,2,…,D} 是矩陣YD×T的行向量,r′n代表n位置在整個(gè)時(shí)間段的觀測(cè)值向量,Y′Y表達(dá)了不同時(shí)刻之間的相關(guān)性,矩陣YD×T的vi′事實(shí)上是相關(guān)矩陣Y′Y的特征向量,r1表示相關(guān)矩陣Y′Y對(duì)應(yīng)特征值最大的特征向量,包含了時(shí)間相關(guān)性最多的信息量,或被稱(chēng)為“時(shí)間模態(tài)”,表征了時(shí)間相關(guān)性的模式。r′i的第j個(gè)分量r′ij表示第j時(shí)刻對(duì)第i時(shí)間模態(tài)的“貢獻(xiàn)”。時(shí)空矩陣YD×T分解后的S是奇異值矩陣,si表示模式i的重要程度,例如,若s1是最大的奇異值,則s1對(duì)應(yīng)的模式1 具有表征空間模式的最重要的特征。

2.2 基于SVD 的時(shí)空序列模型

給定歷史時(shí)空數(shù)據(jù)矩陣YD×(t-1),對(duì)當(dāng)前時(shí)刻t的各個(gè)地理觀測(cè)點(diǎn)進(jìn)行預(yù)測(cè)的具體步驟如下:

步驟1通過(guò)SVD 對(duì)中心化后的時(shí)空矩陣進(jìn)行分解。

假定歷史時(shí)空數(shù)據(jù)矩陣YD×(t-1)的秩為l,可利用式(1)得到如下分解:

SVD 有一個(gè)重要的性質(zhì),定義奇異值占比Er=,則當(dāng)r<<l時(shí),Er可達(dá)到85%以上的水平,剩余的可認(rèn)為是噪聲。因此,通過(guò)選取前幾個(gè)奇異值與對(duì)應(yīng)的左奇異向量和右奇異向量進(jìn)行重建,可以對(duì)矩陣實(shí)現(xiàn)降噪,如下:

步驟2通過(guò)ARIMA[25]對(duì)時(shí)間模式進(jìn)行建模預(yù)測(cè)。

由于分解之后得到的右奇異向量vi′可以看作時(shí)間序列,因此本文利用時(shí)間序列中應(yīng)用最廣泛、效果最好的ARIMA 模型進(jìn)行建模。ARIMA 的標(biāo)準(zhǔn)模型如下:

其中,?dvi,t代表t時(shí)刻第i個(gè)向量的d階差分,εt是t時(shí)刻均值為0 的隨機(jī)誤差,μ、φi(i=1,2,…,p)、θi(i=1,2,…,q)為待估計(jì)參數(shù)。利用AIC、BIC 信息準(zhǔn)則和最大似然法進(jìn)行模型選擇和估計(jì),當(dāng)?shù)玫焦烙?jì)好的模型后,利用該模型進(jìn)行h步向前預(yù)測(cè),如下:

步驟3利用SVD 進(jìn)行重建得到h步向前預(yù)測(cè)結(jié)果。

當(dāng)?shù)玫綍r(shí)間模式的估計(jì)值后,利用已經(jīng)存儲(chǔ)的奇異值和對(duì)應(yīng)的左奇異向量重建時(shí)空矩陣,得到最終預(yù)測(cè)結(jié)果:

2.3 模型優(yōu)化

模型優(yōu)化包括奇異值選擇和ARIMA 模型參數(shù)選擇過(guò)程。針對(duì)奇異值選擇,不同的奇異值個(gè)數(shù)重建的矩陣精度不同,通常情況下,利用前幾個(gè)較大奇異值即可基本重構(gòu)原始時(shí)空矩陣,剩余奇異值可理解為由數(shù)據(jù)波動(dòng)形成的噪音。本文通過(guò)遍歷的方式驗(yàn)證了不同的奇異值個(gè)數(shù)對(duì)最后效果的影響,最終設(shè)定對(duì)前2 個(gè)奇異值對(duì)應(yīng)的時(shí)間模式進(jìn)行建模。針對(duì)時(shí)間模式ARIMA 模型的構(gòu)建,首先需要對(duì)時(shí)間模式的平穩(wěn)性進(jìn)行檢驗(yàn),若不平穩(wěn),需要將其轉(zhuǎn)化為平穩(wěn)模式并在后續(xù)模型中逆推回真實(shí)預(yù)測(cè)結(jié)果;當(dāng)數(shù)據(jù)平穩(wěn)性檢驗(yàn)通過(guò)后,利用ARIMA 模型對(duì)平穩(wěn)時(shí)間模式進(jìn)行建模,并利用ACF 和PACF 圖[25]確定ARIMA 模型中的p、d和q參數(shù)取值;最后通過(guò)交叉驗(yàn)證以及信息準(zhǔn)則AIC、BIC[26]對(duì)模型有效性進(jìn)行檢驗(yàn)并選擇最優(yōu)模型,在檢驗(yàn)通過(guò)后,利用得到的ARIMA 模型完成預(yù)測(cè)。本文所提STSVD 算法描述如算法1 所示,算法流程如圖1 所示。

算法1ST-SVD 算法

圖1 ST-SVD 算法流程Fig.1 Procedure of the ST-SVD algorithm

3 案例分析

3.1 數(shù)據(jù)集描述

本文利用中國(guó)某大型城市的2 333 個(gè)基站在216 h(共9 天)內(nèi)的流量數(shù)據(jù)對(duì)所提ST-SVD 算法進(jìn)行驗(yàn)證,數(shù)據(jù)的采集頻率為1 次/h。圖2 所示為2 333 個(gè)基站的相對(duì)位置布局,經(jīng)緯度已經(jīng)過(guò)處理,表1 所示為其中5 個(gè)基站在13 h 內(nèi)的流量數(shù)據(jù)示例。圖3 所示為3 個(gè)基站在216 h 內(nèi)的流量變化情況,從圖3 可以看出,基站3 具有較明顯的9 個(gè)峰,表明基站流量的變化基本以一天為周期,雖然另外2 個(gè)基站中基站1 也存在較類(lèi)似的峰值,但是兩者的整體變化有較大差異。本文將216 h 內(nèi)的流量數(shù)據(jù)拆分成訓(xùn)練集和測(cè)試集,訓(xùn)練集包含前160 h 的數(shù)據(jù),測(cè)試集包含剩余56 h 的數(shù)據(jù)。

圖2 2 333 個(gè)基站的布局Fig.2 Layout of 2 333 base stations

表1 5 個(gè)基站的部分歷史流量數(shù)據(jù)片段Table 1 Partial historical traffic data fragments of five base stationsKb

圖3 3 個(gè)基站在9 天內(nèi)的流量情況Fig.3 Traffic situation of three base stations in nine days

3.2 ST-SVD 模型構(gòu)建

ST-SVD 模型構(gòu)建步驟如下:

步驟1通過(guò)奇異值分解對(duì)中心化后的時(shí)空矩陣進(jìn)行分解。在本案例中,時(shí)空矩陣Y的大小是2 333×160,在進(jìn)行數(shù)據(jù)預(yù)處理(異常值處理、平穩(wěn)性處理)之后,通過(guò)對(duì)處理后的Y進(jìn)行奇異值分解,得到左奇異矩陣、右奇異矩陣和奇異值。圖4 所示為截取的時(shí)空矩陣Y的右奇異矩陣,即時(shí)空序列的時(shí)間模式,此處截取了一天內(nèi)每個(gè)小時(shí)之間的相關(guān)性情況,黃色區(qū)域表明相關(guān)性較強(qiáng)(彩色效果見(jiàn)《計(jì)算機(jī)工程》官網(wǎng)HTML 版),從圖4 可以看出,時(shí)間相關(guān)性具有較明顯的周期模式,并且可預(yù)測(cè)性較強(qiáng)。圖5所示為時(shí)空矩陣Y中不同地點(diǎn)的皮爾遜相關(guān)系數(shù)與距離之間的關(guān)系,從圖5 可以看出,針對(duì)該區(qū)域基站流量的時(shí)空數(shù)據(jù),距離越近相關(guān)性越大的假設(shè)并不成立。

圖4 時(shí)間相關(guān)性矩陣Fig.4 Time correlation matrix

圖5 相關(guān)性與空間距離的散點(diǎn)圖Fig.5 Scatter plot of correlation and spatial distance

圖6 所示為排序后的奇異值,一般而言,前幾個(gè)奇異值即可涵蓋大部分信息。從圖6 可以看出,前2 個(gè)奇異值占據(jù)了奇異值之和的89%,因此,本文分別構(gòu)建一個(gè)奇異值的重建算法ST-SVD(1)和兩個(gè)奇異值的重建算法ST-SVD(2)。

圖6 降序排列的奇異值Fig.6 Singular values of descending order

圖7、圖8 分別對(duì)應(yīng)前2 個(gè)奇異值的左奇異矩陣(空間模式)和右奇異矩陣(時(shí)間模式)。從中可以看出,空間模式較為復(fù)雜,沒(méi)有明顯規(guī)律,但是時(shí)間模式顯示出明顯的周期性和可預(yù)測(cè)性。因此,本文利用ARIMA 模型分別對(duì)2 個(gè)時(shí)間序列進(jìn)行建模并預(yù)測(cè)。

圖7 左奇異矩陣Fig.7 Left singular matrix

圖8 右奇異矩陣Fig.8 Right singular matrix

步驟2通過(guò)AIC 和BIC 信息準(zhǔn)則(表2)選擇ARIMA 模型中的p、q、d參數(shù)并得到下述結(jié)果:

表2 模型擬合程度指標(biāo)Table 2 Index of model fitting degree

RMSE 和MAE[27]的計(jì)算公式分別如下:

步驟3利用奇異值分解進(jìn)行重建得到h步向前預(yù)測(cè)結(jié)果。在得到t時(shí)刻時(shí)間模式的預(yù)測(cè)值v1,t和v2,t后,即可利用式(1)結(jié)合左奇異矩陣和奇異值重建時(shí)空矩陣,得到t時(shí)刻空間各個(gè)位置的預(yù)測(cè)值??紤]到流量的周期性一般為一天,因此,本文利用ARIMA 模型分別向前1 步、向前6 步、向前12 步和向前24 步進(jìn)行預(yù)測(cè),并利用Bootstrap[28]從2 333 個(gè)基站中抽取不同的樣本量,從100 次實(shí)驗(yàn)中取均值作為最終結(jié)果,以評(píng)估算法在整個(gè)周期內(nèi)不同預(yù)測(cè)長(zhǎng)度下的準(zhǔn)確度和預(yù)測(cè)性能。

3.3 模型性能比較

本文將ST-SVD(1)、ST-SVD(2)與現(xiàn)有常用的ARIMA、Lasso-VAR、LSTM 和STARMA 4 種模型進(jìn)行對(duì)比。其中,ARIMA 模型并不是時(shí)空序列模型,但是在不考慮空間觀測(cè)點(diǎn)的相關(guān)性時(shí)時(shí)空序列變成獨(dú)立的多個(gè)時(shí)間序列,可以分別利用ARIMA 進(jìn)行建模預(yù)測(cè)。ARIMA 模型時(shí)間成本極高,但是可作為一種基線模型進(jìn)行對(duì)比。Lasso-VAR 是帶有Lasso 正則化約束的VAR 模型,其認(rèn)為時(shí)空模型是時(shí)間序列模型加空間維度,即增加一維,然后通過(guò)傳統(tǒng)的VAR模型并添加Lasso 正則化來(lái)降低過(guò)擬合風(fēng)險(xiǎn)。LSTM是遞歸神經(jīng)網(wǎng)絡(luò)的變體,適用于時(shí)間序列,其與VAR類(lèi)似,將時(shí)空數(shù)據(jù)集的空間維度疊加到時(shí)間序列中進(jìn)行訓(xùn)練預(yù)測(cè)。STARMA 模型是經(jīng)典的時(shí)空分析模型,本文采用歐氏距離定義模型中的空間權(quán)重矩陣。實(shí)驗(yàn)過(guò)程中使用的軟件、軟件依賴(lài)包信息以及模型關(guān)鍵參數(shù)如表3 所示。

表3 實(shí)驗(yàn)過(guò)程中的軟件、軟件依賴(lài)包以及模型關(guān)鍵參數(shù)信息Table 3 The software,software dependency packages and key parameters information of the model during the experiment

利用10 個(gè)、20 個(gè)、50 個(gè)和100 個(gè)基站160 h 內(nèi)的數(shù)據(jù)分別對(duì)上述6 種模型進(jìn)行訓(xùn)練,并給出向前1 步、6 步、12 步和24 步的預(yù)測(cè)結(jié)果,利用常見(jiàn)的預(yù)測(cè)精度指標(biāo)——均方根誤差RMSE 和絕對(duì)值誤差MAE 對(duì)預(yù)測(cè)性能進(jìn)行評(píng)估。由于本文案例中共有2 333 個(gè)基站,為了提高性能評(píng)估的準(zhǔn)確性并降低方差,通過(guò)Bootstrap 在2 333 個(gè)基站中隨機(jī)選取上述10 個(gè)、20 個(gè)、50 個(gè)和100 個(gè)基站100 次,并對(duì)100 次的實(shí)驗(yàn)結(jié)果取平均值以作為最終的性能評(píng)估結(jié)果。

表4 所示為上述6 種模型向前1 步的部分預(yù)測(cè)結(jié)果,加粗?jǐn)?shù)字為最優(yōu)預(yù)測(cè)結(jié)果,括號(hào)中的百分?jǐn)?shù)表示預(yù)測(cè)百分比誤差,計(jì)算公式如式(11)所示表示預(yù)測(cè)值,y表示真實(shí)值。

從表4 可以看出:LSTM 模型的預(yù)測(cè)精度最差,原因是其數(shù)據(jù)量過(guò)少,模型欠擬合,這表明神經(jīng)網(wǎng)絡(luò)模型需要足夠多的樣本來(lái)提高精度;STARMA 模型優(yōu)于不添加空間信息的ARIMA 模型;ST-SVD 的2 種模型相較于其他4 種模型預(yù)測(cè)準(zhǔn)確率更優(yōu)。具體地,利用2 個(gè)奇異值的ST-SVD(2)模型的預(yù)測(cè)誤差約為0.13,ARIMA、Lasso-VAR、LSTM 和STARMA 的誤差分別約為0.22、0.21、0.92 和0.19。ST-SVD(1)和ST-SVD(2)明顯優(yōu)于其他4 種對(duì)比模型且ST-SVD(2)優(yōu)于STSVD(1)。

表4 6 種模型的1 步預(yù)測(cè)結(jié)果Table 4 One-step prediction results of six models

表5 所示為上述6 種模型在4 種不同基站個(gè)數(shù)以及4種不同預(yù)測(cè)步長(zhǎng)情況下的RMSE,括號(hào)中為MAE。從表5可以看出,ST-SVD模型的性能明顯優(yōu)于其余4種對(duì)比模型,而且ST-SVD(2)的重構(gòu)結(jié)果稍?xún)?yōu)于ST-SVD(1)的重構(gòu)結(jié)果。從圖9、圖10可以直觀地看出,2種ST-SVD模型的誤差低于其余4 種對(duì)比模型。

表5 6 種模型在不同基站個(gè)數(shù)與預(yù)測(cè)步長(zhǎng)情況下的實(shí)驗(yàn)結(jié)果Table 5 Experimental results of six models under different number of base stations and different prediction step size

圖9 6 種模型在不同基站個(gè)數(shù)與預(yù)測(cè)步長(zhǎng)下的RMSEFig.9 RMSE of six models under different number of base stations and different prediction step size

圖10 6 種模型在不同基站個(gè)數(shù)與預(yù)測(cè)步長(zhǎng)情況下的MAEFig.10 MAE of six models under different number of base stations and different prediction step size

4 結(jié)束語(yǔ)

時(shí)空序列模型STARMA 通過(guò)構(gòu)建空間權(quán)重矩陣來(lái)表征數(shù)據(jù)的空間相關(guān)模式,但是空間權(quán)重的構(gòu)建大多依賴(lài)距離等主觀性因素,導(dǎo)致STARMA 難以適用于多數(shù)數(shù)據(jù)集。本文建立一種新的時(shí)空序列模型ST-SVD,其利用SVD 技術(shù)對(duì)時(shí)空數(shù)據(jù)集的時(shí)間模式和空間模式進(jìn)行自動(dòng)分解,通過(guò)ARIMA 模型擬合時(shí)間模式并建模預(yù)測(cè),最終重建出時(shí)空預(yù)測(cè)結(jié)果。ST-SVD 模型不需要對(duì)數(shù)據(jù)集的空間結(jié)構(gòu)進(jìn)行假設(shè),只需對(duì)時(shí)間序列實(shí)現(xiàn)建模,大幅降低了問(wèn)題復(fù)雜度和模型訓(xùn)練成本。實(shí)驗(yàn)結(jié)果表明,ST-SVD 模型的預(yù)測(cè)效果優(yōu)于LSTM、STARMA 等時(shí)空序列模型。但是,本文研究尚存在一定不足,一是ST-SVD 認(rèn)為空間模式是時(shí)不變的,即空間作用和時(shí)間作用相互獨(dú)立,二是在奇異值分解后的時(shí)間序列建模中利用了較為傳統(tǒng)的ARIMA 模型,該模型是一種線性模型,無(wú)法捕捉到時(shí)間序列中的非線性模式。下一步將利用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等技術(shù)對(duì)時(shí)間模式進(jìn)行建模,然后通過(guò)奇異值分解重建時(shí)空序列,以解決上述問(wèn)題。

猜你喜歡
時(shí)空基站建模
跨越時(shí)空的相遇
聯(lián)想等效,拓展建?!浴皫щ娦∏蛟诘刃?chǎng)中做圓周運(yùn)動(dòng)”為例
鏡中的時(shí)空穿梭
玩一次時(shí)空大“穿越”
基于PSS/E的風(fēng)電場(chǎng)建模與動(dòng)態(tài)分析
電子制作(2018年17期)2018-09-28 01:56:44
不對(duì)稱(chēng)半橋變換器的建模與仿真
可惡的“偽基站”
基于GSM基站ID的高速公路路徑識(shí)別系統(tǒng)
時(shí)空之門(mén)
小基站助力“提速降費(fèi)”
新余市| 青海省| 红安县| 宝鸡市| 通江县| 平和县| 金塔县| 崇州市| 海安县| 洛宁县| 通江县| 廊坊市| 太仓市| 万年县| 许昌县| 平塘县| 岗巴县| 湟中县| 尉犁县| 彰化市| 岱山县| 云安县| 邵阳市| 汶上县| 诸暨市| 东平县| 司法| 阳江市| 慈利县| 专栏| 原阳县| 肃宁县| 来宾市| 乃东县| 介休市| 永丰县| 黄平县| 游戏| 阿克陶县| 环江| 墨竹工卡县|