国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Time-Causality模型的供熱用氣量預(yù)測(cè)分析

2020-07-14 02:50:46孫志偉賈洪川馬永軍
關(guān)鍵詞:時(shí)間尺度氣量維度

孫志偉 賈洪川 馬永軍

(天津科技大學(xué)計(jì)算機(jī)科學(xué)與信息工程學(xué)院 天津 300457)

0 引 言

時(shí)間序列是按時(shí)間順序記錄的一組數(shù)據(jù),通常是在等間隔時(shí)間內(nèi),根據(jù)一定的采樣率對(duì)某種過程進(jìn)行觀測(cè)的結(jié)果[1]。時(shí)間序列普遍存在于交通、金融、物流和工業(yè)諸多領(lǐng)域,如天氣數(shù)據(jù)的變化、股票價(jià)格序列的變化以及電力負(fù)荷的變化等。時(shí)間序列數(shù)據(jù)本質(zhì)上反映的是某個(gè)或者某些隨機(jī)變量隨時(shí)間不斷變化的趨勢(shì),而時(shí)間序列預(yù)測(cè)方法的核心就是從數(shù)據(jù)中挖掘出這種規(guī)律,并利用其對(duì)將來的數(shù)據(jù)作出估計(jì)[2]。

關(guān)于時(shí)間序列的數(shù)據(jù)挖掘技術(shù)也成了現(xiàn)在的研究熱點(diǎn)。隨著數(shù)據(jù)量的增加,高維度、大容量、高復(fù)雜性的多變量時(shí)間序列預(yù)測(cè)已成為許多研究的焦點(diǎn)[3]。然而多變量的時(shí)間序列往往存在著大量的冗余變量,容易掩蓋重要變量的作用,對(duì)預(yù)測(cè)模型的建立產(chǎn)生負(fù)面的影響[4]。因此需要進(jìn)行數(shù)據(jù)降維處理,常用的數(shù)據(jù)降維的方法包括特征提取和特征選擇。特征提取是指利用算法將輸入的特征空間映射到一個(gè)維度較低的空間。最為經(jīng)典的特征提取方法就是主成分分析法(PCA),它通過線性變換用低維數(shù)據(jù)來代替多維數(shù)據(jù),保留了數(shù)據(jù)原有信息。而特征選擇是根據(jù)一定準(zhǔn)則或某種評(píng)估標(biāo)準(zhǔn)剔除冗余特征選出最優(yōu)的特征子集,再將選擇后的特征子集作為輸入到合適的預(yù)測(cè)模型進(jìn)行預(yù)測(cè)[5]。這將提高目標(biāo)時(shí)間序列的預(yù)測(cè)效果以及預(yù)測(cè)效率。

Lasso(least absolute shrinkage and selection operator)算法通過縮小系數(shù)或消除系數(shù)來強(qiáng)制模型丟棄無關(guān)信息來進(jìn)行特征選擇。Tibshirani[6]在傳統(tǒng)特征選擇方法的基礎(chǔ)上做了改進(jìn),提出Lasso特征選擇方法,該方法在實(shí)現(xiàn)參數(shù)估計(jì)的同時(shí)還可以壓縮變量。Lasso算法通過構(gòu)造懲罰函數(shù)得到精化模型,最終通過確定某些指標(biāo)的系數(shù)為零來達(dá)到簡(jiǎn)化指標(biāo)集的目的。Katayama等[7]提出了利用Lasso方法提取相關(guān)的預(yù)測(cè)因子并建立在高維多元線性回歸分析的模型。蔣峰等[8]使用Lasso方法選取影響地方財(cái)政收入的主要因素變量,并將其作為GRNN神經(jīng)網(wǎng)絡(luò)的輸入變量對(duì)某地的財(cái)政收入進(jìn)行預(yù)測(cè),其預(yù)測(cè)效果優(yōu)于其他對(duì)比模型。

多元自適應(yīng)回歸樣條[9](Multivariate Adaptive Regression Splines,MARS)也是一種特征篩選的方法。該方法通過前向過程建立不同的樣條基函數(shù),在后向階段利用廣義交叉驗(yàn)證準(zhǔn)則來評(píng)估子集的性能以獲取最佳子集。MARS非常適合解決大數(shù)量的數(shù)據(jù)集問題,能夠?qū)Ψ蔷€性和變量間的交互作用進(jìn)行建模,且運(yùn)算十分便捷[10]。王盛慧等[11]將MARS算法應(yīng)用到水泥能耗建模中,建立了精確的煤耗模型,并通過參數(shù)分析,給出了變量的相對(duì)重要性值,進(jìn)一步分析煤耗與重要變量之間的關(guān)系。Tsai等[12]提出利用MARS來篩選特征并用SVR做預(yù)測(cè),利用遺傳算法對(duì)SVR的進(jìn)行調(diào)參的混合時(shí)間序列模型預(yù)測(cè)長(zhǎng)期股票數(shù)據(jù)取得了不錯(cuò)的效果。

關(guān)于時(shí)間序列的特征選擇,利用時(shí)間序列的Granger關(guān)系進(jìn)行篩選也引發(fā)學(xué)者的研究。傳統(tǒng)的相關(guān)關(guān)系是兩個(gè)變量因素的相關(guān)密切程度,反映變量之間的依賴關(guān)系。而Granger關(guān)系的目的是檢測(cè)一個(gè)時(shí)間序列在預(yù)測(cè)方面對(duì)另一個(gè)時(shí)間序列的影響,是指變量序列導(dǎo)致目標(biāo)序列變化。關(guān)于Granger關(guān)系的分析方法,其核心思想是:如果使用變量序列和目標(biāo)序列進(jìn)行雙變量預(yù)測(cè)其效果優(yōu)于只使用目標(biāo)序列的單變量預(yù)測(cè),則認(rèn)為該變量序列有助于預(yù)測(cè)目標(biāo)序列,也就是說該變量序列為目標(biāo)序列的因變量,存在著Granger關(guān)系。孫友強(qiáng)等[14]提出一種基于Granger關(guān)系挖掘的多變量時(shí)間序列預(yù)測(cè)模型與傳統(tǒng)方法有更精確的預(yù)測(cè)效果。Hmamouche等[15]提出一種基于Granger關(guān)系圖的特征選擇算法,建立預(yù)測(cè)模型進(jìn)行預(yù)測(cè),并與其他的特征算法比較,有更好的預(yù)測(cè)效果。

現(xiàn)有的時(shí)序數(shù)據(jù)預(yù)測(cè)方法大多是從單一時(shí)間尺度上進(jìn)行分析,然而時(shí)間序列數(shù)據(jù)的變化規(guī)律不是單一的,而是具有短期性、周期性和長(zhǎng)期趨勢(shì)性等復(fù)雜特性。所以只是從單一的時(shí)間尺度對(duì)時(shí)間序列進(jìn)行預(yù)測(cè)不能全面地把握時(shí)序數(shù)據(jù)的特點(diǎn),需要從多個(gè)時(shí)間尺度對(duì)其未來的發(fā)展趨勢(shì)進(jìn)行分析預(yù)測(cè)。王金策等[16]利用時(shí)間序列分段算法從原始序列中提取帶有多時(shí)間尺度趨勢(shì)的特征,并應(yīng)用隱馬爾可夫模型設(shè)計(jì)多時(shí)間尺度趨勢(shì)預(yù)測(cè)算法對(duì)股票數(shù)據(jù)進(jìn)行預(yù)測(cè),在各個(gè)尺度上有比較好的預(yù)測(cè)效果。李潔等[17]根據(jù)時(shí)序數(shù)據(jù)的特征建立基于后向傳播算法的循環(huán)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,對(duì)多種時(shí)間尺度的旅客出行情況進(jìn)行預(yù)測(cè),提升了預(yù)測(cè)模型的準(zhǔn)確性。

上述研究從多個(gè)方面對(duì)時(shí)間序列特征選擇及預(yù)測(cè)進(jìn)行了研究,但沒有考慮在多時(shí)間尺度下預(yù)測(cè)模型的特征隨尺度變化而其預(yù)測(cè)作用會(huì)發(fā)生變化,并且基本沒有考慮時(shí)間本身作為維度的可能。因此,本文對(duì)所選特征的預(yù)測(cè)作用隨時(shí)間尺度的變化進(jìn)行分析研究。

本文主要對(duì)在多時(shí)間尺度下的供熱用氣量數(shù)據(jù)進(jìn)行預(yù)測(cè),分析其預(yù)測(cè)模型的特征變化,提出了引入時(shí)間維度的Granger關(guān)系特征選擇預(yù)測(cè)模型Time-Causality,基于Granger關(guān)系來篩選有助于預(yù)測(cè)用氣量數(shù)據(jù)的特征維度。對(duì)于供熱用氣量數(shù)據(jù),其變化具有很強(qiáng)的時(shí)間周期性。針對(duì)其周期性的特點(diǎn)本文引入時(shí)間維度作為模型輸入維度,并與用氣量的歷史值和篩選得到的特征維度作為L(zhǎng)STM神經(jīng)網(wǎng)絡(luò)的輸入維度構(gòu)建預(yù)測(cè)模型。最后分析研究隨時(shí)間尺度變化,預(yù)測(cè)模型的特征對(duì)用氣量預(yù)測(cè)作用的變化,并進(jìn)一步分析各個(gè)特征的對(duì)用氣量數(shù)據(jù)貢獻(xiàn)作用,以便為供熱用氣量預(yù)測(cè)工作的研究提供更準(zhǔn)確的參考。

1 相關(guān)理論知識(shí)

1.1 Granger關(guān)系分析

Granger關(guān)系的原理是變量序列的增加有助于結(jié)果序列的預(yù)測(cè)。這里序列y={y1,y2,…,yn}設(shè)為目標(biāo)序列,將序列x={x1,x2,…,xn}設(shè)為變量序列。為了檢測(cè)Granger關(guān)系,這里會(huì)用到兩個(gè)回歸方程。

給定兩個(gè)平穩(wěn)的時(shí)間序列xt和yt,其分別代表變量序列和目標(biāo)序列,xt-k,xt-k+1,…,xt-1為xt的過去k個(gè)時(shí)段的觀測(cè)值,yt-1,yt-l+1,…,yt-1為yt的l個(gè)時(shí)段的觀測(cè)值,則:

(1)

(2)

得到回歸方程后,計(jì)算F統(tǒng)計(jì)量,表示為:

(3)

式中:RSS1和RSS2分別表示式(1)和式(2)的殘差平方和。

若F統(tǒng)計(jì)量下的置信度表明式(2)的預(yù)測(cè)誤差顯著地小于式(1)的預(yù)測(cè)誤差,那么x是y的Granger原因,即x有助于對(duì)y的預(yù)測(cè)。

當(dāng)進(jìn)行Granger關(guān)系分析時(shí),還需要考慮目標(biāo)序列是對(duì)變量序列的Granger關(guān)系的情況,所以需要建立以下回歸:

(4)

(5)

如果式(2)能提升預(yù)測(cè)y的效果,同時(shí)式(5)不能提升預(yù)測(cè)x的效果,則表明x真正引起y變化。

Granger關(guān)系是一種基于統(tǒng)計(jì)的關(guān)聯(lián)關(guān)系檢驗(yàn),可以在時(shí)間序列的預(yù)測(cè)、異常檢測(cè)中發(fā)揮作用。

1.2 LSTM神經(jīng)網(wǎng)絡(luò)

LSTM神經(jīng)網(wǎng)絡(luò)模型是一種改進(jìn)的RNN模型[21],其基本單元是記憶模塊。LSTM記憶模塊中包括三個(gè)門結(jié)構(gòu),分別是遺忘門、輸入門和輸出門。遺忘門控制LSTM中記憶單元遺忘掉無用的歷史信息,輸入門可以更新本記憶單元的單元狀態(tài),輸出門決定輸出信息。

如圖1所示,對(duì)于t時(shí)刻,LSTM單元會(huì)有當(dāng)前時(shí)刻的輸入向量xt,并且前一時(shí)刻LSTM的隱藏狀態(tài)為ht-1。

圖1 LSTM單元結(jié)構(gòu)圖

記憶模塊的狀態(tài)更新和信息輸出的過程如下:

首先,遺忘門忘記無用的信息:

ft=σ(Wxfxt+Whfht-1+bf)

(6)

然后,輸入門根據(jù)輸入數(shù)據(jù)和先前記憶單元的狀態(tài)來更新狀態(tài):

it=σ(Wxixt+Whiht-1+bi)

(7)

(8)

(9)

最后,輸出門輸出當(dāng)前時(shí)刻的信息,并記錄隱藏狀態(tài):

ot=σ(Wxoxt+Whoht-1+bo)

(10)

ht=ot×tanh(Ct)

(11)

式中:Wxc、Wxi、Wxj、Wxo為連接輸入向量xt的權(quán)重矩陣;Whc、Whi、Whj、Who為連接隱含層ht的權(quán)重矩陣;bi、bc、bf、bo為偏置向量;σ是Sigmoid激活函數(shù);ft、it和ot分別表示t時(shí)刻遺忘門、輸入門和輸出門的輸出狀態(tài);Ct表示t時(shí)刻的記憶單元狀態(tài)。

LSTM首先在訓(xùn)練期間計(jì)算LSTM單元的輸出值,然后反向計(jì)算LSTM的誤差項(xiàng),再根據(jù)誤差項(xiàng)計(jì)算每個(gè)權(quán)重的梯度,最后基于梯度優(yōu)化算法更新權(quán)重。

綜上所述,采用克羅米芬聯(lián)合絨毛膜促性腺激素、人絕經(jīng)促性腺激素治療婦科內(nèi)分泌失調(diào)具有顯著效果,能夠有效提高患者卵泡雌激素及雌二醇水平,降低不良反應(yīng)發(fā)生,促使患者盡快恢復(fù)健康。

2 Time-Causality預(yù)測(cè)模型

2.1 供熱數(shù)據(jù)特點(diǎn)

如圖2所示,鍋爐房用氣量變化曲線呈現(xiàn)出以天為周期的周期性變化,而每天的數(shù)據(jù)會(huì)隨溫度等其他因素影響呈現(xiàn)出差異。圖3為日用氣量數(shù)據(jù)的變化趨勢(shì),每天都是在4:00左右把用氣量調(diào)到一天的最大,在7:00-8:00用氣量會(huì)有所下降;而到了中午,室外氣溫升高,用氣量會(huì)維持在相對(duì)較低的數(shù)值;到了16:00左右用氣量數(shù)據(jù)會(huì)小幅度陡增,過了幾個(gè)小時(shí)后會(huì)下降到和中午持平的數(shù)值范圍;在22:00用氣量急劇下降到一天中最低值。

圖2 某周內(nèi)天津某鍋爐房用氣量數(shù)據(jù)變化趨勢(shì)圖

圖3 某天內(nèi)天津某鍋爐房用氣量變化趨勢(shì)圖

結(jié)合鍋爐房用氣量數(shù)據(jù)的特點(diǎn),引入時(shí)間偏移量作為另一個(gè)新的輸入維度。由于供熱系統(tǒng)鍋爐房的數(shù)據(jù)呈現(xiàn)出以24小時(shí)(天)為單位的周期性變化,因此本文的時(shí)間偏移量采用當(dāng)前時(shí)刻距該天0:00的分鐘數(shù)。以1日凌晨4:00的數(shù)據(jù)為例,該時(shí)刻的時(shí)間偏移量為240,而對(duì)于2日0:00的時(shí)間偏移量則重新記為0。引入時(shí)間偏移量更好地刻畫用氣量在一天中不同時(shí)間的變化規(guī)律。

2.2 具體流程

Time-Causality預(yù)測(cè)模型的構(gòu)建流程圖如圖4所示。

圖4 Time-Causality預(yù)測(cè)模型流程圖

具體步驟如下:

(1) 數(shù)據(jù)平穩(wěn)性檢測(cè)。Granger關(guān)系分析的一個(gè)重要前提是目標(biāo)序列和變量序列必須具有平穩(wěn)性[18]。因此,首先要利用單位根檢驗(yàn)[19]對(duì)時(shí)間序列進(jìn)行平穩(wěn)性檢驗(yàn),將不平穩(wěn)的時(shí)間序列進(jìn)行適當(dāng)?shù)钠椒€(wěn)化處理,以防止虛假回歸。

(2) 建立回歸模型。Grange關(guān)系分析基于一個(gè)目標(biāo)序列的單變量預(yù)測(cè)模型和一個(gè)目標(biāo)序列與變量序列的雙變量預(yù)測(cè)模型。對(duì)于這兩個(gè)模型一般采用VAR模型來建立。對(duì)于VAR模型滯后期長(zhǎng)度的檢驗(yàn),這里采用AIC信息準(zhǔn)則(Akaike Information Criterion)[20]來確定。

(3) 各個(gè)特征維度之間F統(tǒng)計(jì)量檢測(cè)。建立各個(gè)特征序列之間的回歸模型后,進(jìn)一步利用F統(tǒng)計(jì)量檢測(cè)。這里提出兩個(gè)假設(shè):

H0:?i∈{1,2,…,L},bk=0
H1:?i∈{1,2,…,L},bk≠0

在零假設(shè)H0(假設(shè)x不引起y)的情況下,F統(tǒng)計(jì)量服從自由度為(L,n-(K+L+1))的F分布。因此為了在一定程度上進(jìn)行Granger分析。檢驗(yàn)的p值是在H0為真的前提下,觀察給定結(jié)果的概率,這里的Granger關(guān)系則考慮為1-p,這樣其表示Granger關(guān)系的值在[0,1]之間。進(jìn)一步可以得出各個(gè)特征維度之間的關(guān)系矩陣M。

(4) 篩選變量。從矩陣M中篩選出特征,滿足變量序列x對(duì)目標(biāo)變量y的Granger關(guān)系遠(yuǎn)遠(yuǎn)大于y對(duì)x的Granger關(guān)系。矩陣M中的元素的值my,x表示變量序列x對(duì)目標(biāo)變量y的Granger關(guān)系的大小,而mx,y的值表示目標(biāo)序列y對(duì)變量序列x的Granger關(guān)系的大小。如果my,x的值減去mx,y的值遠(yuǎn)遠(yuǎn)大于給定的閾值δ,則變量序列x為篩選得到的特征之一。利用此方法對(duì)除目標(biāo)變量的所有變量遍歷篩選特征。

(5) 引入時(shí)間偏移量為時(shí)間維度。在原有數(shù)據(jù)維度下,新增時(shí)間偏移量這一預(yù)測(cè)的輸入維度,對(duì)于實(shí)驗(yàn)采取的不同時(shí)間尺度來說,時(shí)間偏移量會(huì)有所不同。對(duì)于分鐘級(jí)的原始數(shù)據(jù)是當(dāng)前時(shí)刻距該天0:00的分鐘數(shù),對(duì)于小時(shí)級(jí)的數(shù)據(jù)則是當(dāng)天的小時(shí)數(shù),對(duì)于日數(shù)據(jù)則是對(duì)應(yīng)的天數(shù)。

(6) LSTM模型訓(xùn)練。本文的LSTM預(yù)測(cè)模型包含2層LSTM單元,之后接一個(gè)單一神經(jīng)單元的全連接層作為用氣量預(yù)測(cè)模型的輸出層,從輸出層得到的結(jié)果再經(jīng)反歸一化得到最終的預(yù)測(cè)值。模型的激活函數(shù)選定為Relu函數(shù),batch_size為64,訓(xùn)練次數(shù)(epoch)為500。本文的LSTM模型都建立在Keras庫的基礎(chǔ)上,以TensorFlow為后端通過Python 3.6語言進(jìn)行編寫。

(7) 預(yù)測(cè)模型的評(píng)估方法。本文采用平均絕對(duì)百分誤差(Mean Absolute Percentage Error,MAPE)與均方根誤差(Root Mean Square Error,RMSE)作為模型準(zhǔn)確性的評(píng)價(jià)標(biāo)準(zhǔn),公式表達(dá)如下:

(12)

(13)

(8) 分析不同尺度下特征選擇的差異。為了進(jìn)一步分析各個(gè)特征在不同尺度下的預(yù)測(cè)差異,將Time-Causality模型篩選得到各個(gè)特征與供熱用氣量歷史值作為模型的輸入維度分別進(jìn)行訓(xùn)練和預(yù)測(cè)。對(duì)其預(yù)測(cè)得到的RMSE值和MAPE值作為評(píng)估標(biāo)準(zhǔn)進(jìn)行分析。由于各個(gè)時(shí)間尺度下的RMSE值和MAPE值差異很大,需要對(duì)其進(jìn)行歸一化處理。本文采用的歸一化的方法是min-max最小值最大值標(biāo)準(zhǔn)化,使數(shù)據(jù)的值映射到[0,1]之間,表示為:

(14)

式中:xmin是所在尺度下最小的RMSE或MAPE;xmax是所在的時(shí)間尺度下RMSE或MAPE的最大值;x*為歸一化后得到的預(yù)測(cè)貢獻(xiàn)分?jǐn)?shù)。根據(jù)預(yù)測(cè)貢獻(xiàn)分?jǐn)?shù)的大小,進(jìn)一步分析各個(gè)特征在不同時(shí)間尺度下的預(yù)測(cè)作用。

3 實(shí) 驗(yàn)

3.1 數(shù)據(jù)集與數(shù)據(jù)預(yù)處理

本文使用天津市某鍋爐房的供熱數(shù)據(jù)進(jìn)行測(cè)試,采集數(shù)據(jù)的時(shí)間間隔為分鐘級(jí)包括室外氣溫、用氣量、鍋爐房供水回水溫度、鍋爐房供水回水壓力等數(shù)據(jù)維度。實(shí)驗(yàn)數(shù)據(jù)的時(shí)間范圍選取1月份4周的數(shù)據(jù),其中前3周的數(shù)據(jù)作為模型的訓(xùn)練數(shù)據(jù),第4周的數(shù)據(jù)作為模型的測(cè)試數(shù)據(jù)。為了從多時(shí)間尺度更好地分析供熱用氣量數(shù)據(jù),除了原始采集數(shù)據(jù)外,選取時(shí)間尺度為10分鐘、1小時(shí)和1天。另外對(duì)于時(shí)間尺度為1天的數(shù)據(jù),以11月份和12月份作為訓(xùn)練數(shù)據(jù),1月份的4周數(shù)據(jù)作為測(cè)試數(shù)據(jù)。

為了對(duì)鍋爐房用氣量進(jìn)行分析與預(yù)測(cè),要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,包括空值數(shù)據(jù)處理以及無效數(shù)據(jù)的處理等。由于各個(gè)維度數(shù)據(jù)大小差異很大,需要對(duì)數(shù)據(jù)進(jìn)行歸一化處理來減小誤差,提高預(yù)測(cè)精度。公式如下:

(15)

式中:xmin是原始的樣本數(shù)據(jù)分量的最小值;xmax是原始的樣本數(shù)據(jù)分量的最大值;x*是要輸入到神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)。當(dāng)數(shù)據(jù)進(jìn)行歸一化處理輸入到神經(jīng)網(wǎng)絡(luò)中進(jìn)行預(yù)測(cè)時(shí),需要對(duì)最后的預(yù)結(jié)果進(jìn)行反歸一化處理,保證和原來的輸入數(shù)據(jù)在同一個(gè)數(shù)量級(jí),公式如下:

(16)

式中:yi為網(wǎng)絡(luò)輸出,采用歸一化后的數(shù)據(jù)進(jìn)行訓(xùn)練后,訓(xùn)練好的模型結(jié)構(gòu)值適用于歸一化后的數(shù)據(jù),因此訓(xùn)前先對(duì)輸入值進(jìn)行歸一化處理,得到神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果對(duì)其值進(jìn)行反歸一化。

3.2 多時(shí)間尺度下特征選擇方法對(duì)比

本文選取主成分分析(PCA)特征降維法、Lasso算法、MARS算法、Granger分析法與本文提出的Time-Causality模型在原始數(shù)據(jù)、時(shí)間尺度為10分鐘、1小時(shí)和1天這四個(gè)時(shí)間尺度下,篩選在不同時(shí)間尺度下有助于對(duì)用氣量數(shù)據(jù)預(yù)測(cè)的有關(guān)特征,并將這些特征與用氣量的歷史觀測(cè)值一起作為L(zhǎng)STM的輸入變量對(duì)用氣量進(jìn)行預(yù)測(cè)。結(jié)果如表1、表2所示。而對(duì)于特征選取評(píng)價(jià)則通過LSTM預(yù)測(cè)模型的MAPE和RMSE的值進(jìn)一步評(píng)估。

表1 不同時(shí)間尺度下特征選擇方法預(yù)測(cè)結(jié)果的RMSE

表2 不同時(shí)間尺度下特征選擇方法預(yù)測(cè)結(jié)果的MAPE

實(shí)驗(yàn)結(jié)果表明:無論是用RMSE還是用MAPE對(duì)預(yù)測(cè)結(jié)果評(píng)價(jià),Granger分析法相比于PCA降維法、Lasso算法和MARS算法都可以在不同的時(shí)間尺度下篩選到更合適的特征。本文提出的Time-Causality方法的預(yù)測(cè)效果在不同時(shí)間尺度下都優(yōu)于Granger分析法,表明Time-Causality方法引入的時(shí)間維度可以提升供熱用氣量的預(yù)測(cè)效果。

3.3 多時(shí)間尺度下特征分析

本文利用Time-Causality模型篩選出有助于用氣量數(shù)據(jù)預(yù)測(cè)的特征,并進(jìn)一步分析在不同尺度下,篩選出的各個(gè)特征的預(yù)測(cè)作用。

表3為利用Time-Causality模型篩選的不同時(shí)間尺度下有助于預(yù)測(cè)用氣量數(shù)據(jù)的特征。在原始采集時(shí)間尺度下只有管網(wǎng)壓力和時(shí)間維度這兩個(gè)特征,而在10分鐘時(shí)間尺度下,有管網(wǎng)壓力、室外溫度、循環(huán)泵出口壓力和時(shí)間維度這4個(gè)特征;時(shí)間尺度放大到1小時(shí),有室外溫度、循環(huán)泵出口壓力和時(shí)間維度這3個(gè)特征;對(duì)于時(shí)間尺度為1天的數(shù)據(jù),只有室外溫度和時(shí)間維度這2個(gè)特征。

表3 Time-Causality模型所選特征

本文認(rèn)為,Granger分析只能證明兩個(gè)變量具有一定的Granger關(guān)系,而要進(jìn)一步分析各個(gè)特征對(duì)目標(biāo)序列的預(yù)測(cè)作用,需要實(shí)驗(yàn)來比較驗(yàn)證。本文將篩選的所有特征分別與用氣量的歷史值作為L(zhǎng)STM的輸入維度,進(jìn)一步構(gòu)建LSTM預(yù)測(cè)模型,通過每個(gè)模型的RMSE和MAPE的值對(duì)該模型進(jìn)行評(píng)估。另外,加入單變量預(yù)測(cè)以驗(yàn)證特征的預(yù)測(cè)效果,也進(jìn)一步分析每個(gè)特征在該尺度下的預(yù)測(cè)作用,從而得出各個(gè)特征的預(yù)測(cè)作用隨著時(shí)間尺度增大的變化規(guī)律。

根據(jù)表4和表5可以得出,Time-Causality模型篩選的特征在不同時(shí)間尺度下訓(xùn)練預(yù)測(cè)的RMSE和MAPE。根據(jù)其RMSE和MAPE可以進(jìn)一步分析每個(gè)特征的預(yù)測(cè)作用隨尺度變化的影響變化。從結(jié)果上進(jìn)行分析,隨著時(shí)間尺度增大,管網(wǎng)壓力的預(yù)測(cè)作用減弱,而室外溫度的預(yù)測(cè)作用明顯增強(qiáng)。

表4 不同時(shí)間尺度下預(yù)測(cè)特征的RMSE結(jié)果

表5 不同時(shí)間尺度下預(yù)測(cè)特征的MAPE結(jié)果

圖5和圖6中的圓圈表示該時(shí)間尺度下Time-Causality模型沒有選擇該特征??梢钥闯觯卣髟诓煌叨鹊念A(yù)測(cè)作用并不相同。隨著時(shí)間尺度增大,室外溫度對(duì)供熱用氣量的預(yù)測(cè)作用在增大。管網(wǎng)壓力在原始分鐘級(jí)時(shí)間尺度的預(yù)測(cè)作用要高于其他特征,但隨時(shí)間尺度變大,預(yù)測(cè)作用在減弱。循環(huán)泵出口壓力的預(yù)測(cè)作用隨時(shí)間尺度增大,其預(yù)測(cè)作用也增大,但在時(shí)間尺度為1天的預(yù)測(cè)作用較弱。

圖5 特征隨時(shí)間尺度變化預(yù)測(cè)作用趨勢(shì)圖(RMSE標(biāo)準(zhǔn))

圖6 特征隨時(shí)間尺度變化預(yù)測(cè)作用趨勢(shì)圖(MAPE標(biāo)準(zhǔn))

4 結(jié) 語

本文引入了時(shí)間維度作為輸入維度并基于因果關(guān)系提出了Time-Causality預(yù)測(cè)模型,將篩選的特征與用氣量的歷史值作為輸入維度構(gòu)建LSTM的供熱用氣量預(yù)測(cè)模型。對(duì)比實(shí)驗(yàn)表明,Time-Causality模型可以在不同時(shí)間尺度下篩選出更優(yōu)的特征,有助于供熱用氣量的預(yù)測(cè),并且引入的時(shí)間維度可提升預(yù)測(cè)效果。本文又從原始采集分鐘級(jí)數(shù)據(jù)、10分鐘、1小時(shí)和1天不同時(shí)間尺度下,分析各個(gè)特征的預(yù)測(cè)作用。結(jié)果表明:不同時(shí)間尺度Time-Causality模型選用的特征不同,對(duì)于小時(shí)間尺度管網(wǎng)壓力預(yù)測(cè)作用明顯,對(duì)于大尺度下溫度預(yù)測(cè)作用明顯。同一特征在不同的時(shí)間尺度下的預(yù)測(cè)作用不同,如隨時(shí)間尺度變大,室外溫度的預(yù)測(cè)作用逐漸增強(qiáng);而管網(wǎng)壓力維度情況則相反。

本文的實(shí)驗(yàn)結(jié)果可以為供熱系統(tǒng)的用氣規(guī)律提供分析,具有實(shí)際的應(yīng)用價(jià)值,在提供優(yōu)質(zhì)供熱的基礎(chǔ)上,高效地利用能源。后續(xù)將嘗試構(gòu)建關(guān)于用氣量的Granger關(guān)系的分析圖,并從不同時(shí)刻分時(shí)間段的角度對(duì)用氣量數(shù)據(jù)進(jìn)行研究預(yù)測(cè),從而更好地分析鍋爐房用氣量數(shù)據(jù)的特點(diǎn)以及供熱系統(tǒng)用氣規(guī)律。

猜你喜歡
時(shí)間尺度氣量維度
時(shí)間尺度上非完整系統(tǒng)的Noether準(zhǔn)對(duì)稱性與守恒量
時(shí)間尺度上Lagrange 系統(tǒng)的Hojman 守恒量1)
交直流混合微電網(wǎng)多時(shí)間尺度協(xié)同控制
能源工程(2021年1期)2021-04-13 02:06:12
頁巖超臨界態(tài)吸附氣量計(jì)算模型
淺論詩中“史”識(shí)的四個(gè)維度
中華詩詞(2019年7期)2019-11-25 01:43:00
氣量可以學(xué)習(xí)嗎
大港油田穩(wěn)步提高產(chǎn)氣量 提前4個(gè)月完成全年指標(biāo)
錄井工程(2017年3期)2018-01-22 08:39:56
氣量三層次
大連市暴雨多時(shí)間尺度研究分析
光的維度
燈與照明(2016年4期)2016-06-05 09:01:45
襄汾县| 香河县| 广宁县| 新化县| 淮阳县| 敖汉旗| 长治县| 山阳县| 梁山县| 罗甸县| 南投市| 七台河市| 武城县| 富宁县| 阳曲县| 曲沃县| 秦皇岛市| 上饶市| 武城县| 新绛县| 任丘市| 高尔夫| 洱源县| 内江市| 永州市| 寿宁县| 顺平县| 铜川市| 蒙阴县| 河曲县| 喜德县| 唐山市| 济源市| 呼伦贝尔市| 望都县| 蕲春县| 泸定县| 永靖县| 武邑县| 科技| 谢通门县|