凌德森,王曉凱,朱 濤
(山西大學(xué) 物理電子工程學(xué)院,山西 太原 030006)
隨著城市化和工業(yè)化的快速發(fā)展,能源需求量不斷增加,大量的污染物被排放到大氣中,導(dǎo)致了嚴(yán)重的空氣污染問題[1]??諝馕廴疚餄舛鹊某瑯?biāo)可能會(huì)誘發(fā)呼吸系統(tǒng)病變等疾病,進(jìn)而制約社會(huì)、經(jīng)濟(jì)的發(fā)展[2]。因此,建立一個(gè)準(zhǔn)確可靠的空氣污染物濃度預(yù)測(cè)模型對(duì)人們規(guī)避空氣污染危害和政府制定減排政策具有重要意義。
空氣污染物濃度預(yù)測(cè)是一個(gè)復(fù)雜的非線性問題,目前,其研究方法分為確定性模型、統(tǒng)計(jì)模型和神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型三類[3]。確定性模型是以空氣動(dòng)力學(xué)理論和物理化學(xué)過程為基礎(chǔ),通過模擬大氣的物理和化學(xué)環(huán)境對(duì)空氣污染物濃度進(jìn)行預(yù)測(cè)[4]。最常使用的方法是高斯模型[5]和多尺度空氣質(zhì)量模型[6]。然而,確定性模型需要關(guān)于污染物來源以及大氣的物理化學(xué)特征的可靠信息,數(shù)據(jù)不便收集,并且需要大量時(shí)間來完成預(yù)測(cè)[7]。相比較于確定性模型,統(tǒng)計(jì)模型更簡(jiǎn)單、更快捷、更有效,常使用的方法有自回歸綜合移動(dòng)平均模型[8](Autoregressive Integrated Moving Average Model,ARIMA)和多元線性回歸[9](Multiple Iinear Regression,MLR)。人工智能的發(fā)展為空氣污染物濃度預(yù)測(cè)研究提供了新的機(jī)會(huì)。當(dāng)人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)被證明在污染物濃度的預(yù)測(cè)上能夠取得良好的性能后[10],ANN被廣泛應(yīng)用于空氣污染物濃度預(yù)測(cè)中[11]。然而,人工神經(jīng)網(wǎng)絡(luò)存在難以提取時(shí)間序列和相關(guān)的時(shí)序特征問題[12]。隨后遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)的出現(xiàn)在一定程度上解決了該問題,并在時(shí)序問題的分析中表現(xiàn)出更強(qiáng)的適應(yīng)性。長(zhǎng)短期記憶(Long-Short Term Memory,LSTM)網(wǎng)絡(luò)是RNN的一種變體,具有特殊的門結(jié)構(gòu)加強(qiáng)了數(shù)據(jù)間長(zhǎng)期依賴關(guān)系的獲取,解決了RNN在訓(xùn)練過程中的梯度消失問題以及無法獲取數(shù)據(jù)之間長(zhǎng)期依賴關(guān)系[13]的問題。門控循環(huán)單元(Gated Recirculation Unit,GRU)神經(jīng)網(wǎng)絡(luò)是LSTM網(wǎng)絡(luò)的進(jìn)一步改進(jìn),在具有LSTM神經(jīng)網(wǎng)絡(luò)相同效果的同時(shí)降低了網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜度??諝馕廴疚餄舛刃蛄惺堑湫偷姆蔷€性、非平穩(wěn)時(shí)間序列,若將收集到的數(shù)據(jù)直接進(jìn)行預(yù)測(cè)實(shí)驗(yàn),會(huì)使得模型預(yù)測(cè)精度不高。于是丁子昂等[14]采用補(bǔ)充總體經(jīng)驗(yàn)?zāi)B(tài)分解(Complementary Ensemble Empirical Mode Decomposition,CEEMD)方法將PM2.5濃度序列進(jìn)行分解,并利用皮爾遜相關(guān)(Pearson)算法進(jìn)行篩選,增強(qiáng)了數(shù)據(jù)中體現(xiàn)的時(shí)序特征,做到了快速、有效地預(yù)測(cè)PM2.5濃度。Jin等[15]提出一種混合深度學(xué)習(xí)模型,利用經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)算法和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)對(duì)PM2.5濃度數(shù)據(jù)進(jìn)行分解和分類,實(shí)驗(yàn)結(jié)果表明,經(jīng)過數(shù)據(jù)處理,可以提高預(yù)測(cè)的準(zhǔn)確性。
因此,為了提高模型預(yù)測(cè)精度,本文采用自適應(yīng)完整集成經(jīng)驗(yàn)?zāi)B(tài)分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMDAN)、排列熵(Permutation Entropy,PE),以及GRU神經(jīng)網(wǎng)絡(luò)組合的空氣污染物濃度預(yù)測(cè)模型。CEEMDAN算法將空氣污染物濃度數(shù)據(jù)分解為不同尺度的子序列,利用PE算法計(jì)算分解后的子序列復(fù)雜度,按子序列復(fù)雜程度重新組合成新的子序列,降低模型的運(yùn)算規(guī)模,最后利用GRU神經(jīng)網(wǎng)絡(luò)對(duì)重新組合后的新序列進(jìn)行預(yù)測(cè),以提高模型對(duì)空氣污染物濃度的預(yù)測(cè)精度。
EMD是由Wu和Huang提出的一種用于處理非平穩(wěn)、非線性序列的時(shí)空分析方法[16],可以在不知道的任何先驗(yàn)知識(shí)的情況下,依據(jù)序列自身時(shí)間尺度特征來進(jìn)行信號(hào)的自適應(yīng)分解處理。EMD算法分解步驟如下。
① 在給定的時(shí)間序列x(t)中,找到其所有的極值點(diǎn),分別擬合極大值點(diǎn)和極小值點(diǎn)的包絡(luò)線xmax(t)和xmin(t),并計(jì)算出極值點(diǎn)包絡(luò)線的平均值x(t),再用時(shí)間序列x(t)減去平均值m(t),即得到本征模態(tài)。
h(t)=x(t)-m(t)
(1)
② 判斷h(t)是否滿足極值點(diǎn)包絡(luò)平均值為零,局部極值點(diǎn)和過零點(diǎn)的數(shù)目相差在1以內(nèi),若滿足則h(t)即為序列的本征模態(tài),否則,重復(fù)步驟①直到h(t)滿足條件為止。
③ 重復(fù)步驟①和步驟②,直到時(shí)間序列x(t)分解剩余的殘差分量r(t)為單調(diào)序列或常序列為止。這樣可得到經(jīng)過EMD算法分解后的時(shí)間序列x(t)。
(2)
式中:N為分解得到的子模態(tài)數(shù)。
CEEMDAN算法是在EMD算法的基礎(chǔ)上改進(jìn)得到的,不僅擁有對(duì)非線性信號(hào)的自適應(yīng)分解特性,即能夠根據(jù)非線性序列自身的特征進(jìn)行信號(hào)的自適應(yīng)分解,而且解決了EMD 算法分解中存在的模態(tài)混疊問題。算法分解具體步驟如下。
① 在待分解的污染物濃度時(shí)間序列y(t)中,加入正負(fù)成對(duì)的高斯白噪聲(-1)qεwn(t)(q=1,2),得到新序列x(t)。
x(t)=y(t)+(-1)qεwn(t)
(3)
式中:ε為白噪聲的標(biāo)準(zhǔn)差;wn(t)為標(biāo)準(zhǔn)正態(tài)分布的高斯白噪聲。
(4)
③ 對(duì)得到的N個(gè)本征分量進(jìn)行平均得到CEEMDAN分解后的第一個(gè)本征模態(tài)分量:
(5)
④ 計(jì)算去除第一個(gè)本征模態(tài)后的殘差序列為
(6)
(7)
⑥ 對(duì)步驟⑤中得到的本征模態(tài)進(jìn)行平均得到CEEMDAN分解后的第2個(gè)本征模態(tài)分量:
(8)
⑦ 計(jì)算去除第二個(gè)本征模態(tài)后的殘余序列為
(9)
⑧ 同理,由上述步驟①~步驟⑦可以得到第k個(gè)殘差序列和第k+ 1個(gè)子模態(tài)。
(10)
(11)
⑨ 重復(fù)步驟①~步驟⑧,當(dāng)殘差序列為單調(diào)函數(shù)時(shí),無法再分解出新的子模態(tài),算法結(jié)束,此時(shí)原始序列為
(12)
式中:K為最終得到的本征模態(tài)數(shù)量;R(t)為分解剩余殘差分量。
PE算法是一種通過比較時(shí)間序列中相鄰時(shí)間點(diǎn)的值,來檢測(cè)時(shí)間序列動(dòng)態(tài)變化的方法,可以表征信號(hào)的復(fù)雜性以及度量信息的不確定性,適合處理非線性問題。PE值的大小代表時(shí)間序列的復(fù)雜性和隨機(jī)性,值越大說明時(shí)間序列的復(fù)雜性越大、隨機(jī)性越強(qiáng);反之,時(shí)間序列隨機(jī)性越弱,復(fù)雜性越小。其基本算法如下:
① 對(duì)給定的N長(zhǎng)時(shí)間序列{X(i),i=1,2,…,N}進(jìn)行相空間重構(gòu),得到相空間矩陣為
(13)
式中:j=1,2,…,K;m為嵌入的維數(shù);τ為延遲時(shí)間;K=N-(m-1)τ。
② 將重構(gòu)得到的相空間矩陣中的第j個(gè)重構(gòu)分量x(j),x(j+τ),…,x[j+(m-1)τ]按數(shù)值大小進(jìn)行升序排列,j1,j2,…,jm為重構(gòu)分量中各元素所在列的索引。即:
x[i+(j1-1)τ]≤x[i+(j2-1)τ]≤…≤x[i+(jm-1)τ]
(14)
上式中重構(gòu)分量中存在相等的值,則按照j1,j2的排列順序進(jìn)行大小排序,即當(dāng)j1 ③ 時(shí)間序列X(i)經(jīng)過相空間重構(gòu)后所得的重構(gòu)矩陣中的每一行都能得到一組符號(hào)序列。 S(k)=(j1,j2,…,jm) (15) 式中:k= 1,2,…,l,且k≤m!。 ⑤ 最后根據(jù)信息熵的定義,將時(shí)間序列X(i)的PE定義為 (16) 式中:0≤HPE≤ln(m!);當(dāng)Pk=1/m!時(shí),HPE達(dá)到最大值ln(m!)。 RNN是一種人工神經(jīng)網(wǎng)絡(luò),其中網(wǎng)絡(luò)節(jié)點(diǎn)之間的連接沿著序列形成有向圖,因此RNN改變了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)無法保存過去數(shù)據(jù)間的相互作用的缺點(diǎn),并可以顯示隨時(shí)間序列變化的動(dòng)態(tài)行為。但是隨著時(shí)間間隔的增大,RNN也變得易丟失遠(yuǎn)處的數(shù)據(jù)單元信息,即產(chǎn)生梯度消失的問題。為了解決RNN處理時(shí)間序列的梯度消失問題,相繼提出LSTM和GRU等神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)來避免產(chǎn)生梯度消失問題。LSTM通過輸入門控制是否將數(shù)據(jù)寫入細(xì)胞狀態(tài)中,遺忘門控制記憶單元值的更新,輸出門決定是否將值輸出[17]。其中輸入門計(jì)算式為 it=σ(Wi·[ht-1,xt+bf]) (17) (18) (19) 式中:xt為輸入變量;Ct為細(xì)胞狀態(tài);Wi和Wc為輸入偏置;σ和tanh為激活函數(shù);σ為sigmoid函數(shù)。 遺忘門用來確定t-1時(shí)刻的隱藏狀態(tài)ht-1和t時(shí)刻有多少輸入的信息被保留,其公式為 ft=σ(Wf·[ht-1,xt]+bf) (20) 式中:Wf為遺忘門的權(quán)重矩陣;bf為遺忘門的偏置項(xiàng)。 輸出門用來控制輸出單元的隱藏狀態(tài)是否輸出,其公式為 ot=σ(Wo·[ht-1,xt]+bo) (21) ht=ot·tanh(Ct) (22) 式中:ot為輸出門的輸出;Wo為輸出門的權(quán)重;bo為輸出門的偏置項(xiàng)。 LSTM在3個(gè)門的相互作用下不僅能夠進(jìn)行長(zhǎng)期記憶,還解決了CNN的梯度消失問題。但由于LSTM結(jié)構(gòu)較為復(fù)雜,在序列的預(yù)測(cè)中效率較低,GRU神經(jīng)網(wǎng)絡(luò)是Chung等[18]在2014年提出的一種新的RNN變體,在保證與LSTM的相當(dāng)精度的同時(shí)還提高了效率。GRU神經(jīng)網(wǎng)絡(luò)單元結(jié)構(gòu)如圖1所示。 圖1 GRU神經(jīng)網(wǎng)絡(luò)單元結(jié)構(gòu) GRU擺脫了細(xì)胞狀態(tài)并使用隱藏狀態(tài)來傳輸信息,只包含兩個(gè)門,分別為重置門rt和更新門zt,更新門用于控制前一時(shí)刻有多少狀態(tài)信息傳入到當(dāng)前時(shí)刻狀態(tài),更新門的值越大,表明上一時(shí)刻狀態(tài)信息傳入到當(dāng)前時(shí)刻的狀態(tài)信息越多;重置門用來篩選信息,決定前一時(shí)刻的狀態(tài)信息有多少被忽略,重置門的值越小,說明前一時(shí)刻的狀態(tài)信息傳入到當(dāng)前時(shí)刻的狀態(tài)信息越少[19]。GRU網(wǎng)絡(luò)前向傳播公式為 rt=σ(Wr·[ht-1,xt]) (23) zt=σ(Wz·[ht-1,xt]) (24) (25) (26) 基于CEEMDAN、PE和GRU組合的空氣污染物濃度預(yù)測(cè)模型,在網(wǎng)絡(luò)結(jié)構(gòu)的搭建中,經(jīng)過反復(fù)實(shí)驗(yàn),最終得到空氣污染物濃度預(yù)測(cè)模型。該模型具體步驟如下。 ① 獲取空氣污染物濃度歷史數(shù)據(jù),為了提高模型的預(yù)測(cè)精度、降低運(yùn)算的復(fù)雜度,對(duì)原始數(shù)據(jù)進(jìn)行歸一化處理,公式為 (27) 式中:yi為歸一化后的污染物濃度歷史實(shí)時(shí)數(shù)據(jù);xi為原始數(shù)據(jù);xmax、xmin分別為原始數(shù)據(jù)中的最大值、最小值。 ② 利用CEEMDAN分解算法將歸一化后的污染物濃度數(shù)據(jù)進(jìn)行分解,獲得一組固有模態(tài)函數(shù){IMF1,IMF2,…,IMFn}分量和一個(gè)殘余分量RES。 ③ 利用PE算法計(jì)算出②中得到的{IMF1,IMF2,…,IMFn}分量以及RES分量的PE值,并按照PE值的大小將各分量重新組合成新的子序列{NEW1,NEW2,…,NEWm}。 ⑤ 將各子序列預(yù)測(cè)結(jié)果疊加,并進(jìn)行反歸一化處理得到最終的預(yù)測(cè)結(jié)果。 CEEMDAN-PE-GRU預(yù)測(cè)模型結(jié)構(gòu)如圖2所示。 圖2 CEEMDAN-PE-GRU預(yù)測(cè)模型結(jié)構(gòu) 本文的研究目的是能夠精確預(yù)測(cè)空氣污染物濃度的變化趨勢(shì)。為了能夠更好地衡量模型的預(yù)測(cè)效果,采用了3個(gè)評(píng)價(jià)指標(biāo)來分析預(yù)測(cè)結(jié)果與真實(shí)值之間偏差[20]:平均絕對(duì)誤差(Mean Absolute Error,MAE)、均方根誤差(Root Mean Squared Error,RMSE)和決定系數(shù)(Coefficient of Determination)。一般來說RMSE和MAE值越小,決定系數(shù)的值越接近1,則預(yù)測(cè)結(jié)果與真實(shí)值之間的偏差越小,模型的擬合效果越好;反之,則偏差較大、模型的擬合效果越差。計(jì)算公式為 (28) (29) (30) 為了得到有效的預(yù)測(cè)精度,對(duì)不同的GRU網(wǎng)絡(luò)層數(shù)的模型進(jìn)行了實(shí)驗(yàn),將污染物濃度序列作為驗(yàn)證實(shí)驗(yàn)對(duì)象,選擇單隱藏層、雙隱藏層和三隱藏層進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表1所示。由表1中的結(jié)果可知:隱藏層數(shù)的增加并不一定可以帶來更好的預(yù)測(cè)效果。因此,經(jīng)過多次實(shí)驗(yàn),本文最終選擇使用單隱藏層神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)。 表1 不同層數(shù)網(wǎng)絡(luò)的實(shí)驗(yàn)結(jié)果 網(wǎng)格搜索法是指定參數(shù)值的一種窮舉搜索方法,該方法將預(yù)測(cè)模型的參數(shù)通過交叉驗(yàn)證方法進(jìn)行優(yōu)化,來獲取最優(yōu)的學(xué)習(xí)算法。 為了減少模型預(yù)測(cè)過程中出現(xiàn)的過擬合或欠擬合問題,保證模型的最優(yōu)化,使用網(wǎng)格搜索算法進(jìn)行預(yù)測(cè)模型參數(shù)的選取;為了保證各模型實(shí)驗(yàn)的公平性,所有實(shí)驗(yàn)過程均在相同的硬件環(huán)境下,并利用MATLAB2019b和Python3.6仿真平臺(tái)搭建預(yù)測(cè)模型。綜上,預(yù)測(cè)模型以及對(duì)比模型主要參數(shù)如表2所示。 表2 預(yù)測(cè)模型及對(duì)比模型主要參數(shù) 本文選擇以某市2017年1月1日至2017年3月31日,每小時(shí)采樣一次的空氣污染物濃度數(shù)據(jù)為研究樣例。數(shù)據(jù)集收集于中國環(huán)境檢測(cè)總站的全國城市空氣質(zhì)量實(shí)時(shí)發(fā)布平臺(tái)(https://air.cnemc.cn)和真氣網(wǎng)(https://www.aqistudy.cn/),其中包括PM10、PM2.5、SO2、NO2、O3和CO六項(xiàng)主要污染物濃度,共2160條數(shù)據(jù)。各污染物濃度時(shí)間序列如圖3所示。為了驗(yàn)證模型對(duì)污染物濃度的預(yù)測(cè)性能,將各污染物數(shù)據(jù)的前1952條數(shù)據(jù)作為預(yù)測(cè)模型的訓(xùn)練集,后208條數(shù)據(jù)作為測(cè)試數(shù)據(jù)集。 圖3 空氣污染物濃度時(shí)間序列 由于空氣污染物濃度序列具有典型的非平穩(wěn)性、非線性特點(diǎn),本文利用CEEMDAN算法對(duì)非線性序列的自適應(yīng)分解特性,將歸一化后的原始空氣污染物濃度序列進(jìn)行分解,各污染物濃度序列分解結(jié)果如圖4所示。 圖4 基于CEEMDAN的污染物濃度分解結(jié)果 若將分解后的分量分別進(jìn)行預(yù)測(cè),會(huì)增大預(yù)測(cè)模型的計(jì)算規(guī)模,因此為了降低模型的計(jì)算規(guī)模,以及更有效地對(duì)空氣污染物進(jìn)行預(yù)測(cè),采用PE算法對(duì)分解得到的各分量進(jìn)行計(jì)算,以此評(píng)估各分量的復(fù)雜程度。各污染物濃度序列分量PE值如表3所示。 表3 各污染物濃度序列分量PE值 如圖4所示,污染物濃度序列IMF分量的波動(dòng)性逐漸降低,深刻體現(xiàn)了污染物濃度在3個(gè)月內(nèi)波動(dòng)趨勢(shì)的變化,RES體現(xiàn)了空氣污染物濃度的變化趨勢(shì)。另外結(jié)合表3可以看出,IMF1、IMF2的復(fù)雜度最大,且隨機(jī)性較強(qiáng),雖然兩者相鄰,但PE值相差較大,因此將IMF1、IMF2分別作為單獨(dú)序列;IMF3和IMF4的波動(dòng)相似且具有一定的規(guī)律性,PE值在0.2~0.5之間,故將其合并成一個(gè)新的序列;IMF5~I(xiàn)MF7不僅數(shù)據(jù)變化平穩(wěn),而且具有相對(duì)較高的規(guī)律性,RES作為污染物的變化趨勢(shì),其平穩(wěn)性高、波動(dòng)簡(jiǎn)單,因此將IMF5~I(xiàn)MF7和RES合并為新序列。重組后的新序列如圖5所示。 圖5 重組后的新序列 為了驗(yàn)證本文預(yù)測(cè)模型的優(yōu)越性,在相同的計(jì)算環(huán)境下分別建立CEEMDAN-PE-GRU模型、BP模型、LSTM模型、GRU模型和經(jīng)過徑向基函數(shù)(RBF)改進(jìn)的SVR模型對(duì)PM2.5、PM10、NO2、O3、CO和SO2共6項(xiàng)污染物分別進(jìn)行仿真分析。各模型對(duì)污染物的預(yù)測(cè)結(jié)果與真實(shí)數(shù)據(jù)對(duì)比如圖6所示,各模型預(yù)測(cè)性能對(duì)比指標(biāo)結(jié)果如表4所示。 如圖6所示,BP模型、LSTM模型、GRU模型和RBF-SVR模型的預(yù)測(cè)結(jié)果與真實(shí)結(jié)果有著較大的誤差,總體結(jié)果存在較大的滯后性;而CEEMDAN-PE-GRU模型雖然在部分變化復(fù)雜的位置上也存在一定的誤差,但總體預(yù)測(cè)結(jié)果與真實(shí)值最接近、滯后性更低,能夠更準(zhǔn)確地反映污染物的變化趨勢(shì),較其他4種模型的預(yù)測(cè)結(jié)果來說效果更好。 圖6 各污染物預(yù)測(cè)結(jié)果 如表4所示,相比較BP模型、LSTM模型和RBF-SVR模型,GRU模型預(yù)測(cè)結(jié)果的平均絕對(duì)誤差、均方根誤差有著不同程度的降低,決定系數(shù)增加,表明GRU神經(jīng)網(wǎng)絡(luò)能夠更好地對(duì)空氣污染物濃度時(shí)間序列進(jìn)行預(yù)測(cè)。與RBF-SVR模型、BP模型、LSTM模型以及GRU模型相比較的結(jié)果來看,基于CEEMDAN-PE-GRU模型的平均絕對(duì)誤差、均方根誤差和決定系數(shù)都優(yōu)于其他4種模型。以空氣污染物中SO2濃度的預(yù)測(cè)結(jié)果為例,就CEEMDAN-PE-GRU模型與其他4種模型的均方根誤差而言,分別下降了48.38%、49.07%、54.92%和47.96%,說明CEEMDAN-PE-GRU模型預(yù)測(cè)精度最高、誤差最小;另外與單一GRU模型比較可以得出,經(jīng)過CEEMDAN-PE處理后的預(yù)測(cè)模型的精度明顯提高,其平均絕對(duì)誤差、均方根誤差分別下降了43.51%、47.96%,決定系數(shù)增加了50.84%,表明經(jīng)過CEEMDAN-PE處理后的預(yù)測(cè)模型能夠更好地挖掘數(shù)據(jù)中的隱藏信息,實(shí)現(xiàn)更加精確的預(yù)測(cè)。 表4 不同模型預(yù)測(cè)性能比較結(jié)果 綜上所述,CEEMDAN-PE-GRU模型對(duì)空氣污染物濃度的預(yù)測(cè)具有更高的精度,優(yōu)于RBF-SVR模型、BP模型、LSTM模型和GRU模型。 為了提高對(duì)空氣污染物濃度的預(yù)測(cè)精度,降低序列的非線性、非平穩(wěn)波動(dòng)特性的影響,基于CEEMDAN-PE-GRU模型,對(duì)6項(xiàng)空氣污染物濃度數(shù)據(jù)進(jìn)行研究,結(jié)果表明利用CEEMDAN分解算法對(duì)空氣污染物濃度序列進(jìn)行分解可以有效地挖掘數(shù)據(jù)中的變化規(guī)律和隱藏信息,其次使用PE算法將復(fù)雜度相近的子序列進(jìn)行重構(gòu),達(dá)到挖掘隱藏信息的同時(shí)降低了組合預(yù)測(cè)方法的計(jì)算規(guī)模。通過與RBF-SVR模型、BP模型、LSTM模型和GRU模型相比,本文預(yù)測(cè)模型各項(xiàng)指標(biāo)都優(yōu)于其他模型,表明CEEMDAN-PE-GRU模型能夠更好地處理空氣污染物濃度序列,提高空氣污染物濃度的預(yù)測(cè)精度。1.3 GRU神經(jīng)網(wǎng)絡(luò)
1.4 預(yù)測(cè)模型構(gòu)建
1.5 預(yù)測(cè)模型的評(píng)價(jià)指標(biāo)
1.6 模型參數(shù)的選取
2 實(shí)驗(yàn)與結(jié)果分析
2.1 數(shù)據(jù)來源
2.2 數(shù)據(jù)分解與重組
2.3 預(yù)測(cè)結(jié)果與分析
3 結(jié)束語