黃晟
(西安財經(jīng)大學(xué),陜西 西安 710100)
傳統(tǒng)模糊時間序列模型的不足在于只考慮隸屬度最大的模糊子集,而忽略其他隸屬度所對應(yīng)的模糊子集,從而導(dǎo)致數(shù)據(jù)的信息丟失,使得最終的預(yù)測結(jié)果缺乏可靠性和準(zhǔn)確性。在本節(jié)中,我們提出一種基于高階和廣義模糊關(guān)系的新模型GTS(M,N)。GTS(M,N)是指第N主模糊邏輯關(guān)系的M階模糊時間序列模型。
廣義(多元高階)模糊時間序列預(yù)測模型的建模步驟如下:
步驟1 定義論域和提取時間間隔的規(guī)則。論域可以定義為U=[開始,結(jié)束]。例如,U={u1,u2,…,un},mi是ui的中點(diǎn),其對應(yīng)的模糊集為Ai=(i=1,2,…,n)。
步驟2 定義模糊集,模糊化歷史數(shù)據(jù)。模糊集Ai可表示為Ai=(ai1,ai2,…,ain),其中aij∈[0,1],uj表示Ai中的隸屬度。如果aij={ai1,ai2,…,ain},則時間t的數(shù)據(jù)應(yīng)該分為第j類。在本文中,定義模糊集如公式(1)所示。
(1)
公式(1)定義了在Ai=(i=1,2,…,n)中的時間i的值xi的隸屬度。
(2)
其中xi是在時間i的觀測值,lin是間隔長度。
步驟3 本文選擇了LEE提出的方法創(chuàng)建模糊邏輯關(guān)系。例如,模型的模糊邏輯關(guān)系GTS(M,N)可以分為M×N階關(guān)系矩陣,表示為R(k,l)(k=1,2,…,M,l=1,2,…,N)。
那么,對于給定的M,時間t的預(yù)測值可以通過以下公式獲得:
(3)
其中,第k次預(yù)測的調(diào)整參數(shù)ωk(k=1,2,…,M)也可以通過最小化訓(xùn)練數(shù)據(jù)集的均方根誤差或其他評估標(biāo)準(zhǔn)來獲得。至此,建立了一種廣義(多元高階)模糊時間序列預(yù)測模型。
本模型以合肥市1995年到2016年的氣溫數(shù)據(jù)作為訓(xùn)練集,選取三月的平均氣溫用于預(yù)測作為測試集。實(shí)驗(yàn)選取三月氣溫數(shù)據(jù)利于體現(xiàn)建模過程。用于預(yù)測時間序列數(shù)據(jù)的方法的步進(jìn)過程,其中M=3和N=2。
表1 平均氣溫模糊集的隸屬度
續(xù)表
步驟1 將論域分為七個區(qū)間,分別為u1,u2,u3,u4,u5,u6,u7,其中u1=[15,16],u2=[16,17],u3=[17,18],u4=[18,19],u5=[19,20],u6=[20,21],u7=[21,22];它們的中點(diǎn)分別為15.5,16.5,17.5,18.5,19.5,20.5和21.5。
步驟2 令A(yù)1=(不是很熱),A2=(不是特別熱),A3=(一般),A4=(熱),A5=(非常熱),A6=(特別熱),A7=(很熱)對應(yīng)于“氣溫”的語言值的模糊集合。通過公式(2)定義的三角隸屬函數(shù),給出由公式(1)定義的模糊集和所有觀測值。
步驟3 基于模糊邏輯關(guān)系將推導(dǎo)得到的模糊關(guān)系劃分成組。在本文中,我們使用Lee的方法來構(gòu)造模糊邏輯關(guān)系矩陣。例如,令k=1和l=1。模糊邏輯關(guān)系集合被列為
A1→A1,A1→A1,A1→A2,A2→A3,A3→A3,A3→A3,A3→A3,A3→A4,
A4→A4,A4→A4,A4→A3,A3→A3,A3→A3,A3→A3,A3→A3,A3→A4,
A4→A6,A6→A6,A6→A7,A7→A7,A7→A6
并且它們將被分組并且由復(fù)現(xiàn)的模糊關(guān)系加權(quán)如下:
第1組:A1→A1,權(quán)重為2,A1→A2,權(quán)重為1;
第2組:A2→A3,權(quán)重為1;
第3組:A3→A3,權(quán)重為7,A3→A4,權(quán)重為2;
第4組:A4→A4,權(quán)重為2,A4→A3,權(quán)重為1,A4→A6,權(quán)重為1;
第5組:A6→A6,權(quán)重為1,A6→A7,權(quán)重為1;
第6組:A7→A7,權(quán)重為7,A7→A6,權(quán)重為1。
步驟4 通過計算提出的方法,我們說明了2001年平均氣溫的預(yù)測過程如下:1999年平均氣溫的模糊集是(0.02,0.52,0.98,0.48,0,0,0)。兩個最大的隸屬度是第三個和第二個。
表2 本模型與Chen的模型的RMSE比較
在表2中,本文比較了所提出方法和Chen[6,15]的模型的RMSE預(yù)測值與真實(shí)值??梢钥闯觯疚乃岢瞿P偷腞MSE小于2011年的Chen[6,15]的模型。圖1顯示了合肥市平均氣溫對應(yīng)的三個三角隸屬函數(shù)。
圖1 2000年合肥平均氣溫預(yù)測的隸屬函數(shù)
可見,在隸屬函數(shù)中,當(dāng)M增加越明顯獲得的預(yù)測精度差異越大。還有另一個結(jié)論,第三隸屬函數(shù)的預(yù)測并不總是優(yōu)于第一函數(shù)的預(yù)測。階數(shù)和主模糊邏輯關(guān)系略微影響預(yù)測結(jié)果。階數(shù)越高,預(yù)測結(jié)果越好,模糊邏輯關(guān)系層次越多,預(yù)測誤差越小,但不會無限遞減。圖2和圖3為2000年溫度的實(shí)際值和預(yù)測值的一些示例。
圖2 相同長度時間隔的2000年溫度真實(shí)值和預(yù)測值的比較
由圖2可知在相同的時間間隔即L=300中GTS(3,1)具有比GTS(1,1)更好的性能。
圖3 不同長度間隔的2000年溫度真實(shí)值和預(yù)測值的比較
圖3說明當(dāng)區(qū)間長度較小時,GTS(1,1)得到更好的預(yù)測。
本研究使用1979年到2004年的黃山游客數(shù)量數(shù)據(jù)作為訓(xùn)練集,選取游客總量用于預(yù)測。廣義高階模糊時間序列在黃山風(fēng)景區(qū)游客流量的應(yīng)用步驟與上述氣溫預(yù)測類似,重點(diǎn)研究了不同階數(shù)、不同長度間隔對模型預(yù)測的結(jié)果,在此便不做詳細(xì)闡述了。模型建立的步驟如下:
步驟1 將論域劃分。
步驟2 定義模糊集。
步驟3 將模糊邏輯關(guān)系劃分成組。
步驟4 計算預(yù)測。
模型的預(yù)測結(jié)果和分析如下:
本節(jié)將在圖4和圖5中進(jìn)一步描述一些性質(zhì),圖4和圖5描繪了1994年以后十年的平均預(yù)測誤差,圖4顯示了RMSE和不同階數(shù)間隔長度之間的關(guān)系。
圖4 RMSE和不同階數(shù)間隔長度之間的關(guān)系
從圖4中可以看出,間隔長度越長,RMSE越大,高階模型優(yōu)于低階模型。
圖5 RMSE和具有不同長度間隔的階數(shù)之間的關(guān)系
從圖5中可以看出,即間隔的長度越短導(dǎo)致穩(wěn)定的預(yù)測。圖5顯示了RMSE和具有不同長度間隔的階數(shù)之間的關(guān)系。
通過使用合肥市的氣溫和黃山風(fēng)景區(qū)的游客流量作為評估模型的數(shù)據(jù)集,得出以下結(jié)論:該模型的預(yù)測結(jié)果比Chen先前提出的常規(guī)模糊時間序列預(yù)測模型的精確性要高。階數(shù)和主模糊關(guān)系略微影響預(yù)測結(jié)果。階數(shù)越高,預(yù)測結(jié)果越好,模糊邏輯關(guān)系層次越多,預(yù)測結(jié)果越精確。