單文廣
摘 要: 窗口的長度是一個非常關(guān)鍵的調(diào)整參數(shù)的奇異譜分析(SSA)技術(shù)。為在SSA應(yīng)用中找到窗口長度的最佳值,可使用周期譜圖分析法進(jìn)行SSA窗口長度的選擇。佛羅里達(dá)州的降水?dāng)?shù)據(jù)含有一些潛在的周期性,使用周期譜分析方法的應(yīng)用方法確定窗口長度,提取降水時間序列的潛在降雨周期,能有效進(jìn)行降水預(yù)報分析,結(jié)果成功確認(rèn)周期譜分析可以在SSA應(yīng)用中選擇窗口長度提供有效的幫助。
關(guān)鍵詞: 奇異譜分析(SSA) 窗口長度 線性遞推公式(LRFS) 周期譜分析
奇異譜分析(SSA)是在許多科學(xué)研究領(lǐng)域進(jìn)行時間序列分析的可靠的技術(shù)創(chuàng)新。SSA技術(shù)由Broomhead和King(1986a,1986b)首次提出,其已經(jīng)成為應(yīng)用不同的單一和多變量時間序列分析領(lǐng)域的一個有效的工具。Allen和Smith(1996)闡明了SSA的基本格式與調(diào)節(jié)振蕩的研究,探索了在蒙特卡羅算法和記錄的變化。Yiou(2000)等人應(yīng)用擴(kuò)展的方法,對非平穩(wěn)時間序列包括間歇性使用小波分析的多尺度方差發(fā)散的概念進(jìn)行研究。Marques(2006)等人應(yīng)用SSA方法和水文時間序列,研究單一時間序列其主要信息的分解能力及相關(guān)的預(yù)報技巧。Baratta(2003)等人提出SSA新的發(fā)展技術(shù)應(yīng)用于臺伯河流域的降雨時間序列的預(yù)報。目前,SSA技術(shù)已運(yùn)用于各應(yīng)用領(lǐng)域。
根據(jù)SSA算法的一般結(jié)構(gòu),其有兩個基本的和重要的參數(shù):窗口長度L和SSA特征值數(shù)r,參數(shù)L和R的選擇取決于所要分析的數(shù)據(jù)。L和R的正確的選擇影響著時間序列的有效的分解。Elsner和Tsonis(1996)做了一些關(guān)于SSA應(yīng)用中常規(guī)參數(shù)選擇的探討。Mahmoudvand和Zokaei(2012)研究了Hankel矩陣的奇異值的性能,獲得了最佳的結(jié)果參數(shù)值。
值得注意的是,L的變化會影響SSA方法中重建組分的可分特性。為找到應(yīng)用中窗口長度L最優(yōu)值,我們用周期譜分析的方法進(jìn)行SSA窗口長度L選擇研究,通過使用周期譜分析方法應(yīng)用于佛羅里達(dá)州的降水?dāng)?shù)據(jù)獲得潛在的周期,然后應(yīng)用SSA技術(shù)提取降雨時間序列的周期,比較在不同的窗口長度L的預(yù)測結(jié)果。
1.方法和數(shù)據(jù)
1.1奇異譜分析
SSA的主要目的是分解幾個組件系列組,算法主要描述遵循Golyandina(2001)等人的方法。若對于一時間序列X=(x■,x■,…,x■),窗口長度為L,且1 Y=[Y■,Y■,…,Y■]=x■ x■ … x■x■ x■ … x■x■ x■ … x■… … ?塤 …x■ x■ … x■(1) 然后對其進(jìn)行經(jīng)驗(yàn)正交展開,得出前幾個特性向量即可表示序列周期振蕩的主要模態(tài)和趨勢,可用來識別和描述序列中蘊(yùn)含的各種線性或非線性振蕩信號,而相對應(yīng)的時間系數(shù)則表示相應(yīng)周期的長期變化特征。由于經(jīng)過奇異譜分解,序列的頻域信號被分解為具有單一循環(huán)周期的時域信號,因此可按下式重建各個振蕩分量序列。 f■=■■e■■ for 1≤k 由此表明,SSA算法的應(yīng)用需要選擇兩個參數(shù):窗口的長度L和特征向量數(shù)量r。 1.2周期譜分析 周期譜是一個信號的譜密度估計,周期譜分析能夠找出哪些頻率包括在系列中。一個序列(x■,x■,…,x■),周期譜的定義可以描述為: P(T)=■■x(n)e■■(3) 方程表明譜密度估計和嵌入式周期之間的關(guān)系,可以表明哪些期間應(yīng)視為主要周期。 1.3線性遞歸公式 線性遞歸公式的理論和相關(guān)的特征多項(xiàng)式是眾所周知、廣泛使用的。根據(jù)定義,一個非零序列X■=(x■,x■,…,x■)可由一個線性遞推公式(LRF)表示為: x■=■a■x■(3) LRF的特點(diǎn)是可應(yīng)用于各種廣泛的模型并依賴于不同的滯后變量。 1.4數(shù)據(jù) 在目前的研究中,使用的數(shù)據(jù)是某地的月平均降水資料,從1981年1月到2012年12月。如圖1所示,32年(1981-2012)月降水的奇異的時間序列數(shù)據(jù),其中28年的記錄是用來分析的,最近4年的記錄用來驗(yàn)證預(yù)測的。 圖1 月降水量 2.結(jié)果與討論 本研究中使用月降水資料,28年(N=336)。為了描述降水時間序列特性,研究了不同的窗口長度L的奇異譜分析。長度為N的測試數(shù)據(jù),以N/2=168和N/3=112作為窗口長度。為了找到可能的嵌入式周期,周期譜分析法被應(yīng)用到的原始數(shù)據(jù),如圖2所示,有四個明顯的周期譜峰,對應(yīng)于周期T■=12、T■=21、T■=44和T■=81。 圖2 降水時間序列的周期譜圖 這些可能的固有周期為可選的窗口長度的值?;谶@些選擇的窗口長度L對時滯排列矩陣進(jìn)行奇異譜,得到有序的主成分。圖3顯示了第一主成分和相關(guān)的貢獻(xiàn)率分析:從波動趨勢平穩(wěn)隨L的變化,以及相應(yīng)的貢獻(xiàn)率下降。 圖3 觀察值和第一主成分及 SSA方法的主要特點(diǎn)是能夠很好地分離不同的組件。在大多數(shù)情況下,所占百分?jǐn)?shù)小的成分通常對應(yīng)噪聲成分,所以這些主成分都能正確地描述該系列的總趨勢。在不同的窗口長度下,重建這些主成分和原來的時間序列進(jìn)行對比,如圖4所示。 圖4 觀測值與擬合值 在圖4中,模擬的時間序列很好地擬合了原始時間序列,結(jié)果如表1所示。 表1 擬合序列各項(xiàng)參數(shù) 基于這些主要成分的時間序列分析中,LRF分別應(yīng)用到主成分的時間序列并對主成分進(jìn)行了預(yù)測,然后這些新的主成分形成了4年的降水預(yù)報(2009-2012)。圖5顯示了觀測值與預(yù)測值的對比分析。 圖5 降雨觀察和預(yù)測對比圖 圖5充分表明,此方法能夠很好地預(yù)測降水的變化隨著季節(jié)趨勢性的演化特征。為了評估并比較預(yù)測的性能,使用以下定量驗(yàn)證方法:根均方誤差(RMSE)、決定系數(shù)(R2)和平均絕對誤差(MAE)。統(tǒng)計驗(yàn)證對比結(jié)果如表2所示。 表2 預(yù)測結(jié)果對比 從以上數(shù)據(jù)和驗(yàn)證的標(biāo)準(zhǔn)可發(fā)現(xiàn),窗口長度L=81的預(yù)測,表現(xiàn)出更好的性能。 3.結(jié)語 以上應(yīng)用SSA和LRF方法對降水時間序列進(jìn)行了預(yù)測。降水時間序列的周期譜分析表明,一些可能的固有周期可作為可選的窗口長度,并且這些主要成分很好地擬合了原始時間序列。圖形的對比和預(yù)測結(jié)果的比較表明,窗口的長度L=81的預(yù)測為最好的參數(shù)選擇。結(jié)果表明在SSA應(yīng)用中,周期譜分析法能夠很好地選擇窗口長度,并進(jìn)行復(fù)雜的時間序列預(yù)測。