韓心婭+沈翀+沈婷婷+程宗毛
摘要:本文針對東海一點的9年海表溫度遙感數(shù)據(jù)集的序列(2003-2011)進行處理,首先通過SPSS初步檢驗出所處理的溫度數(shù)據(jù)滿足正態(tài)性。然后通過Mann-Kendall秩次相關(guān)檢驗研究了數(shù)據(jù)點溫度的趨勢性和突變性。通過周期存在性檢驗取定四個周期。用傅里葉函數(shù)描述周期成份,各自系數(shù)分別通過參數(shù)估計得到。對比測試數(shù)據(jù)的周期項和原始數(shù)據(jù)圖表得結(jié)果有效。該隨機序列的自相關(guān)是拖尾的,而偏相關(guān)是一階截尾的,故可建立AR(3)模型,分析得序列是白噪聲序列。
關(guān)鍵詞:海表溫度;Mann-Kendall方法;趨勢性;突變性;周期成分
1.引言:時間序列分析是概率統(tǒng)計學(xué)科中的一個分支,隨著基本理論的更加深入和完善,以及統(tǒng)計軟件技術(shù)的發(fā)展,使其在氣象水文等領(lǐng)域有了更加廣泛的應(yīng)用。海表溫度不僅是描述海洋表層熱狀況的重要指標(biāo),其異常情況還是海洋影響大氣環(huán)流、氣候變化的主要因子。所以海表溫度一直都是諸多學(xué)者觀察、研究和預(yù)測的重要研究對象。趨勢性、突變性和周期性是時間序列數(shù)據(jù)的基本特征, Mann-Kendall方法作為一種非參數(shù)統(tǒng)計檢驗方法,其優(yōu)點在于樣本不需遵從一定的分布,也不會受少數(shù)異常值的干擾,計算相對方便。近幾年被廣泛用于氣溫、降水量變化 、植被變化等自然界變化的趨勢分析中,考慮到海表溫度的變化規(guī)律也有相似的性質(zhì)。因此,本文選擇通過處理海表溫度使其可以顯示出正態(tài)性,而后引入該M-K方法測試數(shù)據(jù)在一定時間段內(nèi)是否異常,在此基礎(chǔ)上再進一步提取海表溫度集的周期成分,確立時間序列模型。
2.數(shù)據(jù)預(yù)處理
本文考慮建立合理的分析模型提取海洋表層溫度數(shù)據(jù)的趨勢性、周期性和突變性特征,通過誤差分析比較不同提取方法的優(yōu)缺點,為預(yù)測海表溫度未來的變化提供更加有效的依據(jù)。此外,將溫度數(shù)據(jù)集進行合理的區(qū)間劃分,使得每個區(qū)間內(nèi)的統(tǒng)計數(shù)據(jù)復(fù)合最優(yōu)的正態(tài)分布統(tǒng)計,并給出正態(tài)分布的檢驗方法、統(tǒng)計區(qū)間的上下節(jié)點及統(tǒng)計分布模型的相關(guān)參數(shù)。
本文采用了東海海表上2003年至2011年一研究點的溫度遙感數(shù)據(jù)集,從1開始編號,共計數(shù)據(jù)3287個。計一年為365天,這組數(shù)據(jù)記錄了9年里每一天的溫度,但是由于2004年和2008年是閏年,為減小不同年份的對比差異,將這兩年2月29日的溫度數(shù)據(jù)剔除。推算可得這兩個時間點的溫度數(shù)據(jù)對應(yīng)的序號分別為425和1886,剔除后數(shù)據(jù)長度變?yōu)?285。
幾乎所有的科研數(shù)據(jù)都必須滿足正態(tài)性才能進行分析,因此要對數(shù)據(jù)進行正態(tài)性檢驗,以保證后續(xù)分析的可靠性。本文利用SPSS對每個點每一年的溫度數(shù)據(jù)進行了直方圖和正態(tài)曲線繪制,具體將東海2003年的情況呈現(xiàn)如下:
觀察圖1可得數(shù)據(jù)呈正態(tài)分布。圖2給出了K-S檢驗的具體結(jié)果,由于概率p值為0.227,大于0.05,故不能拒絕K-S檢驗的原假設(shè),即數(shù)據(jù)滿足正態(tài)性。這為接下來的探討提供了一定的支持和幫助。
3.海表溫度基本特征分析
3.1 Mann-Kendall方法簡介。Mann-Kendall方法由于最初由H.B. Mann和M.G.Kendall提出原理并發(fā)展了該方法。當(dāng)時這一方法僅用于檢測序列的變化趨勢,后來經(jīng)他人進一步完善和改進,才形成目前的計算格式。該方法既可以檢測序列的變化趨勢,也可以進行突變點檢驗。
3.2 Mann-Kendall方法應(yīng)用
3.2.1 研究點海表溫度的日變化趨勢與突變情況。在對東海表溫度的數(shù)據(jù)的趨勢性和突變性信息進行提取時,本文主要采用M-K方法,通過matlab軟件編寫程序,我們得到下述結(jié)果:
①趨勢變化:
②突變情況:
③結(jié)果分析:一般而言M-K方法計算的趨勢符合正態(tài)分布,且Z= 4.381>1.96,則說明該點海表溫度的日變化趨勢有明顯上升趨勢。UFK和UBK在95%的信度線之間沒有交點,說明該點溫度在這段期間內(nèi)沒有突變。
3.2.2 研究點海表溫度的年變化趨勢與突變情況
①趨勢變化:
②突變情況:
③結(jié)果分析:Z statistic = 0.31277<1.96,說明該點溫度的年變化趨勢有上升但不明顯。UFK和UBK在95%的信度線之間有交點,且致在8-9年之間,說明該點海表溫度在第八年左右發(fā)生突變,且該點表溫度由下降趨勢轉(zhuǎn)為上升趨勢。
3.3 周期成分識別
3.3.1 周期顯著性判斷。首先我們用方差分析法判斷時間序列中是否存在顯著周期。在分析周期之前,事先并不知道這一序列的周期是多少,所以要根據(jù)序列長度,列出可能存在的周期。若時間序列總長度為n,則可能存在的周期為。將周期為T的時間序列進行分組,對應(yīng)可以分為組數(shù)據(jù),根據(jù)
可知第i組的平均值為:
上式中ni表示第i組內(nèi)的數(shù)據(jù)個數(shù)。
將時間序列分別按每一個可能的周期進行分組,計算相應(yīng)的組內(nèi)離差平方和SE及組間離差平方和SA:
上式中表示第i組的平均值,表示總平均值。
可以證明服從自由度為的F分布。給定顯著性水平,查分布表可以得到的值,如果,則此周期為顯著周期。由于與真實周期相鄰的值有可能通過顯著性檢驗,我們?nèi)∵B續(xù)通過F檢驗的T值中使F值最大的對應(yīng)T值作為主周期。用測試數(shù)據(jù)測試檢驗周期的存在和判定周期:
從圖5中可以看出當(dāng)t=52,103,154,206時F值最大,故我們?nèi)《ㄟ@四個周期。
3.3.2 周期提取。周期確定后, 周期成份Pt可用如下形式也即傅里葉函數(shù)描述:
上式中d表示有效諧波數(shù)即主周期的個數(shù),Ti表示第i個諧波對應(yīng)的周期,ai和bi為參數(shù),計算式為:
根據(jù)傅里葉函數(shù)求系數(shù)的公式,對其參數(shù)進行估計得到:
從而得出測試數(shù)據(jù)的周期項和原始數(shù)據(jù)的對比圖,從而計算得到隨機項圖,具體如下所示:
用Eviews對隨機項做ADF檢驗,檢驗結(jié)果如下表所示:
從上圖中可以看出,該隨機序列通過ADF檢驗,是一組平穩(wěn)序列。再對隨機序列進行相關(guān)分析,看其是否相關(guān),從而判定它是否是白噪聲。
從圖9可以看出,該隨機序列的自相關(guān)是拖尾的,而偏相關(guān)是一階截尾的,故可建立AR(3)模型,模型建立結(jié)果和殘差序列如下所示:
由圖11和圖12可知,該殘差序列在5%的置信區(qū)間內(nèi)平穩(wěn)且不相關(guān),故為白噪聲序列。
總結(jié):本文通過SPSS初步檢驗出所處理的溫度數(shù)據(jù)滿足正態(tài)性。繼而通過Mann-Kendall秩次相關(guān)檢驗發(fā)現(xiàn)東海表層溫度的年變化趨勢雖然在第八年有突變,海表溫度由下降趨勢轉(zhuǎn)為上升趨勢,但近9年整體無明顯變化的趨勢。而在日變化趨勢上則有明顯的上升趨勢。周期存在性檢驗中,t=52,103,154,206時F值最大,故我們?nèi)《ㄟ@四個周期。周期成份可用傅里葉函數(shù)來描述,4個周期下系數(shù)則可分別通過參數(shù)估計得到。測試數(shù)據(jù)的周期項和原始數(shù)據(jù)對比圖表明所得結(jié)果有效。該隨機序列的自相關(guān)是拖尾的,而偏相關(guān)是一階截尾的,故可建立AR(3)模型,分析得序列是白噪聲序列。