阿斯姆古麗·阿納耶提,師慶東,劉 曼,唐存士,王安隆
(新疆維吾爾自治區(qū)綠洲生態(tài)重點實驗室,新疆大學 資源與環(huán)境科學學院,干旱生態(tài)環(huán)境研究所,新疆 烏魯木齊 830046)
遙感動態(tài)監(jiān)測土地利用、土地覆蓋和植被變化的具體方法多樣,圖像差值法是目前使用最多的土壤動態(tài)探測方法.這種方法多使用間斷的、非連續(xù)的遙感數(shù)據(jù),計算結果容易受到偶然因素的影響.當有一組長期的連續(xù)隨時間變化的數(shù)據(jù)時,以上的方法也不便于充分利用序列數(shù)據(jù).對于連續(xù)隨時間而產(chǎn)生遙感數(shù)據(jù),經(jīng)幾何校正后在各幅圖中同一個確定位置的像元點上,都將產(chǎn)生一組隨時間變化的點數(shù)據(jù)序列,這一組數(shù)據(jù)實際上反映出該點的植被變化過程,描述出這些點的變化過程以及通過變化過程預測今后的發(fā)展趨勢以及區(qū)域的發(fā)展趨勢,具有重要的現(xiàn)實意義.由于地理環(huán)境的區(qū)域分異規(guī)律和各種自然、人文因素的影響,不同的地區(qū)表現(xiàn)出不同的變化特征,對于一個遙感時間序列情況的復雜度使得無法對每一個像元建立精確的模型,一般情況下一幅遙感數(shù)據(jù)將包含成千上萬個像素點,對于這些點的時間變化序列可能包含多種變化模式,若想將每一個像元的時間序列進行準確分析在目前情況下是困難的和不經(jīng)濟的.但是,退而求其次,若能從時序中發(fā)現(xiàn)內(nèi)在的演化宏觀區(qū)域趨勢,能夠判斷出它在未來某一時刻的大致范圍也有很重要的價值.
因此需要一種相對簡化的模型進行分析,模型的簡明便于人們的理解,如果模式的結構越復雜,它就越難于被解釋,而簡明的數(shù)學表達形式對進行數(shù)學分析與解釋處理也比較方便.
當回歸分析中的自變量是時間單位時,許多經(jīng)典的回歸理論都能用于時間序列的自回歸模型中[1~6],對此曼和沃爾德在1943年已經(jīng)作了證明,而線性函數(shù)也被認為是逼近真實現(xiàn)象、數(shù)學表達簡明的時間序列分析工具[7].
出于以上考慮,本文用年時間單位作為自變量,將每個像元的FVC值作為因變量,在GIS的支持下,利用線性回歸理論來分析和預測中國西部干旱區(qū)植被變化.
研究區(qū)北部界限從阿爾泰山脈,沿中蒙邊界至陰山西端,南部以昆侖山山脈為界,西起中國與中亞各國的邊界,東部則以賀蘭山為界(參見圖1).
圖1 研究區(qū)位置示意圖
圖2 中國西部干旱區(qū)1982~2000年FVC指數(shù)斜率分布
本次研究所使用的數(shù)據(jù)為FVC,由美國亞利桑那州立大學曾旭斌博士提供,該數(shù)據(jù)采用MVC方法提取[8].數(shù)據(jù)空間分辨率8 km,時間為1982~2000年每年FVC指數(shù)圖像,共19幅.
對8 km分辨率圖像分別做了幾何糾正,由于采用了統(tǒng)一的投影方式.通過ARCGIS將FVC影像轉為柵格(grid)文件并進行工作區(qū)切割,本次研究的絕大部分工作是在ARCGIS8.3軟件的支持下完成.
線性回歸分析是處理具有線性相關的兩個變量x與y之間關系的工具.首先要通過實驗得到這兩個變量的若干組數(shù)據(jù),然后建立他們的線性關系式.最后對其進行顯著性檢驗.
通過最小二乘法原理可以求得反映隨時間變化趨勢的斜率
通過對每一個像元點方程的擬合,計算出了每個點的斜率,斜率也反映了該點變化趨勢,斜率為正,表示該點的植被改善,斜率為負,表明該點的植被退化,圖2就是根據(jù)式(1)在ARCGIS中的AML語言支持下計算的1982~2000年植被斜率分布圖.
回歸是否顯著,必須經(jīng)過顯著性的檢驗,也就是說并不是所有的點都是可以滿足線性要求的,每一個點都要接受顯著性檢驗.對于線性回歸,可以使用相關系數(shù)法和方差分析方法進行顯著性檢驗,本次研究使用方差分析檢驗法.
已知
可以將因變量y的總離差平方和分解為兩部分,令
稱Q為殘差(剩余)平方和,稱U為回歸平方和,Q反映了隨機誤差,是觀測值與回歸值距離的平方和,Q值越小說明觀測值與回歸直線的距離越近,回歸效果越好,否則,則相反.
在假設H0,β1=0成立的條件下,統(tǒng)計量
服從第一自由度為1,第二自由度為n-2的F分布.在給定顯著水平α,可按方差分析的檢驗方法進行檢驗.當F>Fa(1,n?2)時,否定原假設,說明回歸方程是顯著的,即說明x與y有線性關系,則判定所建立的回歸方程是有意義的,當F≤Fa(1,n?2)時,接受原假設,說明回歸方程不顯著,即說明x與y無線性關系,則判定所建立的回歸方程無意義.
圖3是根據(jù)1982~2000年數(shù)據(jù)所建的回歸方程的F檢驗(深色為符合點、淺色為不符合點).其中第一自由度為1,第二自由度為17(19-1-1),顯著水平α=0.05,從圖3可以看出,準噶爾盆地中心、天山北坡綠州帶、塔里木河流域、葉爾羌河流域、喀什地區(qū)、和田地區(qū)、阿爾金山和祁連山北坡、阿拉善-柴達木盆地東側的地區(qū)整體區(qū)域上符合F檢驗,這些地區(qū)的變化與時間有很強的回歸關系,且這些點的分布與圖2有相近的分布.
從圖3中可以看出,1982~2000年這一段時間內(nèi),與時間變化有回歸關系的區(qū)域并不廣泛,也就是說,在這近20年的變化中,有一部分是與時間有相關性的,而另一部分是無法通過顯著性檢驗的.對無法通過顯著性檢驗的數(shù)據(jù)大體上可分為三種情況:一種是與時間序列變化有關系的植被變化,這種變化有正有負,主要根據(jù)斜率的正負決定,并可通過F檢驗;一種是植被穩(wěn)定區(qū),其斜率基本為0;最后一種是植被劇烈波動區(qū),其殘差太大,難以與時間變化做回歸分析.因此,在進行了回歸分析的F顯著性檢驗后,有必要對不符合F檢驗的地區(qū)進行斜率為0的樣本假設檢驗,符合假設的地區(qū)為植被穩(wěn)定區(qū).既不符合F檢驗又不符合斜率為0的假設檢驗的為植被非線性回歸波動區(qū).
對小樣本總體平均值的統(tǒng)計假設可用t分布來檢驗,該統(tǒng)計量計算式為
采用此方法筆者利用每個像元點的19個序列值采用式(5)計算,得到計算結果分布圖,又通過t分布數(shù)值表查得當自由度為18,置信度α=0.05的臨界值為2.10,對計算結果分布圖按2.101分類,小于2.101的區(qū)域為符合t假設檢驗的區(qū)域,為植被穩(wěn)定區(qū),否則為不穩(wěn)定區(qū).計算結果見圖4.
圖3 根據(jù)1982~2000年數(shù)據(jù)所建的回歸方程的F檢驗(深色為符合點,淺色為不符合點)
圖4 根據(jù)1982~2000年數(shù)據(jù)所建的回歸方程的斜率為0的t檢驗的分布(深色為符合點,淺色為不符合點)
1.通過對差值分析和回歸分析進行比較后認為,將具有時間序列的植被指數(shù)信息對時間進行回歸分析后,所得到的結果比簡單的差值分析的結果穩(wěn)定,而且回歸方程充分利用了所有的圖像信息,并且具有延伸預測的理論基礎.
2.通過對回歸方程的F檢驗和t檢驗結果(圖3和圖4)可以看出所得到的回歸方程,不服從F分布的地區(qū)基本上服從t分布.因此,可以使用F分布或t分布來分析植被的變化區(qū)和穩(wěn)定區(qū).筆者還對既不服從F分布又不服從t分布的區(qū)域作了分析,不服從這二者分布的區(qū)域有2 765個像元,占總像元數(shù)39 554的0.069 7,也就是說93%以上的單元或者服從t分布,或者服從F分布.因此對于中國西部干旱區(qū)的植被變化基本上可以分為兩種情況,植被基本穩(wěn)定區(qū)和植被穩(wěn)定變化區(qū),而植被變化區(qū)可以通過斜率法、圖像差值法、相關系數(shù)法等方法分為正向變化區(qū)和負向變化區(qū).