劉伯奇 祝從文
(中國(guó)氣象科學(xué)研究院, 北京 100081)
目前,數(shù)值模式已從單獨(dú)大氣環(huán)流模式發(fā)展成為海-陸-氣-冰耦合的氣候系統(tǒng)模式,基于模式產(chǎn)品的動(dòng)力預(yù)測(cè)逐漸成為提高汛期降水季節(jié)預(yù)測(cè)能力的重要手段。盡管動(dòng)力模式對(duì)熱帶大氣環(huán)流和氣溫降水的預(yù)測(cè)技巧大幅提高,但由于模式尚無(wú)法完全準(zhǔn)確模擬ENSO演變及其遙相關(guān)和海-陸-氣相互作用[39],因此模式對(duì)熱帶外地區(qū),尤其是對(duì)我國(guó)夏季汛期降水的預(yù)測(cè)技巧仍十分有限[40]。考慮到動(dòng)力預(yù)測(cè)能力的不足,基于大氣外強(qiáng)迫影響東亞夏季風(fēng)的機(jī)理研究,很多學(xué)者從不同角度建立了我國(guó)夏季汛期降水異常的統(tǒng)計(jì)預(yù)測(cè)模型。這些模型有的基于ENSO對(duì)副高的調(diào)控[41],有的基于黑潮延伸體海溫異常的氣候效應(yīng)[42],有的基于北大西洋NAO的下游影響[43],有的基于歐亞大陸積雪[44]或土壤濕度[45],有的則基于上述多種因子[46]。
本文預(yù)測(cè)對(duì)象是中國(guó)160站夏季(6—8月)平均降水異常,參考?xì)夂驊B(tài)為1981—2010年平均。大氣環(huán)流的異常演變包含對(duì)下墊面強(qiáng)迫響應(yīng)的重要信息,是大氣外強(qiáng)迫因子與預(yù)測(cè)對(duì)象之間的重要橋梁。為兼顧熱帶和熱帶外地區(qū)對(duì)流和環(huán)流對(duì)外強(qiáng)迫響應(yīng)的差異性,本文選取的預(yù)測(cè)因子包括低緯度地區(qū)(30°S~30°N)美國(guó)CPC的CMAP(Climate Prediction Center Merged Analysis of Precipitation)逐月降水[50]和南半球、北半球中高緯度地區(qū)(30°S以南和30°N以北)日本JRA-55再分析產(chǎn)品的逐月200 hPa位勢(shì)高度場(chǎng)[51]。預(yù)測(cè)對(duì)象和預(yù)測(cè)因子的研究時(shí)段均為1981—2019年,從前期秋季(9—11月)開(kāi)始至前期冬季(12月—次年2月)結(jié)束,針對(duì)預(yù)測(cè)因子進(jìn)行3個(gè)月滑動(dòng)平均,分別從前期4個(gè)不同階段(9—11月、10—12月、11月—次年1月、12月—次年2月)對(duì)夏季降水預(yù)測(cè)。
假設(shè)有N年降水異常資料Y,預(yù)測(cè)當(dāng)年為第i年,其降水異常場(chǎng)為Yi,首先用剔除預(yù)測(cè)當(dāng)年信息的N-1年資料進(jìn)行EOF展開(kāi),得到m個(gè)EOF主模態(tài)(Vk,i,1≤k≤m),再將第i年的觀測(cè)資料投影到這些主模態(tài)上,獲得第i年的多元回歸系數(shù)(R1,i,R2,i,R3,i,…,Rm,i),則Yi可以展開(kāi)為
(1)
其中,Rk,i表示Yi對(duì)第k個(gè)EOF主模態(tài)(Vk,i)的回歸系數(shù)(即預(yù)測(cè)對(duì)象)。與傳統(tǒng)的EOF分析相比,本方法中逐年的EOF模態(tài)(Vk,i)相對(duì)獨(dú)立,雖然Vk,i會(huì)隨預(yù)測(cè)年份變化,但由于本方法針對(duì)每個(gè)預(yù)測(cè)年獨(dú)立計(jì)算其多元回歸系數(shù)Rk,i,因此無(wú)論Vk,i如何變化,Yi總能通過(guò)Rk,i和Vk,i正確地重構(gòu)。本方法將EOF模態(tài)視為時(shí)變函數(shù),并使Rk,i隨之逐年調(diào)整,可避免將預(yù)測(cè)當(dāng)年信息通過(guò)主成分帶入交叉檢驗(yàn)的回報(bào)模型中。
包含預(yù)測(cè)年信息時(shí),取前4個(gè)EOF主模態(tài)和主成分能夠較全面刻畫(huà)我國(guó)夏季汛期降水異常的整體時(shí)空變化特征[52]。剔除預(yù)測(cè)年信息時(shí),則需要更多模態(tài)和多元回歸系數(shù)方能反映我國(guó)夏季汛期降水異常的年際變化。分析發(fā)現(xiàn),隨著模態(tài)數(shù)的增加,重構(gòu)場(chǎng)和觀測(cè)場(chǎng)的空間相關(guān)系數(shù)逐漸升高,同時(shí)兩者的空間方差比(重構(gòu)場(chǎng)的空間方差除以觀測(cè)場(chǎng)的空間方差)也逐漸加大(圖1)。在該過(guò)程中,空間相關(guān)系數(shù)和空間方差比的增幅隨模態(tài)為2個(gè)增至12個(gè)的過(guò)程中迅速加大,隨后逐漸減小。這種非線性增幅說(shuō)明,截取前12個(gè)EOF模態(tài)和多元回歸系數(shù)(R1,R2,R3,…,R12)不會(huì)對(duì)預(yù)報(bào)模型和預(yù)報(bào)結(jié)果造成不穩(wěn)定影響?;谇?2個(gè)EOF模態(tài)和多元回歸系數(shù)的重構(gòu)場(chǎng)能很好地重現(xiàn)我國(guó)東部黃河以南地區(qū)夏季汛期降水異常的年際波動(dòng)(圖2),重構(gòu)場(chǎng)和觀測(cè)場(chǎng)的平均空間相關(guān)系數(shù)為0.601,其年際變化范圍為0.35~0.85(圖3)。值得注意的是,基于交叉檢驗(yàn)和空間投影的EOF主模態(tài)和多元回歸系數(shù)重構(gòu)場(chǎng)對(duì)我國(guó)華北—東北和西部地區(qū)夏季汛期降水年際變率的刻畫(huà)能力較弱,這是因?yàn)樯鲜龅貐^(qū)夏季降水以短時(shí)強(qiáng)降水過(guò)程為主,故在季節(jié)平均降水異常場(chǎng)上信號(hào)較弱,當(dāng)采用空間投影法獲取多元回歸系數(shù)時(shí),很可能無(wú)法準(zhǔn)確捕獲這些地區(qū)的夏季降水異常。這與我國(guó)西部和北方夏季降水的季節(jié)可預(yù)報(bào)性低于東部和南方的傳統(tǒng)認(rèn)知相符。此外,重構(gòu)場(chǎng)和觀測(cè)場(chǎng)相比空間方差較小(圖1),這與EOF分析方法的空間平滑特性有關(guān),也說(shuō)明有必要對(duì)預(yù)測(cè)結(jié)果進(jìn)行合理的方差訂正。
圖1 基于1981—2019年EOF主模態(tài)和多元回歸系數(shù)重構(gòu)降水異常場(chǎng)和觀測(cè)降水異常場(chǎng)(參考態(tài))的泰勒?qǐng)D(不同顏色的點(diǎn)表示基于不同數(shù)量EOF主模態(tài)和多元回歸系數(shù)的重構(gòu)結(jié)果)Fig.1 Taylor diagram of the reconstructed rainfall anomaly field based on EOF modes and multiple regression coefficients referring to the observation during 1981-2019(dots in different colors denote reconstructed results using different numbers of EOF modes and principle components)
圖2 基于1981—2019年前12個(gè)EOF主模態(tài)和多元回歸系數(shù)重構(gòu)的降水異常場(chǎng)與觀測(cè)逐站降水異常序列時(shí)間相關(guān)系數(shù)空間分布(斜線和打點(diǎn)區(qū)分別表示達(dá)到0.05和0.01顯著性水平)Fig.2 Correlation coefficient of reconstructed rainfall anomaly using the first 12 EOF modes and multiple regression coefficients to observed rainfall anomaly at each station during 1981-2019(areas with significance exceeding 0.05 and 0.01 levels are slashed and stippled,respectively)
圖3 基于1981—2019年前12個(gè)EOF主模態(tài)和多元回歸系數(shù)重構(gòu)的降水異常場(chǎng)與觀測(cè)降水異常場(chǎng)空間相關(guān)系數(shù)逐年時(shí)間序列Fig.3 Anomaly correlation coefficient of reconstructed rainfall anomaly using the first 12 EOF modes and multiple regression coefficients to observed rainfall anomaly during 1981-2019
通過(guò)EOF分析,將預(yù)測(cè)對(duì)象轉(zhuǎn)換為12個(gè)多元回歸系數(shù)序列,將預(yù)測(cè)的多元回歸系數(shù)和剔除預(yù)測(cè)當(dāng)年信息的EOF空間模態(tài)進(jìn)行重構(gòu),即可得到預(yù)測(cè)當(dāng)年降水場(chǎng)。因此,如何準(zhǔn)確預(yù)測(cè)每一個(gè)回歸系數(shù)成為關(guān)鍵問(wèn)題。本章將結(jié)合降水場(chǎng)多元回歸系數(shù)的預(yù)測(cè)問(wèn)題,介紹搜索預(yù)測(cè)因子潛在預(yù)測(cè)技巧的方案和客觀自動(dòng)選擇預(yù)測(cè)因子的思路。
傳統(tǒng)的經(jīng)驗(yàn)統(tǒng)計(jì)預(yù)測(cè)往往采用相關(guān)系數(shù)分布或SVD分析方法確定預(yù)測(cè)模型,但這與實(shí)際的氣候預(yù)測(cè)存在較大差異。首先,相關(guān)系數(shù)反映的預(yù)測(cè)因子是預(yù)測(cè)對(duì)象的必要條件,而實(shí)際預(yù)測(cè)卻需要尋找預(yù)測(cè)對(duì)象的充分條件;其次,相關(guān)系數(shù)易受極端氣候事件的影響,且預(yù)測(cè)對(duì)象和預(yù)測(cè)因子之間的相關(guān)性還易受氣候變化和年代際變率等緩變過(guò)程影響。因此,基于相關(guān)分析得到的預(yù)測(cè)因子隨時(shí)間變化不穩(wěn)定,直接導(dǎo)致預(yù)測(cè)模型的預(yù)測(cè)技巧不穩(wěn)定,表現(xiàn)出強(qiáng)烈的年際和年代際波動(dòng)。因此,基于交叉檢驗(yàn)和最小二乘法線性擬合設(shè)計(jì)預(yù)測(cè)因子的潛在技巧分布圖。
具體計(jì)算步驟如下:假設(shè)預(yù)測(cè)對(duì)象多元回歸系數(shù)R(m,N)和預(yù)測(cè)因子場(chǎng)X(x,y,N)的總樣本量為N,預(yù)測(cè)當(dāng)年為第i年,其中m表示多元回歸系數(shù)個(gè)數(shù),x和y分別表示預(yù)測(cè)因子場(chǎng)的經(jīng)向和緯向格點(diǎn)數(shù),那么,①?gòu)腞(m,N)和X(x,y,N)中剔除掉第i-1,i和i+1的數(shù)據(jù),形成訓(xùn)練數(shù)據(jù)集。連續(xù)剔除預(yù)測(cè)當(dāng)年及其相鄰兩年的數(shù)據(jù)是為了在年際尺度上完全去除預(yù)測(cè)當(dāng)年信息,以盡量減小過(guò)度擬合的影響。該方法被廣泛應(yīng)用于季節(jié)預(yù)測(cè)回報(bào)試驗(yàn)的交叉檢驗(yàn)中[53-55]。②基于訓(xùn)練數(shù)據(jù)集,利用最小二乘法擬合,建立預(yù)測(cè)因子場(chǎng)X(x,y,N)每個(gè)格點(diǎn)數(shù)據(jù)序列和預(yù)測(cè)對(duì)象的線性函數(shù)關(guān)系,得到回歸參數(shù)K和截距B;再將第i年的前1年秋季至冬季的預(yù)測(cè)因子格點(diǎn)數(shù)據(jù)代入以上函數(shù)關(guān)系,得到第i年夏季降水場(chǎng)回歸系數(shù)的預(yù)測(cè)值;遍歷X的所有格點(diǎn)(x,y),得到基于不同格點(diǎn)數(shù)據(jù)的第i年預(yù)測(cè)回歸系數(shù)場(chǎng)。③將預(yù)測(cè)年i循環(huán)N次,得到N年基于預(yù)測(cè)因子場(chǎng)X每個(gè)格點(diǎn)數(shù)據(jù)序列的預(yù)測(cè)回歸系數(shù)場(chǎng);再計(jì)算觀測(cè)回歸系數(shù)序列與預(yù)測(cè)回歸系數(shù)場(chǎng)的相關(guān)系數(shù),將其中具有顯著相關(guān)性的格點(diǎn)視為存在潛在預(yù)測(cè)技巧,故將預(yù)測(cè)回歸系數(shù)場(chǎng)和觀測(cè)回歸系數(shù)序列之間的相關(guān)系數(shù)場(chǎng)定義為潛在技巧分布圖(potential skill map,簡(jiǎn)稱(chēng)PSM)。
與傳統(tǒng)相關(guān)分析相比,PSM采用實(shí)際統(tǒng)計(jì)預(yù)測(cè)建模的計(jì)算流程,能夠準(zhǔn)確提取預(yù)測(cè)對(duì)象的充分條件,同時(shí)由于采用交叉檢驗(yàn)思路,其結(jié)果可消除極端氣候事件影響,因此得到的統(tǒng)計(jì)關(guān)系具有更好的時(shí)間穩(wěn)定性。需要說(shuō)明的是,在使用PSM時(shí),需要人為確定總樣本N的分析時(shí)段。本文采用的分析時(shí)段是1999—2019年,這是因?yàn)闅夂蛳到y(tǒng)自然變率在20世紀(jì)90年代末期發(fā)生了顯著的年代際調(diào)整,表現(xiàn)為北大西洋多年代振蕩(AMO)[56]和太平洋年代際振蕩(PDO)相繼發(fā)生位相轉(zhuǎn)換[57],受其影響,東亞夏季風(fēng)的影響因子發(fā)生明顯改變,這說(shuō)明對(duì)統(tǒng)計(jì)預(yù)測(cè)而言,數(shù)據(jù)長(zhǎng)度并非越長(zhǎng)越好,應(yīng)根據(jù)氣候變化的觀測(cè)事實(shí)挑選合理的訓(xùn)練期。
以R2為例,圖4和圖5展示傳統(tǒng)相關(guān)系數(shù)分布圖和PSM的區(qū)別。以R2為例,是因?yàn)樗那罢仔盘?hào)范圍相對(duì)較廣,更容易體現(xiàn)二者差別。事實(shí)上,其他回歸系數(shù)也有類(lèi)似的差別(圖略)。雖然與R2顯著相關(guān)的低緯度對(duì)流出現(xiàn)在前期秋季、冬季的熱帶西南印度洋(圖4),但PSM顯示,上述低緯度對(duì)流對(duì)R2并無(wú)潛在預(yù)測(cè)技巧(圖5)。同時(shí),前期秋季、冬季與R2顯著相關(guān)的中高緯度環(huán)流異常位于歐亞大陸、北美大陸和南極大陸上空(圖4),這些中高緯度環(huán)流信號(hào)在PSM上也顯示出對(duì)R2的顯著預(yù)測(cè)技巧(圖5)。在當(dāng)年春季和夏季,與R2顯著相關(guān)的大范圍低緯度對(duì)流位于熱帶東太平洋(圖4),但它們?cè)赑SM上卻并不明顯(圖5)。夏季同期具有潛在技巧的預(yù)測(cè)因子則是歐洲北部的高空環(huán)流(圖4和圖5)。同期預(yù)測(cè)因子為建立動(dòng)力-統(tǒng)計(jì)相結(jié)合預(yù)測(cè)模型提供基礎(chǔ)。盡管動(dòng)力模式對(duì)中國(guó)夏季降水異常的直接預(yù)測(cè)技巧偏低,但其對(duì)低緯度降水和中高緯度高空環(huán)流卻具有較好預(yù)測(cè)技巧。由于同期預(yù)測(cè)因子影響預(yù)測(cè)對(duì)象的物理過(guò)程更直接、不確定性更小,因此,可應(yīng)用具有動(dòng)力預(yù)測(cè)技巧的夏季熱帶外高空環(huán)流與觀測(cè)多元回歸系數(shù)的PSM,提高動(dòng)力模式對(duì)中國(guó)夏季降水異常的預(yù)測(cè)技巧。以上對(duì)比說(shuō)明,PSM比傳統(tǒng)相關(guān)系數(shù)分布圖更加嚴(yán)格,具有潛在技巧的前兆信號(hào)一定和預(yù)測(cè)因子具有顯著相關(guān),但和預(yù)測(cè)因子顯著相關(guān)的前兆信號(hào)卻未必具有潛在預(yù)測(cè)技巧。
圖4 1999—2019年R2與不同季節(jié)預(yù)測(cè)因子的相關(guān)分布(打點(diǎn)區(qū)表示達(dá)到0.05顯著水平,預(yù)測(cè)因子包括30°S~30°N地區(qū)降水和南半球、北半球中高緯度地區(qū)200 hPa位勢(shì)高度場(chǎng))Fig.4 Spatial distribution of temporal correlation coefficient between the second regression coefficient(R2) and the predictors in different seasons during 1999-2019 (the stippled denotes passing the test of 0.05 level, predictors include the rainfall in30°S-30°N and 200 hPa geopotential height in the mid-high latitude)
圖5 1999—2019年不同季節(jié)預(yù)測(cè)因子對(duì)R2的潛在技巧分布圖(打點(diǎn)區(qū)表示達(dá)到0.05顯著性水平,預(yù)測(cè)因子包含30°S~30°N地區(qū)降水和南半球、北半球中高緯度地區(qū)200 hPa位勢(shì)高度場(chǎng))Fig.5 Potential skill map of the second regression coefficient(R2) referring to the predictors in different seasons during 1999-2019(the stippled denotes passing the test of 0.05 level, predictors include rainfall in30°S-30°N and 200 hPa geopotential height in the mid-high latitude)
盡管PSM能過(guò)濾掉和預(yù)測(cè)對(duì)象顯著相關(guān)卻沒(méi)有預(yù)測(cè)技巧的前兆信號(hào),但仍需從中確定每年的關(guān)鍵預(yù)測(cè)因子,以便準(zhǔn)確開(kāi)展統(tǒng)計(jì)預(yù)測(cè)。傳統(tǒng)的統(tǒng)計(jì)預(yù)測(cè)中,挑選關(guān)鍵因子依賴于預(yù)報(bào)員或科研人員的經(jīng)驗(yàn),具有很強(qiáng)的主觀性。為克服這一不足,在PSM的基礎(chǔ)上,借鑒集合預(yù)報(bào)思想,設(shè)計(jì)預(yù)測(cè)因子自動(dòng)選擇器,其計(jì)算方法分為兩步:①?gòu)木哂袧撛陬A(yù)測(cè)技巧的預(yù)測(cè)因子格點(diǎn)中,挑選出預(yù)測(cè)和觀測(cè)回歸系數(shù)符號(hào)一致率達(dá)到一定閾值的格點(diǎn),進(jìn)入預(yù)測(cè)因子自動(dòng)選擇器。對(duì)1999—2019年共21年數(shù)據(jù),選擇的符號(hào)一致率樣本量閾值為17,即21年的預(yù)測(cè)中,有17年預(yù)測(cè)結(jié)果和觀測(cè)值同號(hào)。②將達(dá)到符號(hào)一致率閾值的所有預(yù)測(cè)回歸系數(shù)值的中位數(shù)定義為回歸系數(shù)的預(yù)測(cè)值。因此,在最終建模時(shí),僅基于單一格點(diǎn)上的預(yù)測(cè)因子給出回歸系數(shù)的預(yù)測(cè)值,這樣可有效地避免多因子建模時(shí)的過(guò)度擬合問(wèn)題。
預(yù)測(cè)因子自動(dòng)選擇器的優(yōu)點(diǎn)之一是完全客觀化,挑選的預(yù)測(cè)因子不會(huì)因人而異;它的另一優(yōu)點(diǎn)是能針對(duì)不同年份挑選出不同預(yù)測(cè)因子,更符合實(shí)際情況。熱度圖能夠反映這些多元回歸系數(shù)的關(guān)鍵因子,且不同回歸系數(shù)的關(guān)鍵因子存在明顯年際差異(圖6)。每幅熱度圖上都有21個(gè)點(diǎn),對(duì)應(yīng)為在21年的回報(bào)試驗(yàn)中,每個(gè)回歸系數(shù)逐年不同的關(guān)鍵因子,若某些區(qū)域內(nèi)點(diǎn)的聚集程度越高,則表示這些區(qū)域內(nèi)的預(yù)測(cè)因子在回報(bào)試驗(yàn)中所起作用越大。以前4個(gè)多元回歸系數(shù)為例,R1的關(guān)鍵因子主要集中在10—12月熱帶西太平洋暖池對(duì)流和12月—次年1月南太平洋的高空環(huán)流R2的關(guān)鍵因子則更多地分布在前期秋季、冬季南半球中高緯度高空環(huán)流中,對(duì)R3而言,前期秋季、冬季的大西洋低緯度對(duì)流成為大多數(shù)年份的關(guān)鍵因子,而R4關(guān)鍵因子的空間分布則較為分散,說(shuō)明其預(yù)測(cè)難度相對(duì)較大。對(duì)其余多元回歸系數(shù)而言,R5和R7的關(guān)鍵因子主要是前期秋季和初冬歐亞大陸上空的高空環(huán)流,R9和R10的關(guān)鍵因子主要是11月—次年1月和12月—次年2月南極洲上空的高空環(huán)流,R12的關(guān)鍵因子則包括前年10—12月北太平洋低緯度對(duì)流和12月—次年1月南太平洋高空環(huán)流,而R8和R11關(guān)鍵因子的空間分布較分散(圖略)。
預(yù)測(cè)因子自動(dòng)選擇器挑選的關(guān)鍵因子對(duì)預(yù)測(cè)對(duì)象的影響應(yīng)具有較清晰的物理過(guò)程。需要指出的是,預(yù)測(cè)對(duì)象和預(yù)測(cè)因子之間時(shí)空尺度的一致性是考察預(yù)測(cè)模型物理屬性的重要前提。本方法將大范圍的預(yù)測(cè)對(duì)象和小范圍的預(yù)測(cè)因子建立統(tǒng)計(jì)關(guān)系,后者對(duì)前者的影響可能有兩種途徑:①直接影響,即小范圍預(yù)測(cè)因子通過(guò)某種“升尺度”物理過(guò)程直接影響中國(guó)大范圍汛期降水異常型。以R1的關(guān)鍵影響因子為例,10—12月熱帶西太平洋暖池對(duì)流反映前冬ENSO事件通過(guò)暖池區(qū)熱帶對(duì)流影響我國(guó)南方地區(qū)夏季降水異常的過(guò)程,在這一過(guò)程中,海-氣相互作用和熱帶-熱帶外遙相關(guān)型將西太平洋暖池的局地對(duì)流異常信號(hào)和影響整個(gè)東亞地區(qū)的東亞—太平洋遙相關(guān)波列相聯(lián)系。②間接影響,即小范圍預(yù)測(cè)因子代表某種大尺度信號(hào)的統(tǒng)計(jì)投影,在這種情況下,需要分析預(yù)測(cè)因子對(duì)應(yīng)的大尺度信號(hào),并進(jìn)一步分析其影響東亞夏季降水異常的物理過(guò)程。圖6揭示的某些關(guān)鍵因子尚無(wú)明確的機(jī)理解釋?zhuān)@說(shuō)明對(duì)東亞夏季風(fēng)和我國(guó)夏季汛期降水年際變率的理解尚不全面。因此,潛在技巧圖也為深入研究東亞夏季風(fēng)年際變率機(jī)理提供新的切入點(diǎn)。
圖6 預(yù)測(cè)因子自動(dòng)選擇器提取的1999—2019年前4個(gè)多元回歸系數(shù)的預(yù)測(cè)因子熱度圖(預(yù)測(cè)因子包含30°S~30°N地區(qū)降水和南半球、北半球中高緯度地區(qū)200 hPa位勢(shì)高度場(chǎng))Fig.6 Heat map of predictors of the first 4 multiple regression coefficients during 1999-2019 obtained by the predictor automatic selection scheme(predictors include the rainfall in 30°S-30°N and 200 hPa geopotential height in the mid-high latitude)
PSM和預(yù)測(cè)因子自動(dòng)選擇器可產(chǎn)生逐年降水場(chǎng)多元回歸系數(shù)的歷史回報(bào)值及其預(yù)測(cè)技巧。初篩后的每個(gè)預(yù)測(cè)因子均產(chǎn)生1個(gè)回歸系數(shù)預(yù)測(cè)值,對(duì)應(yīng)圖7的陰影區(qū)。以前4個(gè)多元回歸系數(shù)為例,通過(guò)預(yù)測(cè)因子自動(dòng)選擇器第1步初篩的預(yù)測(cè)因子個(gè)數(shù)依次為115,312,157和410。回報(bào)的多元回歸系數(shù)值基本覆蓋觀測(cè)回歸系數(shù)的變化范圍,說(shuō)明自動(dòng)挑選的因子能反映回歸系數(shù)變化的多樣性。多元回歸系數(shù)預(yù)測(cè)值的中位數(shù)集合就是各年回報(bào)的回歸系數(shù),對(duì)應(yīng)圖7的紅線,且每個(gè)回歸系數(shù)回報(bào)所用的預(yù)測(cè)因子具有明顯年際差異(圖6)。同時(shí),前4個(gè)多元回歸系數(shù)回報(bào)結(jié)果和觀測(cè)的相關(guān)系數(shù)依次為0.70,0.57,0.82和0.87,均達(dá)到0.01的顯著性水平。對(duì)第5至第12個(gè)多元回歸系數(shù)而言,回報(bào)結(jié)果和觀測(cè)數(shù)據(jù)的相關(guān)系數(shù)依次為0.8,0.7,0.74,0.85,0.47,0.59,0.8和0.76,均達(dá)到0.01顯著性水平(圖略)。以上結(jié)果說(shuō)明該方法對(duì)多元回歸系數(shù)具有顯著回報(bào)技巧。
圖7 1999—2019年前4個(gè)多元回歸系數(shù)的回報(bào)檢驗(yàn)(陰影區(qū)表示回歸系數(shù)范圍)Fig.7 Reforecast test of the first 4 multiple regression coefficients during 1999-2019(the shaded denotes range of regression coefficients)
基于每年預(yù)測(cè)的多元回歸系數(shù)和剔除該年信息的EOF主模態(tài),能重構(gòu)出預(yù)測(cè)年夏季汛期降水異常值,通過(guò)和觀測(cè)降水異常值對(duì)比反映該方法的整體預(yù)測(cè)技巧。當(dāng)采用前12個(gè)多元回歸系數(shù)和EOF模態(tài)進(jìn)行回報(bào)時(shí),該預(yù)測(cè)模型對(duì)我國(guó)東部大部分地區(qū)的夏季汛期降水異常具有較高的季節(jié)預(yù)測(cè)技巧(提前3個(gè)月,基于前期秋季至冬季的預(yù)測(cè)因子),大值中心位于長(zhǎng)江流域、黃河流域和珠江流域等人口密集區(qū)(圖8),這與預(yù)測(cè)技巧上限(圖2)的分布特征一致。同時(shí),該模型對(duì)我國(guó)華北—東北地區(qū)和西部地區(qū)夏季降水的季節(jié)預(yù)測(cè)能力相對(duì)較弱。從降水型的整體分布看,該模型預(yù)測(cè)的我國(guó)夏季汛期降水異常場(chǎng)和觀測(cè)結(jié)果的符號(hào)一致率變化范圍為40%~70%,平均符號(hào)一致率達(dá)到60%(圖9a),兩者空間相關(guān)系數(shù)的變化范圍為0.25~0.65,平均空間相關(guān)系數(shù)為0.436(圖9b),均遠(yuǎn)高于現(xiàn)有主流的氣候模式動(dòng)力預(yù)測(cè)技巧(空間相關(guān)系數(shù)小于0.1)[40,46,58]。當(dāng)采用前12個(gè)多元回歸系數(shù)和EOF空間模態(tài)進(jìn)行回報(bào)試驗(yàn)時(shí),回報(bào)結(jié)果和觀測(cè)的符號(hào)一致率及空間相關(guān)系數(shù)的年際波動(dòng)相對(duì)較小,說(shuō)明該模型的預(yù)測(cè)技巧具有良好的時(shí)間平穩(wěn)性。
需要指出的是,多元回歸系數(shù)的物理含義是降水場(chǎng)在由某組EOF向量作為基底所支撐的相空間中各個(gè)分量軸上的投影,因此,需要考慮EOF模態(tài)作為相空間基底的時(shí)間穩(wěn)定性對(duì)預(yù)測(cè)性能的影響。為定量分析這種影響,可分別取不同的多元回歸系數(shù)和EOF模態(tài)(m=1, 2, 3, …, 12)進(jìn)行回報(bào)檢驗(yàn)(圖9b和圖10)。結(jié)果表明:除了2001年,其余年份回報(bào)結(jié)果相對(duì)于觀測(cè)降水的空間相關(guān)系數(shù)均隨著模態(tài)數(shù)的增加而增大(圖9b)。多年平均結(jié)果也證明,高階模態(tài)的引入能夠進(jìn)一步提高回報(bào)技巧(圖10)。這說(shuō)明本文中的高階模態(tài)仍具有潛在的物理意義,它們通過(guò)增加回報(bào)結(jié)果的多樣性提高預(yù)測(cè)技巧。此外,空間相關(guān)系數(shù)隨m值的增長(zhǎng)并非線性,在m為1~4階段,空間相關(guān)系數(shù)增長(zhǎng)最快,隨后增長(zhǎng)變緩,這說(shuō)明前4個(gè)多元回歸系數(shù)和主模態(tài)對(duì)降水的整體分布起決定性作用,這與龐軼舒等[52]的結(jié)果一致。若基于PSM中具有顯著技巧的某一區(qū)域大范圍平均的前兆信號(hào)進(jìn)行我國(guó)夏季降水異常的回報(bào)試驗(yàn),回報(bào)效果(1999—2019年平均空間相關(guān)系數(shù)為0.15~0.23,依賴于選取的預(yù)測(cè)因子)遠(yuǎn)低于自動(dòng)因子選擇器,這說(shuō)明變因子預(yù)測(cè)更符合實(shí)際情況,即每年影響我國(guó)夏季降水異常的關(guān)鍵因子可能不同。
圖8 采用前12個(gè)多元回歸系數(shù)和EOF模態(tài)的回報(bào)與觀測(cè)降水站點(diǎn)相關(guān)系數(shù)空間分布(打點(diǎn)區(qū)表示達(dá)到0.1顯著性水平)Fig.8 Correlation coefficient of reforecast anomalous rainfall using the first 12 multiple regression coefficients and EOF modes to observed rainfall anomaly(the stippled denotes passing the test of 0.1 level)
圖9 預(yù)測(cè)模型對(duì)1999—2019年中國(guó)夏季汛期平均降水異常的回報(bào)檢驗(yàn)(a)采用前12個(gè)多元回歸系數(shù)和EOF模態(tài)的回報(bào)結(jié)果相對(duì)于觀測(cè)的同號(hào)率,(b)基于不同多元回歸系數(shù)的回報(bào)結(jié)果相對(duì)于觀測(cè)降水異常的空間相關(guān)系數(shù)的逐年變化(m表示前1~12個(gè)多元回歸系數(shù)和EOF主模態(tài)的回報(bào)結(jié)果)Fig.9 Reforecast test of Chinese summer rainfall anomaly during 1999-2019 using new predicting method(a)the same sign rate between reforecast and observation using the first 12 multiple regression coefficients and EOF modes,(b)anomaly correlation coefficients between observation and reforecast based on different numbers of multiple regression coefficients(m,ranging from 1 to 12,indicates the reforecast generated by different numbers of multiple regression coefficients and EOF modes)
圖10 基于1999—2019年不同多元回歸系數(shù)的回報(bào)結(jié)果相對(duì)于觀測(cè)降水異常的空間相關(guān)系數(shù)多年平均值Fig.10 Mean value of anomaly correlation coefficients between observation and reforecast based on different numbers of multiple regression coefficients during 1999-2019
圖11是將歷史回報(bào)的降水異常轉(zhuǎn)換為降水距平百分率后,基于國(guó)家氣候中心預(yù)測(cè)技巧評(píng)分標(biāo)準(zhǔn)(PS評(píng)分)的回報(bào)技巧。結(jié)果表明:在回報(bào)時(shí)段內(nèi),該模型預(yù)測(cè)的我國(guó)夏季汛期降水距平百分率平均PS評(píng)分為71.00分,除2009年P(guān)S評(píng)分偏低以外,其余年份的PS評(píng)分均在70分左右,回報(bào)結(jié)果PS評(píng)分的時(shí)間平穩(wěn)性良好(圖11b)。如前文所述,該模型在采用EOF分析和統(tǒng)計(jì)建模的過(guò)程中,不可避免地使預(yù)測(cè)降水的方差衰減。為合理定義方差訂正系數(shù),需要首先計(jì)算預(yù)測(cè)結(jié)果PS評(píng)分對(duì)方差訂正系數(shù)A(線性放大倍數(shù))的響應(yīng)曲線(圖11a)。如圖11a所示,在A=5.5后,PS評(píng)分不再隨A的增大而增加,說(shuō)明A=5.5是適用于該模型的相對(duì)合理的方差訂正系數(shù)。訂正后(A=5.5),該模型回報(bào)結(jié)果的平均PS評(píng)分技巧從71.00分進(jìn)一步提升至82.10分,其變化范圍為70分~90分,展現(xiàn)出穩(wěn)定的高回報(bào)技巧(圖11b)。
圖11 回報(bào)降水距平百分率的PS評(píng)分對(duì)方差訂正系數(shù)的響應(yīng)函數(shù)(a)和方差訂正前后的PS評(píng)分(b)Fig.11 Response PS score curve of the reforecast percentage of rainfall anomaly to the variance correction parameter(a) and PS score before and after variance corrected(b)
由于傳統(tǒng)的相關(guān)分析和主觀挑選預(yù)測(cè)因子進(jìn)行季節(jié)預(yù)測(cè)存在較大不確定性,本文提出PSM和預(yù)測(cè)因子自動(dòng)選擇器,并基于二者建立我國(guó)夏季汛期降水異常的季節(jié)預(yù)測(cè)模型。該模型對(duì)我國(guó)夏季汛期降水異常具有穩(wěn)定的較好歷史回報(bào)技巧。具體結(jié)論如下:
1) PSM采用交叉檢驗(yàn)思路,能夠反映預(yù)測(cè)因子對(duì)預(yù)測(cè)對(duì)象的潛在預(yù)測(cè)技巧,且不受極端樣本影響。PSM完全基于實(shí)際的統(tǒng)計(jì)預(yù)測(cè)建模流程,在邏輯上體現(xiàn)尋找預(yù)測(cè)對(duì)象的充分條件的特點(diǎn),是對(duì)傳統(tǒng)相關(guān)系數(shù)分布圖(尋找必要條件)的重要補(bǔ)充。結(jié)合兩者結(jié)果,可揭示符合預(yù)測(cè)對(duì)象充要條件的預(yù)測(cè)因子。
2) 預(yù)測(cè)因子自動(dòng)選擇器借鑒集合預(yù)報(bào)思想,從PSM中挑選出具有最顯著潛在預(yù)測(cè)技巧的預(yù)測(cè)因子,再通過(guò)大量預(yù)測(cè)結(jié)果的集合產(chǎn)生最終預(yù)測(cè)產(chǎn)品,實(shí)現(xiàn)逐年自動(dòng)挑選預(yù)測(cè)因子的功能。該方案不僅克服了依賴于預(yù)報(bào)員主觀經(jīng)驗(yàn)選擇預(yù)測(cè)因子的不足,也為進(jìn)一步深入東亞夏季風(fēng)年際變率可預(yù)報(bào)性研究提供新切入點(diǎn)。
3) 基于PSM和預(yù)測(cè)因子自動(dòng)選擇器的統(tǒng)計(jì)預(yù)測(cè)模型對(duì)我國(guó)夏季汛期降水異常的回報(bào)技巧較高。在基于前期秋季、冬季預(yù)測(cè)因子的21年回報(bào)試驗(yàn)中,預(yù)測(cè)結(jié)果和觀測(cè)的平均符號(hào)一致率為60%,平均空間相關(guān)系數(shù)為0.436,平均PS評(píng)分為71.00分,經(jīng)方差訂正后,平均PS評(píng)分可達(dá)82.10分,遠(yuǎn)高于現(xiàn)有動(dòng)力模式的預(yù)測(cè)技巧。
目前,動(dòng)力模式直接輸出的降水預(yù)測(cè)技巧偏低,但其對(duì)東亞夏季風(fēng)主要環(huán)流系統(tǒng)(西北太平洋副熱帶高壓、東亞大槽、高空副熱帶西風(fēng)急流等)的預(yù)測(cè)技巧正在逐步提高。因此,通過(guò)統(tǒng)計(jì)方法利用動(dòng)力模式輸出的環(huán)流信息提高我國(guó)夏季汛期降水異常預(yù)測(cè)能力成為氣候預(yù)測(cè)研究的新熱點(diǎn),且已有一些動(dòng)力-統(tǒng)計(jì)相結(jié)合預(yù)測(cè)汛期降水異常的成功案例[59-61]。本文采用的預(yù)測(cè)因子既包含低緯度降水,也包含中高緯度高空環(huán)流,動(dòng)力模式對(duì)二者具有一定的預(yù)測(cè)能力,如何將本文提出的統(tǒng)計(jì)預(yù)測(cè)模型和動(dòng)力預(yù)測(cè)結(jié)果相結(jié)合,進(jìn)一步發(fā)展全新的動(dòng)力-統(tǒng)計(jì)相結(jié)合預(yù)測(cè)模型,將成為未來(lái)的工作重點(diǎn)。