呂泓柯, 鞏遠發(fā), 王桂華
1. 成都信息工程大學大氣科學學院, 四川 成都 610225;
2. 湖南省人工影響天氣領導小組辦公室,湖南 長沙 410118;
3. 氣象防災減災湖南省重點實驗室,湖南 長沙 410118;
4. 復旦大學大氣與海洋科學系, 上海 200438;
海洋表面鹽度(sea surface salinity, SSS)和海洋表面溫度(sea surface temperature, SST)是海洋表面的基本物理狀態(tài), 在水循環(huán)、海洋環(huán)流、海洋生態(tài)系統(tǒng)乃至天氣和氣候變化等方面都發(fā)揮著至關重要的作用(Lin et al, 2001)。
相比SSS, 人們對SST 的研究深入得多。SST的觀測技術發(fā)展相對較長, 目前國際上有多種較為完整的SST 產(chǎn)品 (Guan et al, 2003; Thiébaux et al,2003; Reynolds et al, 2007; Woodruff et al, 2011;Donlon et al, 2012), 其應用也相當廣泛和成熟(Srivastava et al, 2000; Guo et al, 2004; Zhan et al,2011)。然而, 受觀測資料的限制, 鹽度的研究則相對較為匱乏。在20 世紀末Argo 計劃實施前, 全球海洋每年的鹽度觀測數(shù)據(jù)只有溫度的15%左右。Argo 計劃實施后, 對海洋鹽度的觀測能力得到極大提升, 至2005 年左右, 每年的鹽度觀測數(shù)量與溫度基本相當(王輝贊 等, 2012)。進一步, 隨著海洋鹽度衛(wèi)星 SMOS(Soil Moisture and Ocean Salinity)、SAC-D(Scientific Application Satellite-D)等的成功發(fā)射, 逐漸積累了一定量的鹽度數(shù)據(jù), 這為開展鹽度方面的研究乃至預報工作提供了極大保障。
印度洋作為印—太暖池的重要組成部分, 對我國天氣和氣候所起的作用被廣泛關注。印度洋是印度季風的發(fā)源地和流經(jīng)地, 印度季風是亞洲季風的主要成員, 而印度洋的變化能通過影響具有行星尺度的亞洲季風系統(tǒng)在中—高緯度的相互作用來影響中國天氣氣候的異常變化(晏紅明 等, 2000)。海洋上層鹽度對天氣過程、季節(jié)內(nèi)振蕩以及季節(jié)與年際等更為低頻的海氣耦合模態(tài), 都有重要的反饋作用(Qiu et al, 2012)因此, 開展印度洋SSS 的預報工作,對預報預測中國天氣氣候具有一定的指導意義。
現(xiàn)有海洋模型HYCOM、MOM、NEMO、ROMS和POM 等, 可以對全球海洋進行模擬預報(方長芳等, 2013)。但是, 多變量經(jīng)驗正交函數(shù)(multi-variate empirical orthogonal function, MEOF)和線性馬爾可夫相結(jié)合的預報模型(簡稱線性馬爾可夫模型, 下同)憑借著計算便捷, 開發(fā)成本低且預報效果好等因素,被廣泛應用于各種海洋要素的預測, 如太平洋海表溫度異常(Johnson et al, 2000)、南極海冰(Chen et al,2004)、ENSO(Xue et al, 1994)、東亞季風降水變化(Wu et al, 2013)等。尚未發(fā)現(xiàn)利用該模型對鹽度進行預測的研究, 故本文嘗試將線性馬爾可夫模型初步應用于印度洋SSS 的預測, 從混合層鹽度收支方程出發(fā), 選擇海表面高度(sea surface height, SSH)、SST、SSS 等物理量的異常值作為模型的組成部分,對印度洋SSS 進行逐月預報, 并進一步考慮遙相關關系, 提高線性馬爾可夫模型的預報能力。
基于鹽度方程進行物理量的選擇。由于模式是在MEOF 的基礎上構(gòu)建的, 因此需要考慮大氣、海洋動力學和熱力學因素對SSS 變化的作用, 故我們根據(jù)混合層鹽度收支方程(Foltz et al, 2004)選擇物理量。
除了SSS 可以明顯地影響自身變化以外; SSH也可以通過影響海洋水平速度進而影響SSS; 再者,海溫也可以通過影響大氣環(huán)流和降水來間接影響SSS?;诖朔治? 本文選用的資料包括: 來自Argo項 目 (http://apdrc.soest.hawaii.edu/las/v6/constrain?var=204)的月均SSS 數(shù)據(jù), 格點為1°×1°。月均SSH數(shù)據(jù)來自哥白尼海洋環(huán)境監(jiān)測服務中心 (center for marine environmental monitoring service, CMEMS)(https://marine.copernicus.eu/), 并插值到 0.5°×0.5°的網(wǎng)格上。1°×1°分辨率的SST 數(shù)據(jù)由美國國家環(huán)境預測中心(National Center for Environmental Prediction, NCEP)(https://psl.noaa.gov/data/gridded/data.ncep.reanalysis.html)提供。此外, 方程中包含的蒸發(fā)、降水等物理量, 因?qū)︻A報效果改善并不明顯(詳見3.1), 這里一并略去。最后, 參與模型構(gòu)建的時間尺度選擇2005—2017 年, 模型使用的區(qū)域覆蓋了印度洋地區(qū)(40°S—30°N, 30°E—110°W)。
關于線性馬爾可夫模型構(gòu)建細節(jié)(Chen et al,2004)大致分為以下幾個步驟:
1) 計算各變量的逐月異常值, 即各變量減去各月在13 年(2005—2017 年)內(nèi)的平均值, 并分別歸一化。再將上述各異常值保持時間尺度不變, 并在空間上進行累加, 組合成一個時間和空間的二維數(shù)組。
2) 將這個數(shù)組進行MEOF 分解:
式中,V為進行MEOF 分解的數(shù)據(jù)矩陣,E和P分別為MEOF 分解后所得到的空間模態(tài)和相應的時間序列,T為矩陣轉(zhuǎn)置符號。
3) 將時間序列按月拆分。假設相鄰的PC 之間存在線性關系, 計算自然月間的馬爾可夫過渡矩陣A:
式中,Pi和Pi+1分別為第i個月、第i+1 個月的時間序列,ei為誤差。從上式得到
式中, 尖括號表示時間平均, 對于最優(yōu)的模型配置來說誤差ei與PT i線性無關, 故轉(zhuǎn)移矩陣A為:
由上式得到的轉(zhuǎn)移矩陣一共有12 個, 即1 月與2 月, 2 月與3 月……12 月與翌年1 月間的過渡矩陣。
4) 保留適當?shù)哪B(tài), 通過依次應用馬爾可夫過渡矩陣預測時間序列, 并將相應的預測值與各自的空間場相結(jié)合, 最終達到對所選變量預測的目的。
本文主要運用統(tǒng)計學的方法來衡量模式預報結(jié)果的優(yōu)劣性, 包括均方根誤差(RMSE)和相關系數(shù)(r)。其中均方根誤差是真實值與預報值之間的偏差,用于衡量模式結(jié)果的準確度。相關系數(shù)則是反應觀測值與預測值之間相關關系的密切程度。設X(ii= 1,2, …,n) 為預報值,Yi(i= 1,2,… ,n)為相應的觀測值。和σ X(σY)分別為X i(Yi)的平均值和標準差, 有如下的統(tǒng)計關系:
傳統(tǒng)線性馬爾可夫模型總是選擇同一區(qū)域的物理量進行構(gòu)建, 本文一開始對印度洋鹽度預報模型的構(gòu)建亦是如此, 但實際影響印度洋SSS 的物理量遠不止于此, 比如太平洋可以通過印度尼西亞輸運量(Indonesian throughflow, ITF)(劉凱 等,2011)、印度洋偶極子(Indian Ocean Dipole, IOD)(Saji et al, 1999)、熱容量和海洋羅斯貝波等對印度洋產(chǎn)生影響(李雁領 等, 2004; 王健 等, 2014)。所以我們需要考慮遙相關關系, 即向該模型里加入不屬于同一區(qū)域但相關聯(lián)的物理量, 提高模型的預報水平。
為合理預估保留的MEOF 模態(tài)數(shù), 我們首先分別對各個物理量的異常值進行EOF 分解并計算其方差貢獻率。圖1 分別為印度洋區(qū)域海表面高度異常(sea surface height anomaly, SSHA)和海表面溫度異常(sea surface temperature Anomaly, SSTA)以及海表面鹽度異常(sea surface salinity anomaly,SSSA)在EOF 分解后的方差貢獻分布情況。當EOF模數(shù)大致小于 5 時, 所有物理量的方差貢獻率都較大, 反之方差貢獻率相對較小。這表明前幾個模態(tài)就能強烈地捕獲這些參數(shù)的主要信息。因此, 在后續(xù)的工作中, 我們只需要為該模型保留 5 個左右的模態(tài)。
圖1 各物理量在不同EOF 模態(tài)上的方差貢獻分布圖Fig. 1 Distribution diagram of the variance contribution of the EOF
MEOF 方法是常用的包含多個氣象要素場的分析方法, 圖2 便是由SSS、SST 和SSH 組合而成的數(shù)組在前三個模態(tài)的空間變化。前三模態(tài)方差貢獻率分別為13.2%、8.6%和5.9%。第一模態(tài)里, SSS隨緯度的分布呈帶狀變化, 正值極區(qū)位于印度洋北部, 負值極區(qū)位于印度洋中部, 隨后在印度洋南部呈現(xiàn)偏正的特征。在第二模態(tài)中, SSS 存在反相變化的偶極模式, 并呈現(xiàn)東西分布的狀態(tài), 這與第二模態(tài)的SST 空間場較為相似。最后, 在第三模態(tài)中,SSS 空間場在大部分海盆內(nèi)都呈現(xiàn)了偏負值的情況,而SSH 空間場的絕大部分海域在前三個模態(tài)也呈現(xiàn)負值。故在模型中加入SSH 和SST, 能更好地模擬印度洋SSS 的空間變化。
圖2 由SSS、SSH、SST 組成的數(shù)組進行MEOF 分解得出的前三模態(tài)的空間場Fig. 2 First three MEOF modes of the combined SSS, SSH and SST
首先使用非交叉驗證方法來討論線性馬爾可夫的后置預測模型, 這是一種不破壞數(shù)據(jù)連續(xù)性的方法。為使結(jié)果差異明顯, 我們先對每一個網(wǎng)格點隨時間變化的基礎上求得相關系數(shù), 再進行區(qū)域平均(下同)?;谏鲜鲇懻摰慕Y(jié)果, 保留前3、5、7 個模態(tài)數(shù), 提前0~12 個月預測場與觀測場之間的區(qū)域平均相關性如圖3 所示(其中每個點的相關系數(shù)都通過了顯著性檢驗, 下同)。在大部分提前時間范圍內(nèi),保留模態(tài)數(shù)越多, 預測效果越好, 所以這里討論保留前7 個模態(tài)的模型。同時, 本文以相關系數(shù)r=0.5為參考,r>0.5 代表較好的預報,r<0.5 則代表不理想的預報。如圖3a 所示, 如果實驗中只包含SSSA, 大致可提前6 個月在印度洋進行海表鹽度預報。如果考慮加入SSTA(圖3b)或者SSHA(圖3c), 提前8 個月的預報效果也是較好的。包含SSHA 或SSTA 的模型似乎顯示了更多與原始場相匹配的細節(jié), 這可能是因為海洋包含了系統(tǒng)的大部分信息。最后, 當我們添加了SSSA、SSHA、SSTA(圖3d)之后, 改善效果更為明顯, 甚至可提前9 個月進行印度洋海表鹽度的預報。
圖3 預測和觀測SSSA 的相關性折線圖Fig. 3 Line plot of non-cross-validation correlation coefficients for the predicted and observed SSA
選擇適宜的物理量不是一蹴而就的, 從混合層鹽度收支方程中可以發(fā)現(xiàn), 還有很多物理量會影響鹽度的變化, 如蒸發(fā)、降水、海表面風場等等。但如圖4 所示, 這些物理量的加入并不能提高模型的預報能力, 因此后續(xù)工作中都將其舍棄。
圖4 預測和觀測SSSA 的相關性折線圖Fig. 4 Line plot of non-cross-validation correlation coefficients for the predicted and observed SSSA
運用交叉驗證, 保留不同MEOF 模態(tài)數(shù)進行后置預測實驗, 進一步探討模型的構(gòu)造?;谏鲜鲇懻? 模型的技能似乎隨著保留的模態(tài)數(shù)增加而增加。但從理論上講, 馬爾可夫模型只需要保留一定數(shù)量的模態(tài)數(shù), 因為使用太多的模態(tài)可能會有很多噪聲污染模型。此外, 在上述非交叉驗證的預報中存在一定人為影響, 因為該模型用于驗證的數(shù)據(jù)與參與模型構(gòu)造的數(shù)據(jù)是存在重疊的情況。所以我們運用交叉驗證的實驗來解決上述問題, 一般方法如下: 首先, 對多變量矩陣進行MEOF 分解, 得到對應的空間模態(tài)和時間序列(步驟只做一次); 再對每年的PC 進行一一驗證, 這里設定用于驗證的數(shù)據(jù)是時間范圍為1 年的PC 數(shù)據(jù), 用于驗證的PC 從頭開始逐月向后, 直至時間序列的末尾, 共計156 次(13 年×12 月=156 次)。這里保留對應的物理量和一定的模態(tài)數(shù), 建立線性馬爾可夫的驗證模型。圖5顯示保留了13 年的SSSA、SSHA 和SSTA 組合而成的樣本, 在不同的模態(tài)數(shù)和預報時間基礎上, 預測SSSA 和觀測場之間交叉驗證的相關性。我們得出, 模型預報技能并沒有隨著保留模態(tài)數(shù)的增加而增加, 當保留前5 個模態(tài)時, 預報效果最好。此外,印度洋區(qū)域海表鹽度的后置預報技能較為可觀, 即便提前8 個月, 該相關性也會在0.4 左右浮動。
圖5 后置預測和觀測SSSA 之間的交叉驗證相關性在印度洋地區(qū)保留不同模態(tài)數(shù), 由SSSA、SSTA、SSHA 組合而成Fig. 5 Line plot of cross-validation correlation coefficients for the predicted and observed SSSA
為更直觀的對比分析, 把僅包含SSSA 的模型和包含SSSA、SSTA、SSHA 的模型從上述交叉驗證實驗中得到的相關系數(shù)在空間上進行繪制。其中,所有小于0 的點都設置為0。如圖6 所示, 2 個模型雖然都存在隨著預報時間的增加, 預測效果變?nèi)醯那闆r。但是, 即使提前預報時間較長(如圖所示提前9 個月), 模型所擁有的相關性較好的區(qū)域(紅色區(qū)域)也相當多, 這說明該預報模型是可行的, 甚至在部分區(qū)域的預測效果是很好的。此外, 包含SSSA、SSTA 和SSHA 的模型預測結(jié)果較好的區(qū)域是完全大于僅包含SSSA 的模型, 這也進一步說明了多元成分模型的優(yōu)越性。
圖6 后置預測與觀測SSSA 的相關系數(shù)空間分布圖Fig. 6 Spatial distribution of cross-validation correlation coefficients for the predicted and observed SSSA
綜上所述, 通過上述各種關于模型構(gòu)造的討論,我們將保留SSSA、SSTA、SSHA 和前5 個模態(tài), 進行后續(xù)預報實驗。
為提高預報效果, 有必要對傳統(tǒng)模型進行改進。由于傳統(tǒng)模型僅由同一區(qū)域的部分物理量進行構(gòu)造, 但是影響該區(qū)域物理量(預報量)的物理量遠不止于此, 因此, 這里考慮向模型中添加有遙相關關系的因子?;谝汛_定的物理量, 特別添加南太平洋的SSHA、SSTA 以及IOD 系數(shù)(方法2), 挑選合適物理量的方式與3.1 一致, 這里不再贅述。最終基于“實時”預報的評估結(jié)果如圖7 所示。為避免結(jié)果的偶然性, 我們把新“實時”預測得到的物理量(預測量)放入模型中對應物理量(觀測量)的末尾,保證模型中數(shù)據(jù)時間尺度不變, 去掉前端的數(shù)據(jù),從而構(gòu)成新的模型。并一次又一次地預測得到新的量, 重復上述步驟, 直至時間序列的末尾, 最后做時間平均。從圖7 可知, 當模型添加這些遙相關量以后, RMSE 明顯變小, 相關系數(shù)增加。從相關系數(shù)的均值計算得出, 這樣的預報效果大約提高10%。這意味著這種方法是可行的, 故下文利用改進后的模型對印度洋SSS 進行“實時”預測, 進一步檢驗該模型的效果。
圖7 觀測與預測SSSA 場之間的RMSE 及相關系數(shù)Fig. 7 The RMSE and the correlation coefficients between the observed and predicted SSSA fields
所謂“實時”預測, 預測的目標周期都超過模型的訓練周期。本文從2017 年12 月開始, 逐月對印度洋SSS 進行預測, 其預測效果(RMSE 和相關系數(shù))隨時間的變化如圖8 所示。在預測的前7 個月內(nèi),RMSE 從0.24 降低到0.1, 相關系數(shù)從0.95 增加到0.99。不僅如此, 為比較原始數(shù)據(jù)和預測數(shù)據(jù)隨時間的變化, 我們選擇大洋東西分界78°E 和南北分界線赤道為斷面。同時, 把HYCOM 在2008 年SSS 的逐日后置預報數(shù)據(jù)處理成逐月平均數(shù)據(jù)(https://www.hycom.org/dataserver/gofs-3pt0/analysis), 一同參與比較。如圖9、10 所示, 首先, 線性馬爾可夫模型預測得到的SSS 的空間分布特征與觀測場較為吻合,均呈現(xiàn)出西高東低(圖9)和南高北低(圖10)的分布態(tài)勢。此外, 在赤道斷面, 本文模型預測的SSS 極值在冬季相對較大, 在夏季相對較小, 這與觀測場隨時間的變化情況是一致的, 這說明本模型的預報場能捕捉與觀測場一致的季節(jié)變化特征。然而, HYCOM 后置預報場的預報能力相對較弱, 特別是在赤道斷面上的負值區(qū)域。這也進一步表明本模型對印度洋SSS的時空變化特征具有較好的預報優(yōu)勢。
圖8 觀測與預測SSS 之間的RMSE 及相關系數(shù)(印度洋區(qū)域)Fig. 8 RMSE and correlation coefficients between the observed and predicted SSS in the Indian Ocean
圖9 印度洋區(qū)域赤道斷面提前1~11 個月的SSS 觀測(左)、馬爾可夫模型預報結(jié)果(中)和HYCOM 后置預報結(jié)果(右)Fig. 9 SSS observations (left),Markov modelforecast results (center) and HYCOM hindcast results (right)for 1-11months earlier, onthe equatorial section of the Indian
本研究建立了一個MEOF 與線性馬爾可夫相結(jié)合的模型來預測印度洋區(qū)域SSS 的變化。采用交叉驗證和“實時”預測的方式評估了該模型的預測能力?;?13 年逐月樣本的統(tǒng)計模型, 使用印度洋的SSSA、SSTA 和SSHA, 保留前5 個模態(tài), 對印度洋海表鹽度進行預報, 結(jié)果表明該模型具有較好的性能, 大致可提前9 個月進行較好的預報。進一步考慮遙相關作用, 向該模型中添加南太平洋的SSHA, SSTA及IOD 系數(shù), 預報效率平均提高10%(相關系數(shù))。
本文采用的預報方法, 計算便捷且開發(fā)成本低,為變量的預測提供了一個很好的選擇。但是, 在本文模型中, 加入蒸發(fā)量、降水量和海表面風場等物理量并不能給印度洋SSS 帶來更好的預報效果, 目前尚不清楚原因, 需要進一步探究。未來我們將考慮更多的變量來拓展本文的工作, 并進一步推廣至全球海洋SSS 的預測。