葉凌云
(臺(tái)州市水文站 浙江臺(tái)州 318000)
感潮河段是河流與海洋的過渡段,在該河段上,一方面有來自上游徑流的影響,另一方面又受到下游潮汐的作用,是受徑流和潮流共同作用的河段。由于兩種水流的共同作用,加上河口區(qū)本身的一些地理特性,使感潮河段的水文情勢(shì)較河流和海洋復(fù)雜,并具有獨(dú)自的特點(diǎn),由于問題的復(fù)雜,目前較常用的預(yù)報(bào)方法仍主要是經(jīng)驗(yàn)相關(guān)法和回歸分析法。
社會(huì)科學(xué)統(tǒng)計(jì)軟件 SPSS(以下簡(jiǎn)稱 SPSS)是世界上最早的統(tǒng)計(jì)分析軟件,目前已經(jīng)廣泛應(yīng)用于眾多領(lǐng)域和行業(yè)。在國際學(xué)術(shù)交流中,凡使用 SPSS軟件完成的計(jì)算,可以不必說明算法,可見影響之大。作為統(tǒng)計(jì)分析工具,SPSS軟件理論嚴(yán)謹(jǐn)、內(nèi)容豐富,數(shù)據(jù)管理、統(tǒng)計(jì)分析、趨勢(shì)研究、制表繪圖、文字處理等功能,幾乎無所不包。本文應(yīng)用 SPSS軟件對(duì)感潮河段控制站臨海站進(jìn)行預(yù)報(bào),把臨海站上游多個(gè)站點(diǎn)的水位、雨量作為影響因子,進(jìn)行回歸分析,建立預(yù)報(bào)模型。
靈江流域地處浙江省東南沿海,位于120°~130°E、28°30′~29°30′N間,是浙江八大水系之一。它北以天臺(tái)山為界,南有括蒼山,其間山丘起伏,植被一般,屬亞熱帶季風(fēng)性氣候區(qū)。夏秋季節(jié),不僅常受臺(tái)風(fēng)影響,出現(xiàn)較大暴雨洪水,而且常受東風(fēng)波等天氣系統(tǒng)的影響,產(chǎn)生較強(qiáng)降雨。臨海站是靈江流域控制站,集雨面積4356km2,距椒江河口57km,潮汐影響顯著。當(dāng)上游洪水下泄時(shí),潮汐影響隨洪水位的升高而減弱,當(dāng)臨海站洪水位高于 8m時(shí), 水位過程線中潮形基本消失,潮汐影響基本消失。上游干流永安溪源于天堂尖,穿越仙居縣,入臨海市西部,河長(zhǎng)141.3km , 集雨面積約2702km2;臨海站上游5km,有最大支流始豐溪匯入,始豐溪源于大盤山東麗,穿越天臺(tái)縣,河長(zhǎng)134.2km ,集雨面積約1610km2。 靈江流域水文站網(wǎng)密度較大,站點(diǎn)較多,觀測(cè)資料系列比較長(zhǎng),采用回歸分析法可以綜合各種因素,建立預(yù)報(bào)模型,可以在感潮河段的水位預(yù)報(bào)中取得較好的效果。
臨海站河段是典型的感潮河段,導(dǎo)致洪水發(fā)生的因素較多,并且復(fù)雜多變。由于近二十年來流域特性發(fā)生較大變化,本文主要收集了 1980年到 2012年流域洪水資料,根據(jù)臨海站實(shí)際情況,共引入自變量10個(gè),因變量1個(gè)。10個(gè)自變量指的是:仙居站洪峰水位1H、仙居洪峰水位發(fā)生時(shí)(t時(shí)刻)的沙段站同時(shí)水位2H ,t時(shí)刻天臺(tái)站同時(shí)水位3H ,t時(shí)刻柏枝岙站4H ,t時(shí)刻臨海站同時(shí)水位5H ,t時(shí)刻以前 6小時(shí)流域平均降雨量1P,t時(shí)刻以前6小時(shí)百步站、柏枝岙站、臨海站區(qū)間降雨量2P,t時(shí)刻以前 12小時(shí)流域平均降雨量3P, t時(shí)刻以前12小時(shí)百步站、柏枝岙站、臨海站區(qū)間降雨量4P,t時(shí)刻仙居站和臨海站水位差6H 。因變量是臨海站洪峰水位H。
SPSS軟件可以進(jìn)行數(shù)據(jù)管理、統(tǒng)計(jì)分析、圖表分析和輸出管理,可為水文預(yù)報(bào)提供嶄新的操作環(huán)境平臺(tái)和豐富的技術(shù)方法。本文主要在臨海站上游仙居站洪峰水位出現(xiàn)時(shí),對(duì)臨海站的洪峰水位進(jìn)行預(yù)報(bào),預(yù)見期 10個(gè)小時(shí)左右,分析步驟如下:
(1)打開SPSS數(shù)據(jù)文件窗口,建立由因變量(臨海站洪峰水位)和10個(gè)自變量組成的SPSS數(shù)據(jù)文件并保存。按照“分析→描述性統(tǒng)計(jì)”對(duì)所有的因變量和自變量進(jìn)行描述性統(tǒng)計(jì),為分析的數(shù)據(jù)提供一個(gè)直觀的描述。
(2)在數(shù)據(jù)編輯窗口中進(jìn)行包含分類自變量的多元線性逐步回歸分析。按照“分析→回歸→線性”操作步驟計(jì)算預(yù)報(bào)對(duì)象的估計(jì)值;按照“轉(zhuǎn)換→計(jì)算變量”操作步驟生成臨海洪峰水位實(shí)測(cè)值與估計(jì)值之間的相對(duì)擬合誤差。SPSS軟件會(huì)把這些計(jì)算數(shù)據(jù)和結(jié)果自動(dòng)保存在數(shù)據(jù)編輯窗口中。然后按照“圖形→舊對(duì)話框→線圖”操作步驟生成臨海洪峰水位實(shí)測(cè)值與其估計(jì)值組成的歷史擬合曲線,SPSS軟件會(huì)自動(dòng)在數(shù)據(jù)編輯窗口中保存數(shù)據(jù)和計(jì)算結(jié)果,并在輸出窗口中輸出剔除因子和引人因子的統(tǒng)計(jì)結(jié)果、相關(guān)信息、圖形等。
(3)對(duì)回歸效果進(jìn)行檢驗(yàn)。SPSS軟件會(huì)自動(dòng)進(jìn)行回歸效果的統(tǒng)計(jì)檢驗(yàn),包括回歸方程的擬合度檢驗(yàn)、回歸方程的顯著性檢驗(yàn)和回歸系數(shù)的顯著性檢驗(yàn)。擬合度檢驗(yàn)通常用復(fù)相關(guān)系數(shù) R2來判斷,R2越接近于 1,表明回歸直線的擬合程度越好;回歸方程的顯著性檢驗(yàn)(F檢驗(yàn))和回歸系數(shù)的顯著性檢驗(yàn)(t檢驗(yàn))都是計(jì)算樣本統(tǒng)計(jì)量的相伴概率P值,將其與給定的顯著水平α(即信度)值相比較。若P<α,則表明在這一信度水平上,回歸方程的回歸系數(shù)有統(tǒng)計(jì)學(xué)意義;若P>α,則表明在這一信度水平上,回歸方程的回歸系數(shù)無統(tǒng)計(jì)學(xué)意義。
(4)若通過統(tǒng)計(jì)檢驗(yàn),則可用包含分類自變量的多元線性回歸方程對(duì)臨海洪峰水位進(jìn)行預(yù)報(bào),也可進(jìn)行概率區(qū)間預(yù)報(bào)。當(dāng)因變量Y服從正態(tài)分布時(shí),對(duì)應(yīng)i個(gè)預(yù)報(bào)因子的觀測(cè)值 xi的預(yù)報(bào)對(duì)象估計(jì)值 yi落在區(qū)間[yi-Sy,yi+Sy]內(nèi)的可能性約為68%,落在區(qū)間[yi-2Sy,yi+2Sy]內(nèi)的可能性約為95%(Sy為剩余標(biāo)準(zhǔn)差),Sy越小,用回歸方程所估計(jì)的值就越精確。
由表 1可以看出,回歸模型的相關(guān)系數(shù)R=0.991,復(fù)相關(guān)系數(shù)R2=0.982,R2接近于1,表明回歸直線的擬合度高。修正的相關(guān)系數(shù)為0.974,估計(jì)值的標(biāo)準(zhǔn)誤差為0.212,標(biāo)準(zhǔn)誤差較小,表示用回歸方程估算的預(yù)報(bào)值相對(duì)精度較高。根據(jù)德賓—瓦特遜檢驗(yàn)其自相關(guān)度,系數(shù)接近于 2,表示基本沒有自相關(guān)關(guān)系,對(duì)預(yù)報(bào)的結(jié)果不會(huì)使預(yù)報(bào)結(jié)果失去有效性。由此可見,本次回歸方程的擬合度較好。
表1 模型匯總
表2 方差分析
表3 預(yù)報(bào)模型系數(shù)
由表 2可以看出:回歸模型的回歸平方和35.77,均方差為5.932;剩余平方和為0.673,均方差 0.045。統(tǒng)計(jì)量 F=132.831,相伴概率值為ρ=0.000<0.001(信度),說明回歸方程通過了顯著性檢驗(yàn),預(yù)報(bào)值和因子之間有線性關(guān)系。
由表3中可以看出,有部分自變量從預(yù)報(bào)模型中剔除,這就說明這些自變量與臨海洪峰水位不存在顯著的線性關(guān)系,不將其引入回歸方程。剩余自變量都通過了回歸系數(shù)的顯著性檢驗(yàn)(t檢驗(yàn)),說明具有回歸意義,不能從回歸方程中剔除。由此可見,通過多元線性回歸可以找出預(yù)報(bào)值和哪種影響因子的整體相關(guān)度高,并且剔除相關(guān)度低的影響因子,從而降低樣本數(shù)據(jù)的冗余度。從圖1中可以看出殘差具有正態(tài)分布,從而可以認(rèn)為得出的多元線性回歸方程是合理的,可表示為:
從1980年到2012年的發(fā)生洪水時(shí)臨海洪峰水位實(shí)測(cè)值和預(yù)報(bào)值的擬合曲線(見圖2)可以看到,曲線擬合結(jié)果較好。根據(jù)SPSS 的統(tǒng)計(jì)計(jì)算結(jié)果顯示臨海洪峰水位的平均值為8.81m,標(biāo)準(zhǔn)差 1.305,實(shí)測(cè)臨海洪峰水位的平均值為8.81m,兩者差值為0,預(yù)報(bào)精度高。從所選樣本統(tǒng)計(jì)結(jié)果來看,所有樣本擬合誤差均不超過0.30m,相對(duì)誤差均小于3%。根據(jù)《水文情報(bào)預(yù)報(bào)規(guī)范》(GB/T 22482—2008)臨海站水位預(yù)報(bào)允許誤差為0.50m,樣本預(yù)報(bào)合格率100%。表4中列出了從2000年到2012年臨海站幾場(chǎng)大洪水的洪峰水位預(yù)報(bào)結(jié)果。
圖1 標(biāo)準(zhǔn)化殘差正態(tài)概率
圖2 臨海站洪峰水位實(shí)測(cè)值和預(yù)報(bào)值擬合曲線
表4 2000-2012年臨海幾場(chǎng)大洪水的洪峰水位預(yù)報(bào)結(jié)果
(1)SPSS作為統(tǒng)計(jì)軟件,簡(jiǎn)單易操作,具有強(qiáng)大的統(tǒng)計(jì)分析功能,特別在受到多重影響因素影響的感潮河段,可以利用現(xiàn)有資料,迅速的建立有關(guān)方程。
(2)從建立的預(yù)報(bào)方程來看,剔除了部分因子,根據(jù)臨海站實(shí)際情況,當(dāng)臨海站上游洪水下泄時(shí),潮汐影響隨洪水位的升高而減弱,當(dāng)臨海站洪水位高于 8m時(shí), 水位過程線中潮形基本消失,潮汐影響基本消失。本文洪水都選擇幾十年來較大的洪水,洪水水位均超過或者接近8m,因此剔除預(yù)報(bào)時(shí)臨海水位是合理的。但當(dāng)水位不足8m時(shí),潮汐影響較大,6m以下時(shí),潮汐主要控制臨海站水位,當(dāng)臨海站處于高潮位時(shí)候,對(duì)臨海洪峰水位預(yù)報(bào)值影響較大。另外一方面,暴雨中心的位置及其走向也是影響洪水位的因素之一,需進(jìn)一步研究和考慮。
1. 劉曾美,吳俊校,陳子燊.感潮地區(qū)暴雨和潮水位遭遇組合的澇災(zāi)風(fēng)險(xiǎn)[J].武漢大學(xué)學(xué)報(bào)(工學(xué)版2010,43(2)),167-168
2. 楊競(jìng),童禎恭,劉玉哲.SPSS軟件對(duì)飲用水質(zhì)進(jìn)行主成分分析評(píng)價(jià)的運(yùn)用[J].環(huán)境科學(xué)與技術(shù),2011,34(7)171-174.
3. 陳斌,包為民,瞿思敏,元曉華.雙向線性回歸模型在椒江臨海站水位預(yù)報(bào)中的應(yīng)用[J].水文,2008,28(3):45-48.
4. 王姝,柴建設(shè).基于社會(huì)科學(xué)統(tǒng)計(jì)(SPSS)回歸性分析的尾礦庫事故預(yù)測(cè)模型[J].中國安全科學(xué)學(xué)報(bào),2008,18(12):35-39.
5. 胡廣錄,張濟(jì)世,樊立娟.基于SPSS軟件的黑河正義峽下泄水量預(yù)報(bào)分析[J].人民黃河,2013,35(4)22-28.