程詩念,樊貴盛
(太原理工大學水利科學與工程學院,太原 030024)
隨著人口的增長和經濟的發(fā)展,鹽堿地的開發(fā)利用越來越受到各學者的關注。在廣大科技工作者的不斷探索與努力下,關于鹽堿地的改良已積累了豐富經驗,但沖洗方法是主要措施之一。鄭普山、郝保平[1]等通過野外試驗與室內分析,探究了不同改良劑對鹽堿土壤理化性狀的影響,進而影響入滲能力或參數。譚丹、譚芳[2]對沖洗條件下鹽堿土壤水鹽運移進行了模擬得到了鹽堿地改良下的優(yōu)化配水方式。黃圣楠、陳剛[3]等利用一維圓柱形滲流柱,在人為降雨、淋濾條件下,對土壤排鹽過程中水鹽運移特性進行了研究。目前,關于鹽堿地的改良主要分為物理措施、化學措施、生物措施以及相結合的綜合措施[4]。其中,因物理方法操作簡單、取材容易、投入低下而得到廣泛推廣,其土壤水動力學原理是通過改變土壤物理性狀來調控土壤水鹽運移,從而提高入滲淋鹽效果,達到降低土壤鹽分的目的。因此,鹽堿地土壤水分入滲的研究對指導鹽堿地的改良意義重大,鹽堿土壤入滲參數的準確獲取成為改良鹽堿地的關鍵。
支持向量機(Support Vector Machine,SVM)是一種基于結構風險最小化原理的機器學習方法,能在模型的復雜性與學習能力之間找到一個最優(yōu)折衷,使結構風險最小化,從而獲得最佳泛化能力,與模糊邏輯法、人工神經網絡等方法相比,在很多方面都表現出其特有的優(yōu)勢,因而備受各學者關注。將該方法應用于土壤水力學參數的預測進一步豐富了土壤轉換函數[5],楊紹鍔、黃元仿[6]基于支持向量機建立了預測土壤飽和導水率、殘余含水率等水力學參數的土壤轉換函數,表明應用支持向量機預測土壤水力學參數是可行的。鄭立華、李民贊[7]等采用近紅外光譜數據,建立了土壤全氮和有機質含量的支持向量機回歸模型,表明土壤參數適合于全譜支持向量回歸。
為進一步推廣支持向量機算法,并探究獲取鹽堿土壤水分入滲參數的新方法,本文以鹽堿土壤水分入滲試驗數據為基礎,采用支持向量機回歸算法,以Philip入滲模型參數為預測變量,建立回歸預測模型,以期獲得高精度的預測,研究成果可為鹽堿地土壤改良提供技術參數與理論指導。
試驗區(qū)位于山西省朔州東部的應縣,E112°58′~113°37′,N39°17′~39°45′之間,屬北溫帶大陸氣候;該地區(qū)氣候寒冷,年平均氣溫不高于8 ℃,干旱多風,年降雨量300~400 mm;同時受季風影響,在季節(jié)性干旱和降雨條件下,地下水埋深為1.5~2.0 m;地區(qū)地形復雜,排水條件差,形成了大面積的原生鹽堿荒地。
為獲取更廣泛的鹽堿土壤入滲數據,試驗在臧寨、杏寨、大黃崴、大臨河四個鄉(xiāng)鎮(zhèn)展開。試驗區(qū)土壤母質以近代河流沖積物為主,根據國際制土壤質地分級標準劃分,土壤質地均為砂質壤土。土壤顆粒以砂粒為主,其質量分數約占60%。土壤含鹽量為1.151~5.143 g/kg,pH值均大于7,全為鹽堿土壤。試驗區(qū)耕作層土壤體積含水率為4.12%~25.86%,容重為1.15~1.85 g/cm3,有機質含量為0.416~1.467 g/kg。
入滲試驗采用大田雙套環(huán)單點入滲儀,試驗前在保證地表土壤不受擾動的情況下進行簡單處理后將雙套環(huán)埋在深為20 cm左右的土層中。試驗開始后,用1 000 mL量筒分時段向入滲儀內緩慢加水,加水過程確保地表土壤不受沖擊,并通過自制水位控制器來調控內外環(huán)的入滲水頭差,始終保持在2~3 cm,以保證一維垂直入滲。入滲過程中,0~10 min,每1 min記錄一次;10~60 min,每5 min記錄一次;60~90 min,每10 min記錄一次,試驗歷時90 min。
在入滲試驗點采用土鉆法獲取土壤樣本用以測定對應土壤基本理化參數,其中土壤含水率的測定通過稱重法、有機質的測定采用重鉻酸鉀容量法,土壤全鹽量采用殘渣烘干法,具體操作參見中國農業(yè)出版社出版的《土壤農化分析》[8]第三版;土壤容重測定采用環(huán)刀法;土壤質地分析采用激光粒度分析儀;土壤pH通過pH計測定,水土比2.5∶1,具體步驟參照文獻[9]。
1957年,基于非飽和半無限土壤垂直入滲條件,Philip[10]根據土壤水分運動方程的級數解推導得到在短歷時入滲情況下,任意時刻的入滲率i(t)與入滲時間t之間滿足冪級數關系,關系式為:
(1)
式中:i(t)為t時刻的入滲率,cm/min;S為吸滲率,cm/min0.5;A為穩(wěn)定入滲率,cm/min。
根據上式,對時間t積分,即可得出累積入滲量I(t)與入滲歷時t之間的關系:
I(t)=St0.5+At
(2)
式(1)和式(2)共同構成了Philip入滲模型,本文選擇描述式(2)作為研究模型。
根據所取得的入滲過程資料,即累積入滲量I(t)與入滲歷時t之間的對應關系,利用Matlab2009中的非線性擬合工具,擬合得到Philip入滲模型參數,即吸滲率S和穩(wěn)滲率A。將取得的S和A與在試驗區(qū)同步測定的土壤基本理化參數結合,建立土壤基本理化參數與入滲參數之間的一一對應關系,完成試驗樣本的建立,本文建立了100組試驗樣本,如表1所示。
表1 試驗樣本數據表
本文選取鹽堿土壤體積含水率θ0、干容重γ1、有機質含量G、粉粒含量w1、黏粒含量w2、全鹽量δ和pH值ε為輸入變量,Philip水分入滲模型的吸滲率S和穩(wěn)滲率A為輸出變量,建立預測模型。選擇90組試驗數據樣本作為建模樣本,10組作為驗證樣本。
首先將輸入樣本x通過非線性函數φ(x)映射到高維空間,然后建立如下回歸函數:
f(ω,x)=ωφ(x)+b
(3)
式中:ω為權值向量;b為閾值。
已知樣本集{(x1,y1) (x2,y2) (x3,y3)…(xm,ym)}(m為樣本組個數,本文訓練樣本的組數為90,檢驗樣本的組數為10),其中xi∈Rn(i=1,2,…,m)為輸入向量,此處為土壤基本理化參數值,n表示輸入向量的維數,也就是輸入變量的個數,此處n=7;yi∈R(i=1,2,…,m)為輸出變量,本文為Philip土壤水分入滲模型中的吸滲率S和穩(wěn)滲率A。
引入擬合誤差函數ε、懲罰因子C和松弛變量ξ、ξ*(ξ、ξ*≥0),由此最佳回歸函數轉化為求解式(4)的最小值:
(4)
對應的約束條件為:
(5)
引入拉格朗日乘子,將其轉化為二次對偶形式,通過解對偶問題即可得到式(3)的解:
(6)
式中:αi、α*i(αi、α*i≥0)為拉格朗日乘子;k(x,xi)為核函數,應滿足Mercer條件。
式(6)即為本文所建立的預測模型。
付陽[12]等認為影響支持向量機預測模型精度的主要因素為:核函數、懲罰因子C和函數擬合誤差ε。
(1)核函數的選擇。常用的核函數主要有線性核函數、多項式核函數、徑向基核函數。本文采用交叉驗證法,以平均相對誤差(MRE)作為評價指標,在保證其他參數一定,只改變核函數的情況下,經過試算,最后選取平均相對誤差最小的徑向基核函數作為支持向量機預測模型的核函數,其表達式為:
k(xi,xj)=exp(-g‖xi-xj‖) (g=1.0)
(7)
(2)懲罰因子C和擬合誤差ε的選取。參數C和ε權衡了最大空白和最小訓練誤差,進而影響著訓練與預測精度。
ε為函數擬合誤差,其值的改變影響著模型結構的復雜程度。ε值過大,模型結構趨于簡單,支持向量個數會越少,算法在擬合數據過程中會出現壓力不足現象,將導致擬合誤差大;ε值過小,雖能提高擬合精度,但模型結構會過于復雜,有可能造成運算速度降低,導致訓練時間過長, 模型泛化能力較差,有可能導致將會出現過擬合現象。
因個別樣本數據的嚴重偏離,而引入的懲罰因子C可以用于控制模型復雜度和逼近誤差的折中。C越大,也就是懲罰力度越大,模型的復雜程度越高,容易出現“過學習”。而C值過小,會導致對經驗誤差的懲罰偏小,模型的復雜程度降低,有可能造成“欠學習”。如果直接剔除偏差樣本,雖在一定程度上會提高訓練模型對自身數據的學習精度,但將其應用于其他數據進行預測時,精度會有所降低。
基于此,在確定核函數為徑向基核函數的前提下,進行多次試算,并利用多參數網格搜索法對參數C和ε進行優(yōu)化選取,最后取C=100,ε=0.05。
將模型參數值帶入回歸算法中,利用Matlab2009進行回歸預測,經過分析,得到訓練樣本和檢驗樣本的相對誤差如表2和表3所示。
表2 訓練樣本相對誤差表
表3 檢驗樣本相對誤差表
從表2和表3可以看出:吸滲率S訓練樣本相對誤差的最小值為0.04%,最大值為9.75%,平均值為4.05%;檢驗樣本相對誤差的最小值為2.11%,最大值為7.84%,平均值為4.22%。穩(wěn)滲率A訓練樣本相對誤差的最小值為1.07%,最大值為11.53%,平均值為5.49%;檢驗樣本相對誤差的最小值為1.43%,最大值為9.52%,平均值為3.58%。不論是訓練樣本還是檢驗樣本,兩入滲參數的平均相對誤差值均較小,預測值與實測值之間吻合程度高,預測精度較高,建立的預測模型是可行的。
依據預測得到的Philip入滲模型參數,得到Philip入滲模型的預測表達式,通過計算可得90 min累積入滲量I90的預測值,與實測值相比較,計算相對誤差,得到訓練樣本和檢驗樣本中兩入滲參數的綜合誤差分析表,如表4和表5所示。
表4 訓練樣本I90誤差分析表
表5 檢驗樣本I90誤差分析表
從表4和表5可以看出:90組訓練樣本中,根據Philip兩入滲參數計算得到的累積入滲量I90的預測值與實測值相比較,相對誤差的最小值為0.13%,最大值為11.77%,平均值為4.28%;10組檢驗樣本中,90 min累積入滲量I90的預測值與實測值相比較,相對誤差的最小值為0.28%,最大值為8.75%,平均值為4.48%,可以看出兩參數的綜合誤差值較小,表明所建立的模型能實現對Philip入滲模型參數的高精度預測。
(1)基于支持向量機理論,對Philip入滲模型參數進行預測,以平均相對誤差作為評價指標,吸滲率S的訓練誤差為4.05%,檢驗誤差為4.22%;穩(wěn)滲率A的訓練誤差為1.07%,檢驗誤差為3.58%;兩入滲參數綜合誤差90 min累積入滲量I90的訓練誤差為4.28%,檢驗誤差為4.48%。訓練樣本和檢驗樣本誤差均較小,能滿足精度要求,表明基于支持向量機理論的鹽堿土Philip入滲模型參數的預測是可行的。
(2)由模型得到的Philip入滲模型中的吸滲率S、穩(wěn)滲率A以及90 min累積入滲量I90的預測值與實測值吻合程度高,預測效果理想,實現了支持向量機預測模型對鹽堿土壤入滲參數的預測。
本文是針對鹽堿土壤,基于支持向量機算法對Philip入滲模型參數的初次嘗試,模型中有關參數的選擇、輸入參數的選取等都有待進一步的研究,以期獲取更精準的預測結果,豐富支持向量機算法的研究領域。
[1] 鄭普山,郝保平,馮悅晨,等.不同鹽堿地改良劑對土壤理化性質、紫花苜蓿生長及產量的影響[J].中國生態(tài)農業(yè)學報,2012,20(9):1 216-1 221.
[2] 譚 丹,譚 芳.明溝排水條件下鹽堿地改良優(yōu)化配水模式[J].灌溉排水學報,2008,28(1):97-100.
[3] 黃圣楠,陳 剛,丁國平,等.灘涂鹽堿土一維滲透淋濾試驗與排鹽效果分析[J].安全與環(huán)境工程,2014,21(2):64-67.
[4] 馬 晨,馬履一,劉太祥,等.鹽堿地改良利用技術研究進展[J].世界林業(yè)研究,2010,23(2):28-32.
[5] 黃元仿,李韻珠.土壤水力性質的估算——土壤轉換函數[J].土壤學報,2002,39(4):517-523.
[6] 楊紹鍔,黃元仿.基于支持向量機的土壤水力學參數預測[J].農業(yè)工程學報,2003,23(7):42-47.
[7] 鄭立華,李民贊,安曉飛,等.基于近紅外光譜和支持向量機的土壤參數預測[J].農業(yè)工程學報,2010,26(S2):81-87.
[8] 南京農業(yè)大學. 土壤農化分析[M]. 北京: 中國農業(yè)出版社, 1986.
[9] NY/T 1377-2007, 土壤pH的測定[S].
[10] PHILIP J R.The theory of infiltration about sorptivity and algebraic infiltration equations[J]. Soi Sci., 1957,84(4):257-264.
[11] 原林虎. PHILIP入滲模型參數預報模型研究與應用[D]. 太原:太原理工大學, 2013.
[12] 付 陽,李昆侖.支持向量機模型參數選擇方法綜述[J].電腦知識與技術,2010,6(10):8 081-8 082,8 085.