李浩然,樊貴盛(太原理工大學(xué)水利科學(xué)與工程學(xué)院, 太原 030024)
土壤水分特征曲線是表示土壤水勢(shì)與水分含量之間關(guān)系的曲線,是研究土壤水分保持和運(yùn)動(dòng)所用到的基本特性曲線[1],對(duì)于推求土壤比水容重、田間持水率、凋萎系數(shù)等水力學(xué)參數(shù)具有重要意義,因此準(zhǔn)確獲取土壤水分特征曲線模型參數(shù)是精確推求上述水力學(xué)參數(shù)的關(guān)鍵。而傳統(tǒng)的實(shí)驗(yàn)方法(負(fù)壓計(jì)法、壓力膜儀法、砂形漏斗法等)均存在耗時(shí)費(fèi)力,應(yīng)用范圍受限制等問題。土壤傳輸函數(shù)的發(fā)展為土壤水分特征曲線的獲取提供了機(jī)遇,備受眾多學(xué)者關(guān)注。王歡元[2]等通過不同的土壤傳輸函數(shù)對(duì)土壤水力學(xué)參數(shù)進(jìn)行了預(yù)測(cè),并且精度較高;朱安寧[3]等通過多元逐步回歸分析的方法建立了VG模型的土壤傳輸函數(shù)模型,并且擬合效果較好;韓勇鴻等[4]利用土壤傳輸函數(shù),建立了關(guān)于田間持水率的神經(jīng)網(wǎng)絡(luò)預(yù)報(bào)模型。
在眾多的土壤傳輸函數(shù)方法當(dāng)中,支持向量機(jī)對(duì)于處理小樣本、非線性、高維數(shù)等問題表現(xiàn)出較好的運(yùn)算能力,能有效避免在預(yù)測(cè)中出現(xiàn)“過擬合”和“欠學(xué)習(xí)”,是一種基于核展開,將樣本空間通過非線性映射,映射到高維空間解決樣本空間的非線性分類與回歸問題的機(jī)器學(xué)習(xí)方法,具有較高的預(yù)測(cè)精度,廣泛運(yùn)用于預(yù)測(cè)方面的研究。鄭立華[5]等利用近紅外光譜與支持向量機(jī)對(duì)有機(jī)質(zhì)含量的支持向量機(jī)預(yù)報(bào)模型;呂燁[6]等運(yùn)用支持向量機(jī)對(duì)微咸水灌溉土壤的EC與pH值的變化規(guī)律進(jìn)行了預(yù)測(cè)研究,預(yù)測(cè)效果較好;雷國(guó)慶[7]等通過支持向量機(jī)對(duì)土壤水分入滲參數(shù)進(jìn)行了預(yù)測(cè)并取得較高的精度。但將支持向量機(jī)運(yùn)用于土壤水分特征曲線模型參數(shù)的預(yù)測(cè)的文獻(xiàn)還鮮有報(bào)道。
支持向量機(jī)模型的輸入因子是決定預(yù)測(cè)參數(shù)精度的關(guān)鍵條件,目前大多數(shù)研究主要是通過定性分析與實(shí)踐經(jīng)驗(yàn)對(duì)輸入因子進(jìn)行選取。灰色關(guān)聯(lián)理論通過數(shù)學(xué)手段在一定程度上量化界定了輸入、輸出因子之間的關(guān)聯(lián)性,有效保證了輸入因子選擇的科學(xué)性。本文試圖在采用灰色關(guān)聯(lián)理論,分析土壤各基本理化參數(shù)與Gardner模型參數(shù)之間的關(guān)聯(lián)度的基礎(chǔ)上,科學(xué)選定其輸入因子,建立基于土壤基本理化參數(shù)的支持向量機(jī)預(yù)測(cè)模型,實(shí)現(xiàn)對(duì)土壤水分特征曲線Gardner模型參數(shù)的預(yù)測(cè)。
試驗(yàn)土壤來源于黃土高原區(qū)山西省中西部耕作農(nóng)田,地貌單元包括平原、丘陵、高原和盆地等。試驗(yàn)區(qū)春季、秋季短,夏季潮濕多雨,冬季寒冷干燥,年溫差大。年平均降水量為350~620 mm,降水主要集中在6-9月份,占總降水量的60%以上;年平均蒸發(fā)量達(dá)750~1 250 mm,蒸發(fā)強(qiáng)度高;土壤類型豐富,主要包括黃褐土、栗鈣土、棕壤土;土壤質(zhì)地類型粉砂質(zhì)黏壤土、壤土、粉砂質(zhì)壤土、砂質(zhì)壤土。試驗(yàn)區(qū)土壤各基本理化參數(shù)變化范圍如表1所示。
本試驗(yàn)分為土壤基本理化參數(shù)測(cè)定試驗(yàn)和土壤水分特征曲線及其參數(shù)的測(cè)定試驗(yàn):
(1)土壤基本理化參數(shù)測(cè)定試驗(yàn)。對(duì)試驗(yàn)區(qū)耕作層與犁底層的土壤進(jìn)行粉粒、黏粒、砂粒含量的測(cè)定,通過激光粒度分析儀測(cè)出相應(yīng)的百分比;由于是擾動(dòng)土,將土樣按照1.10~1.70 g/cm3的密度值進(jìn)行配置;有機(jī)質(zhì)的測(cè)定使用重鉻酸鉀容量法測(cè)定土樣中的有機(jī)碳含量,根據(jù)相關(guān)換算得到有機(jī)質(zhì)含量;對(duì)土樣中的八大離子進(jìn)行測(cè)定所用的方法有EDTA標(biāo)液滴定法、火焰光度計(jì)等,并將八大離子的累加和作為全鹽量。
表1 試驗(yàn)區(qū)土壤理化條件
(2)土壤水分特征曲線及其參數(shù)測(cè)定。利用壓力膜儀對(duì)土壤水分特征曲線進(jìn)行測(cè)定。土樣風(fēng)干過篩并均勻裝填在環(huán)刀內(nèi),放入壓力膜儀中進(jìn)行令其吸水到達(dá)飽和含水率。達(dá)到后按照0.3~15 bar的壓力級(jí)差對(duì)土樣施壓,使得土壤中的水分排出并每隔24 h對(duì)重量進(jìn)行測(cè)定。在同等壓力之下,如果土樣在前后兩次的重量變化小于0.005 g則認(rèn)為土樣水分全部排出,并進(jìn)行下一組試驗(yàn)。最終,根據(jù)實(shí)驗(yàn)結(jié)果計(jì)算出體積含水率,并對(duì)結(jié)果進(jìn)行擬合得到Gardner模型參數(shù)值。
Gardner模型是Gardner[8,9]在1970年提出冪函數(shù)持水式,因其經(jīng)驗(yàn)參數(shù)較少而廣泛應(yīng)用于實(shí)際當(dāng)中。 Gardner模型的具體表達(dá)式為:
h=aθ-b
(1)
式中:h代表的是土壤水吸力,cm;θ代表的是土壤體積含水率,%;a、b均為擬合參數(shù),無單位量綱且均為正數(shù)。其中,參數(shù)a隨著土壤持水能力的增大而增大;參數(shù)b隨著土壤含水率變化速率的增大而增大。
根據(jù)土壤水分特征曲線的性質(zhì)可知,土壤持水性能影響著Gardner模型的參數(shù),而土壤持水性與不同的土壤基本理化參數(shù)密切相關(guān)。目前,大多數(shù)研究認(rèn)為,對(duì)于土壤持水性能影響較大的土壤基本理化參數(shù)有土壤質(zhì)地、土壤容重、土壤有機(jī)質(zhì)含量、土壤無機(jī)鹽含量。
(1)參數(shù)a與影響因素的定性關(guān)系。參數(shù)a反映的是土壤的持水能力,對(duì)于土壤而言,不同的土壤基本理化參數(shù)通過改變土壤中的孔隙情況而影響著土壤的持水能力。當(dāng)土壤中的黏粒含量與粉粒含量較多時(shí),土壤質(zhì)地變重,產(chǎn)生較多的中小孔隙;密度的增加大,代表著土壤變得板結(jié),從而土體收到擠壓產(chǎn)生中小孔隙;有機(jī)質(zhì)含量的增加使得讓土壤中的孔隙變得更加穩(wěn)定;無機(jī)鹽含量的增加則是改變了土壤分散度,從而大孔隙破壞變?yōu)橹行】紫?。中小孔隙增加不僅使得土壤毛管吸力增加,而且增大了孔隙表面積,使得土體顆粒對(duì)水分的吸附能力增強(qiáng),從而影響土壤的持水能力,最終影響參數(shù)a的變化。
(2)參數(shù)b與影響因素的定性關(guān)系。參數(shù)b反映了土壤持水能力隨著水吸力增大時(shí)的變化速率。當(dāng)黏粒含量與粉粒含量上升時(shí),中小孔隙增加,高水吸力下的持水性能增強(qiáng);土壤容重增大,土壤孔隙變小,土壤水力傳導(dǎo)度下降,毛管作用變強(qiáng),持水性能增強(qiáng);有機(jī)質(zhì)含量的增加,土壤結(jié)構(gòu)越固結(jié),從而是的孔隙連通性變差;無機(jī)鹽含量的變化,使得土壤溶質(zhì)勢(shì)發(fā)生變化,從而影響到土壤含水率的變化量。土壤條件的改變會(huì)影響到土壤持水能力的變化情況,最終影響到參數(shù)b的變化。
灰色關(guān)聯(lián)分析是一種用灰色關(guān)聯(lián)度順序來描述影響因子間關(guān)系的強(qiáng)弱大小次序的方法[10]。其基本思想是以因素?cái)?shù)據(jù)序列為依據(jù),然后通過數(shù)學(xué)手段研究其內(nèi)在的幾何對(duì)應(yīng)聯(lián)系。因此,本文將運(yùn)用灰色關(guān)聯(lián)分析對(duì)影響土壤水分特征曲線的主要因素土壤質(zhì)地、土壤體積質(zhì)量、土壤有機(jī)質(zhì)含量、土壤無機(jī)鹽含量進(jìn)行關(guān)聯(lián)度分析及灰色關(guān)聯(lián)排序。具體步驟如下:
(1)首先隨機(jī)抽取試驗(yàn)數(shù)據(jù)中的30組進(jìn)行關(guān)聯(lián)度計(jì)算。然后將因變量模型參數(shù)a、b構(gòu)成參考序列,自變量各土壤基本理化參數(shù)構(gòu)成比較序列。具體如下:
(3)
式中:式(2)為參考序列,y01與y02分別為模型參數(shù)a與模型參數(shù)b的因變量序列;式(3)為比較序列,x01~x05分別為土壤容重、土壤黏粒含量、土壤粉粒含量、土壤有機(jī)質(zhì)含量、土壤無機(jī)鹽含量的自變量序列。
(2)無量綱化處理:具體公式如下:
(4)
(5)
(3)灰色關(guān)聯(lián)系數(shù):具體公式如下:
Δ0i(k)=|y0i(k)-x0i(k)|
(6)
(7)
式中:式(6)為求差序列的公式,差序列為自變量序列與因變量序列相減,取其絕對(duì)值;式(7)位關(guān)聯(lián)系數(shù)計(jì)算公式,式中x0(min)與x0(max)分別為差序列中的最小值與最大值;ε為分辨系數(shù),一般取0.5。
(4)關(guān)聯(lián)度計(jì)算:
計(jì)算公式如下:
(8)
式中:n為樣本容量,在本次計(jì)算中n=30。
根據(jù)灰色關(guān)聯(lián)度計(jì)算,最終得出土壤水分特征曲線Gardner模型參數(shù)a、b與個(gè)土壤基本理化參數(shù)之間的關(guān)聯(lián)度。具體結(jié)果如表2所示。
表2 Gardner模型參數(shù)與土壤基本理化參數(shù)關(guān)聯(lián)度表
由表2可以看出,對(duì)于Gardner模型參數(shù)a與b而言,土壤容重、土壤黏粒含量,土壤粉粒含量、土壤有機(jī)質(zhì)含量與土壤無機(jī)鹽含量對(duì)模型參數(shù)a、b的關(guān)聯(lián)排序是一樣的,由大到小均為土壤粉粒含量>土壤容重>土壤無機(jī)鹽含量>土壤有機(jī)質(zhì)含量>土壤黏粒含量。
一般認(rèn)為,關(guān)聯(lián)度在0.8以上則認(rèn)為自變量與因變量關(guān)聯(lián)度很好;關(guān)聯(lián)度在0.6~0.8之間則認(rèn)為自變量與因變量關(guān)聯(lián)度好;關(guān)聯(lián)度在0.5以下則認(rèn)為不相關(guān)[11]。根據(jù)結(jié)果可知,各土壤基本理化參數(shù)與Gardner模型參數(shù)關(guān)聯(lián)度均屬于很好或者好。因此,以下以土壤容重、土壤黏粒含量、土壤粉粒含量、土壤有機(jī)質(zhì)含量、土壤無機(jī)鹽含量可以作為重要的影響因素,用于構(gòu)建支持向量機(jī)Gardner模型參數(shù)的預(yù)測(cè)模型。
基于灰色關(guān)聯(lián)理論分析可得,土壤質(zhì)地、土壤容重、土壤有機(jī)質(zhì)含量、土壤無機(jī)鹽含量與Gardner模型參數(shù)有著較高的關(guān)聯(lián)度。因此,本文最終選取土壤黏粒含量、土壤粉粒含量、土壤容重、土壤有機(jī)質(zhì)含量、土壤無機(jī)鹽含量作為預(yù)測(cè)模型的輸入因子,Gardner模型參數(shù)作為輸出因子,并選取90組土樣數(shù)據(jù)作為建模樣本,10組數(shù)據(jù)作為檢驗(yàn)樣本。建模樣本數(shù)據(jù)如表3所示。
表3 建模樣本數(shù)據(jù)表
選定輸入因子建立樣本點(diǎn)(x1,y1),(x2,y2),…,(xn,yn),xi∈Rm,y∈{-1,1}。將其映射到高維空間中,建立最優(yōu)分割的超平面。具體方程如下:
Y=f(X)=[ω·φ(X)]+d
(9)
式中:ω為權(quán)系數(shù)向量;d為閾值;φ(x)為建立的高維空間的映射。
為了對(duì)最優(yōu)平面方程進(jìn)行求解,引入懲罰因子C與松弛變量ξ和ξ*。因此,對(duì)最優(yōu)平面方程的轉(zhuǎn)化為求以下方程最小值問題:
min{1/2‖ω‖2+C(∑ni=1ξi+∑ni=1ξ*i)}
(10)
同時(shí)引入不敏感損失函數(shù)ε,從而確定約束條件:
(11)
為了求得式(11)的最小值,引入拉格朗日乘子法對(duì)其進(jìn)行求解:
L(ω,n,ξi,ξ*i)=1/2‖ω‖2+C(∑ni=1ξi+∑ni=1ξ*i)-
αi∑ni=1(ε+ξi-Yi+ωXi+d)-
α*i∑ni=1(ε+ξ*i-Yi+ωXi+d)
(12)
式中:αi,α*i為拉格朗日乘子,αi,α*i≥0;ξi,ξ*i≥0; i=1,2,…,n。
根據(jù)拉格朗日乘子法的原理,對(duì)w,d,ξi,ξ*i偏導(dǎo)數(shù),并領(lǐng)其偏導(dǎo)等于0。具體方程式如下:
(13)
將以上公式帶入回到式(12)中,并引入核函數(shù)對(duì)其進(jìn)行求解。常用的核函數(shù)一般有多項(xiàng)式核函數(shù)、高斯核函數(shù)以及Sigmoid核函數(shù)3種。本文中使用的核函數(shù)為高斯核函數(shù),函數(shù)具體方程形式如下:
(14)
最終求出最優(yōu)解即為所建立的支持向量機(jī)預(yù)測(cè)模型表達(dá)式:
f(X)=[ω·φ(X)]+d=∑ni=1(αi-α*i)K(x,xi)+d
(15)
對(duì)于支持向量機(jī)預(yù)測(cè)模型而言,參數(shù)的取值對(duì)于模型的精度有著重要的影響。對(duì)于本次所建立的預(yù)測(cè)模型而言,需要確定的參數(shù)有C(懲罰因子)、ε(不敏感損失函數(shù)值)和σ(核函數(shù)參數(shù))。其中,對(duì)于懲罰因子而言,C的大小決定著支持向量機(jī)模型的復(fù)雜程度與預(yù)測(cè)精度,C值過大,則代表著對(duì)干擾誤差的懲罰較大,從而導(dǎo)致模型過于復(fù)雜,而C值過小,則會(huì)導(dǎo)致訓(xùn)練精度的降低,從而誤差過大,影響預(yù)測(cè)結(jié)果;ε的取值則是控制著擬合精度與支持向量的個(gè)數(shù),ε值過大則會(huì)導(dǎo)致支持向量較少,模型結(jié)構(gòu)相對(duì)簡(jiǎn)單,但是擬合誤差相對(duì)較大,ε值過小,模型結(jié)構(gòu)變得相對(duì)復(fù)雜,同時(shí)提高預(yù)測(cè)精度,但是會(huì)影響到擬合的運(yùn)算速率,求解時(shí)間過長(zhǎng);σ是核函數(shù)參數(shù),一般取自變量數(shù)量的倒數(shù)附近的數(shù)值,σ值決定了支持向量機(jī)的學(xué)習(xí)程度,σ值過小可能會(huì)導(dǎo)致“過學(xué)習(xí)”、“過擬合”的現(xiàn)象,σ值過大則會(huì)導(dǎo)致學(xué)習(xí)無效。
因此,根據(jù)以上參數(shù)的選取情況,本文采用較為常用的“窮舉法”對(duì)參數(shù)進(jìn)行選取,即通過試算比較并根據(jù)均方根誤差作為指標(biāo)來確定參數(shù)的最優(yōu)值。參數(shù)選取結(jié)果如表4。
表4 支持向量機(jī)模型參數(shù)
3.4.1 建模樣本精度分析
最終,經(jīng)過所建立的支持向量機(jī)預(yù)報(bào)模型,得到了90組建模樣本中Gardner模型參數(shù)a與b的預(yù)測(cè)結(jié)果,分析其相對(duì)誤差如表5。
表5 建模樣本誤差分析表
通過表5可以看出,建立的關(guān)于參數(shù)a、b的支持向量機(jī)預(yù)測(cè)模型誤差較小。其中,關(guān)于參數(shù)a最大相對(duì)誤差為17.33%,最小值為0.28%,平均相對(duì)誤差為5.65%;關(guān)于參數(shù)b最大相對(duì)誤差為21.56%,最小值為0.85%,平均相對(duì)誤差為4.87%。建模樣本的相對(duì)誤差均在可控范圍之內(nèi),說明建立的模型對(duì)于參數(shù)a、b均有較好的預(yù)測(cè)效果。
3.4.2 檢驗(yàn)樣本精度分析
為了驗(yàn)證所得模型的精確度,因此使用隨機(jī)預(yù)留的10組數(shù)據(jù),對(duì)建立的支持向量機(jī)預(yù)測(cè)模型進(jìn)行預(yù)測(cè)驗(yàn)證。檢驗(yàn)結(jié)果如表6。
由表6可以看出,對(duì)于Gardner模型參數(shù)a的進(jìn)行檢驗(yàn)的結(jié)果中,相對(duì)誤差最大值為11.55%,最小值為 0.68%,平均相對(duì)誤差為3.96%;對(duì)于Gardner模型參數(shù)b的結(jié)果中,相對(duì)誤差最大值為12.6%,最小值為0.42%,平均相對(duì)誤差為4.68%。通過檢驗(yàn)結(jié)果可以看出,根據(jù)90組訓(xùn)練樣本所建立的支持向量機(jī)預(yù)測(cè)模型的預(yù)測(cè)精度較高,可以為Gardner模型參數(shù)的預(yù)測(cè)提供較好的理論依據(jù)。
(1)采用支持向量機(jī)的方法,以建立以土壤常規(guī)理化參數(shù)為輸入變量,以土壤水分特征曲線Gardner經(jīng)驗(yàn)?zāi)P蛥?shù)(a、b)為輸出變量的預(yù)測(cè)模型是可行的。建模樣本的模型參數(shù)(a、b)平均相對(duì)誤差分別為5.65%和4.87%;檢驗(yàn)樣本平均相對(duì)誤差分別為3.96%和4.68%,完全在可接受范圍。誤差小,預(yù)測(cè)精度高。因此所建預(yù)測(cè)模型可信、可行,實(shí)現(xiàn)了土壤水分特征曲線模型過程或參數(shù)的預(yù)測(cè)。
表6 檢驗(yàn)樣本誤差分析表
(2)采用灰色關(guān)聯(lián)分析方法對(duì)預(yù)測(cè)變量影響因素量化選擇是一種有效方法。本文對(duì)土壤質(zhì)地、土壤容重、土壤有機(jī)質(zhì)、土壤無機(jī)鹽進(jìn)行的關(guān)聯(lián)度分析以及排序,定量定義了輸入變量與Gardner模型參數(shù)的關(guān)聯(lián)性和取舍,不妨更多地應(yīng)用于其他多元影響因素的量化選擇中。
本文試驗(yàn)和建模預(yù)測(cè)的結(jié)果表明,運(yùn)用支持向量機(jī)對(duì)土壤水分特征曲線模型參數(shù)的預(yù)測(cè)方面有著良好的表現(xiàn)。但是,在選擇建模參數(shù)的問題上,大多采用的是經(jīng)驗(yàn)選取。在以后的研究中,應(yīng)嘗試不同的方法,比如交叉驗(yàn)證法、梯度下降法、遺傳算法等,以進(jìn)一步提高支持向量機(jī)的預(yù)測(cè)模型精度。
[1] 雷志棟,楊詩秀,謝傳森.土壤水動(dòng)力學(xué)[M].北京:清華大學(xué)出版社,1988.
[2] 王歡元, 韓霽昌, 羅林濤,等. 兩種土壤傳遞函數(shù)在預(yù)測(cè)砒砂巖與沙復(fù)配土的水力學(xué)參數(shù)中的應(yīng)用[J]. 土壤通報(bào), 2013,(6):1 351-1 355.
[3] 朱安寧, 張佳寶, 陳效民,等. 封丘地區(qū)土壤傳遞函數(shù)的研究[J]. 土壤學(xué)報(bào), 2003,40(1):53-58.
[4] 韓勇鴻, 樊貴盛, 孔令超. 田間持水率土壤傳輸函數(shù)研究[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2013,44(9):62-67.
[5] 鄭立華, 李民贊, 安曉飛,等. 基于近紅外光譜和支持向量機(jī)的土壤參數(shù)預(yù)測(cè)[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2010,26(s2):81-87.
[6] 呂 燁, 阮本清, 管孝艷,等. 基于支持向量機(jī)的微咸水灌溉下土壤鹽分預(yù)測(cè)[J]. 中國(guó)水利水電科學(xué)研究院學(xué)報(bào), 2014,(2):162-169.
[7] 雷國(guó)慶, 樊貴盛. 基于支持向量機(jī)的土壤水分入滲參數(shù)預(yù)測(cè)研究[J]. 節(jié)水灌溉, 2015,(12):28-30.
[8]GardnerWR,HillelD,BenyaminiY.Post-irrigationmovementofsoilwater:I.Redistribution[J].WaterResourcesResearch,1970,6(3):851-861.
[9]GardnerWR,HillelD,BenyaminiY.Post-irrigationmovementofsoilwater:P.SimulationsRedistributionandevaporation[J].WaterResourcesRrsearch,1970,6(4):1 114-1 153.
[10] 趙曉芬. 灰色系統(tǒng)理論概述[J]. 吉林省教育學(xué)院學(xué)報(bào), 2011,(3):152-154.
[11] 邱國(guó)良, 吳基文, 王厚柱. 基于灰色BP神經(jīng)網(wǎng)絡(luò)的水位礦井涌水量預(yù)測(cè)[J]. 礦業(yè)安全與環(huán)保, 2011,38(6):28-30.