国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

精細全光譜結(jié)合GS-SVR的復(fù)雜水體硝酸鹽分析方法研究

2021-02-03 08:02雷會平胡炳樑劉嘉誠王雪霽
光譜學(xué)與光譜分析 2021年2期
關(guān)鍵詞:硝酸鹽步長光譜

雷會平,胡炳樑,于 濤*,劉嘉誠,李 煒,王雪霽,鄒 妍,史 倩

1.中國科學(xué)院西安光學(xué)精密機械研究所,陜西 西安 710119 2.中國科學(xué)院大學(xué)光電學(xué)院,北京 100049 3.山東省科學(xué)院海洋儀器儀表研究所,山東 青島 266000

引 言

水是人類社會生產(chǎn)生活與持續(xù)發(fā)展必不可少的資源[1]。硝酸鹽是水質(zhì)健康狀態(tài)評價的一個關(guān)鍵要素,過高濃度的硝酸鹽一旦流入水體環(huán)境就會刺激藻類快速繁殖,致使水體惡化,進而造成物種多樣性劇減以及生態(tài)環(huán)境的破壞,如果被人體誤攝,會引起“高鐵血紅蛋白癥”。因此,實現(xiàn)水體硝酸鹽的高精度快速實時在線監(jiān)測對于水務(wù)事業(yè)的安全保障與水污染的預(yù)警防治極具重要的科學(xué)意義和社會價值。

基于光學(xué)測量的水質(zhì)在線監(jiān)測方法是當前及未來水環(huán)境動態(tài)監(jiān)測的發(fā)展趨勢[1]。相較于傳統(tǒng)硝酸鹽現(xiàn)場采樣加實驗室化學(xué)分析的測定方法,其具有操作便捷,無需前處理,檢測效率高,重復(fù)性好且無二次污染等顯著優(yōu)點,非常適合水環(huán)境中硝酸鹽的快速在線監(jiān)測,在直飲水,地表水,廢水的在線檢測等方面具有廣闊的發(fā)展前景。針對水體組份解析算法,常見的有單波長法,雙波長法,偏最小二乘法(partial least square,PLS),人工神經(jīng)網(wǎng)絡(luò)法(artificial neural network,ANN),支持向量機法(support vector machine,SVM)。Jean Causse[2]和Pons[3]等采用連續(xù)光譜二階導(dǎo)數(shù)測定淡水中硝酸鹽和溶解有機碳,并在多個淡水樣品中驗證了該方法的可靠性。宓云軿等[4]依次采用PLS,SVM和LM-反向傳播神經(jīng)網(wǎng)絡(luò)(back propagation neural network,BPNN)建立吸光度與化學(xué)需氧量(chemical oxygen demand,COD)間的濃度模型,結(jié)果驗證SVM,LM-BPNN等回歸模型的預(yù)測效果顯然優(yōu)于PLS。倪雪春等將支持向量回歸機(support vector regression,SVR)運用于混合重疊的光譜分析中,實現(xiàn)了硝酸鹽含量的濃度預(yù)測。王莉麗等[5]研制了一種新型的海水硝酸鹽檢測系統(tǒng),結(jié)合PLS法進行硝酸鹽濃度與吸收光譜間的相關(guān)性分析,實現(xiàn)了海水硝酸鹽的在線檢測。楊瓊[6]等結(jié)合近紅外光譜以及后向間隔偏最小二乘(back interval partial least square,BiPLS)法對生活廢水中的COD回歸建模,結(jié)果顯示預(yù)測效果優(yōu)于PLS建模。劉思鄉(xiāng)等利用主成分分析對原始光譜數(shù)據(jù)降維,然后使用局部加權(quán)線性回歸建模,獲得了較好的預(yù)測結(jié)果。陳穎等[7]提出了一種基于光譜的混合回歸預(yù)測模型,包括雙波長法與最小二乘支持向量機法,將溶液樣本分為高濃度樣本和低濃度樣本兩部分,驗證結(jié)果良好。

但是,實際水體組分更加復(fù)雜與多元化,水體參數(shù)和吸光度二者并非呈現(xiàn)線性相關(guān),使用線性回歸模型難以達到滿意的預(yù)測效果,所以必須建立非線性的預(yù)測模型。ANN建模預(yù)測難以克服預(yù)測結(jié)果的不穩(wěn)定性,而SVM因其在小樣本、非線性、高維問題中的優(yōu)勢獲得廣泛關(guān)注。本文結(jié)合精細全光譜技術(shù),提出一種基于改進的網(wǎng)格搜索(grid search,GS)方法優(yōu)化SVR以期完成建模預(yù)測,并與傳統(tǒng)預(yù)測模型的結(jié)果加以對比,結(jié)果驗證,提出的算法在預(yù)測精度以及訓(xùn)練效率方面都有顯著提升。

1 基本原理

1.1 支持向量回歸思想

SVM基于結(jié)構(gòu)風(fēng)險最小化原理,可以有效地應(yīng)對實際應(yīng)用情境下出現(xiàn)的小樣本、非線性和高維問題[8],具有良好的性能和預(yù)測精度。SVR的基本思路是把原始數(shù)據(jù)x非線性映射到高維特征空間,然后在此空間中解決線性回歸問題。SVM的回歸函數(shù)為

f(x)=wφ(x)+b

(1)

其中φ(x)為特征空間,是權(quán)重向量,b是偏差項。系數(shù)和b則由風(fēng)險函數(shù)最小化來估計

(2)

(3)

式(3)中,若預(yù)測誤差小于ε,則損失為零,否則損失超出范圍。引入兩個正松弛變量ξ和ξ*表示從實際值到相應(yīng)邊界值的距離。將式(2)轉(zhuǎn)化為式(4)

(4)

約束條件為

(5)

該優(yōu)化問題通過式(6)求解

(6)

約束條件為

(7)

(8)

因此,回歸函數(shù)為

(9)

式(9)中,K(xi,x)為核函數(shù),其值為K(xi,x)=Φ(xi)Φ(x)。在SVM中,徑向基核函數(shù)(RBF)K(xi,x)=exp(-‖xi-x‖/2σ2)僅須確定一個變量,便于參數(shù)優(yōu)化。此外,其構(gòu)造的SVR具有良好的非線性預(yù)測性能。因此,將RBF應(yīng)用于SVR中。

1.2 改進的網(wǎng)格搜索法

據(jù)實際應(yīng)用情況,參數(shù)設(shè)置和核函數(shù)的選擇對SVR的學(xué)習(xí)和泛化性能影響很大[9]。網(wǎng)格搜索(grid search,GS)是一種直接的參數(shù)優(yōu)化算法,用于確定SVR的最佳參數(shù)值[10-11]。通過設(shè)置搜索中的上下界(搜索間隔)和跳躍間隔的適當值,使得優(yōu)化算法遍歷網(wǎng)格中的每一個參數(shù)組合,并采用交叉驗證技術(shù)作為性能度量找到最優(yōu)參數(shù)組合。實際操作中往往設(shè)置較大的搜索范圍和較小的搜索間隔,因此,參數(shù)尋優(yōu)的過程會占用大量時間,導(dǎo)致模型效率低下。本文提出了多次變步長的網(wǎng)格搜索算法對SVR模型參數(shù)進行調(diào)整,具體操作步驟如下:

(1) 初始化參數(shù)搜索范圍及搜索步長,在初始的網(wǎng)格搜索范圍中,將預(yù)先設(shè)置的參數(shù)組合搜索步長擴大T倍,進行第一次參數(shù)尋優(yōu)。

(2) 依據(jù)圖1的參數(shù)搜索空間確定流程,將C與σ的搜索范圍縮小,并且縮小搜索步長F倍,繼續(xù)第二次參數(shù)尋優(yōu)。具體流程如圖1。

(3) 依據(jù)圖1的參數(shù)空間確定流程,把C與σ的搜索空間再次縮小,同時把它的步長縮小S倍,繼續(xù)進行參數(shù)尋優(yōu)。其中T=FS。

圖1 參數(shù)搜索空間的確定Fig.1 Determination of parameter search space

(4) 將(3)中獲取的最優(yōu)參數(shù)組合代入SVR模型,建立訓(xùn)練集吸光度光譜數(shù)據(jù)與硝酸鹽濃度的數(shù)學(xué)模型。

(5) 將測試集應(yīng)用于步驟(4)獲取的回歸模型完成預(yù)測,輸出測量結(jié)果。

通過以上操作,將原本的搜索空間減小并多次改變步長,簡化了計算,大幅提升了尋優(yōu)效率。

2 實驗部分

2.1 數(shù)據(jù)獲取

使用自研光譜儀采集溶液的原始透射光譜數(shù)據(jù),并將其轉(zhuǎn)換為吸光度光譜數(shù)據(jù),然后基于可變步長的網(wǎng)格搜索法進行模型參數(shù)尋優(yōu),將獲得的最優(yōu)參數(shù)組合應(yīng)用于SVR模型,建立訓(xùn)練集吸光度光譜數(shù)據(jù)與硝酸鹽濃度間的數(shù)學(xué)模型,然后利用該數(shù)學(xué)模型完成測試集的濃度預(yù)測。總體流程圖如圖2所示。

圖2 實驗整體流程Fig.2 Overall flow of the experiment

2.2 樣本溶液

溶液樣本的配制在陜西科技大學(xué)化學(xué)與化工學(xué)院實驗室內(nèi)完成。采用標準的硝酸鹽溶液,鉑-鈷標準溶液,福爾馬肼標準混懸液根據(jù)實驗要求按照不同的濃度梯度配置了94組不同濃度的溶液樣本。硝酸鹽、濁度、色度的濃度量程分別為7~15 mg·L-1,0.5~5 NTU,7~15度(鉑-鈷色度單位),濃度間隔分別為1 mg·L-1,0.5 NTU,1度。每一個待測溶液樣本的三種組份濃度配比為隨機生成。

2.3 裝置

實驗裝置采用光源,光源衰減器,比色皿,光譜儀和計算機組成的集成系統(tǒng)獲取被測物質(zhì)的透射光譜。樣本溶液光譜數(shù)據(jù)的采集裝置選取了項目組自主設(shè)計研發(fā)的雙光路主動校正連續(xù)光譜儀,原理如圖3所示。該裝置使用雙光路主動校正結(jié)合連續(xù)光譜精細獲取的方法,相對于傳統(tǒng)的單光路連續(xù)長時間作業(yè)的系統(tǒng)誤差校正進行了去除。自研儀器的光譜范圍:185~1 100 nm,光譜分辨率:1.5 nm,閃耀波長:250 nm,共含3 648個像素點。

圖3 光譜法主要測量技術(shù)原理圖Fig.3 Main measurement technology schematic diagram of spectrometric method

將被測溶液的原始透射光譜數(shù)據(jù)轉(zhuǎn)換為吸光度光譜數(shù)據(jù),所有樣本溶液的吸收光譜圖如圖4所示。

圖4 94個不同濃度溶液樣本的吸收光譜Fig.4 Absorption spectrum of 94 samples with different concentrations

2.4 樣本分類

對待測溶液的吸光度數(shù)據(jù)進行建模預(yù)測之前,使用Kennard-Stone算法將其劃分為訓(xùn)練集和測試集,其劃分原則是把已選取的樣本點與其余樣本點間的最小直線距離最大化。樣本i與樣本j間的歐氏距離定義如式(10)

(10)

式(10)中,rik與rjk分別為樣本i和樣本j在波長k處的吸光度,p為待測樣品溶液光譜的波段數(shù)。通過上述算法94個溶液樣本被劃分為80個訓(xùn)練樣本與14個測試樣本。

3 結(jié)果與討論

3.1 改進GS-SVR的參數(shù)尋優(yōu)

改進的GS法通過多次減小參數(shù)的搜索空間以及修正步長大幅提高了參數(shù)尋優(yōu)速度,配合交叉驗證法進行訓(xùn)練集的建模,將獲得的最優(yōu)的C和σ參數(shù)再用于測試樣本的濃度預(yù)測。懲罰參數(shù)C取值范圍設(shè)為[2-9,29],σ取值范圍設(shè)為[2-10,210],二者的搜索步長初始設(shè)為0.5,依次將其擴大10倍,縮小2倍,縮小5倍,選擇RBF核函數(shù),得到三次參數(shù)尋優(yōu)的均方誤差的3D視圖如圖5,圖6,圖7所示。

圖5 改進GS-SVR第一次參數(shù)尋優(yōu)3D視圖Fig.5 3D view for the first parameter optimization of Improved GS-SVR

圖6 改進GS-SVR第二次參數(shù)尋優(yōu)3D視圖Fig.6 3D view for the second parameter optimization of Improved GS-SVR

由圖5—圖7可知,每一次改變步長后參數(shù)搜索空間都會縮小,降低了參數(shù)選擇的計算量,克服了傳統(tǒng)方法非常耗時的缺陷。

圖7 改進GS-SVR第二次參數(shù)尋優(yōu)3D視圖Fig.7 3D view for the third parameter optimization of Improved GS-SVR

3.2 改進GS-SVR建模預(yù)測

將3.1節(jié)三次參數(shù)尋優(yōu)的最優(yōu)參數(shù)C和σ組合(512,0.044 2)應(yīng)用于支持向量回歸模型,最終獲得測試集的預(yù)測效果如圖8(a)所示,預(yù)測結(jié)果的相對誤差(relative error,RE)如圖8(b)所示。

圖8 (a) 改進GS-SVR預(yù)測值與真實值對比; (b) 改進GS-SVR預(yù)測值相對誤差Fig.8 (a) Comparison between the predicted value of improved GS-SVR and the real value;(b) Relative error of the predicted value of improved GS-SVR

圖8和圖9分析可知,改進的GS-SVR建模的預(yù)測效果較好,其中回歸模型的決定系數(shù)(coefficient of determination)R2=0.993 5,預(yù)測均方根誤差(root mean square error of prediction,RMSEP) RMSEP=0.043 5。14個樣本預(yù)測值的絕對誤差(absolute error,AE)控制在0.5以內(nèi),最大AE是0.465 1,一半樣本的AE不超過0.1。預(yù)測值的相對誤差最大3.32%。整個過程平均花費時間為13 s,滿足快速監(jiān)測的應(yīng)用需求。

圖9 (a) 不同預(yù)測模型的預(yù)測值與真實值對比;(b) 不同預(yù)測模型的預(yù)測值相對誤差Fig.9 (a) Comparison between predicted value and real value of different prediction models; (b) Relative error of predicted values of different prediction models

基于吸光度光譜數(shù)據(jù),同時建立了BPNN,SVR,GS-SVR,PSO-SVR,GA-SVR五種預(yù)測回歸模型,與文中提出的可變步長GS-SVR方法加以對比。每種模型訓(xùn)練5次,在表1中統(tǒng)計了硝酸鹽濃度預(yù)測模型的R2,RMSEP,訓(xùn)練時間。

表1 不同預(yù)測模型評價參數(shù)對比Table 1 Comparison of evaluation parameters of different prediction models

分別從預(yù)測精度,預(yù)測誤差,訓(xùn)練效率以及穩(wěn)定性四個方面來對比六種預(yù)測模型的性能。由表1 分析可知,相比于BPNN,SVR,GS-SVR,PSO-SVR,GA-SVR五種預(yù)測回歸模型(取5次預(yù)測精度最高的對比),改進GS-SVR預(yù)測精度最高,R2=0.993 5,分別提高了1.22%,11.66%,0.78%,0.74%和0.77%。RMSEP=0.043 5,分別降低了-4.36%,1 644%,308%,80%和112%。改進GS-SVR平均訓(xùn)練時間為13 s,相較BPNN的67 s,GS-SVR的121 s,PSO-SVR的291 s,GA-SVR的146 s,效率分別提升了4.15倍,8.30倍,21.38倍,10.23倍,盡管SVR模型訓(xùn)練時間最短,但其精度不高,且誤差很大。GS-SVR,PSO-SVR,GA-SVR模型存在一個明顯的缺陷就是計算量大,訓(xùn)練效率較低,需要等待很長時間才能完成一次參數(shù)的解算,參數(shù)尋優(yōu)過程耗時過長,尤其后兩者預(yù)測結(jié)果不穩(wěn)定,容易陷入局部極優(yōu)。BPNN的最大缺點就是預(yù)測效果極不穩(wěn)定,效果較好時R2高達0.981 5,訓(xùn)練效果較差時,R2只有0.715 4。究其原因,BPNN是局部搜索的優(yōu)化算法,在計算非線性函數(shù)的全局極值時極大概率陷入局部極值,導(dǎo)致訓(xùn)練精度降低。同時,網(wǎng)絡(luò)結(jié)構(gòu)的選取尚無成熟的理論指導(dǎo),只能憑經(jīng)驗進行選擇,因此如何采用合適的網(wǎng)絡(luò)結(jié)構(gòu)也是BPNN預(yù)測模型訓(xùn)練的關(guān)鍵問題。比較可知,改進的GS-SVR模型綜合預(yù)測精度,預(yù)測誤差,訓(xùn)練效率以及穩(wěn)定性方面皆優(yōu)于其他模型,在提升預(yù)測精度的同時提高了算法的優(yōu)化效率。

六種硝酸鹽濃度回歸模型的預(yù)測結(jié)果與真實值如圖9(a)所示,相對誤差如圖9(b)所示。改進GS-SVR最大絕對誤差控制在0.5以內(nèi),0.465 1(改進GS-SVR)<0.729 7(GS-SVR)<0.755 1(PSO-SVR)<0.865 9(GA-SVR)<0.874 1(BPNN)<1.830 3(SVR),為六種模型中最優(yōu)。相對誤差為3.32%(改進GS-SVR)<5.77%(PSO-SVR)<6.18%(GA-SVR)<8.30%(GS-SVR)<8.84%(BPNN)<14.12%(SVR),無論是絕對誤差還是相對誤差,改進GS-SVR模型都保持在最低水平,預(yù)測效果明顯優(yōu)于其他五種模型。

4 結(jié) 論

基于精細全光譜結(jié)合支持向量回歸技術(shù)提出了一種基于可變步長的GS法優(yōu)化SVR,將其用于混合水體硝酸鹽濃度的建模預(yù)測。通過可變步長的GS尋優(yōu)算法獲得最優(yōu)參數(shù)C和σ為(512,0.044 2),建立SVR硝酸鹽濃度預(yù)測模型,模型R2=0.993 5,RMSEP=0.043 5,平均訓(xùn)練時間為13 s。并同目前流行的BPNN,SVR,GS-SVR,PSO-SVR,GA-SVR算法對比,R2分別提高了1.22%,11.66%,0.78%,0.74%和0.77%,訓(xùn)練效率分別提升4.15倍(BPNN),8.30倍(GS-SVR),21.38倍(PSO-SVR),10.23倍(GA-SVR)。結(jié)果顯示,提出的GS-SVR方法不僅提高了模型的預(yù)測精度,而且在尋優(yōu)效率方面取得了很大的提升,可為復(fù)雜基質(zhì)水體硝酸鹽濃度的快速在線監(jiān)測提供一種新的有效方法,具備潛在的應(yīng)用價值。

猜你喜歡
硝酸鹽步長光譜
硝酸鹽并不致癌還或有益處
基于三維Saab變換的高光譜圖像壓縮方法
基于Armijo搜索步長的BFGS與DFP擬牛頓法的比較研究
家畜硝酸鹽和亞硝酸鹽中毒的診斷、鑒別和防治
星載近紅外高光譜CO2遙感進展
基于逐維改進的自適應(yīng)步長布谷鳥搜索算法
短期水分脅迫影響巴旦杏植株對硝酸鹽的吸收
一種新型光伏系統(tǒng)MPPT變步長滯環(huán)比較P&O法
苦味酸與牛血清蛋白相互作用的光譜研究
鋱(Ⅲ)與PvdA作用的光譜研究