吳棟,郭瀟
(中國科學(xué)技術(shù)大學(xué)管理學(xué)院國際金融研究院, 合肥 230026)(2019年3月18日收稿; 2019年5月20日收修改稿)
隨著科學(xué)技術(shù)的進(jìn)步和工業(yè)的發(fā)展,有毒有害氣體的使用范圍在不斷擴(kuò)大。這些氣體既可能是生產(chǎn)之初需要的原材料,比如大多數(shù)的有機(jī)化學(xué)物質(zhì),也可能是生產(chǎn)過程中各個環(huán)節(jié)產(chǎn)生的副產(chǎn)品,比如一氧化碳、氨、硫化氫等等。有害氣體影響人類的身體健康,所以有害氣體的檢測在我們的生產(chǎn)和生活中十分重要。
在檢測氣體的過程中用到的最關(guān)鍵的元器件就是氣體傳感器,氣體傳感器是一種能夠感知外部環(huán)境中某種氣體及其濃度變化的氣體敏感元器件。針對不同檢測任務(wù),例如氣體濃度預(yù)測(回歸)[1-2],氣體識別(分類)[3],類似氣體的分組(聚類)[4],實驗人員會使用氣體傳感器陣列設(shè)計不同的實驗[5]。本文主要關(guān)注氣體濃度預(yù)測(回歸),實驗中獲得的氣體傳感器陣列的多變量響應(yīng)都攜帶著有關(guān)氣體濃度變化的信息[6],可以通過傳感器的響應(yīng)分析混合氣體的種類和濃度。
為預(yù)測氣體濃度,首先有必要建立一個聯(lián)系氣體傳感器響應(yīng)與真實氣體濃度的校準(zhǔn)模型。傳統(tǒng)的方法是建立一些特定的參數(shù)模型,包括線性的或者非線性的[7]。比如,文獻(xiàn)[2,5]使用線性模型對氣體傳感器數(shù)據(jù)進(jìn)行定量的多元分析;文獻(xiàn)[8-9]根據(jù)實驗經(jīng)驗提出使用冪函數(shù)模型來刻畫氣體傳感器的相對導(dǎo)電率與氣體濃度變化之間的關(guān)系;文獻(xiàn)[10]經(jīng)過理論上的考慮提出另一種形式的參數(shù)模型;文獻(xiàn)[11]則提出使用對數(shù)模型建立傳感器與氣體濃度之間的聯(lián)系。盡管這些文獻(xiàn)提出的模型都是聯(lián)系氣體傳感器響應(yīng)與氣體濃度之間關(guān)系的,但是它們彼此之間還是存在著一定的差異。在實際應(yīng)用中,真實模型的形式會因為氣體種類和傳感器類型的不同而不同。因此,如果選錯了對應(yīng)的模型,可能會導(dǎo)致最后無法得到較好的預(yù)測結(jié)果。
為了避免模型設(shè)定的錯誤,本文采用非參數(shù)模型建立每個傳感器與氣體濃度之間的聯(lián)系。采用局部線性核回歸的方法對非參數(shù)模型進(jìn)行擬合。對于每個非參數(shù)模型中的窗寬參數(shù),采用交叉驗證的方法進(jìn)行選取。在得到非參數(shù)模型擬合結(jié)果的同時,還可以得到非參數(shù)模型函數(shù)關(guān)于氣體濃度這個協(xié)變量一階偏導(dǎo)數(shù)的估計。這個一階偏導(dǎo)數(shù)的估計在后面對氣體濃度進(jìn)行逆向預(yù)測的時候會起到很大的作用。
這里使用非參數(shù)模型建模,主要是考慮到非參數(shù)模型本質(zhì)上包括線性模型與非線性模型這些特殊情況。采用非參數(shù)模型進(jìn)行建模也降低了由于模型選擇錯誤帶來的氣體濃度預(yù)測誤差較大的風(fēng)險,具有弱假設(shè)條件的非參數(shù)模型在面對數(shù)據(jù)污染的情況時會表現(xiàn)得更加穩(wěn)健[12]。
緊接著,需要對氣體的濃度進(jìn)行預(yù)測。這里面臨的預(yù)測問題與傳統(tǒng)的預(yù)測問題不同,傳統(tǒng)的預(yù)測問題往往是在已知協(xié)變量的情況下預(yù)測響應(yīng)變量的值。但在實際情況中,只能觀察到氣體傳感器的響應(yīng),也即回歸模型中的因變量。然后利用前面擬合好的模型,在已知?dú)怏w傳感器響應(yīng)的情況下,逆向預(yù)測氣體的濃度。為了得到更精確的預(yù)測結(jié)果,在實驗過程中,往往會使用比混合氣體種類更多的氣體傳感器,這樣會得到比氣體濃度更多的氣體傳感器數(shù)據(jù)。通過代入已經(jīng)擬合好的非參數(shù)模型,建立多個新的氣體傳感器響應(yīng)與未知濃度氣體之間的聯(lián)系,最小化它們之間的誤差,得到未知?dú)怏w濃度的預(yù)測值[13]。在后面的數(shù)值模擬分析和實際數(shù)據(jù)分析的過程中,我們發(fā)現(xiàn)非參數(shù)模型的表現(xiàn)都好于特定的參數(shù)模型。
為避免模型假定的錯誤,首先使用非參數(shù)模型對氣體傳感器響應(yīng)與真實的氣體濃度之間的關(guān)系進(jìn)行建模,模型如下所示:
yit=fi(Xt)+it,t=1,…,n,i=1,…,m,
(1)
式中:yit表示第i個傳感器的第t次觀察值,Xt=(x1 t,…,xkt)T表示第t次觀察時對應(yīng)的k種氣體濃度,it表示隨機(jī)誤差。這里假定誤差是獨(dú)立同分布的,且均值為 0。同時假定xjt,j=1,…,k這些協(xié)變量有緊湊的支撐Ω=[0,1]。在實際應(yīng)用中,如果xjt∈/[0,1],需要對所有的協(xié)變量進(jìn)行歸一標(biāo)準(zhǔn)化,如下所示
(2)
(3)
式中:Yi=(yi1,…,yin)T,Wxi=diag{Khi(X1-x),…,Khi(Xn-x)},
通過上面的處理,對每個氣體傳感器與氣體濃度之間的非參數(shù)模型進(jìn)行了擬合。因為我們的目的是預(yù)測未知的氣體濃度,所以需要根據(jù)擬合好的非參數(shù)模型,對k種氣體濃度進(jìn)行逆向預(yù)測。
假設(shè)觀察到m個新的傳感器的響應(yīng)為Ynew=(ynew1,…,ynewm)T,需要預(yù)測未知的k種氣體濃度記為Xnew=(xnew1,…,xnewk)T。根據(jù)前面提出的非參數(shù)模型(1),可以得到如下等式
ynew1=f1(Xnew)+1,
?
ynewm=fm(Xnew)+m.
接下來,采用最小二乘法得到未知濃度的氣體的逆向預(yù)測值。通過代入擬合好的m個傳感器對應(yīng)的非參數(shù)模型,需要最小化如下殘差平方和
(4)
將式(4)的極小值當(dāng)做是Xnew的逆向預(yù)測值。這里采用高斯牛頓法來求極小值[16]。前面介紹的非參數(shù)模型fi(·)關(guān)于氣體濃度的偏導(dǎo)數(shù)估計在這里發(fā)揮了關(guān)鍵的作用,下面介紹如何應(yīng)用高斯牛頓法解決非參數(shù)模型下氣體濃度的逆向預(yù)測問題。
(5)
(6)
(7)
在前面介紹的基于非參數(shù)模型對氣體濃度進(jìn)行逆向預(yù)測的方法中,首先是對每個傳感器對應(yīng)的非參數(shù)模型進(jìn)行擬合,當(dāng)時采用的擬合方法是局部線性核回歸。采用核方法比較關(guān)鍵的一步是確定核函數(shù)的窗寬。為了使得下一步能夠更好地對氣體濃度進(jìn)行預(yù)測,需要根據(jù)已有的數(shù)據(jù)提高非參數(shù)模型的擬合精度,因此需要盡量減小第一步所產(chǎn)生的擬合誤差。下面介紹本文采用的窗寬選擇方法。
關(guān)于非參數(shù)模型窗寬選擇的方法,很多文獻(xiàn)有過討論。比如,文獻(xiàn)[17]證明在具有單個連續(xù)協(xié)變量的回歸模型中,在使用局部多項式方法擬合時,通過交叉驗證選擇得到的帶寬具有漸近最優(yōu)性。文獻(xiàn)[18-19]指出利用數(shù)據(jù)驅(qū)動選擇窗寬的方法在非參數(shù)模型設(shè)定的情形下應(yīng)用十分廣泛,并證明在具有多個協(xié)變量的非參數(shù)模型中,通過交叉驗證選擇得到的窗寬在代入模型之后的漸進(jìn)正態(tài)性。以上研究都表明在非參數(shù)模型設(shè)置下使用交叉驗證進(jìn)行窗寬選擇具有良好的表現(xiàn),因此這里也采用交叉驗證的方法進(jìn)行窗寬選擇。下面需要最小化交叉驗證(CV)得分,表達(dá)式為
(8)
在實際應(yīng)用中,如果直接最小化式(8)來選擇窗寬,需要進(jìn)行n次非參數(shù)模型的擬合,計算成本很大。文獻(xiàn)[20]指出CV(hi1,…,hik)可以進(jìn)一步簡化為
(9)
其中Shi表示局部線性光滑矩陣,定義如下
本節(jié)將通過數(shù)值模擬檢驗基于非參數(shù)模型的氣體濃度逆向預(yù)測方法的效果。首先介紹一下以前的學(xué)者提出的一些描述氣體傳感器響應(yīng)與氣體濃度之間關(guān)系的校準(zhǔn)模型。 Clifford和Tuma[8-9]根據(jù)實驗觀察,提出將傳感器相對電導(dǎo)率與氣體濃度聯(lián)系起來的經(jīng)驗公式。該模型可以通過冪函數(shù)來描述,表達(dá)式如下
ypow(x)=(1+b·x)β,
(10)
式中:ypow(x)=G0/Gg(x)表示傳感器的相對導(dǎo)電率,G0表示傳感器在空氣中的基礎(chǔ)導(dǎo)電率,Gg(x)表示傳感器在氣體濃度為x下的導(dǎo)電率,b和β是未知的參數(shù)。
除此之外, Chaiyboun等[11]提出擬合傳感器響應(yīng)的對數(shù)模型,表達(dá)式如下
ylog(x)=a-b·ln(x+0.5),
(11)
式中:a和b為未知的模型參數(shù),x表示氣體濃度。
與此同時,Chaiyboun等[11]將式(10)和式(11)都推廣到兩種混合氣體的情形,表達(dá)式如下
ypow(x1,x2)=
(12)
式中:b1,β1,b2,β2為未知的模型參數(shù);x1,x2分別表示兩種混合氣體各自的氣體濃度。
ylog(x1,x2)=a0-b0·
(13)
式中:a0,b0,a1,b1為對數(shù)模型的參數(shù);x1,x2分別表示兩種混合氣體各自的氣體濃度。
接下來,使用Clifford和Tuma[8-9]提出的冪函數(shù)模型生成模擬數(shù)據(jù)。然后分別使用對數(shù)模型、冪函數(shù)模型和非參數(shù)模型構(gòu)建校準(zhǔn)模型。通過給定新的傳感器陣列響應(yīng),使用這些擬合好的模型對氣體濃度進(jìn)行逆向預(yù)測,并比較它們的表現(xiàn)。下面分別考慮單一氣體和兩種混合氣體的情況。
這里假設(shè)有單一氣體和 8 個半導(dǎo)體氣體傳感器,氣體濃度由范圍為[0,500]的均勻分布產(chǎn)生。不同傳感器的冪函數(shù)模型(10) 的預(yù)定義系數(shù)如表 1 所示。每次模擬生成的樣本數(shù)為1 000。
表1 8個傳感器對應(yīng)的冪函數(shù)模型 (10) 的預(yù)定義系數(shù) Table 1 Predefined coefficients in power functionmodel (10) for 8 sensors
根據(jù)式(10)產(chǎn)生對應(yīng)的模擬數(shù)據(jù),具體地,對于氣體濃度xj,第k個傳感器的響應(yīng)可以根據(jù)下面這個表達(dá)式產(chǎn)生:
ykj=ypow(xj)+σkj,
(14)
根據(jù)6∶4的比例將生成的數(shù)據(jù)分成兩個部分,其中 60%的數(shù)據(jù)進(jìn)行訓(xùn)練,40%用于測試。接下來,通過對訓(xùn)練數(shù)據(jù)集進(jìn)行交叉驗證來確定不同傳感器對應(yīng)的非參數(shù)模型(1)的窗寬參數(shù)。然后使用非參數(shù)模型對單一氣體的濃度進(jìn)行逆向預(yù)測。本文采用高斯核作為加權(quán)函數(shù)。同樣,首先使用訓(xùn)練數(shù)據(jù)擬合對數(shù)模型(11)和冪函數(shù)模型(10)。緊接著根據(jù)擬合好的 8 個傳感器對應(yīng)的對數(shù)模型和冪函數(shù)模型,通過非線性最小二乘的方法,對氣體濃度進(jìn)行逆向預(yù)測。
最后,將上述模擬過程重復(fù)200 次,并計算200次模擬結(jié)果的 RMSE 的均值和標(biāo)準(zhǔn)差(SD)。同時使用對數(shù)模型(11)、冪函數(shù)模型(10)和非參數(shù)模型(1)對氣體濃度進(jìn)行逆向預(yù)測,結(jié)果匯總在表2中。
表2 使用不同校準(zhǔn)模型對單一氣體濃度進(jìn)行逆向預(yù)測的結(jié)果對比 Table 2 Comparison of inverse prediction resultsof concentration for single gas amongdifferent calibration models
從表2可以看出,使用對數(shù)模型對氣體濃度進(jìn)行逆向預(yù)測的效果不如冪函數(shù)模型和非參數(shù)模型。同時可發(fā)現(xiàn)使用非參數(shù)模型對氣體濃度進(jìn)行逆向預(yù)測能夠取得與正確模型冪函數(shù)模型相同的效果,且使用這兩種模型得到的 RMSE 的標(biāo)準(zhǔn)差相比對數(shù)模型也是比較小的。
這一部分,考慮存在兩種混合氣體和8個半導(dǎo)體氣體傳感器的情況。每種氣體濃度同樣由范圍為 [0,500] 的均勻分布產(chǎn)生。表3列出8個不同傳感器對應(yīng)的冪函數(shù)模型(12)的預(yù)定義系數(shù)。每次模擬生成的樣本數(shù)為1 000。
因此采用適合兩種氣體狀況的模型(12)產(chǎn)生數(shù)據(jù),對于給定的氣體濃度x1j和x2j,第k個傳感器的響應(yīng)由如下表達(dá)式產(chǎn)生:
表3 8個傳感器對應(yīng)的冪函數(shù)模型(12)的預(yù)定義系數(shù)Table 3 Predefined coefficients of power functionmodel (12) for 8 sensors
ykj=ypow(x1j,x2j)+σkj,
(15)
同樣地,將數(shù)據(jù)分成60%的訓(xùn)練集和40%的測試集。運(yùn)用對數(shù)模型(13)、冪函數(shù)模型(12)和非參數(shù)模型(1)在訓(xùn)練集和測試集上分別對氣體濃度進(jìn)行逆向預(yù)測,然后通過計算氣體的預(yù)測濃度與真實濃度之間的RMSE比較這3種模型的表現(xiàn)。整個模擬過程重復(fù)200 次。接下來對比對數(shù)模型(13)、冪函數(shù)模型(12) 和非參數(shù)模型(1)在兩個數(shù)據(jù)集上的表現(xiàn),結(jié)果如表 4 所示。
表4 使用不同校準(zhǔn)模型對混合氣體濃度進(jìn)行逆向預(yù)測的結(jié)果對比 Table 4 Comparison of inverse prediction results of concentrations for mixed gases among different calibration models
正如從表 4 中看到的,對于兩種氣體的情況,采用非參數(shù)模型對氣體濃度進(jìn)行逆向預(yù)測的結(jié)果也好于對數(shù)模型。同時,非參數(shù)模型同樣也達(dá)到了與使用正確模型冪函數(shù)模型一樣的效果。其中冪函數(shù)模型和非參數(shù)模型對應(yīng)的 RMSE 的標(biāo)準(zhǔn)差都是比較小的,因此可以認(rèn)為非參數(shù)模型體現(xiàn)了更加穩(wěn)定的逆向預(yù)測能力。
這一節(jié)主要是通過對實際的氣體傳感器數(shù)據(jù)進(jìn)行分析,對比對數(shù)模型、冪函數(shù)模型和非參數(shù)模型對氣體濃度逆向預(yù)測的表現(xiàn)。本文使用Fonollosa等[21]在UCI機(jī)器學(xué)習(xí)網(wǎng)站上分享的氣體傳感器數(shù)據(jù)。這個數(shù)據(jù)集記錄了濃度變化的混合氣體暴露在16 個氣體傳感器的環(huán)境下,氣體濃度與傳感器響應(yīng)的時間序列數(shù)據(jù)。其中作者分別對兩種混合氣體的組合進(jìn)行了實驗,一種為乙烯與甲烷在空氣中的組合,另一種為乙烯和一氧化碳在空氣中的組合。每組實驗持續(xù)12 h,不斷改變混合氣體的濃度,分別記錄16個氣體傳感器的讀數(shù)。這16個傳感器包含4 種類型:TGS-2602,TGS-2600,TGS-2610,TGS-2620,其中每種傳感器有4個。實驗中氣體的濃度每間隔80~120 s會隨機(jī)改變一次,其中乙烯的濃度變化范圍為(0~20)×10-6,一氧化碳濃度的變化范圍為(0~600)×10-6,甲烷濃度的變化范圍為(0~300)×10-6。
首先,分析乙烯和一氧化碳這個氣體組合。為了更好地了解氣體傳感器數(shù)據(jù),隨機(jī)截取一段時間的傳感器數(shù)據(jù),按照氣體傳感器的種類分組展示傳感器讀數(shù)的變化,如圖 1 所示。
圖1 傳感器陣列的讀數(shù)Fig.1 Readings on the sensor array
圖1依次展示TGS-2602,TGS-2600,TGS-2610,TGS-2620這4種類型的傳感器的讀數(shù)。發(fā)現(xiàn)TGS-2602傳感器在某些時刻會產(chǎn)生突變,無法對氣體濃度變化做出規(guī)律的反應(yīng)。因此,在后面的分析步驟中,會去掉這個傳感器的數(shù)據(jù)。同時,F(xiàn)onollosa等[21]在網(wǎng)站上提供的氣體濃度數(shù)據(jù)是設(shè)定時刻的濃度值,而我們在模型中考慮的是傳感器響應(yīng)與氣體真實濃度之間的關(guān)系。因此需要考慮設(shè)定時刻的氣體濃度到達(dá)傳感器過程中的時間延遲。根據(jù)Fonollosa等[21]的數(shù)據(jù)處理代碼,得到氣體到達(dá)傳感器的不同時間,一氧化碳和甲烷為 17.82 s,乙烯為 26.73 s。 為了將真實的氣體濃度與傳感器的讀數(shù)進(jìn)行匹配,需要根據(jù)前面計算出來的延遲時間對氣體濃度數(shù)據(jù)進(jìn)行平移。例如:在t秒時的一氧化碳的實際濃度需用(t-17.82)s處的設(shè)定濃度值代替,乙烯在t秒時的實際濃度需用(t-26.73) s 處的設(shè)定濃度值代替。
為對比氣體濃度平移變換前后的不同,分別畫出未經(jīng)平移變換和經(jīng)過平移變換后的乙烯和一氧化碳的濃度與氣體傳感器陣列的讀數(shù)變化圖,如圖2和圖3所示。圖2為未經(jīng)平移處理的情況,第1個面板圖展示15個傳感器的讀數(shù)變化,垂直虛線標(biāo)示對應(yīng)的濃度變化時刻,第2和第3個面板圖展示未經(jīng)平移變換的乙烯和一氧化碳濃度的變化。 圖3為經(jīng)過平移處理的情況,第1個面板圖展示15個傳感器的讀數(shù)變化,垂直虛線標(biāo)示對應(yīng)的濃度變化時刻,第2和第3個面板圖展示經(jīng)過平移變換的乙烯和一氧化碳濃度的變化。
圖2 傳感器陣列的讀數(shù)與未經(jīng)平移變換的乙烯和一氧化碳濃度Fig.2 Readings on sensor array and concentrations ofethylene and CO without shifting
圖3 傳感器陣列的讀數(shù)與經(jīng)過平移變換的乙烯和一氧化碳濃度Fig.3 Readings on sensor array and concentrations ofethylene and CO with shifting
通過圖2和圖3的對比,發(fā)現(xiàn)經(jīng)過平移處理后傳感器讀數(shù)的變化與氣體濃度的變化更為一致,因此在分析數(shù)據(jù)之前需要對氣體的濃度數(shù)據(jù)進(jìn)行平移。同時,從圖3可以看出,在氣體濃度轉(zhuǎn)換的階段,傳感器的讀數(shù)都會發(fā)生突變,但這段突變并不能顯示傳感器與對應(yīng)氣體濃度的關(guān)系。因此后面的分析過程中,去掉了這些突變的部分,處理之后的數(shù)據(jù)如圖 4 所示。
圖4 截取后穩(wěn)定階段的傳感器陣列讀數(shù)與對應(yīng)的氣體濃度Fig.4 Readings on sensor array in the stable phase afterinterception and the corresponding gas concentrations
采用對數(shù)模型 (13)、冪函數(shù)模型 (12) 和非參數(shù)模型 (1) 對氣體濃度進(jìn)行逆向預(yù)測,其中對數(shù)模型和冪函數(shù)模型的響應(yīng)變量是傳感器的相對導(dǎo)電率。而Fonollosa等[21]給出的傳感器讀數(shù)為其導(dǎo)電率,需要對原始數(shù)據(jù)進(jìn)行處理得到相對導(dǎo)電率。而我們提出的非參數(shù)模型對響應(yīng)變量的具體含義并沒限制。
在使用非參數(shù)模型 (1) 時分別考慮兩種不同的情況:第1種情況考慮模型(1)的響應(yīng)變量y為相對導(dǎo)電率;第2種情況考慮模型(1)的響應(yīng)變量y為作者給定的原始讀數(shù)。然后比較使用對數(shù)模型 (11)、冪函數(shù)模型(10)和非參數(shù)模型 (1) 進(jìn)行氣體濃度逆向預(yù)測的表現(xiàn),結(jié)果如表5所示。括號中的 RC 表示模型因變量使用的是傳感器的相對導(dǎo)電率,OR 表示模型因變量使用的是傳感器的原始讀數(shù)。
表5 使用不同校準(zhǔn)模型對乙烯和一氧化碳濃度逆向預(yù)測的RMSE Table 5 RMSE of inverse prediction for ethylene andCO concentrations among different calibration models ×10-6
根據(jù)同樣的步驟分析甲烷和乙烯這個氣體組合的數(shù)據(jù),結(jié)果如表 6 所示。
表6 使用不同校準(zhǔn)模型對乙烯和甲烷濃度逆向預(yù)測的RMSE Table 6 RMSE of inverse prediction for ethyleneand methane concentrations amongdifferent calibration models ×10-6
從表5和表6的結(jié)果可以看出非參數(shù)模型的表現(xiàn)優(yōu)于對數(shù)模型和冪函數(shù)模型。進(jìn)一步發(fā)現(xiàn)直接使用傳感器的原始讀數(shù)建立模型,得到的RMSE更小。通過實際分析結(jié)果可以看出使用非參數(shù)模型對氣體濃度進(jìn)行逆向預(yù)測具有更高的靈活性,同時也可以得到比非線性模型更好的預(yù)測結(jié)果。
本文提出一種基于非參數(shù)模型的氣體濃度的逆向預(yù)測方法,通過數(shù)值模擬和實際數(shù)據(jù)分析兩個維度對比非參數(shù)模型、對數(shù)模型和冪函數(shù)模型的表現(xiàn)。從數(shù)值模擬的結(jié)果可以看出,當(dāng)模型選擇錯誤時,對數(shù)模型的結(jié)果不如非參數(shù)模型和正確的冪函數(shù)模型,同時在使用非參數(shù)模型對氣體濃度進(jìn)行逆向預(yù)測時也取得了與冪函數(shù)模型一樣好的結(jié)果。實際分析結(jié)果也表明非參數(shù)模型對氣體濃度進(jìn)行逆向預(yù)測的效果好于對數(shù)模型和冪函數(shù)模型。
在構(gòu)建傳感器響應(yīng)與氣體濃度之間關(guān)系的過程中,一些學(xué)者提出的線性模型和非線性模型過于具體。在實際應(yīng)用中,如果假定的模型與實際的模型有偏差,氣體的預(yù)測結(jié)果將會受到影響。因此,我們建議采用非參數(shù)模型構(gòu)建校準(zhǔn)模型。
在對氣體濃度進(jìn)行逆向預(yù)測的步驟中,需要采用高斯牛頓法最小化傳感器響應(yīng)與模型之間的誤差。高斯牛頓法以前一般是應(yīng)用于非線性的最小二乘問題,而我們在使用非參數(shù)模型建模對氣體濃度進(jìn)行逆向預(yù)測時,需要解決的是非參數(shù)的最小二乘問題。由于在使用局部線性核回歸方法擬合非參數(shù)模型時,也得到了非參數(shù)模型關(guān)于自變量偏導(dǎo)數(shù)的估計,這里創(chuàng)造性地將這個偏導(dǎo)數(shù)應(yīng)用到高斯牛頓法中,也解決了非參數(shù)的最小二乘問題。
雖然本文提出的方法是應(yīng)用于氣體濃度的預(yù)測問題,但是它對解決生物學(xué)和藥學(xué)等其他領(lǐng)域的一些問題也具有一定的借鑒意義。例如,當(dāng)遇到只能觀察到響應(yīng)變量、但是感興趣的協(xié)變量和兩者之間的關(guān)系都未知的情況時,就可以使用基于非參數(shù)模型對協(xié)變量進(jìn)行逆向預(yù)測的方法。
在實際應(yīng)用這些方法的過程中,我們發(fā)現(xiàn)非參數(shù)模型進(jìn)行運(yùn)算需要的時間多于非線性的參數(shù)模型。主要有如下兩個原因:一方面,使用式(3) 擬合非參數(shù)模型需要復(fù)雜的計算;另一方面,在使用非參數(shù)回歸進(jìn)行逆向預(yù)測步驟中,重復(fù)迭代式(6)會增加計算負(fù)擔(dān)。這也是使用非參數(shù)模型進(jìn)行逆向預(yù)測方法的缺陷之一。此外,在擬合非參數(shù)模型的步驟中,認(rèn)為誤差是獨(dú)立同分布的??梢赃M(jìn)一步研究相關(guān)誤差的情況,最終的預(yù)測準(zhǔn)確率可能會有所改善。