趙 暢,裴旭明,王海峰,康 凱
(1.中國科學(xué)院大學(xué)微電子學(xué)院,北京 100049;2.中國科學(xué)院上海高等研究院,上海 201210;3.中國科學(xué)院微系統(tǒng)與信息技術(shù)研究所,上海 200050)
日益加劇的水污染問題凸顯出水質(zhì)監(jiān)測(cè)工作的重要性。常規(guī)的監(jiān)測(cè)方法是水質(zhì)實(shí)驗(yàn)室定期采樣,該方法精度高、監(jiān)測(cè)的參數(shù)多,但過程繁瑣、實(shí)時(shí)性差[1]?;跓o線傳感器網(wǎng)絡(luò)的水質(zhì)監(jiān)測(cè)系統(tǒng)實(shí)時(shí)性強(qiáng),得到廣泛應(yīng)用[2]。然而,部署在系統(tǒng)中的傳感器會(huì)因?yàn)槔匣?、中毒等而出現(xiàn)漂移現(xiàn)象[3]。因此,研究傳感器校準(zhǔn)問題,能提高水質(zhì)監(jiān)測(cè)系統(tǒng)的準(zhǔn)確性,對(duì)于水污染防治具有重要意義。
已有的傳感器校準(zhǔn)方法主要分為兩大類:一類是從電路和工藝的角度提高精度[4-5],但該方法對(duì)器件工藝要求高,技術(shù)上不夠成熟;另一類是從信號(hào)處理的角度進(jìn)行校準(zhǔn),主流方法是利用數(shù)據(jù)的時(shí)空相關(guān)性進(jìn)行同構(gòu)或異構(gòu)盲校準(zhǔn)[6],但盲校準(zhǔn)方法存在傳感器集體漂移的極端情況,校準(zhǔn)偏差較大。另外,有些研究是利用標(biāo)準(zhǔn)數(shù)據(jù)作為參考來校準(zhǔn)。Moon等人[7]為了補(bǔ)償溫度傳感器的漂移,提出一種多元線性回歸方法,比較了校準(zhǔn)溫度與單個(gè)溫度探頭的均方根誤差;Bhatt等人[8]參考地球靜止軌道衛(wèi)星可見傳感器得到大氣輻射模型,從而校準(zhǔn)目標(biāo)傳感器;高可等人[9]研究了基于無磁轉(zhuǎn)臺(tái)的標(biāo)定方法,依靠外界參考信息來校正磁強(qiáng)計(jì)。但這類方法需要大量樣本數(shù)據(jù),而參考數(shù)據(jù)不易獲取。
現(xiàn)階段我國環(huán)境監(jiān)測(cè)以人工采樣和實(shí)驗(yàn)室分析為主,實(shí)驗(yàn)室數(shù)據(jù)樣本相對(duì)于監(jiān)測(cè)系統(tǒng)是稀疏的。本文利用稀疏采樣算法,對(duì)比分析監(jiān)測(cè)系統(tǒng)的數(shù)據(jù)與實(shí)驗(yàn)室數(shù)據(jù),提高水質(zhì)監(jiān)測(cè)系統(tǒng)的準(zhǔn)確性。
在基于無線傳感器網(wǎng)絡(luò)的水質(zhì)監(jiān)測(cè)系統(tǒng)中,將在t=[1,2,…,N]T時(shí)間某個(gè)傳感器節(jié)點(diǎn)的測(cè)量數(shù)據(jù)記為s=[s1,s2,…,sN]T,其中N表示傳感器測(cè)量次數(shù)。假設(shè)真實(shí)環(huán)境物理量為r=[r1,r2,…,rN]T,且與傳感器漂移d、噪聲ω滿足加性關(guān)系[6]:
s=r+d+ω
(1)
式中:d為傳感器漂移,d=[d1,d2,…,dN]T,屬于系統(tǒng)誤差;ω為隨機(jī)噪聲,ω=[ω1,ω2,…,ωN]T,是零均值、方差為σ2的高斯白噪聲。
(2)
如果已知部分時(shí)間點(diǎn)及其對(duì)應(yīng)的傳感器漂移,就可以把時(shí)間作為自變量,把傳感器漂移作為因變量,進(jìn)行曲線擬合來求解漂移模型的參數(shù),從而求得密集的傳感器漂移序列d=[d1,d2,…,dN]T。
(3)
式中:M為標(biāo)準(zhǔn)數(shù)據(jù)的采樣次數(shù);N為傳感器測(cè)量次數(shù);γ為標(biāo)準(zhǔn)數(shù)據(jù)的采樣率;s.t.表示受約束于,其后為約束條件。
觀測(cè)矩陣Φ是一個(gè)M×N的稀疏矩陣。誤差表示如下:
(4)
因此,傳感器校準(zhǔn)問題轉(zhuǎn)化為了傳感器時(shí)間漂移的模型估計(jì)和觀測(cè)矩陣的優(yōu)化問題。
在時(shí)間序列t=[1,2,…,N]T內(nèi),傳感器測(cè)量N次,在該傳感節(jié)點(diǎn)處進(jìn)行M次實(shí)驗(yàn)室標(biāo)準(zhǔn)數(shù)據(jù)的采樣,對(duì)應(yīng)的采樣時(shí)間序列為ts=[t1,t2,…,tM]T,(1≤t1 根據(jù)壓縮感知理論[10],長度為N的傳感器數(shù)據(jù)s=[s1,s2,…,sN]T,與長度為M的采樣時(shí)刻所對(duì)應(yīng)的標(biāo)準(zhǔn)數(shù)據(jù)ss之間滿足以下關(guān)系: ss=Φs (5) 當(dāng)s足夠稀疏(‖s‖0< s=Ψx 式中:Ψ為稀疏表達(dá)基;x是N×1的稀疏向量,滿足‖x‖0=K,且K< 基于標(biāo)準(zhǔn)數(shù)據(jù)稀疏采樣校準(zhǔn)算法的流程如下: (1)輸入:采樣率γ,迭代次數(shù)L; (2)初始化:總時(shí)間N,環(huán)境量r,傳感器數(shù)據(jù)s; (3)計(jì)算采樣點(diǎn)數(shù)M=N×γ; (4)對(duì)于周期性觀測(cè)矩陣的第j行,如果j=0,Φ(0,0)←1,否則Φ(j,j×int(N/M)-1)←1; (5)在每一次迭代中: ④根據(jù)式(4)計(jì)算第i次迭代的均方根誤差; ⑤計(jì)算每個(gè)時(shí)間點(diǎn)的平方誤差,從小到大排序; ⑥將前M個(gè)最小誤差的時(shí)刻tm升序排,存為ts; ⑦將觀測(cè)矩陣賦值為全0矩陣; ⑧更新觀測(cè)矩陣Φ(j,ts[j])←1。 在第1次迭代中,采用周期性觀測(cè)矩陣Φ來確定采樣時(shí)刻ts。在以后的第i(i≥2)次迭代過程中,采樣時(shí)刻的確定方法是:計(jì)算第i-1次迭代時(shí)每個(gè)時(shí)間點(diǎn)對(duì)應(yīng)的傳感器校準(zhǔn)值和測(cè)量值的平方誤差,將誤差從小到大排序,選取前M個(gè)最小誤差所對(duì)應(yīng)的時(shí)間點(diǎn),將其組成向量tm,把時(shí)間點(diǎn)按照誤差升序排列后,即可得到第i次迭代的采樣時(shí)間序列ts=[t1,t2,…,tM]T。總時(shí)間t和采樣時(shí)間ts構(gòu)成一個(gè)M×N的觀測(cè)矩陣Φ(M< 仿真數(shù)據(jù)集由104個(gè)時(shí)間點(diǎn)對(duì)應(yīng)的環(huán)境數(shù)據(jù)和pH傳感器測(cè)量數(shù)據(jù)組成。為了簡便處理,假設(shè)測(cè)量過程中的隨機(jī)噪聲為高斯白噪聲。 本文以離子敏場(chǎng)效應(yīng)管(ion-selective field effect transistor,ISFET) pH傳感器漂移模型為例,生成仿真的漂移數(shù)據(jù)。Jamasb等人[3]建立了ISFET pH傳感器的漂移物理模型: (6) 式中:ΔVG(t)為ISFET柵極電壓的變化量;QI是由絕緣體中可能存在的各種電荷在半導(dǎo)體中誘導(dǎo)的單位面積有效電荷;QD和Qinv分別為存儲(chǔ)在半導(dǎo)體耗盡層中的電荷和反電荷;εins為pH敏感絕緣體的介電常數(shù);εSL為化學(xué)表面改性層的介電常數(shù);xSL(∞)為表面改性層的最終厚度;τ是松弛時(shí)間常數(shù);β表示擴(kuò)散過程的擴(kuò)散參數(shù)。 能斯特方程[11]描述了離子傳感器的響應(yīng)電勢(shì)隨離子活度的變化關(guān)系,其表達(dá)式為: (7) 式中:E為指示電極的電勢(shì);E0為電極的標(biāo)準(zhǔn)電勢(shì);R為焦耳常數(shù);T為熱力學(xué)溫度;F是法拉第常數(shù);αH是外側(cè)溶液中離子活度,與離子濃度成正比。 當(dāng)溫度恒定時(shí)電化學(xué)pH傳感器產(chǎn)生的電動(dòng)勢(shì)是pH的線性函數(shù)。將式(6)的漂移模型簡化成含參數(shù)k、α、β的函數(shù),則時(shí)刻n的漂移可以表示為: dn=k×{1-exp[-(αn)β]} (8) 利用式(8)生成仿真的漂移數(shù)據(jù),相應(yīng)參數(shù)設(shè)定如表1所示。 表1 漂移模型參數(shù) 仿真實(shí)驗(yàn)分為兩個(gè)步驟:數(shù)據(jù)預(yù)處理;驗(yàn)證第3節(jié)算法性能,得到采樣點(diǎn)分布和校準(zhǔn)誤差。 校準(zhǔn)數(shù)據(jù)前要進(jìn)行預(yù)處理,包括處理缺失值和異常值。 缺失值:用前一個(gè)時(shí)刻的數(shù)據(jù)來填充缺失數(shù)據(jù)。 (9) (10) 如圖1(a)所示,原始測(cè)量數(shù)據(jù)中有缺失值和異常值,圖中橫坐標(biāo)表示時(shí)間點(diǎn),縱坐標(biāo)表示該時(shí)間點(diǎn)對(duì)應(yīng)的pH數(shù)值。經(jīng)過預(yù)處理后的數(shù)據(jù)如圖1(b)所示,不完整數(shù)據(jù)和不一致數(shù)據(jù)明顯減少,數(shù)據(jù)趨于平滑。 (a)原始的傳感器測(cè)量數(shù)據(jù) (b)預(yù)處理后的數(shù)據(jù)圖1 原始傳感器測(cè)量數(shù)據(jù)與預(yù)處理后的數(shù)據(jù) 仿真中設(shè)置采樣率γ=0.5%,迭代次數(shù)L=20,總時(shí)間長度N=104,采樣點(diǎn)數(shù)目M=50。觀測(cè)矩陣Φ初始化為周期性矩陣,即每隔200個(gè)點(diǎn)采樣1次,矩陣每行只有一個(gè)非0元素“1”,每列的非0元素的間隔相同,形式如下: 當(dāng)算法穩(wěn)定時(shí),觀測(cè)矩陣為非均勻矩陣,采樣點(diǎn)ts與總時(shí)間t之間滿足ts=Φt。 圖2 校準(zhǔn)前后數(shù)據(jù)對(duì)比與標(biāo)準(zhǔn)采樣點(diǎn)的分布 圖3反映了校準(zhǔn)誤差隨迭代次數(shù)的變化,算法迭代20次,校準(zhǔn)誤差為算法最后一次迭代時(shí)校準(zhǔn)值與環(huán)境物理量的均方根誤差RMSE。前幾次迭代過程中,校準(zhǔn)誤差明顯降低,說明更新觀測(cè)矩陣時(shí)采樣點(diǎn)的變化比較劇烈。經(jīng)過7次迭代后采樣點(diǎn)逐漸穩(wěn)定,校準(zhǔn)模型與環(huán)境物理量之間的損失函數(shù)收斂到7.154×10-3。 圖3 稀疏采樣校準(zhǔn)算法的校準(zhǔn)誤差變化 圖4對(duì)比了不同采樣率下周期性采樣和非周期性采樣的校準(zhǔn)誤差。校準(zhǔn)誤差為算法最后一次迭代的均方根誤差,采樣率的取值集合為{0.2%,0.6%,1.0%,1.4%,1.8%,2.2%}。當(dāng)采樣率低于1.4%時(shí),兩種采樣方法的校準(zhǔn)誤差都隨著采樣率增加而逐漸降低;當(dāng)采樣率高于1.4%后,兩種方法的校準(zhǔn)誤差趨于穩(wěn)定。另外,非周期性稀疏采樣方法的誤差始終比周期性采樣誤差小??紤]到仿真數(shù)據(jù)集較小以及損失函數(shù)數(shù)量級(jí)較小等因素,實(shí)際應(yīng)用中,在滿足傳感器數(shù)據(jù)精度的情況下,可以適當(dāng)周期性地采集數(shù)據(jù),來代替非周期性采樣。 圖4 非周期性采樣與周期性采樣的校準(zhǔn)誤差比較 本文提出了一種基于標(biāo)準(zhǔn)數(shù)據(jù)稀疏采樣的傳感器校準(zhǔn)算法。以ISFET pH傳感器為例,應(yīng)用壓縮感知采樣理論,通過迭代優(yōu)化觀測(cè)矩陣得到稀疏的實(shí)驗(yàn)室數(shù)據(jù),再估計(jì)傳感器漂移模型,從而實(shí)現(xiàn)數(shù)據(jù)校準(zhǔn)。更進(jìn)一步,當(dāng)采樣率為0.5%時(shí),利用迭代算法給出了非均勻采樣的具體時(shí)間點(diǎn)。該算法滿足稀疏采樣算法的時(shí)間非均勻性的要求,校準(zhǔn)誤差比周期性采樣方法小,計(jì)算復(fù)雜度低,有助于制定實(shí)驗(yàn)室標(biāo)準(zhǔn)數(shù)據(jù)的采樣策略。2 算法描述
3 仿真實(shí)驗(yàn)
3.1 數(shù)據(jù)預(yù)處理
3.2 校準(zhǔn)結(jié)果分析
4 結(jié)束語