劉登飛 潘 濤
(1、中山火炬職業(yè)技術(shù)學(xué)院光電信息學(xué)院,廣東 中山528436 2、暨南大學(xué),廣東 廣州510632)
在甘蔗制糖過程管理中,清糖漿是某一環(huán)節(jié)的重要產(chǎn)物,清糖漿的錘度(Bx)是最基礎(chǔ)、最重要的品質(zhì)評(píng)價(jià)指標(biāo)之一。制糖工業(yè)中檢測方法通常采用化學(xué)試劑分析方法,這種方法耗時(shí)、成本也高,無法快速和在線測定。同時(shí)中紅外光譜測試組分的紅外光譜存在著強(qiáng)烈吸收導(dǎo)致不必要的干擾影響。據(jù)文獻(xiàn)報(bào)道,利用傅里葉變換紅外(FTIR)和衰減全反射(ATR)技術(shù)[1]可以非常好的解決相關(guān)問題,使得中紅外光譜分析獲得了廣泛的應(yīng)用[2,3]。
本文采用MWPLS 算法結(jié)合FTIR /ATR 技術(shù)建立甘蔗清糖漿錘度的定標(biāo)模型。為了進(jìn)一步提高模型精度,試探多種方法,最后結(jié)果表明,采用MWPLS 遴選的局部最優(yōu)波段的最好組合波段比全譜波段所得到預(yù)測值具有更高的精度。
105 份甘蔗清糖漿樣品及其重要參數(shù)參考化學(xué)值數(shù)據(jù)由廣東某糖廠提供。樣品錘度化學(xué)值范圍57~67.16%。全體參考化學(xué)值的均值和標(biāo)準(zhǔn)偏差分別為62.41%和1.99%。實(shí)驗(yàn)器材采用布魯克公司的V 70 型傅里葉變換紅外光譜儀(FTIR)和水平衰減全反射(ATR)樣品測量器材。附件器材ATR 的樣品槽為硫化鋅晶體,450入射角,反射3 次。光譜掃描范圍為4500~600cm-1,分束器為溴化鉀,傳感器敏感元件為R-D,掃描次數(shù)為32,分辨率為4cm-1。實(shí)驗(yàn)室溫度為26±1℃,濕度為45%RH。
做實(shí)驗(yàn)時(shí),采集清糖漿樣品置于附件器材樣品槽中,用ATR方式獲得樣品的吸收光譜,每個(gè)樣品重復(fù)掃描3 次,計(jì)算平均光譜。
光譜技術(shù)是一種數(shù)據(jù)分析技術(shù),需要借助樣品重要參數(shù)的化學(xué)值和光譜數(shù)據(jù)一起建立數(shù)學(xué)模型。本文基于所有樣品最好單個(gè)波數(shù)模型的計(jì)算效果給出劃分定標(biāo)集和預(yù)測集的一種新方法。根據(jù)甘蔗清糖漿樣品吸光度與重要參數(shù)錘度(Bx)化學(xué)值的單個(gè)波數(shù)線性模型
SWPB 是所有測試樣品二值的線性關(guān)聯(lián)性,為了讓定標(biāo)模型的分類劃分具有良好的科學(xué)性和預(yù)測性,在這里利用計(jì)算機(jī)組合篩選,使得定標(biāo)集和預(yù)測集的所有樣品的SWPB 值分布一致。
SG 平滑有原譜平滑、s 階導(dǎo)數(shù)平滑多種模式(s=1,2,…),窗口平移的方式,窗口大?。ㄆ交c(diǎn)數(shù): 2m+1)可變。在窗口內(nèi),每一個(gè)波數(shù)點(diǎn)先做最小二乘擬合(多項(xiàng)式次數(shù)n 可變),用同次數(shù)的多項(xiàng)式來要求各點(diǎn)總殘差平方和最小,擬合后計(jì)算幾何中心光譜平滑值和所有階導(dǎo)數(shù)平滑值,再通過窗口平移,算出所有幾何中心點(diǎn)的平滑值,得出原譜和各階導(dǎo)數(shù)的平滑譜。經(jīng)過計(jì)算機(jī)程序計(jì)算,得到對應(yīng)的平滑模式共有582 個(gè)。經(jīng)過選擇,可以有效消除各種光譜隨機(jī)噪音,保留有用的光譜信息[4]。
為了減少噪聲信號(hào)的影響和提高模型的預(yù)測性能,本文采用一種基于移動(dòng)窗口策略的偏最小二乘法來建立PLS 模型。MWPLS 算法考慮到這一點(diǎn):靠近波數(shù)信息一般具有很高的關(guān)聯(lián)性是因?yàn)榧t外光譜的本質(zhì)是物質(zhì)分子各種運(yùn)動(dòng)能級(jí)的外在表現(xiàn);如果一個(gè)波數(shù)信息可以用來建立定標(biāo)預(yù)測模型,那么以它為中心其周圍的范圍內(nèi)也應(yīng)該可以建立定標(biāo)預(yù)測模型;如果一個(gè)波數(shù)信息受到與目標(biāo)物無關(guān)信息的干擾,那么以其為中心其周圍的范圍內(nèi)也應(yīng)該受到與目標(biāo)物無關(guān)信息的干擾[5],所以在這里采用MWPLS 優(yōu)選波段。
圖1 為105 個(gè)甘蔗清糖漿樣品和純水的FTIR/ATR 光譜。在3260 cm-1、1633 cm-1附近對應(yīng)有水分子的強(qiáng)烈吸收。在指紋區(qū)域(1500 cm-1~600 cm-1)有非常尖銳的吸收峰,這部分區(qū)域包含了豐富的甘蔗清糖漿等主要成份的吸收信息。所以主要考慮3000 cm-1~2400 cm-1和1500 cm-1~600 cm-1這兩個(gè)區(qū)域。
圖1 105 個(gè)樣品和水的FTIR/ATR 光譜
圖2 全體樣品SWPB 值與化學(xué)值的分布
按2.2 節(jié)所述,在每個(gè)波數(shù)信息點(diǎn)ν 上,建立單個(gè)波數(shù)模型,計(jì)算全體樣品的預(yù)測值與參考化學(xué)值的均方根偏差,按照均方根偏差最小找到最好波數(shù)vOptimal 為1140 cm-1。根據(jù)1140 cm-1對應(yīng)的最好單個(gè)波數(shù)模型計(jì)算每個(gè)樣品的預(yù)測偏差值,結(jié)果如圖2。根據(jù)圖2,所有樣品的化學(xué)值和預(yù)測偏差值值分布平均,沒有明顯的壞樣品,所以,采用所有樣品來建立定標(biāo)預(yù)測模型。按照大約2:1 的比例,得到105 個(gè)樣品中定標(biāo)集(70個(gè))和預(yù)測集(35 個(gè))的范圍,劃分后用于建模的所有樣品的重要參數(shù)錘度化學(xué)值的初步分析如表1。
表1 105 個(gè)清糖漿樣品化學(xué)值的初步分析
按2.4 節(jié)所述,建立移動(dòng)窗口PLS 模型,移動(dòng)窗口的起點(diǎn)從4500cm-1到600cm-1,每隔1.8 cm-1一個(gè)波數(shù)點(diǎn),移動(dòng)窗口包含的波數(shù)點(diǎn)數(shù)為2~2100。本文選取了具有代表性的一部分窗口(內(nèi)的波數(shù)數(shù)據(jù)點(diǎn))建立PLS 模型。MWPLS 程序在Matlab 下實(shí)現(xiàn)(本文所牽涉到的算法均用Matlab 語言編寫實(shí)現(xiàn))。又按2.3節(jié)的方法,采用SG 平滑化法,得到結(jié)果是SG 平滑預(yù)處理之后的定標(biāo)模型的RMSEP 值都要低于未做預(yù)處理的定標(biāo)模型的RMSEP 值。最終程序結(jié)果表明采用MWPLS 遴選的局部最優(yōu)波段的組合波段可望代替全譜波段得到好的預(yù)測效果。
本文采用FTIR /ATR 光譜技術(shù)結(jié)合MWPLS 算法建立甘蔗清糖漿錘度的定量模型。所采用的定標(biāo)集和預(yù)測集的劃分方法具有良好的建模代表性、客觀性和穩(wěn)定性,有望推廣。以模型的RMSEP 為優(yōu)化目標(biāo),利用MWPLS 在全譜中遴選出若干個(gè)局部最優(yōu)波段,建立直接PLS 定標(biāo)模型得到最優(yōu)組合波段。另外,也對前面組合建立平滑PLS 模型,計(jì)算相應(yīng)的RMSEP 值,得到更優(yōu)的組合波段。從而表明,SG 平滑光譜預(yù)處理要比未做預(yù)處理預(yù)測效果要好,Matlab 程序采用MWPLS 遴選的最優(yōu)組合波段所建立的模型具有最好的預(yù)測精度,為FTIR/ATR 技術(shù)應(yīng)用于甘蔗清糖漿錘度的定量分析提供優(yōu)秀的數(shù)學(xué)模型。