国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于高光譜成像技術(shù)的配方煙絲組分判別

2021-08-24 13:31梅吉帆李智慧李嘉康蘇子淇堵勁松徐大勇李華杰
分析測試學(xué)報(bào) 2021年8期
關(guān)鍵詞:煙絲二階波長

梅吉帆,李智慧,李嘉康,蘇子淇,徐 波,堵勁松,徐大勇*,李華杰

(1.中國煙草總公司鄭州煙草研究院 煙草工藝重點(diǎn)實(shí)驗(yàn)室,河南 鄭州450001;2.福建中煙工業(yè)有限責(zé)任公司,福建 廈門361021)

配方煙絲是葉絲、梗絲、膨脹絲、薄片絲等組分按配方比例均勻摻配后得到的產(chǎn)品。梗絲、膨脹絲、薄片絲的摻配,對降低卷煙成本、降焦減害、改善感官質(zhì)量有重要意義[1-4]。因此,快速準(zhǔn)確地測定各組分在產(chǎn)品中的比例,對于保持產(chǎn)品質(zhì)量、考查各組分的配方設(shè)計(jì)目標(biāo)值、穩(wěn)定煙絲混合工藝質(zhì)量及同質(zhì)化生產(chǎn)具有重大意義[5]。目前,有關(guān)各組分比例測定的研究已有較多報(bào)道,林慧等[6]利用膨脹絲在無水乙酮中的漂浮率遠(yuǎn)高于其他組分,提出一種基于乙酮比重法的膨脹絲組分比例測定方法;李斌等[7]通過建立煙絲梗絲含量與熱解曲線突變溫度區(qū)間的擬合模型,實(shí)現(xiàn)了煙絲中梗絲含量的預(yù)測;胡立中等[5]利用近紅外光譜技術(shù),建立了梗絲、薄片絲在煙絲中比例的預(yù)測模型。但這些技術(shù)都存在對測試樣品具有破壞性、測試周期長、時(shí)效性差等不足。因此,研究一種快速、無損、準(zhǔn)確的配方煙絲組分判別方法極其重要。

高光譜成像技術(shù)(Hyperspectral imaging,HSI)結(jié)合了傳統(tǒng)計(jì)算機(jī)視覺與光譜分析技術(shù)的特點(diǎn),將傳統(tǒng)二維成像技術(shù)和光譜技術(shù)有機(jī)結(jié)合,可以同時(shí)獲取樣品的詳細(xì)光譜信息和圖像信息[8]。目前近紅外高光譜技術(shù)在食品安全和質(zhì)量無損檢測領(lǐng)域的研究逐年增多。趙冬娥等[9]利用主成分分析法提取3種類別垃圾的參考光譜,使用光譜角度填圖法和Fisher判別方法,實(shí)現(xiàn)了紙質(zhì)、塑料、木質(zhì)垃圾的準(zhǔn)確分類,分類準(zhǔn)確度可達(dá)99%。馮朝麗等[10]通過提取全波段感興趣區(qū)域的玉米平均相對反射光強(qiáng)作為分類特征,結(jié)合偏最小二乘判別(PLS-DA)分類模型實(shí)現(xiàn)了玉米品種的分類。李江波等[11]基于高光譜成像技術(shù),結(jié)合主成分分析法和波段比算法對潰瘍果進(jìn)行分類識別,準(zhǔn)確率可達(dá)95.4%。

本研究擬通過近紅外高光譜成像技術(shù)進(jìn)行配方煙絲組分判別的可行性考察,探索建立面對像素的配方煙絲4種組分的支持向量機(jī)判別模型及結(jié)果可視化,并建立面對樣本的配方煙絲4種組分支持向量機(jī)和K近鄰定性判別模型,以期為后續(xù)利用判別結(jié)果進(jìn)行組分比例測定提供支撐。

1 實(shí)驗(yàn)部分

1.1 實(shí)驗(yàn)材料與檢測系統(tǒng)

實(shí)驗(yàn)研究對象為某品牌某一批次產(chǎn)品的配方煙絲組分(葉絲、梗絲、薄片絲、膨脹絲),于摻配生產(chǎn)線上獲取。在進(jìn)行高光譜數(shù)據(jù)采集前,將煙絲樣品平攤放置于托盤內(nèi),置于70%環(huán)境濕度,25℃環(huán)境溫度的恒溫恒濕室內(nèi)平衡48 h,以降低水分對近紅外光譜的影響。

(1)面對像素的煙絲組分判別實(shí)驗(yàn):每次取樣40 g,作為1個(gè)樣本,均勻平鋪在35 cm×20 cm內(nèi)徑的托盤內(nèi),厚度大于5 mm。建模集樣品A1~D1分別為40 g的葉絲、梗絲、薄片絲和膨脹絲。預(yù)測集樣品A2:32 g葉絲8 g梗絲,樣品B2:32 g葉絲8 g薄片絲,樣品C2:32 g葉絲8 g膨脹絲。分別于光譜通道的首、中、尾部選取一通道合成紅綠藍(lán)三通道合成圖(Red-green-blue,RGB),因以第1、第100、第204通道(分別代表1 000.07、1 541.55、2 178.77 nm)合成的RGB圖對4種組分有很好的辨識力,所以選取此三通道合成的RGB圖展示樣品。圖1為建模樣品的RGB圖。

圖1 建模樣本的RGB圖Fig.1 RGB images of modeling samples

(2)面對樣本的煙絲組分判別實(shí)驗(yàn):每次取樣10 g,作為1個(gè)樣本,置于120 mm內(nèi)徑的培養(yǎng)皿內(nèi),厚度大于5 mm。每種組分樣本數(shù)均為100,共計(jì)400個(gè)樣品。圖2給出了4種組分樣品的RGB圖。按照3∶1的比例劃分建模集和測試集,建模集和預(yù)測集的樣本數(shù)分別為300個(gè)和100個(gè)。

圖2 4種配方煙絲組分的RGB圖Fig.2 RGB images of four components in formula tobacco

本實(shí)驗(yàn)的高光譜數(shù)據(jù)由圖3所示的高光譜成像系統(tǒng)獲取。整個(gè)系統(tǒng)由成像鏡頭(OLES30,F(xiàn)inland)、短波高光譜相機(jī)(Image-λ-N25E-HS)、電動(dòng)載物臺、4個(gè)50 W的鹵素?zé)艉陀?jì)算機(jī)等組件構(gòu)成。光譜采集范圍為1 000~2 500 nm,光譜分辨率為5.4 nm,圖像分辨率為384×893。

1.2 數(shù)據(jù)采集及預(yù)處理

1.2.1 圖像采集與校正將樣品放置在電動(dòng)載物臺上,使電動(dòng)載物臺以1.2 cm/s的速度帶動(dòng)樣本經(jīng)過相機(jī)視場進(jìn)行線陣掃描,完成整個(gè)煙絲樣本的數(shù)據(jù)采集。選定的載物臺移動(dòng)速度應(yīng)保證提供橫軸和縱軸相等的空間分辨率,并避免圖像尺寸失真且需適合設(shè)定的相機(jī)曝光時(shí)間[12]。圖像采集過程由系統(tǒng)配有的Spec View軟件控制。為了校正來自相機(jī)暗電流的原始圖像I,提高信噪比,在與樣品圖像采集相同的系統(tǒng)參數(shù)下,首先掃描反射率為99%的標(biāo)準(zhǔn)白色校正板得到全白的標(biāo)定圖像W;然后通過內(nèi)置的黑板得到全黑的標(biāo)定圖像B。最后根據(jù)公式(1)計(jì)算得到校正后的圖像R。

1.2.2 感興趣區(qū)的選取及光譜數(shù)據(jù)的提取主成分分析(Principal component analysis,PCA)是高光譜數(shù)據(jù)常用的一種高維數(shù)據(jù)降維方法,可將高維數(shù)據(jù)線性變換到一個(gè)新的坐標(biāo)系統(tǒng),以增強(qiáng)信息含量、降低噪聲[13]?;诖?,對獲取的校正后圖像進(jìn)行PCA,選取第一主成分圖像作為感興趣區(qū)選取對象,再通過直方圖閾值的方式選取感興趣區(qū)(Region of interest,ROI)。

提取樣本ROI所有像素點(diǎn)光譜數(shù)據(jù)作為面對像素的組分判別研究數(shù)據(jù),以興趣區(qū)內(nèi)所有點(diǎn)的像素平均光譜作為面對光譜的組分判別研究數(shù)據(jù)。獲取的光譜波長范圍為1 000~2 500 nm,對此區(qū)域光譜數(shù)據(jù)的穩(wěn)定性進(jìn)行分析,其中2 200 nm之后的數(shù)據(jù)噪聲較大,先行剔除。選取1 000~2 200 nm范圍內(nèi)的數(shù)據(jù)進(jìn)行后續(xù)分析,獲取的數(shù)據(jù)有217個(gè)光譜維度。研究中所有的高光譜數(shù)據(jù)采集、校正均基于Spec View軟件平臺,感興趣區(qū)的選取、光譜數(shù)據(jù)的提取及后續(xù)的數(shù)據(jù)預(yù)處理、特征波長選擇、分類模型的建立均基于Python3.7軟件。

1.3 特征波長提取方法

連續(xù)投影算法(Successive projections algorithm,SPA)是一種有效的前向循環(huán)特征波長提取方法,在光譜分析領(lǐng)域得到了廣泛應(yīng)用[14-15]。SPA能夠從光譜信息中充分尋找含有最低限度冗余信息的波長組合,以代表樣品最大信息量[16]。

二階導(dǎo)數(shù)法(Second derivative,SD)通過數(shù)學(xué)模擬,計(jì)算不同波段下的二階導(dǎo)數(shù)值[17]。由于二階導(dǎo)數(shù)光譜具有更加尖銳、明顯的波峰和波谷,而波峰波谷往往對應(yīng)著某類化學(xué)物質(zhì),且不同物質(zhì)在此位置的差異也會(huì)更明顯,因此通過對二階導(dǎo)數(shù)光譜的波形進(jìn)行分析,能迅速確定光譜變化明顯的波長位置,選擇的特征波長具有很好的可解釋性。

2 結(jié)果與討論

2.1 面對像素的分析及分類

為了可視化配方煙絲4種組分間的差異性,對4種組分建模集樣品A1、B1、C1、D1(分別代表葉絲、梗絲、薄片絲、膨脹絲)的點(diǎn)光譜數(shù)據(jù)進(jìn)行主成分分析。從4個(gè)樣品中共提取402 368個(gè)點(diǎn)光譜數(shù)據(jù),對其進(jìn)行二階導(dǎo)數(shù)和11點(diǎn)0階薩維茨基-戈萊平滑(SG)濾波處理,將得到的數(shù)據(jù)作為后續(xù)分析光譜數(shù)據(jù)。主成分分析得到的分?jǐn)?shù)通常可顯示樣品的內(nèi)在信息[18],獲取的前5個(gè)主成分(PCs)的累積方差貢獻(xiàn)率達(dá)95.21%,解釋了大多數(shù)的光譜變量。圖4A為4種組分樣品點(diǎn)光譜數(shù)據(jù)在前3個(gè)主成分下的3D主成分得分分布圖。由圖可知,盡管不同組分間的得分分布相互重疊,但同一組分內(nèi)的分布更加集中,形成不同的區(qū)域。因此,雖然可以獲得較為直觀的分類結(jié)果,但建立面對像素的4種組分的同時(shí)判別模型較難實(shí)現(xiàn),需要進(jìn)行更深入的研究。為簡化模型,考察了實(shí)際應(yīng)用中最常見的葉絲中摻配某一組分的情況,即葉絲與梗絲、葉絲與薄片絲、葉絲與膨脹絲的判別,其光譜數(shù)據(jù)得分圖見圖4B~D。由得分分布可知,葉絲與梗絲、葉絲與薄片絲面對像素的判別可行性很高,葉絲與膨脹絲則可行性較低。

圖4 面對像素?cái)?shù)據(jù)在主成分上的3D主成分得分圖Fig.4 Pixel-wise 3D PCA scatter plots of PCs

基于以上研究,以建模集樣品的點(diǎn)光譜數(shù)據(jù)建立葉絲與梗絲、葉絲與膨脹絲、葉絲與薄片絲的支持向量機(jī)(SVM)判別模型,并用建立的模型來判別預(yù)測樣本A2、B2、C2中的煙絲分布情況。圖5為實(shí)際分布與分類結(jié)果圖,對比可知,葉絲與梗絲(圖A1、A2)、葉絲與薄片絲(圖B1、B2)雖然在葉絲的邊緣區(qū)域存在少量誤分情況,但整體上很好地完成了葉絲與梗絲、葉絲與薄片絲的判別任務(wù)。而葉絲與膨脹絲的實(shí)際分布圖(圖C1)和分類分布圖(圖C2)顯示:兩者的誤分情況較前兩種判別結(jié)果明顯增多,建立的SVM模型判別率較低。綜上可知,建立的葉絲與梗絲、葉絲與薄片絲的SVM分類模型很好地完成了組分判別任務(wù),葉絲與膨脹絲的SVM分類效果不佳,該結(jié)果也驗(yàn)證了基于3D主成分得分分布圖得出的結(jié)論,即基于點(diǎn)像素?cái)?shù)據(jù)進(jìn)行葉絲與梗絲、葉絲與薄片絲的組分判別較易實(shí)現(xiàn),通過后續(xù)的模型優(yōu)化,可以得到更加可靠穩(wěn)健的判別模型;而基于點(diǎn)像素?cái)?shù)據(jù)進(jìn)行葉絲與膨脹絲的組分判別較難實(shí)現(xiàn),需要深入的研究。

圖5 預(yù)測樣本中的實(shí)際分布(A1、B1、C1)與分類結(jié)果(A2、B2、C2)的對比圖Fig.5 Comparison image of actual distribution(A1,B1,C1)and classification results of predicting samples(A2,B2,C2)

2.2 面對樣本的分析及分類

在面對樣本的研究中,分析及分類的數(shù)據(jù)為樣品的平均光譜。

2.2.1 不同配方煙絲組分的原始光譜及二階導(dǎo)數(shù)光譜特征圖6為不同配方煙絲組分的平均光譜圖,不同組分的煙絲樣品有著相似的光譜模式,在1 190、1 470、1 940 nm處均存在明顯吸收峰;不同組分的煙絲樣品在某些波段上的反射率存在著較為明顯的差異,證實(shí)了基于近紅外高光譜技術(shù)進(jìn)行組分判別的可行性。

圖6 梗絲、葉絲、薄片絲、膨脹絲樣本的平均光譜曲線Fig.6 Average spectral curve of cut stem,cut lamina,reconstituted tobacco and expanded tobacco samples

雖然4種組分的平均原始光譜數(shù)據(jù)呈現(xiàn)出較好的可分性,但因樣品不均勻及光譜數(shù)據(jù)基線偏移帶來的誤差,導(dǎo)致建立的模型不穩(wěn)定。本研究擬通過結(jié)合濾波的二階導(dǎo)數(shù)對光譜數(shù)據(jù)進(jìn)行預(yù)處理。該方法能在一定程度上消除樣品表面不均勻及光譜數(shù)據(jù)基線偏移帶來的影響,同時(shí)可將原始光譜的擴(kuò)展最大值分解為許多尖銳而不重疊的峰,獲得更多隱藏在原始光譜中的重要光譜細(xì)節(jié)和光譜特征主要變化的定位點(diǎn),從而使得光譜的解釋比原始光譜更容易[19]。圖7為4種組分預(yù)處理后得到的二階導(dǎo)數(shù)光譜。由圖可知,相對于原始光譜,二階導(dǎo)數(shù)光譜具有更加尖銳、明顯的吸收峰和吸收谷,便于確定吸收峰和吸收谷位置對應(yīng)的波長。二階導(dǎo)數(shù)光譜的對應(yīng)波峰和波谷位置與原始光譜不完全一致,而是分布在原始光譜波峰波谷所在區(qū)間內(nèi),說明二階導(dǎo)數(shù)光譜可以揭示隱藏在原始光譜內(nèi)的光譜細(xì)節(jié),從而更準(zhǔn)確地提取對配方煙絲的組分判別最有效的特征波長。

圖7 梗絲、葉絲、薄片絲、膨脹絲樣本的平均二階導(dǎo)數(shù)光譜曲線Fig.7 Average second derivative spectral curve of cut stem,cut lamina,reconstituted tobacco and expanded tobacco samples

2.2.2不同方法提取特征波長比較采用特征波長可降低高光譜數(shù)據(jù)的高維性,并使分類的判別模型更加可靠。分別通過連續(xù)投影算法和二階導(dǎo)數(shù)法獲取特征波長。

(1)連續(xù)投影算法在連續(xù)投影算法中,將數(shù)據(jù)分為建模集和驗(yàn)證集,通過建模集選取特征波長建立多元回歸模型,計(jì)算預(yù)測集的均方根誤差(RMSE),選取含最小RMSE的特征波長組合。本研究中,設(shè)定的波段數(shù)目范圍為4~10,當(dāng)選取的波長數(shù)為6時(shí),達(dá)到最小的RMSE(0.072 61)。選取的6個(gè)特征波長為1 408、1 608、1 658、2 013、2 084、2 151 nm。

(2)二階導(dǎo)數(shù)法選取二階導(dǎo)數(shù)光譜上對煙絲組分分類有較強(qiáng)判別力的波峰波谷(1 391、1 441、1 880、1 913 nm)位置作為特征波長。

2.2.3 配方煙絲4種組分的判別模型基于二階導(dǎo)數(shù)光譜全波段數(shù)據(jù)及不同特征提取方法提取的特征波長,建立K近鄰(KNN)和SVM模型,其組分判別模型結(jié)果如表1所示。以訓(xùn)練集十折內(nèi)部交叉驗(yàn)證得到的平均判別正確率和測試集判別正確率對判別模型進(jìn)行評估?;诙A導(dǎo)數(shù)光譜全波段數(shù)據(jù)建立的兩種判別模型的訓(xùn)練集和測試集的正確判別率均為100%,表明利用二階導(dǎo)數(shù)光譜可以很好地執(zhí)行配方煙絲中4種組分的判別任務(wù);以SPA算法選出的特征波長建立的KNN和SVM判別模型,測試集準(zhǔn)確率達(dá)到90%,訓(xùn)練集準(zhǔn)確率達(dá)到100%。以二階導(dǎo)數(shù)法選取的特征波長建立的KNN和SVM模型,訓(xùn)練集準(zhǔn)確率達(dá)到95%以上,測試集準(zhǔn)確率達(dá)到86.97%。建立的模型都較好地完成了組分判別的任務(wù),且降低了模型的復(fù)雜度和工業(yè)應(yīng)用成本;SVM模型可以避免KNN模型的過擬合現(xiàn)象,后續(xù)選取SVM模型作為本研究的最佳分類器。

表1 基于二階導(dǎo)數(shù)光譜數(shù)據(jù)及特征波長對配方煙絲4種組分的判別結(jié)果Table 1 Results of classification models using second derivative spectral data and the selected wavelengths for discriminating four components

2.2.4 最佳波段選擇在上述研究中,利用特征波長提取算法篩選出了對配方煙絲4種組分具有較高判別力的特征波長組合,應(yīng)用中可采用多光譜儀器進(jìn)行數(shù)據(jù)的獲取。為了進(jìn)一步探究降低工業(yè)應(yīng)用成本的可行性,嘗試在上述選取的特征波長組合中挑選出具有高判別力的特征波長,建立單波長的判別模型。將二階導(dǎo)數(shù)法和SPA法提取出的各特征波長結(jié)合SVM建立單變量模型,每個(gè)單波長在測試集上的準(zhǔn)確率如圖8所示??梢钥闯?,大部分特征波長的判別效果較好,其中1 441、1 608、1 658、1 880、2 151 nm的組分判別準(zhǔn)確率均達(dá)到90%以上,證實(shí)了基于單波長進(jìn)行面對樣本的配方煙絲組分判別的可行性,同時(shí)也為配方煙絲4種組分檢測儀器的開發(fā)提供了理論支持。

圖8 基于單一特征波長的組分判別率Fig.8 Discrimination rates based on the single characteristic wavelength

3 結(jié)論

本研究利用近紅外高光譜成像技術(shù)開展了面對像素、面對樣本的配方煙絲4種組分(葉絲、梗絲、薄片絲、膨脹絲)的判別研究,采用二階導(dǎo)數(shù)法結(jié)合薩維茨基-戈萊平滑濾波對光譜數(shù)據(jù)進(jìn)行預(yù)處理。在面對像素的組分判別研究中,通過點(diǎn)像素的主成分分析,證實(shí)了基于此技術(shù)對葉絲與梗絲、葉絲與薄片絲進(jìn)行組分判別的可行性,以前5主成分?jǐn)?shù)據(jù)建立的支持向量機(jī)判別模型的可視化結(jié)果證明了這一點(diǎn)。在面對樣本的組分判別研究中,通過二階導(dǎo)數(shù)光譜建立的支持向量機(jī)和K近鄰模型都達(dá)到了100%的組分判別率,為降低工業(yè)應(yīng)用成本,通過二階導(dǎo)數(shù)法和連續(xù)投影算法篩選出特征波長,建立的特征波長組合和單波長的支持向量機(jī)模型的判別正確率達(dá)86.97%。

猜你喜歡
煙絲二階波長
不同因素對煙絲填充值的影響研究
杯中“日出”
一類二階迭代泛函微分方程的周期解
膨脹煙絲回潮系統(tǒng)的改進(jìn)
具非線性中立項(xiàng)的二階延遲微分方程的Philos型準(zhǔn)則
基于相似性原理的煙絲結(jié)構(gòu)分布穩(wěn)定性評價(jià)
二階線性微分方程的解法
結(jié)存煙絲返摻方式的選擇
一類二階中立隨機(jī)偏微分方程的吸引集和擬不變集
基于頻域分析方法的軌道高低不平順敏感波長的研究