黃凌霞,周逸斌,金航峰,沈建棟
(1.浙江大學(xué)動物科學(xué)學(xué)院,浙江杭州 310058;2.浙江農(nóng)林大學(xué)農(nóng)業(yè)與食品科學(xué)學(xué)院,浙江杭州 311300;3.湖州南潯尚豪蠶桑專業(yè)合作社,浙江湖州 313000)
基于可見/近紅外光譜技術(shù)的毛腳繭的光譜快速鑒別方法研究
黃凌霞1,周逸斌1,金航峰2,沈建棟3
(1.浙江大學(xué)動物科學(xué)學(xué)院,浙江杭州 310058;2.浙江農(nóng)林大學(xué)農(nóng)業(yè)與食品科學(xué)學(xué)院,浙江杭州 311300;3.湖州南潯尚豪蠶桑專業(yè)合作社,浙江湖州 313000)
基于可見/近紅外光譜技術(shù),研究了鮮繭毛腳繭快速鑒別的方法。采用主成分分析法對毛腳繭和成熟繭進(jìn)行定性分析,再對光譜數(shù)據(jù)采用最小二乘支持向量機(jī)方法建模鑒別,通過連續(xù)投影算法從400~1000 nm波段的鮮繭光譜數(shù)據(jù)中選取了12個特征波長。采用最小二乘支持向量機(jī)法基于400 nm,430 nm,487 nm,512 nm,604 nm,616 nm,732 nm,759 nm,784 nm,852 nm,985 nm,999 nm這12個特征波長建模,結(jié)果對毛腳繭的判別準(zhǔn)確率達(dá)到100%。表明可見/近紅外光譜可以用于毛腳繭的鑒別檢測。
近紅外光譜;毛腳繭;最小二乘支持向量機(jī);連續(xù)投影算法
蠶繭的上蔟時間(mounting time)是影響蠶繭品質(zhì)的重要因素之一。在實(shí)際收購中,通常把正在吐絲的繭及吐完絲未化蛹的毛腳繭統(tǒng)稱為毛腳繭(imma?ture cocoon)。一般熟蠶上蔟后,在25℃左右的條件下,從上蔟第1 d開始吐絲,至第3 d或第4 d吐絲結(jié)繭完成,再經(jīng)過2~3 d才蛻皮化蛹[1]。隨著上蔟時間的增加(3~7 d),蠶繭的繭層量和繭層率均增加[2]。根據(jù)研究,上蔟后48 h所采蠶繭,當(dāng)日無化蛹繭;上蔟后72 h所采蠶繭,當(dāng)日化蛹率為26%;上蔟后96 h所采蠶繭,化蛹率為78%;上蔟后120 h所采蠶繭,化蛹率為100%[3]。
蠶繭流通和加工過程中,毛腳繭的主要危害為烘折比正常繭大,影響蠶繭和生絲的品質(zhì)。特別是尚未吐完絲的繭,將直接影響粒繭絲長、繭層率及出絲率。毛腳繭發(fā)生蒸熱后,毛腳繭蛹、嫩蛹、正常蛹等均易被悶死,而被悶死的嫩蛹在干燥中,蛹?xì)ひ灼屏?,流出污汁或蛹油污染繭層而成下繭。根據(jù)統(tǒng)計,同批量的毛腳繭比正常繭的上車率低2~4%,解舒率下降4~6%,蒸熱嚴(yán)重者解舒率下降10%甚至更多。按照絲廠經(jīng)驗(yàn)數(shù)據(jù),解舒下降1%或上車率降低1%,對應(yīng)繅折增大3~4 kg,生絲成本將會有所增加,同時造成生絲品質(zhì)和絲價的降低。
近年來,由于毛腳繭的泛濫,被譽(yù)為全國優(yōu)質(zhì)繭基地的江浙地區(qū),能繅制出6A級高品位生絲的蠶繭越來越少,嚴(yán)重影響絲綢的質(zhì)量和形象。為此,浙江和江蘇兩省的絲綢協(xié)會聯(lián)合向蠶繭收購單位和繅絲企業(yè)發(fā)起關(guān)于不收毛腳繭的倡議,呼吁從當(dāng)年春繭收購開始,各單位企業(yè)嚴(yán)格按照國家《繭絲流通管理辦法》《繭絲質(zhì)量監(jiān)督管理辦法》不收毛腳繭[4]。由此可見,是否能夠快速有效地刪減收購蠶繭中的毛腳繭是提高繭絲質(zhì)量的一個關(guān)鍵因素。
在生產(chǎn)應(yīng)用中,選擇上蔟時間較長的蠶繭,可以有效減少毛腳繭的數(shù)量,提高蠶繭品質(zhì)。目前對于毛腳繭的鑒別還處于手感目測的階段,需要檢測者有比較豐富的評繭經(jīng)驗(yàn)。當(dāng)鮮繭大量上市時,人工手感目測法需要耗費(fèi)大量的人力,且效率較低,因而有必要研究采用一種快速無損的現(xiàn)代檢測技術(shù)對蠶繭的上蔟時間進(jìn)行檢測。
可見/近紅外光譜(visible and near infraredspec?troscopy,Vis-NIRS)分析技術(shù)是一種低成本、無污染的分析技術(shù),操作簡便,測定速度快[5~6]。劉潔等[7]的研究表明近紅外光譜分析技術(shù)對于帶殼和不帶殼的板栗水分測定都具有可行性。這說明近紅外光譜獲取的信息并不局限于物體的表面,而對于物體的內(nèi)容物也可以提供有效的近紅外光譜信息。陳壽松等[8]研究了茶葉含水率的近紅外的在線快速檢測裝置,這也說明了近紅外光譜技術(shù)可以用于在線快速檢測中,具有實(shí)際應(yīng)用的價值。但是目前還未見將可見/近紅外光譜技術(shù)用于毛腳繭鑒別檢測的研究報道。
本研究采用可見/近紅外光譜技術(shù)對毛腳繭進(jìn)行鑒別檢測。采用連續(xù)投影算法(SPA)提取特征波長,并用PLS方法建立了模型,為實(shí)現(xiàn)毛腳繭快速鑒別提供依據(jù)。
1.1 研究樣品來源
本研究采用的蠶繭品種是秋豐×白玉,蠶繭樣本由湖州南潯尚豪蠶桑專業(yè)合作社于2014年春季提供。熟蠶于5月15日上蔟,5月19日~5月24日每d由蔟中取出蠶繭,觀察蠶繭繭形、色澤、繭層厚薄和縮皺是否正常,外表是否有疵點(diǎn)。每d挑選外觀正常無疵點(diǎn)的蠶繭50粒??偣策x取了4 d、5 d、6 d、7 d、8 d和9 d共六個上蔟時間的鮮繭樣本各50個,共計300個鮮繭樣本。
1.2 光譜數(shù)據(jù)采集
本研究使用Handheld FieldSpec光譜儀(美國ASD公司生產(chǎn)),采集蠶繭350~1075 nm波段的可見/近紅外光譜數(shù)據(jù)。在光譜測量前,在實(shí)驗(yàn)室25℃恒溫條件下先避光貯藏2 h。將蠶繭剝?nèi)ダO衣后,采用反射模式采集可見/近紅外光譜。蠶繭可見/近紅外光譜信息采集示意圖如圖1所示,圖中a是計算機(jī),b是連接光譜儀和計算機(jī)的數(shù)據(jù)線,c是Handheld Fieldspec光譜儀,d是蠶繭樣本,e是光源鹵素?zé)?。將蠶繭樣本放置在水平桌面上,調(diào)整光譜儀位置,使光譜儀與水平面成45°角,同時離桌面高度約8 cm,保證樣本在光譜儀探頭采集范圍內(nèi)。鹵素?zé)舴胖迷趥?cè)面,同樣與水平面成45°角。對300個鮮繭樣本各掃描20次取平均。
圖1 蠶繭可見/近紅外光譜信息采集示意圖Figure 1 Diagram of visible and near spectral acquisition of cocoon
1.3 分析方法
主成分分析(Principal component analysis,PCA)是通過對原始高維度光譜變量進(jìn)行變換,使數(shù)目較少的新變量成為原始變量的線性組合,而且,新變量能最大限度的表征原始變量的數(shù)據(jù)結(jié)構(gòu)特征,并不丟失信息的一種分析方法。其目的是對數(shù)據(jù)降維,以消除眾多信息中相互重疊和相關(guān)的部分信息[9]。
最小二乘支持向量機(jī)(least square-support vec?tor machine,LS-SVM)是一種新型的建模方法,以求解一組線性方程代替經(jīng)典SVM中復(fù)雜的二次優(yōu)化問題,降低了計算的復(fù)雜性,加快了計算的速度,是解決“維數(shù)災(zāi)”和“過學(xué)習(xí)”的有效工具之一,已在光譜分析領(lǐng)域得到應(yīng)用[10]。
連續(xù)投影算法(successive projections algorithm,SPA)是特征變量選取的一種方法。它可以在光譜矩陣中尋找含有最低限度的冗余信息的變量組,使得變量之間的共線性達(dá)到最小,從而達(dá)到減少模型運(yùn)算變量的效果[11]。
本研究通過MTALAB軟件建立各模型。
2.1 不同上蔟時間鮮繭的可見/近紅外光譜曲線
為減少光譜數(shù)據(jù)采集過程中帶入的噪聲,提高最終建立模型的檢測效果,我們選擇了400~1000 nm波段共600個波長點(diǎn)的光譜數(shù)據(jù)進(jìn)行后續(xù)處理。不同上蔟時間鮮繭的400~1000 nm可見/近紅外光譜曲線如圖2所示。可以看到光譜曲線之間存在明顯差異,且有隨著上蔟時間增加,樣本吸光度值逐漸下降的趨勢。同時發(fā)現(xiàn),上蔟時間為4~6 d的鮮繭之間的光譜差異較大,而上蔟后7~9 d采集鮮繭之間的光譜差異則較小。這可能是因?yàn)榍? d繭內(nèi)熟蠶正處于化蛹階段而產(chǎn)生了較大個體變化,而后3 d蛹體已發(fā)育成熟導(dǎo)致蠶繭變化較小。
圖2 不同上蔟時間鮮繭的原始可見/近紅外光譜曲線Figure 2Original Vis/NIR spectral curve of fresh cocoons with different mounting time
2.2 光譜基線校正預(yù)處理
由于在光譜采集過程中,我們對同一上蔟時間的蠶繭樣本進(jìn)行了集中采集,導(dǎo)致了不同上蔟時間蠶繭的光譜數(shù)據(jù)之間存在基線差異,這在一定程度上夸大了模型的檢測效果。為了得到可信性更高的檢測模型,我們需要預(yù)先對光譜數(shù)據(jù)進(jìn)行基線校正預(yù)處理。校正前后的光譜曲線圖如圖3所示,可以看到經(jīng)過基線校正處理,光譜曲線變得相對集中。
圖3 基線校正前后不同上蔟時間鮮繭的可見/近紅外光譜曲線Figure 3Vis/NIR spectral curve of fresh cocoons with different mounting time
2.3 PCA定性分析
將光譜采集的毛腳繭與成熟繭樣本的數(shù)據(jù)進(jìn)行主成分分析(PCA),可以得到定性的聚類分析結(jié)果,取前三個主成分(PC1、PC2和PC3)作主成分分析的三維得分圖如圖4所示,從圖中可以看出,成熟繭和毛腳繭基本上都能很好地區(qū)分開來,說明通過主成分分析法可以獲得基本的聚類效果,能夠?qū)⒊墒炖O與毛腳繭基本加以鑒別。但是,在圖中也可發(fā)現(xiàn),兩類蠶繭的聚類的邊界分界不明顯,因而,為了取得明確的鑒別結(jié)果,還需要通過數(shù)學(xué)建模方法獲得定量鑒別結(jié)果。
2.4 基于可見/近紅外光譜的毛腳繭LS-SVM模型鑒別檢測
在采用基線校正預(yù)處理后對全波段光譜建立LS-SVM模型。表1顯示了預(yù)測集樣本的判別正確率。從表可以看到經(jīng)過基線校正預(yù)處理后所建立的模型對預(yù)測集樣品的判別正確率提高到了100%。通過進(jìn)行基線校正預(yù)處理后進(jìn)行建模,能夠很好地將毛腳繭和成熟繭區(qū)分開來。
圖4 毛腳繭鑒別的主成分分析法主得分圖Figure 4Scores plots obtained from the PCA(PC1×PC2×PC3)of immature cocoon-discrimination
表1 基于不同光譜預(yù)處理方法處理全波段光譜后建立的毛腳繭鑒別LS-SVM模型建模和預(yù)測結(jié)果Table 1 Performance of LS-SVM model based on different preprocessing on all spectra ranges ofimmature cocoon discrimination
2.5 基于SPA方法的全波段有效波長選取
從表1可以看到采用全波段建立的模型得到了較好的預(yù)測結(jié)果。整體的判別正確率達(dá)到了100.0%。說明可見/近紅外光譜技術(shù)能夠應(yīng)用于蠶繭毛腳繭和成熟繭的快速、無損判別。采用SPA算法對全波段光譜共601個變量進(jìn)行有效波長選擇。圖5顯示了基于不同變量個數(shù)的驗(yàn)證標(biāo)準(zhǔn)偏差(RMSEV)值的變化情況??梢钥吹阶兞總€數(shù)從3個到6個時RMSEV下降較快。當(dāng)變量個數(shù)為12時,RMSEV值下降到一個低點(diǎn)并趨于穩(wěn)定,為0.1438。
通過SPA提取的12個波長分別為400,430,487,512,604,616,732,759,784,852,985,999 nm。SPA得到的波長分布情況如圖6所示。其中黑色的豎線表示選中的波長??梢钥吹竭x擇的有效波長在整個可見到近紅外光譜范圍內(nèi)都有分布。說明在對蠶繭是否為毛腳繭還是成熟繭進(jìn)行判別時需要考慮整個可見/近紅外范圍的光譜信息將得到的12個變量作為輸入,建立LS-SVM模型,結(jié)果如表1所示。通過SPA進(jìn)行有效變量選擇,LS-SVM模型所用到的輸入變量個數(shù)由原始光譜的601個減少到了12個,而基于有效波長所建立的模型對預(yù)測集樣本的判別正確率依然維持了全波段建模時的100.0%。說明得到的這12個有效波長變量可以很好地代替全波段光譜來建立模型。
圖5 連續(xù)投影算法選取的毛腳繭鑒別波長數(shù)對應(yīng)的驗(yàn)證集預(yù)測標(biāo)準(zhǔn)偏差Figure 5 RMSEV plot of selected number of immature cocoon discrimination variables by SPA
圖6 SPA法選擇的毛腳繭鑒別12個波長分布圖Figure 6 Plot of 4 selected wavelengths of unpupated cocoon-discrimination by SPA.
本研究基于可見/近紅外光譜技術(shù),對毛腳繭進(jìn)行了鑒別檢測。首先使用基線校正預(yù)處理方法,消除因不同采集時間導(dǎo)致的樣品光譜數(shù)據(jù)基線不同,然后采用主成分分析方法(PCA)對毛腳繭和成熟繭進(jìn)行了定性分析,隨后提出了一種基于最小二乘支持向量機(jī)(LS-SVM)算法的毛腳繭鑒別方法,并采用連續(xù)投影算法(SPA)將601個光譜變量減少到12個,減少了98.00%的模型變量。此模型對毛腳繭的鑒別準(zhǔn)確率達(dá)到了100%。表明基于可見/近紅外光譜技術(shù),可以較好的檢測出毛腳繭。
[1]劉鵬.淺析毛腳繭的危害及其對策[J].蠶學(xué)通訊,1998(4):55-56.
[2]王澤林.不同采繭時間對家蠶繭質(zhì)的影響[J].蠶學(xué)通訊,2008,28(4):25-28.
[3]錢忠兵.不同采繭時間對蠶繭質(zhì)量的影響[J].中國蠶業(yè),2014(01):38-40.
[4]滕啟躍.送走毛腳繭:絲綢產(chǎn)業(yè)轉(zhuǎn)型升級的第一步[J].中國纖檢,2014(13):34-35.
[5]Cozzolino D,Kwiatkowski M J,Parker M,et al.Prediction of phenolic compounds in red wine fermentations by visi?ble and near infrared spectroscopy[J].Analytica Chimi?ca Acta,2004,513:73-80.
[6]Phonkrit M,Kazuhiro N,Danai B,et al.The use of visi?ble and near infrared spectroscopy for evaluating passion fruit postharvest quality[J].Journal of Food Engineering, 2014,143:33-43.
[7]劉潔,李小昱,李培武,等.基于近紅外光譜的板栗水分檢測方法[J].農(nóng)業(yè)工程學(xué)報,2010(02):338-341.
[8]陳壽松,鄭功宇,金心怡,等.茶葉含水率近紅外在線快速測定及其應(yīng)用研究[J].茶葉科學(xué),2014(04):337-343.
[9]He Y,Li X L,Shao Y N.Fast discrimination of apple va?rieties using Vis/NIR spectroscopy.International Journal of Food Properties.2007,10(1):9-18.
[10]Tao SH,Chen DZ,Zhao WX.Fast pruning algorithm for multi-output LS-SVM and its application in chemical pattern classification.Chemometrics and Intelligent Labo?ratory Systems,2009,96(1):63-69.
[11]Paola D M,Alexsandro M Z,Ronaldo C F,et al.Multivari?ate linear regression with variable selection by a succes?sive projections algorithm applied to the analysis of anod?ic stripping voltammetry data[J].ElectrochimicaActa,2014,127(1):68-78.
Detection of Immature Cocoon Based on Visible and Near Infrared Spectroscopy
HUANG Ling-xia1,ZHOU Yi-bin1,JIN Hang-feng2,SHEN Jian-dong3
(1.College of Animal Sciences,ZhejiangUniversity,Hangzhou 310058,China; 2.School of Agricultural and Food Science,Zhejiang A&F University,Hangzhou 311300,China; 3.Shanghao Sericultural Professional Cooperation,Huzhou 313000 Zhejiang,China)
The visible and near infrared spectroscopy has been used to detect immature cocoon.Using principal compo?nent analysis of the qualitative analysis of the immature cocoon and mature cocoon,and then the spectral data using least squares support vector machine modeling identification method,through the successive projections algorithm 12 characteristic wavelengths selected from fresh cocoon spectral data of 400~1000 nm.By using the least squaresupport vector machine method based on 400 nm,430 nm,487 nm,512 nm,604 nm,616 nm,732 nm,759 nm,784 nm,852 nm, 985 nm,999 nm of the 12 characteristic wavelength modeling,results of immature cocoon discriminate accuracy of 100%.Results show that the visible/near infrared spectroscopy can be used to identify the detection immature cocoon.
near infrared spectroscopy;immature cocoon;LS-SVM;successive projections algorithm
O657.3;S886.3
A
0258-4069[2014]04-026-05
國家科技支撐計劃(213BD20B20);現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)體系專項(No.CARS-22);浙江省自然科學(xué)基金(LY12C17001)
黃凌霞(1980-),女,上海崇明人,副研究員,主要從事數(shù)字蠶桑方面的研究。E-mail:lxhuang@zju.edu.cn