摘 要:針對香腸中硝酸鹽含量,提出基于高光譜的無損快速檢測。采集400~1 000 nm范圍內(nèi)45 組香腸樣品高光譜數(shù)據(jù),進行主成分分析(principal component analysis,PCA),擇優(yōu)選取主成分圖像3(principal component 3,PC3)作為研究對象,并得到4 個特征波長,分別為402.47、483.04、642.27、961.82 nm。通過特征波長與波譜對比,最終采用800~950 nm范圍內(nèi)的波長進行亞硝酸鹽定量分析建模。結(jié)合樣品感興趣區(qū)域平均光譜和理化檢驗結(jié)果,采用偏最小二乘回歸和遺傳算法優(yōu)化的人工神經(jīng)網(wǎng)絡(luò)進行定量分析建模。結(jié)果顯示:偏最小二乘回歸模型的決定系數(shù)R2為0.899,交互驗證均方根誤差(root mean square error of cross-validation,RMSECV)為0.291,遺傳算法優(yōu)化的神經(jīng)網(wǎng)絡(luò)模型的決定系數(shù)R2為0.918,RMSECV為0.365,隨著樣品數(shù)增多,神經(jīng)網(wǎng)絡(luò)的建模效果會越來越優(yōu)于偏最小二乘回歸建模。
關(guān)鍵詞:亞硝酸鹽;高光譜技術(shù);偏最小二乘法;遺傳算法;人工神經(jīng)網(wǎng)絡(luò)算法
Abstract: This paper proposes a rapid and nondestructive method based on hyperspectral imaging system to detect the nitrite content in sausages. Firstly, the hyperspectral data in the wavelength range of 400–1 000 nm of 45 sausage samples were obtained and analyzed by principal component analysis. The third principal component (PC3) was selected for investigation, and four characteristic wavelengths were obtained, i.e. 402.47, 483.04, 642.27 and 961.82 nm. Furthermore, by combing the characteristic wavelengths and spectra, the data in the wavelength range of 800–950 nm were definitively chosen to build the models for quantitative analysis of nitrite in sausages based on the average spectra obtained from the region of interest (ROI) and chemical measurements using partial least squares regression (PLSR) and genetic algorithm (GA)-optimized back propagation neural network (BPNN). Results showed that the determination coefficient (R2) and root mean square error of cross-validation (RMSECV) of the PLSR model were 0.899 and 0.291, respectively, whereas those of the BPNN model were 0.918 and 0.365, respectively. As the number of samples increased, the BPNN model was increasingly superior to the PLSR model.
Key words: nitrite; hyperspectal imaging system; partial least squares (PLS); genetic algorithm (GA); neural network
DOI:10.15922/j.cnki.rlyj.2016.12.005
中圖分類號:TS201.6 文獻標志碼:A 文章編號:1001-8123(2016)12-0022-06
引文格式:
陳曉東, 郭培源. 基于主成分分析法提取高光譜圖像特征檢測香腸亞硝酸鹽含量[J]. 肉類研究, 2016, 30(12): 22-27. DOI:10.15922/j.cnki.rlyj.2016.12.005. http://rlyj.cbpt.cnki.net
CHEN Xiaodong, GUO Peiyuan. Detection of nitrite in sausages based on feature extraction of hyperspectral images using principal component analysis[J]. Meat Research, 2016, 30(12): 22-27. (in Chinese with English abstract) DOI:10.15922/j.cnki.rlyj.2016.12.005. http://rlyj.cbpt.cnki.net
香腸在我國有著悠久的歷史,在生產(chǎn)以及貯存過程中,香腸難免會出現(xiàn)質(zhì)量問題,人們食用此類香腸會引發(fā)健康問題。亞硝酸鹽作為肉制品護色劑,適量使用可以增加肉的風味和起到防腐劑作用[1]。但是如果含量超標,成人食用0.3~0.5 g即可引起中毒,3 g可導致死亡,因此國家對肉類中的亞硝酸鹽含量嚴格限制在
0.03 g/kg。目前檢測方法主要是通過理化方法進行,這種檢測方法雖然檢測精確度高,但是檢測周期長,檢測流程繁瑣,對檢測環(huán)境要求高,不利于大眾檢測。
高光譜檢測技術(shù)結(jié)合了圖像技術(shù)和光譜技術(shù),有快速、圖譜合一、無損等特點[2-4]。高光譜檢測可使用400~1 000 nm的波段。國內(nèi)外研究者Haff[5]、Polder[6]、張雷蕾[7]、Barbin[8]、陳全勝[9]等分別已利用高光譜技術(shù)對芒果果蠅侵染程度、西紅柿品質(zhì)、水果品質(zhì)、豬肉新鮮度、鮮肉顏色、豬肉嫩度等進行過研究,都達到了預(yù)期檢測效果?;谝陨涎芯浚緦嶒炋岢龌诟吖庾V及主成分特征與香腸亞硝酸鹽含量的相關(guān)性研究,擬構(gòu)建一種對香腸亞硝酸含量的快速檢測方法。
1 材料與方法
1.1 材料與試劑
本次實驗樣品購于北京家樂福超市。樣品為保質(zhì)期6 個月的不同生產(chǎn)日期的廣味香腸,共45 根,其中距離生產(chǎn)日期1 個月內(nèi)的25 根,距離生產(chǎn)日期3 個月以內(nèi)的10 根,接近過期的10 根。對樣品進行拆封并置于保鮮袋中,之后放于冰箱中保存等待檢測。
1.2 儀器與設(shè)備
高光譜成像系統(tǒng)主要由光譜儀、電荷耦合器件(charge coupled device,CCD)相機、傳送裝置、PC計算機、暗箱等幾部分組成。為了保證光譜采集環(huán)境的穩(wěn)定性,整個采集過程在暗箱中進行。高光譜圖像是一個三維的數(shù)據(jù)矩陣(x,y,l),其中(x,y)代表兩維的空間維度,l代表一維的光譜維度[10],檢測原理是香腸所含不同品質(zhì)對應(yīng)不同化學組成和物理特性,體現(xiàn)在高光譜某一特征峰可以表示亞硝酸鹽的物質(zhì)屬性及含量,從而可以通過分析光譜信息實現(xiàn)香腸中亞硝酸鹽的定性或定量檢測[11]。
1.3 方法
1.3.1 高光譜數(shù)據(jù)采集
將樣品從保鮮袋中取出置于水平移動臺上,依次對45 個樣品進行高光譜數(shù)據(jù)采集,采集時要保持采集環(huán)境的穩(wěn)定,光譜采集范圍是400~1 000 nm,采樣分辨率為5 nm,傳送速率為100 mm/s,總共得到128 個波段。
采集過程中考慮到外界環(huán)境影響及光源因素,需要對光譜進行黑白校正[12]。即掃描標準白板得到全白圖像W,關(guān)閉相機快門得到全黑圖像B,利用R=(I-B)/(W-B)
進行黑白校正,其中I為原始圖像,R為校正后的圖像??紤]底板對整個光譜分析的影響,采用感興趣區(qū)域(region of interest,ROI)工具對原始光譜圖像進行剪切。
1.3.2 主成分分析
主成分分析可以達到去除波段冗余信息、數(shù)據(jù)降維目的[13]。每個主成分圖像都是由原波段線性組合,根據(jù)各波段權(quán)系數(shù)即可得到相應(yīng)的主成分圖像(principal component image,PCI)的特征波長,按式(1)計算。
1.3.5 偏最小二乘法建模
偏最小二乘回歸(partial least squares regression,PLS)是對一般最小二乘回歸(ordinary least squares regression,OLS)的擴展,它集主成分分析與多因變量多自變量回歸建模于一體,一次計算后可實現(xiàn)預(yù)測建模和簡化多變量系統(tǒng)[16]。PLS建立自變量的潛變量關(guān)于因變量的潛變量的線性回歸建模,間接反映自變量與因變量的關(guān)系,自變量與因變量分別按式(3)、(4)計算。
PLS分別應(yīng)用X和Y的潛變量,采取迭代方法,每一次迭代調(diào)整ta、ua使之到最后殘差矩陣中的元素絕對值近似為0。
1.3.6 遺傳算法(genetic algorithm,GA)優(yōu)化的人工神經(jīng)網(wǎng)絡(luò)建模
BP(back propagation)神經(jīng)網(wǎng)絡(luò)是一種按誤差反向傳播的多層前饋網(wǎng)絡(luò)。通過梯度下降法學習規(guī)則,通過反向傳播不斷調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值使網(wǎng)絡(luò)達到最優(yōu)[17-22]。本次實驗中神經(jīng)網(wǎng)絡(luò)建模使用35 組樣品作為訓練集,10 組樣品作為驗證集。
GA通過模擬進化論自然選擇和生物遺傳機理,運用交叉、變異等方法來尋找種群中的最優(yōu)解。本實驗中使用遺傳算法來優(yōu)化神經(jīng)網(wǎng)絡(luò)中的權(quán)值和閾值,尋找最優(yōu)解并輸送到神經(jīng)網(wǎng)絡(luò)中進行樣本預(yù)測。
2 結(jié)果與分析
2.1 光譜圖譜信息
對45 個香腸樣品圖像進行主成分分析,根據(jù)方差累計貢獻率排列,取前4 幅圖像進行研究,如圖4所示。
根據(jù)主成分分析特點,選擇各波段權(quán)重系數(shù)最大的幾個波段作為特征波長進行香腸亞硝酸鹽含量研究。通過主成分分析得到以下4 個特征波長,分別為band7、band23、band54、band114,對應(yīng)的波長分別為402.47、483.04、642.27、961.82 nm。
2.3 樣品感興趣區(qū)域光譜的提取
ROI工具可以從原圖像中提取所要研究亞硝酸鹽對象的區(qū)域[23],分別對45 組樣品提取如下感興趣區(qū)域,其中
1組樣品選取的感興趣區(qū)域如圖5所示。
2.4 理化實驗結(jié)果
檢測樣品分為3 類,即距離生產(chǎn)日期1個月內(nèi)的25 組,距離生產(chǎn)日期3 個月以內(nèi)的10 組,接近過期的10 組。經(jīng)過理化實驗,測得45 組樣品亞硝酸鹽含量信息如表1所示。
由表1可知,理化實驗測得樣本亞硝酸鹽含量最小為1.40 mg/kg,為距離生產(chǎn)日期最近的一組樣品,最大是3.93 mg/kg,為接近過期的一組樣品;理化實驗標準偏差為91.87%。實驗結(jié)果表明,隨著放置時間的增長,香腸中亞硝酸鹽含量也隨著增加。
2.5 圖譜對比
由圖7可知,含有亞硝酸鹽樣品在900 nm附近有明顯的吸收峰(實線譜線Y),而未檢出亞硝酸鹽的樣品(<1 mg/kg)則沒有(虛線譜線N)。實驗表明,900 nm附近的吸收峰可能是由香腸中亞硝酸鹽引起的。由光譜曲線可以看出低波段(400~450 nm)和高波段(950~1 000 nm)附近的噪音特別大,不利于樣品定量分析,600~800 nm的光譜曲線無明顯吸收,對定量分析的結(jié)果也不夠精確,因此,結(jié)合特征波長和波譜對比結(jié)果,選用800~950 nm這一波段作為特征波段,以此來對香腸中亞硝酸鹽含量進行定量分析[24]。
2.6 光譜預(yù)處理
圖8和圖9分別為預(yù)處理前的光譜以及經(jīng)過一階導數(shù)+矢量歸一化預(yù)處理后的光譜。
2.7 偏最小二乘建模分析
偏最小二乘建模過程中使用35 組樣品作為校正集進行建模,10 組樣本作為驗證集進行檢驗?zāi)P偷臏蚀_性,最終得到亞硝酸鹽預(yù)測模型交叉檢驗如圖10所示。
2.8 人工神經(jīng)網(wǎng)絡(luò)建模分析
通過主成分分析以及波譜圖比較得到150 nm長度的定量分析波長范圍,系統(tǒng)采樣分辨率為5 nm,因此可以得到30 個長波的反射率數(shù)據(jù),由此設(shè)計BP神經(jīng)網(wǎng)絡(luò),輸入節(jié)點為30 個,隱藏節(jié)點5 個,輸出節(jié)點1 個。30 個輸入節(jié)點分別對應(yīng)30 個波長的反射率,輸出為亞硝酸鹽含量值。網(wǎng)絡(luò)結(jié)構(gòu)如圖11所示。
權(quán)值根據(jù)選擇概率進行交叉、變異,閾值優(yōu)化方法與權(quán)值方法相同,最后得到的閾值權(quán)值送入網(wǎng)絡(luò)中使用。得到回歸分析圖如圖12所示。訓練數(shù)據(jù)、驗證數(shù)據(jù)、檢驗數(shù)據(jù)以及所有數(shù)據(jù)的回歸性能和復相關(guān)系數(shù)r,其中總體數(shù)據(jù)的復相關(guān)系數(shù)r為0.958,決定系數(shù)
R2為0.918。
根據(jù)式(5)可算得RMSECV為0.365。
2.9 樣本預(yù)測
使用2 種模型分別對驗證集的10 組樣本進行預(yù)測分析結(jié)果如表2所示。
由表2可知,雖然在輸入樣本為35 組的時候,在預(yù)測結(jié)果上PLS所建模型要略優(yōu)于GA-BP網(wǎng)絡(luò)所建立模型,但是在輸入樣本為45 組時,GA-BA所建模型預(yù)測效果顯著提升,且明顯優(yōu)于PLS所建模型。2 種模型所預(yù)測的結(jié)果皆在可以接受的范圍內(nèi),證明高光譜可以滿足檢測香腸中亞硝酸鹽含量的需求。
3 結(jié) 論
本實驗通過對香腸的高光譜圖像及光譜數(shù)據(jù)采集,對45 組樣品圖像進行了主成分分析,根據(jù)方差累計貢獻率排列,按照波段權(quán)重系數(shù)提取特征波長,分別采用偏最小二乘回歸建模及遺傳算法優(yōu)化的神經(jīng)網(wǎng)絡(luò)建模,實驗結(jié)果表明,在多樣本的情況下,神經(jīng)網(wǎng)絡(luò)的建模效果明顯優(yōu)于偏最小二乘回歸建模。隨著訓練樣本數(shù)的增多,其效果更加明顯,基于高光譜及主成分特征提取的香腸亞硝酸鹽含量檢測方法是可行的。
參考文獻:
[1] 趙靜, 王娜, 馮敘橋, 等. 蔬菜中硝酸鹽和亞硝酸鹽檢測方法的研究進展[J]. 食品科學, 2014, 35(8): 42-49. DOI:10.7506/spkx1002-6630-201408008.
[2] 彭彥昆, 張雷蕾. 農(nóng)畜產(chǎn)品品質(zhì)安全高光譜無損檢測技術(shù)進展和趨勢[J]. 農(nóng)業(yè)機械學報, 2013, 44(4): 137-145. DOI:10.6041/j.issn.1000-1298.2013.04.025.
[3] 張令標, 何建國, 王松磊, 等. 高光譜成像技術(shù)在肉品無損檢測中的應(yīng)用及進展[J]. 河南工業(yè)大學學報(自然科學), 2014, 35(1): 100-105.
[4] 李江波, 饒秀勤, 應(yīng)義斌. 農(nóng)產(chǎn)品外部品質(zhì)無損檢測中高光譜成像技術(shù)的應(yīng)用研究進展[J]. 光譜學與光譜分析, 2011, 31(8): 2021-2026. DOI:10.3969/j.issn.1673-1328.2014.27.031.
[5] HAFF R P, SARANWONG S, THANPASE W, et al. Automatic image analysis and spot classification for detection of fruit fly infestation in hyperspectral images of mangoes[J]. Postharvest Biology and Technology, 2013, 86(8): 23-28.
[6] POLDER G, van der HEIJDEN G W A M, YOUNG I T. Spectral image analysis for measuring ripeness of tomatoes[J]. Transactions of the Asae Online, 2002, 45(4): 1155-1161.
[7] 張雷蕾, 李永玉, 彭彥昆, 等. 基于高光譜成像技術(shù)的豬肉新鮮度評價[J]. 農(nóng)業(yè)工程學報, 2012, 28(7): 254-259. DOI:10.3969/j.issn.1002-6819.2012.07.042.
[8] BARBIN D F, SUN D W, SU C. NIR hyperspectral imaging as non-destructive evaluation tool for the recognition of fresh and frozen-thawed porcine longissimus dorsi muscles[J]. Innovative Food Science and Emerging Technologies, 2013, 18(18): 226-236.
[9] 陳全勝, 張燕華, 萬新民, 等. 基于高光譜成像技術(shù)的豬肉嫩度檢測研究[J]. 光學學報, 2010(9): 2602-2607
[10] 馬驥, 曲佳歡, 孫大文, 等. 高光譜成像在食品質(zhì)量評估方面的研究進展與應(yīng)用(二)[J]. 肉類研究, 2012, 26(4): 42-48.
[11] 洪添勝, 喬軍, WANG Ning, 等. 基于高光譜圖像技術(shù)的雪花梨品質(zhì)無損檢測[J]. 農(nóng)業(yè)工程學報, 2007, 23(2): 151-155. DOI:10.3321/j.issn:1002-6819.2007.02.030.
[12] SHETTY N, GISLUM R. Quantification of fructan concentration in grasses using NIR spectroscopy and PLSR[J]. Field Crops Research, 2011, 120(120): 31-37.
[13] 張凱華, 臧明伍, 王守偉, 等. 基于光譜技術(shù)的畜禽肉新鮮度評價方法研究進展[J]. 肉類研究, 2016, 30(1): 30-35. DOI:10.15922/j.cnki.rlyj.2016.01.007.
[14] 中華人民共和國衛(wèi)生部. GB 5009.33—2010 食品安全國家標準食品中亞硝酸鹽和硝酸鹽的測定[S]. 北京: 中國標準出版社, 2010: 149-153.
[15] 葉鶯, 陳崇幗, 林熙. 偏最小二乘回歸的原理及應(yīng)用[J]. 海峽預(yù)防醫(yī)學雜志, 2005, 11(3): 3-6. DOI:10.3969/j.issn.1007-2705.2005.03.002.
[16] 劉碩, 郭培源, 楊昆程, 等. 基于高光譜圖像技術(shù)的臘腸酸價含量檢測[J]. 食品工業(yè)科技, 2016, 37(5): 287-291; 297.
[17] 劉歡, 姜峰, 于國強, 等. 遺傳-神經(jīng)網(wǎng)絡(luò)方法在炸藥撞擊感度預(yù)測中的應(yīng)用研究[J]. 火工品, 2010(6): 42-45. DOI:10.3969/j.issn.1003-1480.2010.06.012.
[18] 王立國, 魏芳潔. 結(jié)合遺傳算法和蟻群算法的高光譜圖像波段選擇[J]. 中國圖象圖形學報, 2013, 18(2): 235-242. DOI:10.11834/jig.20130216.
[19] WANG W, LI C, TOLLNER E W, et al. Shortwave infrared hyperspectral imaging for detecting sour skin (Burkholderia cepacia): infected onions[J]. International Journal of Food Engineering, 2012, 109(1): 38-48.
[20] 陳學杰, 呂柏權(quán), 武冬冬. 基于神經(jīng)網(wǎng)絡(luò)模型參考自適應(yīng)的智能控制優(yōu)化算法[J]. 工業(yè)控制計算機, 2015(1): 49-50. DOI:10.3969/j.issn.1001-182X.2015.01.022.
[21] 馬永杰, 云文霞. 遺傳算法研究進展[J]. 計算機應(yīng)用研究, 2012, 29(4): 1201-1206. DOI:10.3969/j.issn.1001-3695.2012.04.001.
[22] 湯素麗, 羅宇鋒. 人工神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展與應(yīng)用[J]. 電腦開發(fā)與應(yīng)用, 2009, 22(10): 59-61. DOI:10.3969/j.issn.1003-5850.2009.10.025.
[23] 田有文, 王曉娟. 基于高光譜圖像技術(shù)的農(nóng)產(chǎn)品品質(zhì)無損檢
測[J]. 農(nóng)機化研究, 2009, 31(10): 220-222. DOI:10.3969/j.issn.1003-188X.2009.10.063.
[24] 黃文倩, 陳立平, 李江波, 等. 基于高光譜成像的蘋果輕微損傷檢測有效波長選取[J]. 農(nóng)業(yè)工程學報, 2013, 29(1): 272-277.
[25] 孫俊, 金夏明, 毛罕平, 等. 基于高光譜圖像光譜與紋理信息的生菜氮素含量檢測[J]. 農(nóng)業(yè)工程學報, 2014, 30(10): 167-173. DOI:10.3969/j.issn.1002-6819.2014.10.021.