孫 俊,靳海濤,蘆 兵,武小紅,沈繼鋒,戴春霞
基于高光譜圖像及深度特征的大米蛋白質(zhì)含量預(yù)測(cè)模型
孫 俊,靳海濤,蘆 兵,武小紅,沈繼鋒,戴春霞
(江蘇大學(xué)電氣信息工程學(xué)院,鎮(zhèn)江 212013)
無(wú)損檢測(cè);光譜分析;模型;高光譜圖像;堆疊自動(dòng)編碼器;深度特征;大米;蛋白質(zhì)含量
中國(guó)的大米生產(chǎn)量居世界首位,大米的消費(fèi)數(shù)量也居世界前列,有超過(guò)半數(shù)的人口將大米作為主食[1],大米的主要營(yíng)養(yǎng)成分是蛋白質(zhì),它富含人體所必需的氨基酸、賴氨酸[2],蛋白質(zhì)含量決定了大米的營(yíng)養(yǎng)品質(zhì)和食味品質(zhì)[3]。因此,蛋白質(zhì)含量是評(píng)價(jià)大米品質(zhì)的重要指標(biāo)。
目前,大米蛋白質(zhì)含量檢測(cè)的主要措施是化學(xué)試劑測(cè)定法[4],該方法雖然準(zhǔn)確性高,但對(duì)樣本具有破壞性,且消耗化學(xué)試劑量大,成本高。因此,如何快速無(wú)損精確地檢測(cè)大米蛋白質(zhì)含量是當(dāng)前大米生產(chǎn)及儲(chǔ)存中亟需解決的問(wèn)題。
在眾多新興技術(shù)中,光譜技術(shù)可以檢測(cè)目標(biāo)內(nèi)部的特征[5],文獻(xiàn)[6-7]采用近紅外光譜技術(shù)實(shí)現(xiàn)大米蛋白質(zhì)含量檢測(cè),效果良好,但光譜技術(shù)缺乏目標(biāo)的空間信息,建模效果有待進(jìn)一步提升;計(jì)算機(jī)視覺(jué)圖像技術(shù)可以對(duì)樣本外部表面信息進(jìn)行分析,但對(duì)于其內(nèi)部的特征無(wú)法反演[8]。高光譜成像技術(shù)可以提取光譜信息和圖像信息,獲取更全面的信息,并可借助于數(shù)學(xué)手段構(gòu)建模型,實(shí)現(xiàn)對(duì)被測(cè)對(duì)象的無(wú)損檢測(cè)[9],由于其快速、精確、非破壞的特點(diǎn),高光譜無(wú)損檢測(cè)技術(shù)已經(jīng)被廣泛應(yīng)用于農(nóng)作物品種分類[10]和營(yíng)養(yǎng)元素檢測(cè)[11]等研究中。然而,高光譜圖像數(shù)據(jù)量龐大,波段間相關(guān)性較強(qiáng),冗余度高,若直接對(duì)高光譜圖像數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,耗時(shí)較長(zhǎng),且最終效果不理想,會(huì)造成Huges現(xiàn)象[12]。因此,對(duì)高光譜圖像數(shù)據(jù)進(jìn)行降維處理是十分有必要的。
目前,對(duì)高光譜圖像光譜數(shù)據(jù)的降維方法從數(shù)據(jù)相關(guān)性角度分為線性方法和非線性方法。主成分分析法[1]、線性判別方法[13]等作為傳統(tǒng)的線性方法,都是采用線性映射的手段處理高光譜圖像數(shù)據(jù)的,但是高光譜波段間較強(qiáng)的相關(guān)性導(dǎo)致了這些方法在最終處理效果上的不足,而深度學(xué)習(xí)作為非線性方法通過(guò)引入神經(jīng)網(wǎng)絡(luò)先天的非線性,彌補(bǔ)了這些不足[14-16]。堆疊自動(dòng)編碼器(stacked auto-encoder,SAE)[17-18]是一種無(wú)監(jiān)督深度學(xué)習(xí)技術(shù),分別對(duì)每層深度網(wǎng)絡(luò)進(jìn)行訓(xùn)練,從而更加高效地進(jìn)行高光譜圖像數(shù)據(jù)降維處理。
另一方面,對(duì)于高光譜圖像的圖像信息,目前的處理方法是提取其顏色或紋理等特征,趙娟等[19]通過(guò)提取高光譜圖像的紋理特征,建立牛肉的嫩度判別模型,最終精度為94.44%;董高等[20]提取小麥的形態(tài)特征,研究發(fā)現(xiàn)基于形態(tài)特征進(jìn)行建模的效果并不理想。深度學(xué)習(xí)的方法通過(guò)對(duì)整幅圖像進(jìn)行特征提取,可以獲得該高光譜圖像的圖像深度特征,包含了更加全面的信息,目前,還未有相關(guān)文獻(xiàn)對(duì)其報(bào)道。
本文采用SAE對(duì)高光譜圖像的光譜信息和圖像信息及其融合信息分別進(jìn)行特征提取,獲得其深度特征,利用支持向量機(jī)回歸(support vector regression,SVR)建立預(yù)測(cè)模型并采用網(wǎng)格搜索法對(duì)懲罰因子和核參數(shù)進(jìn)行尋優(yōu),以提高模型的預(yù)測(cè)性能,實(shí)現(xiàn)大米蛋白質(zhì)含量的高效無(wú)損檢測(cè)。
文獻(xiàn)[21]表明,大米在存放過(guò)程中,由于大米蛋白質(zhì)中的氨基酸分解,總蛋白質(zhì)含量呈逐漸減少的趨勢(shì)。為了加速大米內(nèi)部氨基酸反應(yīng),獲取不同蛋白質(zhì)含量梯度的大米樣本,試驗(yàn)前于鎮(zhèn)江某大型超市購(gòu)買良記金輪膳選泰香米1 kg,共稱取6組樣本,每組100 g,將6組樣本置于BPS-100CL型液晶恒溫恒濕箱內(nèi)(上海一恒科學(xué)儀器有限公司),在45 ℃、95%相對(duì)濕度的條件下分別放置0,24,48,72,96和120 h,取出后在各組樣本中選取30粒大小相近、顆粒飽滿、顏色透明的米粒作為一個(gè)樣本,每組選取70個(gè)樣本,共制備420個(gè)樣本,立即放入密封的試劑瓶中送往高光譜實(shí)驗(yàn)室進(jìn)行高光譜圖像采集。
本試驗(yàn)所采用的高光譜成像系統(tǒng)主要包括光纖、鹵素?zé)艄庠矗?900-ER型,Illumination Technologies, USA)、高光譜圖像攝影儀(VNIP-HIS-sMOS,五鈴光學(xué)股份有限公司,中國(guó)臺(tái)灣)、移動(dòng)平臺(tái)控制器和處理器等部分。高光譜圖像攝影儀中的攝像機(jī)為CCD相機(jī),光譜儀為可見(jiàn)光/近紅外光譜儀,光譜范圍為400~1 000 nm,光譜分辨率為2.8 nm,圖像分辨率為1 024像素×473像素。
將各組樣本均勻平鋪于移動(dòng)平臺(tái)上進(jìn)行圖像采集,移動(dòng)平臺(tái)移動(dòng)速度設(shè)置為1.99 mm/s。由于光源強(qiáng)度分布不均勻及暗電流噪聲的存在,為了提高獲取圖像的信噪比,需要在掃描前對(duì)每個(gè)樣本進(jìn)行黑白標(biāo)定[22]。首先放置白板(反射率約為100%)于移動(dòng)平臺(tái)上,曝光時(shí)間設(shè)置為7 ms,獲得全白標(biāo)定圖像,保持曝光時(shí)間不變,再蓋上CCD相機(jī)鏡頭,獲得反射率約為0的全黑標(biāo)定圖像,隨后取下CCD相機(jī)鏡頭片,放入大米樣本,調(diào)節(jié)曝光時(shí)間為17 ms,獲得未標(biāo)定圖像raw。黑白標(biāo)定后的圖像的反射光強(qiáng)度可表示為
式中、、raw和均為相應(yīng)圖像的反射光強(qiáng)度;E為樣本的曝光時(shí)間,ms;E為全黑標(biāo)定的曝光時(shí)間,ms;E為白板標(biāo)定的曝光時(shí)間,ms。
采集高光譜圖像后,采用凱氏定氮法[4]測(cè)定樣本蛋白質(zhì)含量。將各樣本稱質(zhì)量并記錄,置于研缽中研磨至粉末狀,然后移入100 mL定氮瓶,置于消化儀做消化處理至內(nèi)容物全部碳化,隨后進(jìn)行鹽酸標(biāo)準(zhǔn)滴定液滴定。通過(guò)最終消耗的鹽酸標(biāo)準(zhǔn)滴定液體積與氮含量的關(guān)系計(jì)算每個(gè)樣本蛋白質(zhì)含量,蛋白質(zhì)含量計(jì)算公式為
式中為樣本中蛋白質(zhì)含量,g/100g;1為消耗鹽酸標(biāo)準(zhǔn)滴定液體積,mL;2為試劑空白消耗鹽酸標(biāo)準(zhǔn)滴定液體積,mL;為鹽酸標(biāo)準(zhǔn)滴定液濃度,mol/L;為樣本質(zhì)量,g;3為吸收消化液體積,mL;為氮換算蛋白質(zhì)系數(shù),大米為5.95;100為換算系數(shù)。
高溫高濕條件下不同放置時(shí)間的大米樣本蛋白質(zhì)含量變化趨勢(shì)如圖1所示,通過(guò)試驗(yàn)測(cè)得大米樣本初始蛋白質(zhì)含量為7.78 g/(100 g),在存放24,48,72,96和120 h后,蛋白質(zhì)含量分別為7.73,7.70,7.68,7.65和7.62 g/(100 g)??梢?jiàn),大米樣本在經(jīng)高溫高濕條件下放置處理后,蛋白質(zhì)含量的變化很小,在放置120 h后蛋白質(zhì)含量減少0.16 g/(100 g)。大米在高溫高濕條件下,呼吸作用等各項(xiàng)生理活動(dòng)加快,消耗了部分占總蛋白量很少的生理蛋白(清蛋白、球蛋白),與文獻(xiàn)[21]結(jié)果一致。
注:放置溫度為45℃,相對(duì)濕度為95%,下同。
ROI的提取方式與大小會(huì)影響到最終高光譜圖像數(shù)據(jù)的獲取質(zhì)量[23]。本文ROI提取流程如圖2所示,原始樣本高光譜圖像如圖2a所示,為加強(qiáng)樣本與背景的差異性,使用波段比算法處理高光譜圖像,根據(jù)多個(gè)像素點(diǎn)光譜曲線選取一個(gè)較大反射率(702.36 nm)波長(zhǎng)與一個(gè)較小反射率(502.31 nm)波長(zhǎng)做商運(yùn)算,結(jié)果如圖2b所示。然后采用閾值分割法進(jìn)行處理,經(jīng)多次測(cè)試,閾值選擇0.94時(shí)分割效果最佳,分割得到二值圖如圖2c所示,將該二值圖應(yīng)用掩膜于原始高光譜圖像,選取ROI,如圖2d所示,為方便后續(xù)處理,將ROI圖像尺寸統(tǒng)一為100像素×100像素。
圖2 大米樣本ROI提取流程
自動(dòng)編碼器(auto-encoder, AE)主要由編碼器和解碼器兩部分構(gòu)成,在對(duì)輸入樣本進(jìn)行學(xué)習(xí)時(shí),其目的是通過(guò)編碼和解碼將輸入數(shù)據(jù)在輸出中重構(gòu)出來(lái)[24]。從某種程度而言,AE是一個(gè)小型的深度學(xué)習(xí)模型,該模型主要包括輸入層、隱含層和輸出層3層。
假設(shè)有無(wú)標(biāo)簽的訓(xùn)練樣本,AE的編碼任務(wù)是將輸入訓(xùn)練樣本通過(guò)非線性函數(shù)映射到隱含層,設(shè)為隱含層的神經(jīng)單元激活值,其數(shù)學(xué)表達(dá)式為
定義重構(gòu)誤差為,表示為
通過(guò)不斷修改參數(shù)來(lái)最小化L,此時(shí)的y保留了x的大部分信息[25]。在實(shí)際應(yīng)用中,用到的往往并不是單獨(dú)的一個(gè)AE,而是將多個(gè)AE通過(guò)級(jí)聯(lián)的方式堆疊構(gòu)成的多層AE,這個(gè)多層AE被命名為SAE[26]。SAE模型如圖3所示,該SAE模型由2個(gè)AE堆疊而成,隱含層2作為SAE最終的降維結(jié)果輸出的深度特征。
這種結(jié)構(gòu)使得SAE的隱含層是非線性的,從而具有更準(zhǔn)確的捕獲復(fù)雜數(shù)據(jù)的能力[27]。
通過(guò)閾值分割法從原始高光譜圖像中提取整個(gè)大米樣本區(qū)域作為ROI,一方面,提取ROI內(nèi)平均光譜信息,每個(gè)高光譜圖像包含478個(gè)波段,故每個(gè)樣本高光譜數(shù)據(jù)維度是478。另一方面,大米中蛋白質(zhì)含量的變化會(huì)導(dǎo)致其顏色、紋理及透明度等變化[28],為了獲取更加全面的圖像信息,提取ROI中每個(gè)波段的圖像,將ROI提取結(jié)果保存為478幅普通的100像素×100像素RGB圖像,并轉(zhuǎn)換為灰度圖像,圖像尺寸統(tǒng)一為28像素′28像素[29]。為了獲取更加精確的圖像信息,減少噪聲的影響,以光譜曲線的3個(gè)波峰760、930和980 nm為中心,獲?。?40~770 nm)、(910~950 nm)、(960~1 000 nm)3個(gè)波長(zhǎng)范圍內(nèi)的圖像,取每個(gè)像素點(diǎn)對(duì)應(yīng)的灰度均值,獲得該樣本的特征圖像,將每幅圖像扁平歸一化為一維向量,共包含784個(gè)像素點(diǎn),每個(gè)圖像對(duì)應(yīng)的數(shù)據(jù)維度是784。高光譜圖像數(shù)據(jù)融合方式包括數(shù)據(jù)層融合和特征層融合,由于光譜特征和圖像特征在性質(zhì)上有較大的差異,如果對(duì)兩者進(jìn)行特征層融合,各特征所占比重的不同會(huì)影響最終建模的精度,為避免該問(wèn)題的出現(xiàn),本文將光譜信息和圖像信息進(jìn)行數(shù)據(jù)層融合,數(shù)據(jù)總維度為1 262,輸入到SAE提取融合信息的深度特征。
大米樣本高光譜圖像的光譜信息與圖像信息融合流程如圖4所示。
圖4 光譜信息與圖像信息融合流程
在SAE提取的光譜深度特征、圖像深度特征及二者融合信息的深度特征基礎(chǔ)上,采用支持向量機(jī)回歸(support vector regression,SVR)建立大米蛋白質(zhì)含量預(yù)測(cè)模型,并引用網(wǎng)格搜索法對(duì)SVR中核參數(shù)和懲罰因子尋優(yōu)。該方法采用5折交叉驗(yàn)證法在[-10,10]選擇最優(yōu)和,步長(zhǎng)設(shè)置為0.5,對(duì)每個(gè)和建立SVR模型并計(jì)算驗(yàn)證集均方根誤差,和最佳值由最小驗(yàn)證集均方根誤差決定[30]。
為了獲取更加全面的光譜信息,本文選取整個(gè)大米樣本區(qū)域作為ROI,提取ROI的平均光譜信息作為該樣本的高光譜數(shù)據(jù)。全樣本的原始高光譜曲線如圖5a所示。高光譜數(shù)據(jù)在獲取過(guò)程中,往往會(huì)受到儀器噪聲等因素的影響,存在吸光度的非線性、基線變動(dòng)和附加散射變動(dòng)等問(wèn)題,不可避免產(chǎn)生誤差。為了減少噪聲對(duì)模型的干擾,本文采用基于時(shí)域局部最小二乘法擬合的多項(xiàng)式平滑(savitzky-golay,SG)濾波方法[32]對(duì)原始高光譜曲線進(jìn)行預(yù)處理,經(jīng)過(guò)SG濾波后的高光譜曲線如圖5b所示,與圖5a原始樣本高光譜曲線相比,毛刺減少,曲線平滑度得到有效提升。
大米樣本的高光譜曲線可以有效地表征大米中蛋白質(zhì)等主要成分的化學(xué)信息,蛋白質(zhì)等化學(xué)信息可以通過(guò)C-H官能團(tuán)、O-H官能團(tuán)和N-H官能團(tuán)在特定波長(zhǎng)下的伸縮變動(dòng)體現(xiàn)。由圖5可知,雖然整體的反射光譜曲線波動(dòng)不明顯,沒(méi)有特別明顯的波峰波谷,但在760、930和980 nm仍有小幅度的波峰出現(xiàn)。結(jié)合圖1分析可知,這些特征波段和蛋白質(zhì)中C-H鍵的振動(dòng)和斷裂有直接關(guān)系,這些特征波段處的波動(dòng)正是由于高溫高濕條件下不同放置時(shí)間的大米內(nèi)部蛋白質(zhì)含量不同而引起的,隨著放置時(shí)間的增加,蛋白質(zhì)含量減少,反射率逐漸增加。因此,高光譜曲線可以直觀地反映高溫高濕條件下不同放置時(shí)間大米蛋白質(zhì)含量的差異。
注:圖中反射率曲線對(duì)應(yīng)的樣本放置時(shí)間從下到上依次為0,24,48,72,96和120 h,全樣本量為420個(gè)。
針對(duì)高溫高濕條件下6組不同放置時(shí)間的大米樣本(每組包含70個(gè)樣本,訓(xùn)練集46個(gè),預(yù)測(cè)集24個(gè)),分別采用3層隱含層SAE尋找最優(yōu)規(guī)模提取光譜深度特征,并利用SVR建立回歸模型,結(jié)果如表1所示,其中預(yù)測(cè)值表示每組樣本中預(yù)測(cè)集樣本的預(yù)測(cè)值均值。
表1 基于光譜深度特征信息的模型預(yù)測(cè)結(jié)果
注:最佳規(guī)模表示SAE數(shù)據(jù)維度和各層神經(jīng)元最佳個(gè)數(shù)。如478-400-290-70表示數(shù)據(jù)維度是478,神經(jīng)元個(gè)數(shù)分別是400、290、70,下同。
Note: Optimal scale means the data dimension and the optimal number of cell of each layer of SAE. E.g. 478-400-290-70 means data dimension is 478, the number of neurons is 400, 290 and 70 respectively, the same below.
對(duì)于SAE隱含層個(gè)數(shù)的設(shè)置,文獻(xiàn)[16]表明,對(duì)于小樣本而言,SAE隱含層個(gè)數(shù)并非越多越好。經(jīng)過(guò)試驗(yàn),通過(guò)SAE參數(shù)規(guī)模尋優(yōu),發(fā)現(xiàn)不同組樣本的最佳SAE規(guī)模不同,其中3層隱含層的建模效果普遍較好,而且將最初的478維降低到了較低維度20~90,減小了建模成本,提高了建模效率,與文獻(xiàn)[16]報(bào)道一致。
圖像深度特征提取結(jié)果如圖6所示,對(duì)于圖像信息,由于原始圖像尺寸均為100像素′100像素,所含冗余信息較多,故在特征提取前,將圖像尺寸統(tǒng)一為28像素′28像素。以第4組中某樣本為例,其高光譜圖像如圖6a所示,將高光譜圖像扁平化,轉(zhuǎn)換為784維的列向量,為了提高運(yùn)算效率,將該向量歸一化,結(jié)果如圖6b所示,并作為SAE的輸入提取圖像深度特征,結(jié)果如圖6c所示。圖6d是經(jīng)過(guò)SAE解碼重構(gòu)后的圖像信息,經(jīng)對(duì)比發(fā)現(xiàn),重構(gòu)信息與原始信息大致趨勢(shì)相同。使用與2.1節(jié)相同方法劃分?jǐn)?shù)據(jù)集,采用SVR建立回歸模型,結(jié)果如表2所示。
圖6 圖像深度特征提取結(jié)果
表2 基于圖像深度特征的模型預(yù)測(cè)結(jié)果
為獲取更加全面的高光譜圖像數(shù)據(jù),將478維光譜數(shù)據(jù)和784維圖像數(shù)據(jù)進(jìn)行融合,得到1 262維融合信息,輸入到SAE提取深度特征,使用與2.1節(jié)相同方法劃分各組樣本集,采用SVR建立回歸模型。經(jīng)過(guò)試驗(yàn),建模結(jié)果如表3所示。
表3 基于光譜-圖像融合信息建模結(jié)果
表4 基于全樣本的不同模型預(yù)測(cè)結(jié)果對(duì)比
在已有的研究中,大米的蛋白質(zhì)含量無(wú)損檢測(cè)大都基于近紅外光譜,劉建學(xué)等[33]以二階導(dǎo)數(shù)譜建立大米蛋白質(zhì)含量預(yù)測(cè)模型,預(yù)測(cè)值和測(cè)定值間的相關(guān)系數(shù)達(dá)到0.94;Bagchi等[34]建立SNV-mPLS模型,預(yù)測(cè)糙米和米糠蛋白質(zhì)含量,模型的決定系數(shù)分別為0.918、0.567;Lin等[35]建立了多元線性回歸、偏最小二成回歸和人工神經(jīng)網(wǎng)絡(luò)模型對(duì)大米蛋白質(zhì)含量進(jìn)行數(shù)據(jù)分析,最終多元線性回歸的模型效果最佳,預(yù)測(cè)集決定系數(shù)為0.806,預(yù)測(cè)集標(biāo)準(zhǔn)誤差為0.266%。本文采用SAE提取大米樣本的高光譜圖像光譜深度特征,結(jié)合支持向量機(jī)建立蛋白質(zhì)含量預(yù)測(cè)模型,對(duì)于全樣本的預(yù)測(cè)集決定系數(shù)為0.939 2,均方根誤差為0.115 3 g/(100 g)。模型的效果優(yōu)于上述文獻(xiàn)方法,相較于文獻(xiàn)[34],本文模型預(yù)測(cè)集決定系數(shù)提升了14.17%,進(jìn)一步驗(yàn)證了本文算法對(duì)于高光譜數(shù)據(jù)特征提取的高效性。
此外,傳統(tǒng)高光譜圖像的圖像信息處理方法主要通過(guò)提取顏色、紋理等特征進(jìn)行建模,但這些特征往往是片面的,最終的建模效果有一定的提升空間。本文首先將高光譜圖像按波段分離,通過(guò)獲取圖像的灰度值均值作為該樣本的特征圖像,最終得到784維的列向量,采用SAE提取其深度特征,結(jié)合支持向量機(jī)回歸建立蛋白質(zhì)含量預(yù)測(cè)模型,最終建模的訓(xùn)練集決定系數(shù)和均方根誤差為0.915 4和0.051 0 g/(100 g),預(yù)測(cè)集決定系數(shù)和均方根誤差為0.821 0和0.111 8 g/(100 g),建模效果良好,驗(yàn)證了圖像深度特征提取方法的可行性。
本研究采用SAE學(xué)習(xí)獲取大米高光譜圖像的光譜、圖像以及二者融合信息的深度特征,并結(jié)合支持向量機(jī)回歸建立大米蛋白質(zhì)含量預(yù)測(cè)模型,得出以下主要結(jié)論:
1)SAE算法提取特征功能強(qiáng)大。經(jīng)由SAE提取深度特征后,基于全部樣本的光譜信息、圖像信息以及二者融合信息的模型預(yù)測(cè)結(jié)果顯示,預(yù)測(cè)集決定系數(shù)分別為0.939 2、0.821 0、0.964 4,且均方根誤差較低,表明SAE適于高光譜圖像數(shù)據(jù)的降維。
2)對(duì)于高光譜圖像的圖像信息,與傳統(tǒng)的提取顏色、紋理等片面信息不同,本文采用SAE提取圖像信息的深度特征,結(jié)果表明,模型的預(yù)測(cè)集決定系數(shù)和均方根誤差分別是0.821 0和0.111 8 g/(100 g),說(shuō)明該深度特征包含了更加全面的圖像信息,為高光譜圖像的圖像處理方法提供了新思路。
[1] 孫俊,金夏明,毛罕平,等. 高光譜圖像技術(shù)在摻假大米檢測(cè)中的應(yīng)用[J]. 農(nóng)業(yè)工程學(xué)報(bào),2014,30(21):301-307.
Sun Jun, Jin Xiaming, Mao Hanping, et al. Application of hyperspectral imaging technology for detecting adulterate rice [J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2014, 30(21): 301-307. (in Chinese with English abstract)
[2] 賈瀟,趙謀明,賈春曉,等. 大米蛋白與阿魏酸酶法交聯(lián)物的乳化特性和抗氧化穩(wěn)定性[J]. 食品科學(xué),2017,38(13):131-137.
Jia Xiao, Zhao Mouming, Jia Chunxiao, et al. Emulsifying properties and antioxidant stability of enzymatically cross-linked products between rice protein and ferulic acid[J]. Food Science, 2017, 38(13): 131-137. (in Chinese with English abstract)
[3] 陳媛,張志國(guó). 大米蛋白研究進(jìn)展[J]. 糧食與油脂,2017,30(7):13-16.
Chen Yuan, Zhang Zhiguo. Research progress in rice protein [J]. Cereals and oils, 2017, 30(7): 13-16. (in Chinese with English abstract)
[4] 國(guó)家衛(wèi)生和計(jì)劃生育委員會(huì).食品安全國(guó)家標(biāo)準(zhǔn)食品中蛋白質(zhì)的測(cè)定:GB5009.5-2016[S]. 北京: 中國(guó)標(biāo)準(zhǔn)出版社,2016.
[5] 彭彥昆,趙芳,李龍,等. 利用近紅外光譜與PCA-SVM識(shí)別熱損傷番茄種子[J]. 農(nóng)業(yè)工程學(xué)報(bào),2018,34(5):159-165.
Peng Yankun, Zhao Fang, Li Long, et al. Discrimination of heat-damaged tomato seeds based on near infrared spectroscopy and PCA-SVM method [J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(5): 159-165. (in Chinese with English abstract)
[6] 劉明博,李玉鵬,唐延林,等. 大米蛋白質(zhì)含量近紅外光譜檢測(cè)模型研究[J]. 中國(guó)農(nóng)學(xué)通報(bào),2013(12):212-216.
Liu Mingbo, Li Yupeng, Tang Yanlin, et al. Study on NIR spectral detection model of rice protein content[J]. Chinese Agricultural Science Bulletin, 2013(12): 212-216. (in Chinese with English abstract)
[7] Miryeong S, Franklineii B, Annam M C, et al. Near-infrared spectroscopy for determination of protein and amylose in rice flour through use of derivatives[J]. Cereal Chemistry, 2004, 81(3): 341-344.
[8] 賈桂鋒,陳偉,馮耀澤. 基于生物散斑圖像和慣性矩譜分析的牛肉摻腐檢測(cè)[J]. 農(nóng)業(yè)工程學(xué)報(bào),2018,34(16):281-286.
Jia Guifeng, Chen Wei, Feng Yaoze. Quantification detection of beef adulteration with spoiled beef based on biospeckle imaging and inertia moment spectrum [J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(16): 281-286. (in Chinese with English abstract)
[9] Camps-Valls G, Tuia D, Bruzzone L, et al. Advances in hyperspectral image classification[J]. IEEE Signal Processing Magazine, 2014, 31(1): 45-54.
[10] 劉小丹,馮旭萍,劉飛,等. 基于近紅外高光譜成像技術(shù)鑒別雜交稻品系[J]. 農(nóng)業(yè)工程學(xué)報(bào),2017,33(22):189-194.
Liu Xiaodan, Feng Xuping, Liu Fei, et al. Identification of hybrid rice strain based on near-infrared hyperspectral imaging technology[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2017, 33(22): 189-194. (in Chinese with English abstract)
[11] 孫紅,鄭濤,劉寧,等. 高光譜圖像檢測(cè)馬鈴薯植株葉綠素含量垂直分布[J]. 農(nóng)業(yè)工程學(xué)報(bào),2018,34(1):149-156.
Sun Hong, Zheng Tao, Liu Ning, et al. Vertical distribution of chlorophyll in potato plants based on hyperspectral imaging[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(1): 149-156. (in Chinese with English abstract)
[12] 孫俊,金夏明,毛罕平,等. 基于高光譜圖像光譜與紋理信息的生菜氮素含量檢測(cè)[J]. 農(nóng)業(yè)工程學(xué)報(bào),2014,30(10):167-173.
Sun Jun, Jin Xiaming, Mao Hanping, et al. Detection of nitrogen content in lettuce leaves based on spectroscopy and texture using hyperspectral imaging technology[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2014, 30(10): 167-173. (in Chinese with English abstract)
[13] 臧卓,林輝,楊敏華. ICA與PCA在高光譜數(shù)據(jù)降維分類中的對(duì)比研究[J]. 中南林業(yè)科技大學(xué)學(xué)報(bào),2011,31(11):18-22.
Zang Zhuo, Lin Hui, Yang Minhua. Comparative study on descending dimension classification of hyperspectral data between ICA algorithm and PCA algorithm[J]. Journal of Central South University of Forestry & Technology, 2011, 31(11): 18-22. (in Chinese with English abstract)
[14] Liu Z, He Y, Cen H, et al. Deep feature representation with stacked sparse auto-encoder and convolutional neural network for hyperspectral imaging-based detection of cucumber defects[J]. Transactions of the ASABE, 2018, 61(2): 425-436.
[15] Yu J, Huang D, Wei Z. Unsupervised image segmentation via Stacked Denoising Auto-encoder and hierarchical patch indexing[J]. Signal Processing, 2017: 143, 346-353.
[16] 孫俊,靳海濤,武小紅,等. 基于低秩自動(dòng)編碼器及高光譜圖像的茶葉品種鑒別[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2018,49(8):316-323.
Sun Jun, Jin Haitao, Wu Xiaohong, et al. Tea variety identification based on low-rank stacked auto-encoder and hyperspectral image[J]. Transactions of the Chinese Society for Agricultural Machinery, 2018, 49(8): 316-323. (in Chinese with English abstract)
[17] Zhou F F. Improving prediction of self-interacting proteins using stacked sparse auto-encoder with PSSM profiles[J]. International Journal of Biological Sciences, 2018, 14(8): 983-991.
[18] Zhang F, Du B, Zhang L. Saliency-guided unsupervised feature learning for scene classification[J]. IEEE Transactions on Geoscience & Remote Sensing, 2014, 53(4): 2175-2184.
[19] 趙娟,彭彥昆. 基于高光譜圖像紋理特征的牛肉嫩度分布評(píng)價(jià)[J]. 農(nóng)業(yè)工程學(xué)報(bào),2015,31(7):279-286.
Zhao Juan, Peng Yankun. Distribution of beef tenderness grading based on texture features by hyperspectral image analysis[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(7): 279-286. (in Chinese with English abstract)
[20] 董高,郭建,王成,等. 基于近紅外高光譜成像及信息融合的小麥品種分類研究[J]. 光譜學(xué)與光譜分析,2015,35(12):3369-3374.
Dong Gao, Guo Jian, Wang Cheng, et al. The classification of wheat varieties based on near infrared hyperspectral imaging and information fusion[J]. Spectroscopy and Spectral Analysis, 2015, 35(12): 3369-3374. (in Chinese with English abstract)
[21] 孫威,劉英. 高氣溫高濕環(huán)境對(duì)大米氨基酸的影響[J]. 武漢輕工大學(xué)學(xué)報(bào),2013(1):24-27.
Sun Wei, Liu Ying. Effects of treatment of high temperature and high relative humidity on rice amino acids[J].Journal of Wuhan Polytechnic University, 2013(1): 24-27. (in Chinese with English abstract)
[22] 朱文靜,毛罕平,周瑩,等. 基于高光譜圖像技術(shù)的番茄葉片氮素營(yíng)養(yǎng)診斷[J]. 江蘇大學(xué)學(xué)報(bào):自然科學(xué)版,2014,35(3):290-294.
Zhu Wenjing, Mao Hanping, Zhou Ying, et al. Hyperspectral imaging technology of nitrogen status diagnose for tomato leaves[J]. Journal of Jiangsu University: Natural Science Edition, 2014, 35(3): 290-294. (in Chinese with English abstract)
[23] 趙凡,董金磊,郭文川. 高光譜圖像光譜提取區(qū)域?qū)ΛJ猴桃糖度檢測(cè)精度的影響[J]. 現(xiàn)代食品科技,2016(4):223-228.
Zhao Fan, Dong Jinlei, Guo Wenchuan. Effect of spectral extraction regions in hyperspectral images on the precision in determining the sugar content of kiwifruits[J]. Modern Food Science & Technology, 2016(4): 223-228. (in Chinese with English abstract)
[24] Bengio Y, Lamblin P, Dan P, et al. Greedy layer-wise training of deep networks[J]. Advances in Neural Information Processing Systems, 2007, 19: 153-160.
[25] Baldi P. Autoencoders, unsupervised learning and deep architectures[C]// International Conference on Unsupervised and Transfer Learning Workshop, 2011: 37-50.
[26] Vincent P, Larochelle H, Bengio Y, et al. Extracting and composing robust features with denoising autoencoders[C]// International Conference on Machine Learning, ACM, 2008: 1096-1103.
[27] Jaitly N, Hinton G E. Using an auto-encoder with deformable templates to discover features for automated speech recognition[C]// The 14th Annual Conference of the International Speech Communication Association, Lyon, 2013: 25-29.
[28] 郭玉寶. 大米儲(chǔ)藏陳化中蛋白質(zhì)對(duì)其糊化特性的影響及其相關(guān)陳化機(jī)制研究[D]. 南京: 南京農(nóng)業(yè)大學(xué),2012.
Guo Yubao. The Effects of Protein on Pasting Properties of Rice During Storage Ageing and its Related Ageing Mechanism[D]. Najing: Nanjing Agricultural University, 2012. (in Chinese with English abstract)
[29] Chen Y, Lin Z, Zhao X, et al. Deep learning-based classification of hyperspectral data[J]. IEEE Journal of Selected Topics in Applied Earth Observations & Remote Sensing, 2014, 7(6): 2094-2107.
[30] Cheng P, Fan W, Xu Y. Quality grade discrimination of Chinese strong aroma type liquors using mass spectrometry and multivariate analysis[J]. Food Research International, 2013, 54(2): 1753-1760.
[31] Guo W, Shang L, Zhu X, et al. Nondestructive detection of soluble solids content of apples from dielectric spectra with ANN and chemometric methods[J]. Food and Bioprocess Technology, 2015, 8(5): 1126-1138.
[32] 孫俊,叢孫麗,毛罕平,等. 基于高光譜的油麥菜葉片水分CARS-ABC-SVR預(yù)測(cè)模型[J]. 農(nóng)業(yè)工程學(xué)報(bào),2017,33(5):178-184.
Sun Jun, Cong Sunli, Mao Hanping, et al. CARS-ABC-SVR model for predicting leaf moisture of leaf-used lettuce based on hyperspectral[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2017, 33(5): 178-184. (in Chinese with English abstract)
[33] 劉建學(xué),吳守一,方如明. 近紅外光譜法快速檢測(cè)大米蛋白質(zhì)含量[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2001,32(3):68-70.
Liu Jianxue, Wu Shouyi, Fang Ruming. Rapid measurement of rice protein content by near infrared spectroscopy[J]. Transactions of the Chinese Society for Agricultural Machinery, 2001, 32(3): 68-70. (in Chinese with English abstract)
[34] Bagchi T B, Sharma S, Chattopadhyay K. Development of NIRS models to predict protein and amylose content of brown rice and proximate compositions of rice bran[J]. Food Chemistry, 2016, 191: 21-27.
[35] Lin L, Lu F, Chang Y. Prediction of protein content in rice using a near-infrared imaging system as diagnostic technique[J]. International Journal of Agricultural and Biological Engineering, 2019, 12(2): 195-200.
Prediction model of rice protein content based on hyperspectral image and deep feature
Sun Jun, Jin Haitao, Lu Bing, Wu Xiaohong, Shen Jifeng, Dai Chunxia
(212013,)
nondestructive detection; spectrum analysis; models; hyperspectral imaging; stacked auto-encoder; deep feature; rice; protein content
10.11975/j.issn.1002-6819.2019.15.036
S126
A
1002-6819(2019)-15-0295-09
2018-12-11
2019-06-06
國(guó)家自然科學(xué)基金資助項(xiàng)目(31471413);江蘇高校優(yōu)勢(shì)學(xué)科建設(shè)工程資助項(xiàng)目PAPD(蘇政辦發(fā)2011 6號(hào));江蘇省六大人才高峰資助項(xiàng)目(ZBZZ-019);常州市科技支撐(社會(huì)發(fā)展)項(xiàng)目(CE20185029)
孫 俊,教授,博士,博士生導(dǎo)師。研究方向?yàn)橛?jì)算機(jī)技術(shù)在農(nóng)業(yè)工程中的應(yīng)用。Email:sun2000jun@ujs.edu.cn
孫 俊,靳海濤,蘆兵,武小紅,沈繼鋒,戴春霞. 基于高光譜圖像及深度特征的大米蛋白質(zhì)含量預(yù)測(cè)模型[J]. 農(nóng)業(yè)工程學(xué)報(bào),2019,35(15):295-303. doi:10.11975/j.issn.1002-6819.2019.15.036 http://www.tcsae.org
Sun Jun, Jin Haitao, Lu Bing, Wu Xiaohong, Shen Jifeng, Dai Chunxia. Prediction model of rice protein content based on hyperspectral image and deep feature[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(15): 295-303. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2019.15.036 http://www.tcsae.org
農(nóng)業(yè)工程學(xué)報(bào)2019年15期