国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于深度自編碼的大曲高光譜數(shù)據(jù)解混研究

2021-03-01 06:31葉建秋黃丹平田建平黃丹羅惠波張力王鑫董娜
食品與發(fā)酵工業(yè) 2021年4期
關(guān)鍵詞:大曲光譜編碼

葉建秋,黃丹平*,田建平,黃丹,羅惠波,張力,王鑫,董娜

1(四川輕化工大學(xué) 機(jī)械工程學(xué)院,四川 宜賓,644000)2(四川輕化工大學(xué) 生物工程學(xué)院,四川 宜賓,644000)

白酒在中國有著悠久的歷史和傳承,已經(jīng)成為我國必不可少的酒文化。相對其他釀造工藝,其最本質(zhì)的區(qū)別在于中國白酒采用了傳統(tǒng)的固態(tài)發(fā)酵技術(shù)[1-3]。而培曲工藝在整個(gè)固態(tài)釀造過程中占據(jù)非常重要的地位,大曲發(fā)酵的狀態(tài)直接影響出酒品質(zhì)[4]。大曲物質(zhì)結(jié)構(gòu)十分復(fù)雜,在發(fā)酵過程中涉及眾多微生物以及物質(zhì)變化[5]。傳統(tǒng)大曲品質(zhì)評定主要依靠人工經(jīng)驗(yàn),局限在感官層面上。隨著檢測技術(shù)的發(fā)展,目前大曲品質(zhì)主要從感官、理化、生化、微生物等方面進(jìn)行評定[6]。感官評定依靠人工經(jīng)驗(yàn),誤差不可控;理化、生化與微生物依靠化學(xué)檢測和生物技術(shù),檢測周期長,勞動強(qiáng)度大,檢測成本高,并且大曲中很多微量物質(zhì)變化在化學(xué)檢測中也很難直接檢測。因此,在大曲檢測中引入高光譜成像技術(shù)[7-8]。高光譜技術(shù)是基于機(jī)器視覺的無損檢測技術(shù),融合二維空間的圖像信息和一維空間的光譜信息[9-10]。理論上,可以快速無損的對大曲物質(zhì)成分進(jìn)行檢測,進(jìn)而進(jìn)行品質(zhì)評價(jià)和發(fā)酵條件的調(diào)控[11-12]。但在實(shí)際檢測過程中發(fā)現(xiàn),大曲物質(zhì)成分復(fù)雜,很多微量物質(zhì)的變化對大曲品質(zhì)的評定和發(fā)酵過程都有著重要的影響。但在光譜信息中,含量較大的物質(zhì)將微量物質(zhì)信息掩蓋,難以直接反映各物質(zhì)的變化情況。因此,亟需一種針對大曲的混元物質(zhì)光譜進(jìn)行分解的技術(shù)[13-14]。

近年來高光譜發(fā)展迅速,從傳統(tǒng)的遙感領(lǐng)域,發(fā)展到農(nóng)作物、食品檢測,以及軍事領(lǐng)域,但針對光譜解混的研究主要還是遙感領(lǐng)域的地物解混[15]。目前對于高光譜解混技術(shù)的研究進(jìn)展迅速,許多解混方法被引入,主要可分為幾何法、稀疏回歸法和統(tǒng)計(jì)學(xué)方法[16-18],這些方法多為有監(jiān)督類型或半監(jiān)督類型方法。RAJABI等提出一種將光譜特征矩陣建模為稀疏矩陣乘積的多層非負(fù)矩陣(Multi Level Nonnegative Matrix Factorization,MLNMF)分解方法對高光譜數(shù)據(jù)進(jìn)行分解,通過相應(yīng)的數(shù)據(jù)測試,可以有效的對光譜數(shù)據(jù)進(jìn)行分解[19];張向榮等提出一種深度卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)的高光譜解混方法,通過CNN提取特征,并將特征映射獲得豐度百分比[20];PALSSON等提出一種神經(jīng)網(wǎng)絡(luò)自編碼的高光譜分解方法,評估了淺層編碼器和深層編碼器的幾種不同架構(gòu)配置[21]。深度自編碼網(wǎng)絡(luò)以其無監(jiān)督、適應(yīng)性強(qiáng)等特性被應(yīng)用于光譜解混領(lǐng)域。因此針對大曲高光譜檢測中所面臨的問題,本研究提出一種基于深度自編碼的無監(jiān)督高光譜大曲解混技術(shù),對大曲物質(zhì)混元光譜曲線進(jìn)行分解。本課題所針對的研究對象(大曲高光譜數(shù)據(jù))不同于傳統(tǒng)的地物解混,目的是為了分解出混元大曲曲線的純凈物質(zhì)曲線,以便于后期對大曲品質(zhì)的定性、定量檢測分析。

由上可知,本課題采用深度自編碼算法對大曲高光譜數(shù)據(jù)進(jìn)行解混研究。以濃香型大曲的高光譜曲線為解混對象,先以大曲光譜數(shù)據(jù)自身為參照,對光譜數(shù)據(jù)進(jìn)行編碼再解碼的模型訓(xùn)練過程,當(dāng)模型誤差滿足要求后,記錄下模型權(quán)重信息,重建一個(gè)相似自編碼模型,取出中間部分特征值,使其通過第一步建立的模型權(quán)重,得到解混曲線;運(yùn)用歐氏距離和皮爾遜相似度算法,同時(shí)對解混出的光譜曲線與采集的真實(shí)曲粉光譜曲線進(jìn)行比較,從而評價(jià)解混效果。

1 系統(tǒng)與數(shù)據(jù)準(zhǔn)備

1.1 硬件系統(tǒng)

芬蘭SPECIM FX17相機(jī),光譜波段為900~1 700 nm,共224個(gè)波段;LSCA-0 817-51移動控制平臺;德國OSRAM的DECOSTA1 ES M6鹵素?zé)艄庠?;Lumo Scanner(LS)采集控制系統(tǒng)。

1.2 數(shù)據(jù)采集

1.2.1 曲粉水分梯度實(shí)驗(yàn)

由于大曲在不同發(fā)酵階段物質(zhì)成分變化較大且復(fù)雜,很難有對解混效果進(jìn)行比對分析,因此本研究先設(shè)計(jì)物質(zhì)量變化相對單一的曲粉水分梯度實(shí)驗(yàn),分別取等量的曲粉加入3、6、9、12、15、18 mL的純水均勻混合。具體采集情況如表1所示。

表1 數(shù)據(jù)采集說明Table 1 Description of data acquisition

1.2.2 純水?dāng)?shù)據(jù)采集實(shí)驗(yàn)

由于上述所采用的高光譜相機(jī)采集的是反射譜,純水等透明液體具有很強(qiáng)的透光性,因此不能直接采集。本研究通過實(shí)驗(yàn)分析,如圖1中所示,石英砂光譜曲線平穩(wěn),不存在較大的特征吸收峰,不會影響其他物質(zhì)光譜曲線形狀;并且石英砂呈白色,作為承載物不存在顏色干擾;化學(xué)性質(zhì)穩(wěn)定不會與水發(fā)生反應(yīng)。因此綜合考慮顏色、化學(xué)性質(zhì)與光譜曲線等多方面因素,選擇石英砂作為純水載體,拍攝近似水分純光譜曲線信息。具體用量如表1中實(shí)驗(yàn)組8、9所示。

圖1 石英砂粉末曲線與加水石英砂水分曲線Fig.1 Powder curve and water content curve of quartz sand

1.3 數(shù)據(jù)預(yù)處理

在高光譜相機(jī)采集數(shù)據(jù)時(shí),會受到暗電流、光量子等噪聲干擾。為減少噪聲對數(shù)據(jù)結(jié)果影響,優(yōu)化光譜信息,提高解混的準(zhǔn)確性,需要對原始高光譜數(shù)據(jù)進(jìn)行黑白校正預(yù)處理,計(jì)算如公式(1)所示,其中R是校正過的反射數(shù)據(jù),DNraw是原始數(shù)據(jù),DNdark是黑板校正數(shù)據(jù),DNwhite是白板校正數(shù)據(jù)。

(1)

在數(shù)據(jù)提取時(shí)高光譜數(shù)據(jù)中并非所有數(shù)據(jù)都是實(shí)驗(yàn)所需數(shù)據(jù),因此本研究采用圖像處理中的閾值分割方法對數(shù)據(jù)位置進(jìn)行快速定位與篩選,并通過腐蝕膨脹,去除邊緣毛刺與中間的孔洞點(diǎn),處理效果如圖2所示。

a-原圖;b-閾值分割;c-有效區(qū)域劃分;d-ROI劃分圖2 圖像預(yù)處理以及ROI劃分Fig.2 Image preprocessing and ROI partition

由于在深度學(xué)習(xí)中需要大量的數(shù)據(jù)樣本,對模型進(jìn)行訓(xùn)練。本研究在上述閾值分割定位過后,通過定位圓心,劃分有效數(shù)據(jù)范圍,如圖2-c所示。在范圍內(nèi)隨機(jī)生成像素尺寸半徑為2的感興趣區(qū)域(region of interest,ROI),并取ROI區(qū)域中的反射率平均值作為樣本曲線。3~18 mL水分梯度樣本中,每個(gè)數(shù)據(jù)樣本中取2 000個(gè)ROI,如圖2-d所示,采集訓(xùn)練用總數(shù)據(jù)為12 000個(gè),成品大曲粉與石英砂與水混合的數(shù)據(jù)樣本以及上述實(shí)驗(yàn)梯度樣本中取解混測試樣本分別為200個(gè),總計(jì)1 600個(gè)。

2 自編碼解混實(shí)驗(yàn)

2.1 線性模型試驗(yàn)

解混算法依賴于光譜實(shí)際的混合情況,目前高光譜的混合模型主要分為兩類:線性混合模型[22]和非線性混合模型[23]。其中線性模型具有簡潔、高效、物理含義明確的特點(diǎn),從而成為光譜解混領(lǐng)域的研究熱點(diǎn)。為了探究大曲高光譜物質(zhì)曲線混合模型是非線性還是線性,本研究通過采集純曲粉、石英砂與水混合、曲粉與水混合3種情況下的高光譜曲線,對比純曲粉與類似純水的加水石英砂光譜曲線相加所得曲線,與曲粉和水混合所得曲線進(jìn)行相關(guān)性分析,最終兩曲線相關(guān)度為0.995 3,疊加曲線比較如圖3所示。

圖3 曲粉疊加實(shí)驗(yàn)效果圖Fig.3 Experimental effect of koji powder superposition

通過上述相關(guān)性分析實(shí)驗(yàn),可以驗(yàn)證曲粉物質(zhì)成分的模型為線性的相加性模型,因此可推測大曲高光譜各物質(zhì)光譜曲線主要為線性疊加模型,如公式(2)所示:

(2)

式中:x為曲粉中各物質(zhì)混合曲線,mr為某個(gè)純凈物質(zhì)r=1…R,R表示物質(zhì)數(shù)量,sr為物質(zhì)的豐度占比,b為干擾噪聲。當(dāng)考慮所有數(shù)據(jù)時(shí),模型可寫作公式(3):

x=SM+b

(3)

式中:S為豐度矩陣,M為物質(zhì)成分矩陣,通過自動編碼器在無監(jiān)督的情況下,可以將以上線性模型進(jìn)行盲分解。

2.2 自編碼訓(xùn)練

近年來隨著深度學(xué)習(xí)的不斷發(fā)展,深度學(xué)習(xí)方法在高光譜圖像分析領(lǐng)域有廣泛應(yīng)用,并且在光譜解混領(lǐng)域也展現(xiàn)出優(yōu)越的性能[24]。其中深度自編碼網(wǎng)絡(luò)以無監(jiān)督的特性在解混中確定端元和豐度系數(shù)方面都展現(xiàn)出良好的性能。因此,本研究采用深度自編碼網(wǎng)絡(luò)對大曲高光譜數(shù)據(jù)進(jìn)行解混研究。

自編碼器本質(zhì)是一種前向神經(jīng)網(wǎng)絡(luò),可分為兩部分:編碼器部分GE,將輸入x編碼壓縮為隱藏的低維表示h=GE(x);另一部分為解碼部分GD,將壓縮的低維表示h解碼為輸入x的近似值x′=GD(h)。最終通過目標(biāo)函數(shù)Fx′,x最小化x與x′重構(gòu)之間的誤差,反向傳遞權(quán)重參數(shù)來訓(xùn)練網(wǎng)絡(luò)。如公式(4)~公式(6)所示:

h=GEx=Φ(SM+b)

(4)

x′=GD[GE(x)]=Φ′[Φ(SM+b)]

(5)

(6)

圖4 自編碼網(wǎng)絡(luò)模型結(jié)構(gòu)示意圖Fig.4 Structure of s autoencoder network model

模型訓(xùn)練完成后,假設(shè)需要解混物質(zhì)表示為A,在自定義層部分的特征表示為a∈R,解碼部分權(quán)重為w,噪聲表示為b,則A物質(zhì)的解混數(shù)據(jù)可表示如公式(7)所示:

A=φ(aw+b)

(7)

本研究設(shè)計(jì)的深度自編碼器具體結(jié)構(gòu)如表2所示。

表2 網(wǎng)絡(luò)結(jié)構(gòu)表Table 2 Network structure

在編碼壓縮部分,輸入層神經(jīng)元數(shù)與高光譜數(shù)據(jù)譜帶相同,考慮到建模效率以及減少信息丟失的因素,采用多層逐層壓縮的方法,4個(gè)全連接層將輸入由224逐漸壓縮到特征成員數(shù)R。由于大曲成分含量復(fù)雜,本研究主要針對水分對大曲的影響,因此最終壓縮層R選取為2,目的在于解出水分和曲粉的光譜曲線,以便于后續(xù)對模型進(jìn)行評價(jià)。其中數(shù)據(jù)維度從224到R過程中激活函數(shù)#可以為任意,如Relu,Sigmoid,LReLU,Tanh等,本研究主要解混目標(biāo)主要是線性混合,因此主要采用Relu激活函數(shù)。需要注意的是在壓縮維度到R即自定義層部分時(shí),為了實(shí)現(xiàn)豐度和為一的約束(abundance sum-to-one constraint,ASC)和非負(fù)豐度約束(abundance nonnegativity constraint,ANC),激活函數(shù)必須選擇Softmax。Softmax將多個(gè)神經(jīng)元輸出映射到(1,0)區(qū)間內(nèi),其原理如公式(8)所示,輸出有j個(gè)元素,其中第i個(gè)元素的表示為Si。

(8)

最后的解壓部分結(jié)構(gòu)與編碼部分類似,同樣是層與層之間全連接,與編碼部分對稱的逐層解壓,可以減小噪聲數(shù)據(jù)干擾。

2.3 解混效果評價(jià)

為更進(jìn)一步評價(jià)解混模型的效果,需要對解混曲線和原始純物質(zhì)曲線進(jìn)行相關(guān)性分析。本研究主要采用歐氏距離(eucledian distance,ED)和皮爾遜相關(guān)系數(shù)(Pearson correlation,PC)兩種方法從特征距離和角度對解混曲線和原始曲線進(jìn)行相關(guān)性評價(jià),以達(dá)到選出最優(yōu)解混模型的目的。如公式(9)、公式(10)所示:

(9)

(10)

式中:歐式距離計(jì)算的是2個(gè)數(shù)據(jù)集特征之間的距離,距離越大,相似度越小,距離越小兩數(shù)據(jù)越相似;皮爾遜相關(guān)系數(shù)與余弦相似度類似,但是相比余弦相似度計(jì)算具有平移不變性和尺度不變性,對本研究的評價(jià)更具有準(zhǔn)確性。

3 實(shí)驗(yàn)與結(jié)果分析

通過對模型訓(xùn)練,可以取出曲粉與水混合物中的單獨(dú)的曲粉曲線和水分曲線。由圖5可以看出,解混曲線存在噪聲,因此需要在不損失主要信息的情況下對解混曲線進(jìn)行濾波。通過實(shí)驗(yàn),本研究采用Savitzky-Golay(S-G)濾波器,對解混曲線進(jìn)行濾波處理?;瑒哟翱陂L度為21,擬合階數(shù)為3,濾波效果如圖5所示。

圖5 解混曲線濾波效果對比圖Fig.5 Comparison of filtering effect of unmixing curve

自編碼中采用不同的目標(biāo)函數(shù),對于解混結(jié)果有不同的影響。本研究通過12 000組數(shù)據(jù)對解混模型進(jìn)行訓(xùn)練,在模型驗(yàn)證時(shí),用不同水分梯度的曲粉與水的混合樣本,進(jìn)行解混,得到曲線如圖6所示。圖中曲線隨梯度有一定的波動,但是水分含量越大的樣本曲線越接近,水分含量越少的樣本曲線波動越大。猜測是因?yàn)樗趾可贂r(shí),水與曲粉混合不均勻?qū)е隆R虼?,后續(xù)模型評價(jià)實(shí)驗(yàn),將取水分梯度曲線的平均值進(jìn)行模型評價(jià)。

圖6 解混梯度曲線對比Fig.6 Comparison of unmixing gradient curves

同時(shí)比較均方誤差(mean squared error,MSE)、絕對值方均誤差(mean absolute error,MAE)、雙曲余弦的對數(shù)誤差(Log-Cosh,L-C)3種目標(biāo)函數(shù)得到最終解混曲線,進(jìn)行S-G濾波處理后取水分梯度平均值,與原始曲線進(jìn)行歐式距離與皮爾遜相關(guān)系數(shù)的比較,得到模型效果評價(jià)如表3所示。解混出的曲粉、水各自最優(yōu)模型評價(jià)用加黑字體表示。

表3 模型效果評價(jià)Table 3 Model effect evaluation

通過上面的模型評價(jià)可以看出,不同目標(biāo)函數(shù)解混模型中,曲粉解混效果最好為S-G濾波后的L-G目標(biāo)函數(shù)的自編碼解混模型,歐式距離為0.342 7,皮爾遜相關(guān)系數(shù)為0.996 7;水分解混效果在兩種評價(jià)方式中存在差異,以歐式距離評價(jià)時(shí),最優(yōu)模型為L-C目標(biāo)函數(shù)的自編碼模型,歐式距離為0.726 3,以皮爾遜系數(shù)評價(jià)時(shí),最優(yōu)模型為MSE目標(biāo)函數(shù)的自編碼模型,相關(guān)系數(shù)為0.997 2,但是通過數(shù)據(jù)可以看出,皮爾遜相關(guān)系數(shù)評價(jià)的數(shù)值都較為接近,歐式距離評價(jià)系數(shù)差距較大,因此最終以歐式距離評價(jià)標(biāo)準(zhǔn)為主,因此水分解混效果最好的模型依然是以L-C為目標(biāo)函數(shù)的深度自編碼模型。

4 結(jié)論

本研究提出通過深度學(xué)習(xí)中的自編碼網(wǎng)絡(luò),以無監(jiān)督學(xué)習(xí)的方法,區(qū)別于傳統(tǒng)遙感的宏觀地物解混,實(shí)現(xiàn)對大曲高光譜混元物質(zhì)光譜曲線中水分與曲粉光譜曲線的分離提取。通過編碼部分將原始光譜曲線壓縮為低維空間的特征表示,再通過解碼部分將壓縮后的特征數(shù)據(jù)逐層解壓為與原始數(shù)據(jù)相近的重構(gòu)數(shù)據(jù),將解混曲線進(jìn)行S-G濾波過后,再對比不同目標(biāo)函數(shù),以歐氏距離和皮爾遜相關(guān)系數(shù)兩種評價(jià)算法對解混效果進(jìn)行評價(jià)。最終通過數(shù)據(jù)比較,以L-C為目標(biāo)函數(shù)的自編碼網(wǎng)絡(luò)對大曲水分含量的解混效果最好,對解混曲粉與原始曲粉的ED和PC分別為0.342 7和0.996 7;解混出的水分?jǐn)?shù)據(jù)與原始水分?jǐn)?shù)據(jù)的ED和PC分別為0.726 3和0.995 5。通過上述研究可證明,對大曲物質(zhì)成分的逐層分離提取可行,該無監(jiān)督的深度自編碼解混方法,為實(shí)現(xiàn)大曲高光譜微量物質(zhì)的檢測分析提供理論支撐與方法,具有一定的應(yīng)用價(jià)值。

猜你喜歡
大曲光譜編碼
基于三維Saab變換的高光譜圖像壓縮方法
生活中的編碼
高光譜遙感成像技術(shù)的發(fā)展與展望
兩宋大曲異同考
《全元詩》未編碼疑難字考辨十五則
唐雅樂大曲存辭考略
子帶編碼在圖像壓縮編碼中的應(yīng)用
Genome and healthcare
不同外源因子對宋河大曲質(zhì)量的影響
扣囊復(fù)膜孢酵母CICC33077在芝麻香型白酒高溫大曲生產(chǎn)中的應(yīng)用