祁文博 牟濤濤 陳少華
北京信息科技大學(xué)儀器科學(xué)與光電工程學(xué)院,北京 100192
礦物顏料是古代制作藝術(shù)品常用的顏料,分析礦物顏料成分有助于文物的鑒定和修復(fù),因此開發(fā)一種礦物顏料檢測方法是必要的。
當(dāng)前主流的檢測技術(shù)有紅外光譜[1]、拉曼光譜[2]和X-射線[3]等。這些技術(shù)被廣泛應(yīng)用于醫(yī)學(xué)、農(nóng)業(yè)和食品安全等領(lǐng)域。SI L等人[4]使用近紅外光譜技術(shù)結(jié)合化學(xué)計(jì)量方法研究藥品摻假情況,對Yaobitong膠囊做定量和定性分析,驗(yàn)證了紅外光譜技術(shù)在藥品檢測中的可行性。UNAL M等人[5]提出利用拉曼光譜評估軟骨水化狀態(tài)的方法,取得了較好的效果。在這些技術(shù)中,拉曼光譜具有高靈敏度、抗干擾能力強(qiáng)等優(yōu)點(diǎn),適合應(yīng)用于礦物顏料的檢測。
1928年,印度科學(xué)家C.V.RAMAN發(fā)現(xiàn)了拉曼效應(yīng)的存在。拉曼光譜是基于拉曼效應(yīng)的檢測技術(shù),它是一種散射光譜,可以得到分子振動、轉(zhuǎn)動方面的信息,從而分析物質(zhì)成分。很多學(xué)者已經(jīng)把拉曼光譜技術(shù)應(yīng)用于顏料的檢測分析中[6-7]。LEI Z等人[8]使用掃描電鏡-能譜儀、拉曼光譜和偏振光顯微鏡對大高玄殿的彩繪顏料進(jìn)行研究,實(shí)驗(yàn)中使用了不易移動的儀器,因此不能進(jìn)行現(xiàn)場檢測。COSANO D等人[9]使用顯微拉曼光譜檢測Annunciation sculptural group上的顏料,實(shí)驗(yàn)中進(jìn)行了大量的光譜分析,這需要專業(yè)的光譜學(xué)知識。上述實(shí)驗(yàn)的局限性限制了拉曼光譜的應(yīng)用。
深度學(xué)習(xí)算法可以自動提取拉曼光譜的特征并進(jìn)行分類,不需要人工的光譜分析。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)作為深度學(xué)習(xí)的一個分支,被廣泛應(yīng)用于醫(yī)學(xué)[10]、自然語言處理[11]和圖像識別[12]等領(lǐng)域,CNN通常包含卷積層、池化層和全連接層:卷積層用于提取特征,池化層用于減小特征圖的大小,并消除冗余的信息,全連接層用于分類。拉曼光譜由于儀器定標(biāo)、精度等問題可能發(fā)生少量偏移,卷積層的平移不變性特點(diǎn)可以很好地適應(yīng)這種偏移。
本文提出一種Deep-CNN模型,結(jié)合便攜式拉曼光譜儀,可以自動、準(zhǔn)確地識別三元混合礦物顏料的成分,同時(shí)解決了實(shí)驗(yàn)室級別的拉曼儀器操作復(fù)雜、不易移動的問題。在使用便攜式拉曼儀器時(shí)會引入較強(qiáng)的環(huán)境光[13]和噪聲,給分類帶來難度,Deep-CNN模型消除了這些影響。實(shí)驗(yàn)結(jié)果表明,該模型具備以下3點(diǎn)優(yōu)勢:(1)具有良好的抗噪聲能力;(2)使用小數(shù)據(jù)集訓(xùn)練也能取得準(zhǔn)確的分類結(jié)果;(3)對成分不同于實(shí)驗(yàn)樣本的混合物也能做出準(zhǔn)確的分類。
CNN是一種包含卷積計(jì)算的深度學(xué)習(xí)算法,通常包含卷積層、池化層和全連接層。卷積層通過卷積核在原始數(shù)據(jù)上滑動,進(jìn)行卷積計(jì)算,由于卷積核共享參數(shù)的特性,使CNN具備平移不變性。卷積層運(yùn)算公式如下:
其中,xin-1——第n-1層第i個輸入特征圖;
*——卷積運(yùn)算;
yjn——第n層第j個輸出特征圖;
kijn——第n-1層與第n層卷積運(yùn)算所使用的卷積核;
bjn——第n層第j個特征圖的偏置;
f——卷積層的激活函數(shù)。
卷積層后通常使用池化層進(jìn)行下采樣,池化層可以在保留數(shù)據(jù)重要特征的同時(shí)去除冗余信息,常見的池化層包括平均池化層和最大池化層,它們分別是對池化窗口內(nèi)的數(shù)據(jù)取平均值和取最大值。多個卷積層和池化層組合使用構(gòu)成特征提取器。提取的特征輸入全連接層進(jìn)行分類,為了避免過擬合,全連接層通常會應(yīng)用“輟學(xué)技術(shù)”(Dropout),即隨機(jī)凍結(jié)部分神經(jīng)元。全連接層的計(jì)算公式為:
其中,W——參數(shù)矩陣;
x——輸入向量;
y——輸出向量;
b——偏置向量;
n——神經(jīng)元數(shù)量;
m——輸入向量長度。
實(shí)驗(yàn)選用古代繪畫中常用的3種礦物顏料(朱砂、雌黃和淡黃)制備樣本,將這3種礦物顏料混合,最終得到7類樣本,具體成分如表1所示:
表1 混合礦物顏料的成分
由于實(shí)驗(yàn)中使用的礦物顏料是彩色的,使用普通的拉曼儀器在較高功率下可能會對樣本產(chǎn)生損傷,因此,本次實(shí)驗(yàn)使用基于數(shù)字鏡像裝置(Digital Mirror Device,DMD)和Lissajous模式調(diào)制的便攜式拉曼儀器采集拉曼光譜[14],可以在保證不損傷樣本的前提下獲得更優(yōu)質(zhì)的光譜(使用更高的激光功率),光譜采集系統(tǒng)如圖1所示。光譜儀的具體參數(shù)為:激光波長是785 nm±0.02 nm;分辨率是8~11 cm-1;激光功率設(shè)置為500 mW;光譜范圍是200~1,800 cm-1。對每個樣本采集40個光譜,共采集280個光譜作為訓(xùn)練集和驗(yàn)證集(訓(xùn)練集和驗(yàn)證集的比為3:1),其中,每個光譜是一個長度為801的一維數(shù)據(jù)。為了保證模型評估的準(zhǔn)確性,按照上述樣本制作方法再次制作7個新的樣本,對每個樣本采集20個光譜作為測試集,圖2為7個樣本的拉曼光譜。
CNN是一種基于數(shù)據(jù)訓(xùn)練的模型,數(shù)據(jù)不足會導(dǎo)致模型過擬合,即在訓(xùn)練集上的表現(xiàn)良好,但在測試集上的表現(xiàn)很差,因此需要進(jìn)行數(shù)據(jù)增強(qiáng)來擴(kuò)充數(shù)據(jù)集。拉曼光譜由于儀器定標(biāo)、誤差和檢測環(huán)境等影響會發(fā)生少量偏移,因此對光譜進(jìn)行平移變換從而增強(qiáng)數(shù)據(jù)集是合理的。本實(shí)驗(yàn)通過隨機(jī)去除光譜首尾共3個數(shù)據(jù)點(diǎn)的方法對光譜進(jìn)行數(shù)據(jù)增強(qiáng),將訓(xùn)練集和驗(yàn)證集擴(kuò)充為原來的4倍(1,120條光譜)。
為了減少拉曼光譜的噪聲和基線漂移,實(shí)驗(yàn)使用Savitzky-Golay、airPLS和歸一化算法對光譜進(jìn)行預(yù)處理,Savitzky-Golay濾波算法可以對光譜進(jìn)行平滑,減少噪聲,其原理是通過線性最小二乘法將相鄰數(shù)據(jù)點(diǎn)的連續(xù)子集與一個低次多項(xiàng)式進(jìn)行擬合。airPLS基線矯正算法可以有效減少光譜的基線漂移,其采用了基于誤差的迭代加權(quán)策略,即每一個數(shù)據(jù)點(diǎn)的權(quán)重更新基于上一個循環(huán)擬合的基線和原始信號之間的差異。歸一化可以使不同數(shù)量級的特征易于比較,本實(shí)驗(yàn)為了最大程度保留光譜信息,保留基線矯正后光譜的負(fù)值部分,圖3為朱砂、雌黃、淡黃混合物光譜的預(yù)處理效果圖。
混合物檢測屬于多標(biāo)簽分類問題,實(shí)驗(yàn)中建立了3個Deep-CNN模型,分別用于判斷樣本是否包含朱砂、雌黃和淡黃。
本文提出的Deep-CNN模型,包含7個卷積層、7個池化層、2個全連接層和1個輸出層。其中,池化層使用最大池化層,每個全連接層都包含512個神經(jīng)元,輸出層包含1個神經(jīng)元。每個卷積層和全連接層都使用ReLU激活函數(shù)去線性化,輸出層使用Sigmoid激活函數(shù)得到預(yù)測概率。激活函數(shù)公式如下:
模型使用RMSProp作為優(yōu)化器,二值交叉熵?fù)p失作為損失函數(shù),表2總結(jié)了該模型每個層的輸出形狀、過濾器尺寸和步長。圖4展示了該模型的結(jié)構(gòu)。經(jīng)過多次訓(xùn)練確定3個模型的學(xué)習(xí)率都是0.0001,批大?。╞atch size)都是300。
表2 Deep-CNN模型各層的輸出形狀、過濾器尺寸和步長
漢明損失(HL)、one-error(OE)和準(zhǔn)確率常被用于多標(biāo)簽分類模型的評估。
HL用于考察單個標(biāo)簽被誤分類的情況,公式為:
其中,N——樣本的數(shù)量;
Yi′——第i個樣本的預(yù)測標(biāo)簽;
Yi——第i個樣本的真實(shí)標(biāo)簽;
M——每個樣本標(biāo)簽數(shù)量。
OE用于記錄樣本的預(yù)測標(biāo)簽集中概率最大的標(biāo)簽不在真實(shí)標(biāo)簽中的情況,其公式為:
其中,f——模型的映射;
xi——第i個樣本;
y——樣本的一個標(biāo)簽;
Y——標(biāo)簽集;
Yi——第i個樣本的真實(shí)標(biāo)簽集。
準(zhǔn)確率是樣本所有標(biāo)簽都被正確分類的概率,它是最嚴(yán)格的評估標(biāo)準(zhǔn)。
使用測試集對模型進(jìn)行評估,140個光譜全部被正確分類,準(zhǔn)確率為100%,HL和OE為0,表明模型具備良好的性能。減少訓(xùn)練集和驗(yàn)證集大小到140條光譜,對模型進(jìn)行訓(xùn)練,準(zhǔn)確率依然保持在100%,這說明該模型對數(shù)據(jù)的依賴性小。在數(shù)據(jù)難以采集的場景下,本文提出的Deep-CNN模型是一種具備優(yōu)勢的分類方法。
4.2.1 抗噪聲能力評估
相比于實(shí)驗(yàn)室級別的拉曼光譜儀,便攜式拉曼光譜儀具有檢測速度快、方便攜帶等優(yōu)勢,但更容易受到噪聲的干擾,因此模型需要具備較強(qiáng)的抗噪聲能力。向測試集中加入不同大小的高斯白噪聲,得到5個不同信噪比的測試集,信噪比分別為10 dB、20 dB、30 dB、40 dB和50 dB。圖5是添加噪聲后朱砂、雌黃、淡黃混合物的拉曼光譜,分別使用這5個測試集對模型進(jìn)行測試,HL、OE和準(zhǔn)確率見表3。
表3 加入噪聲后模型的HL、OE和準(zhǔn)確率
實(shí)驗(yàn)結(jié)果表明,Deep-CNN模型可以準(zhǔn)確分類信噪比不低于30 dB的光譜。為了直觀觀察10 dB和20 dB 的測試集的分類情況,在圖6中展示了這兩個測試集分類結(jié)果的混淆矩陣,每個矩陣中的數(shù)字代表被分到對應(yīng)類別的光譜的數(shù)量。
混淆矩陣表明,光譜信噪比為10 dB時(shí),所有的朱砂都可以被正確分類,有40個包含雌黃的拉曼光譜被錯誤分類,60個不包含淡黃的拉曼光譜被錯誤分類;光譜信噪比為20 dB時(shí),所有的朱砂和雌黃都可以被正確分類,60個不包含淡黃的拉曼光譜被錯誤分類。這說明分類器效果由好到壞依次是朱砂、雌黃、淡黃。結(jié)合圖5拉曼光譜分析發(fā)現(xiàn),強(qiáng)噪聲會掩蓋部分強(qiáng)度較弱的特征峰,因此,特征峰更明顯的物質(zhì)分類效果更好。
4.2.2 未知混合物分類性能評估
為了進(jìn)一步評估模型的魯棒性,制作5個新的樣本,樣本成分見表4。由于每個樣本都加入了新的物質(zhì)——蛤白,因此這些樣本對于Deep-CNN模型來說是未知的。
表4 5個新樣本的成分
每個樣本采集20個光譜作為測試集,用于對模型測試,HL、OE和準(zhǔn)確率分別為0、0和100%,這說明Deep-CNN模型可以準(zhǔn)確識別未知的混合物。
本文提出了一種Deep-CNN模型,該模型可以自動、快速、無損地分析彩色礦物顏料的成分,準(zhǔn)確率可以達(dá)到100%。當(dāng)訓(xùn)練集和驗(yàn)證集的數(shù)量減少到140條光譜時(shí),準(zhǔn)確率依然保持在100%,這說明模型可以應(yīng)用于一些不易采集光譜的場景中。
為了驗(yàn)證模型的魯棒性,對模型進(jìn)行了抗噪聲能力的測試和對未知樣本識別能力的測試。試驗(yàn)結(jié)果表明,該模型在對信噪比不低于30 dB的光譜進(jìn)行分類時(shí),HL、OE和準(zhǔn)確率分別為0、0和100%,而在10 dB和20 dB的情況下,朱砂依然可以被準(zhǔn)確分類,20 dB時(shí)雌黃也可以被準(zhǔn)確分類,這是由于朱砂和雌黃的特征峰更加明顯。使用未知的光譜(加入蛤白)對模型進(jìn)行測試,準(zhǔn)確率也達(dá)到了100%。上述結(jié)果表明:該模型具備良好的魯棒性。
當(dāng)前使用CNN模型識別礦物顏料拉曼光譜的研究非常少,本文為這個領(lǐng)域的研究提供了有價(jià)值的參考。