殷賢華,劉 昱,賀 微,奉慕霖,石玉林
(1.桂林電子科技大學(xué) 電子工程與自動(dòng)化學(xué)院,桂林 541004;2.廣西自動(dòng)檢測(cè)技術(shù)與儀器重點(diǎn)實(shí)驗(yàn)室,桂林 541004)
丁腈橡膠(nitrile butadiene rubber,NBR)、氯丁橡膠(chloroprene rubber,CR)、丁基橡膠(isobutylene isoprene rubber,IIR)和丁苯橡膠(styrene butadiene rubb-er,SBR)是4種使用比較廣泛的通用橡膠,主要用來(lái)制造各種輪胎和一般橡膠制品。2-硫醇基苯并噻唑(2-mercaptobenzothiazole,MBT)是橡膠工業(yè)中廣泛使用的硫化促進(jìn)劑,常常作為其它硫化促進(jìn)劑的母體原料[1];一硫化四甲基秋蘭姆(tetramethyl thiuram monosulfide,TMTM)可以降低硫化橡膠的拉伸強(qiáng)度,適用于工程車輛[2];4,4′-二硫代二嗎啉(4,4-dithiodimorpholine,DTDM)可以使硫化膠拉伸強(qiáng)度和耐疲勞性能平衡,同時(shí)耐熱、耐老化性能也比較好,適用于小轎車[3]。隨著橡膠工業(yè)的發(fā)展,對(duì)橡膠及其助劑的有效檢測(cè)具有重要的研究意義。目前主要的檢測(cè)方法有氣相色譜法、燃效實(shí)驗(yàn)法和紅外光譜法等,由于這些方法耗時(shí)且準(zhǔn)確性低,無(wú)法高效地實(shí)現(xiàn)橡膠材料的區(qū)分,尋找一種高效無(wú)損的檢測(cè)方法至關(guān)重要。
太赫茲(terahertz,THz)波作為一種頻率處于0.1THz~10THz之間的電磁輻射[4],其量子能量低、散射效應(yīng)較弱,對(duì)環(huán)境輻射不敏感[5],基于太赫茲技術(shù)的時(shí)域光譜(terahertz time-domain spectroscopy,THz-TDS)系統(tǒng)逐漸應(yīng)用在許多領(lǐng)域。橡膠及多數(shù)助劑屬于高分子化合物,在太赫茲波段的吸收和諧振很強(qiáng),顯示出“指紋”特性[6],這使得基于太赫茲的橡膠及其助劑的檢測(cè)研究成為可能[7]。近年來(lái),國(guó)內(nèi)外學(xué)者針對(duì)橡膠及其助劑的太赫茲吸收特性展開了研究[8-10]。研究結(jié)果表明,部分橡膠及助劑在太赫茲波段展現(xiàn)出獨(dú)有的吸收特性,具有一定的研究意義。目前的研究中主要針對(duì)橡膠和添加劑在太赫茲頻段的吸收特性,卻很少使用具體的算法來(lái)對(duì)吸收峰接近或者重疊的橡膠或者助劑建立分類模型。所以,通過(guò)太赫茲?rùn)z測(cè)技術(shù)進(jìn)行吸收峰相似的橡膠和助劑的精確分類識(shí)別具有重要意義。
支持向量機(jī)(support vector machines,SVM)作為經(jīng)典的分類算法,成功地應(yīng)用在各種分類場(chǎng)景[11-13]。但是在SVM模型中,其懲罰參量C和徑向基核函數(shù)參量σREF對(duì)分類結(jié)果影響較大,如何優(yōu)化這兩個(gè)參量,關(guān)系到分類模型的優(yōu)劣[14]。粒子群算法(particle swarm optimization,PSO)作為一種群體智能尋優(yōu)算法,在工程計(jì)算中廣泛應(yīng)用。部分學(xué)者將PSO應(yīng)用在SVM的參量尋優(yōu),實(shí)現(xiàn)了相對(duì)較好的效果[15-16]。本文中針對(duì)PSO容易陷入局部最優(yōu)、搜索范圍窄的缺點(diǎn),將隨機(jī)權(quán)重策略和異步學(xué)習(xí)因子同時(shí)引入到PSO算法中,提出改進(jìn)的粒子群算法(majorization particle swarm optimization,MPSO)。針對(duì)物理特性相似、特征吸收峰相近的橡膠和硫化促進(jìn)劑,將MPSO與SVM結(jié)合建立精確分類模型,提高橡膠和硫化促進(jìn)劑的識(shí)別準(zhǔn)確率。
實(shí)驗(yàn)中以NBR,CR,IIR和SBR 4種常用的硫化橡膠,以及MBT,TMTM和DTDM 3種硫化促進(jìn)劑為實(shí)驗(yàn)對(duì)象。選用的4種硫化橡膠由國(guó)家橡膠及橡膠制品質(zhì)量監(jiān)督中心(廣西)提供,為純度為94%以上的原生橡膠粉末經(jīng)過(guò)混煉、返煉、硫化3步制作而成,然后對(duì)橡膠質(zhì)檢所提供的橡膠樣片裁剪成滿足實(shí)驗(yàn)系統(tǒng)測(cè)試要求的實(shí)驗(yàn)樣片;3種硫化促進(jìn)劑購(gòu)于東莞市百億塑料制品有限公司(純度均在96%以上),首先按照設(shè)計(jì)好的樣本配置比例進(jìn)行稱量,然后將樣本在研缽中進(jìn)行充分的研磨混合,最后利用壓片機(jī)在49000N的壓力下壓制成片。每個(gè)樣片厚度 1mm 左右,直徑 12mm 左右,重量約180mg。每種樣片制作了36個(gè)實(shí)驗(yàn)樣品,其中4種硫化橡膠共144個(gè)實(shí)驗(yàn)樣品,3種硫化促進(jìn)劑共108個(gè)實(shí)驗(yàn)樣品。為減少空氣水分對(duì)實(shí)驗(yàn)樣品的影響,樣本壓制前后,分別將原材料和壓制好的樣片放入YB-1A真空恒溫干燥箱中在50℃下干燥2h左右。實(shí)驗(yàn)樣品具體信息見表1所示。
Table 1 Types and quantities of experimental sample set 1 and set 2
實(shí)驗(yàn)設(shè)備主要由飛秒激光器(德國(guó)TOPTICA公司生產(chǎn))和太赫茲時(shí)域光譜系統(tǒng)(美國(guó)Zomega公司生產(chǎn))組成。其中飛秒激光器進(jìn)光功率約為120mW,脈沖持續(xù)時(shí)間為100fs,中心波長(zhǎng)為780nm,重復(fù)頻率為80MHz。實(shí)驗(yàn)時(shí),將室內(nèi)溫度控制在25℃左右,為減少空氣濕度對(duì)實(shí)驗(yàn)的影響,將THz-TDS實(shí)驗(yàn)箱中充入干燥空氣,使箱內(nèi)空氣濕度降到1%以內(nèi),具體的設(shè)備原理圖見參考文獻(xiàn)[17]。
THz-TDS檢測(cè)的主要目標(biāo)是獲得表征材料特征的宏觀光學(xué)常數(shù),一般包括復(fù)折射率、電導(dǎo)率和吸收系數(shù)等。利用透射式THz-TDS在獲得參考信號(hào)Eref(T)和樣品信號(hào)Esam(T)后,經(jīng)過(guò)傅里葉變換得到對(duì)應(yīng)的頻域信號(hào)Eref(ω)和Esam(ω),其中,T表示時(shí)間,ω為太赫茲波振動(dòng)的角頻率。吸光度表示太赫茲波被材料吸收的程度,其為無(wú)量綱的相對(duì)量。使用吸光度來(lái)描述樣品的吸收特性,可以減少樣本厚度不均勻?qū)庾V分析產(chǎn)生的影響。吸光度A(ω)的計(jì)算公式如下所示[18]:
(1)
粒子群算法[19]作為一種群智能優(yōu)化算法,因其優(yōu)良的尋優(yōu)特性,被應(yīng)用在各種工程實(shí)踐中。PSO的數(shù)學(xué)原理為[20]:假設(shè)存在一個(gè)n維搜索空間,由m個(gè)粒子組成的種群X={x1,x2,…,xm},其中第i個(gè)粒子的位置xi和速度vi表示為:
(2)
假設(shè)第i個(gè)粒子搜索到的最優(yōu)位置為pi=(pi1,pi2,…,pin)T,種群的全局最優(yōu)位置為pg=(pg1,pg2,…,pgn)T,那么第d維的粒子xi的速率和位置更新公式如下所示:
vid(t+1)=wvid(t)+c1r1(pid(t)-xid(t))+
c2r2(pgd(t)-xid(t))
(3)
xid(t+1)=xid(t)+xid(t+1)
(4)
式中,d=1,2,…,n,表示粒子維數(shù);i=1,2,…,m,表示第i個(gè)粒子;t表示當(dāng)前迭代次數(shù),t+1表示下一代迭代數(shù);w表示慣性權(quán)重,c1和c2表示學(xué)習(xí)因子;r1和r2表示[0,1]上服從均勻分布的偽隨機(jī)數(shù)。
面對(duì)PSO算法容易出現(xiàn)陷入局部極值或者過(guò)早停止收斂的現(xiàn)象,將隨機(jī)權(quán)重策略和異步學(xué)習(xí)因子加入到PSO算法中。隨機(jī)權(quán)重策略的引入有兩個(gè)優(yōu)點(diǎn):首先,如果在進(jìn)化初期接近最好點(diǎn),隨機(jī)權(quán)重策略可能產(chǎn)生相對(duì)較小的w值,加快算法的收斂速度。另外,w的隨機(jī)生成可以有效避免迭代初期最優(yōu)值的錯(cuò)失,提高尋優(yōu)的準(zhǔn)確率。w的描述如下式所示:
(5)
式中,N(0,1)表示標(biāo)準(zhǔn)正太分布的隨機(jī)數(shù),r(0,1)表示0~1之間的隨機(jī)數(shù),μ表示均值,μmin和μmax分別表示均值μ可以取到的最小值和最大值,σ表示均方差。
面對(duì)PSO算法固定學(xué)習(xí)因子帶來(lái)的收斂速度慢、尋優(yōu)范圍窄的權(quán)限,將隨著迭代而變化的學(xué)習(xí)因子(異步學(xué)習(xí)因子)引入到PSO中可以增強(qiáng)了迭代初始階段的全局搜索能力,有利于收斂到全局最優(yōu)。異步學(xué)習(xí)因子的變化公式為:
(6)
(7)
式中,c1,begin和c2,begin表示學(xué)習(xí)因子初值,c1,end和c2,end表示學(xué)習(xí)因子終值,tmax表示最大迭代次數(shù)。
通過(guò)MPSO與SVM的結(jié)合,提出改進(jìn)的粒子群優(yōu)化支持向量機(jī)(MPSO-SVM)分類模型。以分類準(zhǔn)確率作為適應(yīng)度函數(shù)對(duì)SVM的懲罰參量C和徑向基核函數(shù)參量σREF進(jìn)行迭代尋優(yōu),從而提高SVM模型的分類正確率。MPSO-SVM的基本流程如圖1所示。
Fig.1 Basic process of MPSO-SVM
迭代開始前對(duì)基本參量進(jìn)行初始化:學(xué)習(xí)因子初值設(shè)置為2.5,學(xué)習(xí)因子終值設(shè)置為0.5,均值μmax取為0.8,均值μmin取為0.5,方差σ取為0.2,tmax取為100,種群數(shù)量設(shè)置為20,懲罰因子C和核函數(shù)參量σREF的初值范圍設(shè)置為[10-2,102];
混淆矩陣作為一種機(jī)器學(xué)習(xí)中經(jīng)典的可視化指標(biāo),可以較直觀地衡量一個(gè)分類器分類的準(zhǔn)確程度?;煜仃囆袑?duì)應(yīng)的類別表示樣本的真實(shí)類別,每一行的實(shí)驗(yàn)樣本總數(shù)為該行對(duì)應(yīng)的類別的真實(shí)樣本數(shù);各列類別為預(yù)測(cè)類別,每一列的實(shí)驗(yàn)樣本總數(shù)為預(yù)測(cè)為該類的樣本總數(shù)[21]。其中,基于混淆矩陣的查全率(recall ratio)R和查準(zhǔn)率(precision ratio)P是兩個(gè)比較常用的指標(biāo),其計(jì)算公式如下所示:
(8)
(9)
式中,查全率Rh表示被模型正確預(yù)測(cè)為第h類的實(shí)驗(yàn)樣本數(shù)與第h類實(shí)驗(yàn)樣本真實(shí)數(shù)量之比,衡量分類模型識(shí)別相關(guān)種類能力的尺度;查準(zhǔn)率Ph表示被模型正確預(yù)測(cè)為第h類的實(shí)驗(yàn)樣本數(shù)與被模型預(yù)測(cè)為第h類的實(shí)驗(yàn)樣本總數(shù)之比,表示模型識(shí)別某個(gè)種類的精確度;Nhh,Nhj,Njh分別表示混淆矩陣中第h行第h列、第h行第j列、第j行第h列所對(duì)應(yīng)的數(shù)值。
本研究中利用太赫茲時(shí)域光譜系統(tǒng)分別對(duì)NBR,CR,IIR和SBR 4種硫化橡膠,以及MBT,DTDM和TMTM 3種硫化促進(jìn)劑進(jìn)行多次測(cè)量取平均后,分別得到7種物質(zhì)的純凈物吸光度圖譜,如圖2a和圖2b所示。
Fig.2 Absorbance spectrum of different substancesa—four kinds of vulcanized rubber b—three kinds of vulcanization accelerators
由于不同物質(zhì)分子振動(dòng)模式的不同,各物質(zhì)在太赫茲頻段顯示出特有的“指紋”特性,使得不同物質(zhì)在不同頻率點(diǎn)具有特定的吸收峰。從圖2a可以看出,在0.3THz~1.6THz頻段內(nèi),4種硫化橡膠具有各自獨(dú)特的特征吸收峰:丁腈橡膠(NBR)在0.92THz,1.22THz和1.39THz處有3個(gè)的特征吸收峰;氯丁橡膠(CR)在1.24THz和1.39THz處具有兩個(gè)明顯的特征吸收峰;丁基橡膠(IIR)在1.08THz和1.48THz處存在兩個(gè)特征吸收峰;丁苯橡膠(SBR)在1.09THz和1.52THz處有明顯特征吸收峰。從圖2b可以看出,3種硫化促進(jìn)劑的特征吸收峰較明顯,DTDM在1.51THz處有明顯的特征吸收峰,MBT在0.92THz和1.40THz處存在特征吸收峰,TMTM在1.48THz處存在一個(gè)明顯的特征吸收峰。
可以看出,4種硫化橡膠的特征吸收峰位置較接近,如果受噪聲或者誤差的影響,吸收峰存在偏移而發(fā)生重疊,則很難對(duì)4種橡膠做出準(zhǔn)確判斷;3種硫化促進(jìn)劑中,MBT的吸收峰較獨(dú)特,可以明顯區(qū)分,但是DTDM和TMTM的吸收峰位置接近,難以直觀地準(zhǔn)確區(qū)分。所以針對(duì)4種硫化橡膠和3種硫化促進(jìn)劑,需要借用一定的分類算法來(lái)進(jìn)行建模區(qū)分。
為了更加準(zhǔn)確地對(duì)4種硫化橡膠和3種硫化促進(jìn)劑進(jìn)行分類,采用MPSO-SVM來(lái)進(jìn)行精確分類識(shí)別。如表1所示,4種硫化橡膠144個(gè)樣本數(shù)據(jù)中,96個(gè)樣本數(shù)據(jù)進(jìn)行模型訓(xùn)練,48個(gè)樣本數(shù)據(jù)進(jìn)行測(cè)試;3種硫化促進(jìn)劑108個(gè)樣本數(shù)據(jù)中,72個(gè)樣本數(shù)據(jù)進(jìn)行模型訓(xùn)練,48個(gè)樣本數(shù)據(jù)進(jìn)行測(cè)試。針對(duì)以上數(shù)據(jù)集,利用SVM、PSO-SVM和MPSO-SVM 3種模型進(jìn)行分類識(shí)別。首先,以分類正確率作為適應(yīng)度,通過(guò)算法對(duì)支持向量機(jī)的參量進(jìn)行尋優(yōu),結(jié)果如表2所示。
Table 2 Selection results of SVM model parameters based on three algorithm
基于表2中的參量,3種模型分類結(jié)果的混淆矩陣如圖3和圖4所示。
Fig.3 Confusion matrix of classification results for four kinds of vulcanized rubbera—classification results of SVM b—classification results of PSO-SVM c—classification results of MPSO-SVM
Fig.4 Confusion matrix of classification results of three kinds of vulcanization acceleratorsa—classification results of SVM b—classification results of PSO-SVM c—classification results of MPSO-SVM
圖3是3種算法針對(duì)4類硫化橡膠分類得到的混淆矩陣。圖中,1,2,3,4依次對(duì)應(yīng)NBR,CR,IIR和SBR 4種硫化橡膠。從圖3a中可以看出,SVM算法的誤判集中在第1類橡膠和第4類橡膠上,其中7個(gè)第1類橡膠被錯(cuò)分到第2類,1個(gè)第1類橡膠被誤判為第3類橡膠,以及3個(gè)第4類橡膠被誤判為第3類橡膠;從圖3b中可以看出,PSO-SVM算法的分類結(jié)果較好,誤判主要集中在第1類上,將8個(gè)第1類橡膠分到了第2類和1個(gè)第1類橡膠分到了第4類,將1個(gè)第3類錯(cuò)分為第4類;從圖3c中可以看出,誤判率主要集中在第1類上,將8個(gè)第1類分到了第2類和1個(gè)第1類分到了第4類。整體而言,誤判率主要集中在第1類橡膠上,主要原因是第1類橡膠和第2類橡膠的特征吸收峰位置很接近,其中1.39THz處的吸收峰發(fā)生重疊是主要影響誤判的原因。
圖4是3種算法針對(duì)3類硫化促進(jìn)劑分類得到的混淆矩陣。圖中,1,2,3依次對(duì)應(yīng)DTDM,MBT和TMTM3種硫化促進(jìn)劑。從圖4中可以看出,相較于4類硫化橡膠,3類硫化促進(jìn)劑的分類結(jié)果更好。從圖4a中可以看出,SVM算法的誤判主要集中在第1類和第3類,其中1個(gè)第1類和1個(gè)第3類互相誤判;從圖4b中可以看出,PSO-SVM的分類結(jié)果比較好,僅將1個(gè)第3類誤判為第2類;從圖4c中可以看出,MPSO-SVM的誤判率為零,3類硫化促進(jìn)劑可以全部正確分類,效果最好。
進(jìn)一步定量評(píng)判分類結(jié)果,由混淆矩陣計(jì)算出set 1和set 2數(shù)據(jù)集分類結(jié)果的查全率和查準(zhǔn)率,如表3所示。從表中可以看出,針對(duì)set 1數(shù)據(jù)集,MPSO-SVM識(shí)別CR,IIR和SBR的查全率均為100%,在NBR橡膠的查全率僅為25%,低于SVM;對(duì)于查準(zhǔn)率,MPSO-SVM針對(duì)NBR和SBR可以精確分類,在CR的分類精準(zhǔn)度上略低于SVM。針對(duì)set 2數(shù)據(jù)集,MPSO-SVM的查全率和查準(zhǔn)率均為100%,效果最佳。
Table 3 The recall and precision of the classification results for the three algorithms
保持set 1和set 2訓(xùn)練集和測(cè)試集的樣本不變,將SVM,PSO-SVM和MPSO-SVM 3種方法分別運(yùn)行20次,得到訓(xùn)練集和測(cè)試集的平均準(zhǔn)確率如表4所示。從表中可以看出,3種方法針對(duì)兩個(gè)不同的數(shù)據(jù)集的結(jié)果中,MPSO-SVM算法的綜合正確率更高;本文中的算法在Intel(R) Core(TM) i5-4210U CPU 1.70GHz、內(nèi)存為4GB的電腦配置環(huán)境下運(yùn)行,相比PSO-SVM算法,該算法的分類識(shí)別時(shí)間更短,效率更高。
Table 4 Comprehensive evaluation of three algorithms after running 20 times
本研究中以4類常見的硫化橡膠和3類常用橡膠硫化促進(jìn)劑為實(shí)驗(yàn)對(duì)象,通過(guò)改進(jìn)的粒子群算法與支持向量回歸機(jī)相結(jié)合,建立分類識(shí)別模型。研究結(jié)果表明,粒子群算法與隨機(jī)權(quán)重策略和異步學(xué)習(xí)因子的結(jié)合可以較好地對(duì)支持向量機(jī)的懲罰參量和核函數(shù)參量進(jìn)行尋優(yōu),從而有效提高分類模型的識(shí)別準(zhǔn)確率,相比于SVM和PSO-SVM算法,MPSO-SVM算法的識(shí)別準(zhǔn)確率更高,為基于太赫茲時(shí)域光譜技術(shù)的物質(zhì)檢測(cè)分析提供了新的參考方法,具有重要的參考價(jià)值。