夏延秋,王 宸,馮 欣,2*
(1.華北電力大學(xué) 能源動(dòng)力與機(jī)械工程學(xué)院,北京 102206;2.中國(guó)科學(xué)院蘭州化學(xué)物理研究所 固體潤(rùn)滑國(guó)家重點(diǎn)實(shí)驗(yàn)室,甘肅 蘭州 730000)
潤(rùn)滑油是廣泛應(yīng)用于汽車(chē)、機(jī)械和冶金等行業(yè)的重要產(chǎn)品,主要由基礎(chǔ)油和添加劑組成.其中添加劑含量占比通常為1%~10%,主要用途是改善基礎(chǔ)油的原有性能或賦予新的性能.潤(rùn)滑油添加劑的種類(lèi)繁多,有十幾大類(lèi),近萬(wàn)個(gè)品種.一般地說(shuō),潤(rùn)滑油的品種和質(zhì)量往往取決于添加劑的品種和質(zhì)量[1],因而對(duì)添加劑的合理生產(chǎn)和使用,已成為有效利用資源,提高設(shè)備性能和節(jié)約能源的重要途徑之一[2-3].
鑒于添加劑在潤(rùn)滑油品中所起的關(guān)鍵作用,實(shí)際生活中經(jīng)常通過(guò)對(duì)潤(rùn)滑油內(nèi)添加劑的種類(lèi)及含量的識(shí)別與剖析,作為判定潤(rùn)滑油類(lèi)別歸屬、品質(zhì)和性能的重要依據(jù).不僅適用于出廠(chǎng)油品的質(zhì)量檢測(cè),也可據(jù)此監(jiān)測(cè)與評(píng)估在用潤(rùn)滑油的健康等級(jí),還成為對(duì)未知油品鑒別與解析的主要手段[4].但是傳統(tǒng)采用的理化測(cè)試分析方法多受人為因素影響,耗時(shí)長(zhǎng)、誤差大且成本高.近年來(lái)興起的中紅外光譜分析技術(shù)[5-6],結(jié)合計(jì)算機(jī)技術(shù)和模式識(shí)別技術(shù)等近代計(jì)算分析方法,相較于傳統(tǒng)方法,具有無(wú)損、快速、高通量和低成本等優(yōu)點(diǎn)[7-8],越來(lái)越廣泛應(yīng)用于各種有機(jī)物質(zhì)的定性和定量分析.但在潤(rùn)滑領(lǐng)域中的應(yīng)用,目前多側(cè)重于油品中單一成分檢測(cè)[9-10],針對(duì)油品中的微量添加劑多種類(lèi)同步識(shí)別的研究在文獻(xiàn)中尚未見(jiàn)到.
對(duì)中紅外光譜數(shù)據(jù)的處理,現(xiàn)應(yīng)用較多的算法有偏最小二乘回歸(PLS)[11]、支持向量機(jī)(SVM)[12]、K近鄰(KNN)[13]和隨機(jī)森林(RF)[14]等.其中KNN和RF可以用于非線(xiàn)性分類(lèi)[15-18],較適用于樣本容量比較大的類(lèi)域自動(dòng)分類(lèi)問(wèn)題,且不易發(fā)生過(guò)擬合,尤其是所具有的多輸出特點(diǎn)[19-20],為本文解決多種添加劑的種類(lèi)同步識(shí)別問(wèn)題提供了解決思路.但是此類(lèi)方法通常需事先讀取所有的訓(xùn)練數(shù)據(jù),而占據(jù)大量的內(nèi)存空間,影響求解效率。為消除干擾及無(wú)效信息,降低搜索空間維度,最為行之有效的辦法就是對(duì)中紅外光譜特征波段進(jìn)行篩選.常用的特征優(yōu)選方法有后向間隔偏最小二乘法(BiPLS)[21]、蟻群算法(ACO)[22-23]、遺傳算法(GA)[24]和粒子群算法(PSO)[25]等.Liu等[26]利用BiPLS進(jìn)行近紅外光譜的特征優(yōu)選,并結(jié)合PLS建立玉米秸稈中纖維素和半纖維素含量預(yù)測(cè)模型,但BiPLS篩選波長(zhǎng)耗時(shí)長(zhǎng)且結(jié)果穩(wěn)定性較差.Zhang等[27]嘗試了改進(jìn)ACO算法對(duì)土壤全氮譜的特征提取,但ACO一般需要較長(zhǎng)的搜索時(shí)間,且易出現(xiàn)停滯現(xiàn)象.文獻(xiàn)[28-29]均利用GA對(duì)近紅外光譜進(jìn)行特征選擇,可以較好地解決選擇過(guò)程中波段組合數(shù)目多和難以遍歷的問(wèn)題,但其在有限時(shí)間內(nèi)的收斂效率有待提高.二進(jìn)制粒子群算法(BPSO)是PSO的二進(jìn)制版本,具有很強(qiáng)的全局搜索能力,在配電網(wǎng)故障定位和組合優(yōu)化問(wèn)題方面已得到廣泛應(yīng)用,如文獻(xiàn)[30]用BPSO優(yōu)化了導(dǎo)電材料的分布,但其尚未被引入分類(lèi)模型和光譜特征優(yōu)選問(wèn)題中,且隨著算法迭代搜索隨機(jī)性越來(lái)越強(qiáng),缺乏后期的局部搜索能力.可見(jiàn),單一優(yōu)化算法在計(jì)算效率、全局搜索性、通用性和簡(jiǎn)潔性方面各具優(yōu)勢(shì).
本文選用KNN算法和RF算法分別建立潤(rùn)滑油添加劑種類(lèi)識(shí)別基礎(chǔ)分類(lèi)模型,設(shè)計(jì)并實(shí)現(xiàn)GA-BPSO混合優(yōu)化對(duì)光譜全波段的特征波段區(qū)域篩選方法,并以此構(gòu)建增強(qiáng)分類(lèi)模型.選取實(shí)例進(jìn)行測(cè)試,通過(guò)對(duì)比分析GA-BPSO混合優(yōu)選以及GA和BPSO各自單一應(yīng)用時(shí),兩種基礎(chǔ)模型分別與其對(duì)應(yīng)的增強(qiáng)模型之間波段范圍變化及識(shí)別結(jié)果差異,考察光譜波段篩選效果和模型識(shí)別準(zhǔn)確率情況,驗(yàn)證GA-BPSO優(yōu)選方法的有效性.
測(cè)試樣本所用基礎(chǔ)油為PAO-10,選用了T321、T534和T307三種常見(jiàn)設(shè)備潤(rùn)滑油添加劑[31].其中T321是采用硫黃或單氯化硫及異丁烯為原料制得的含硫添加劑,具有含硫量高、極壓性能好、油溶性好和顏色淺等優(yōu)點(diǎn);T534是烷基二苯胺,一種性能優(yōu)越的高溫抗氧劑;T307是硫代磷酸胺鹽,具有優(yōu)良的極壓抗磨性、抗氧抗腐蝕性能及熱穩(wěn)定性.此三種添加劑多用于配制車(chē)輛齒輪油、工業(yè)齒輪油和汽輪機(jī)油等工業(yè)設(shè)備潤(rùn)滑油.
樣本調(diào)配:三種添加劑均取質(zhì)量分?jǐn)?shù)為1%的量,按照排列組合的方式分別加入基礎(chǔ)油,構(gòu)成8種樣本,并統(tǒng)一進(jìn)行編號(hào),如圖1所示.
Fig.1 The number of test samples 圖1 測(cè)試樣本編號(hào)
每種樣本采集10條光譜數(shù)據(jù),按照3:1的比例劃分訓(xùn)練集和測(cè)試集.
其中訓(xùn)練集數(shù)據(jù)的分布情況如圖2所示.
Fig.2 The distribution of training set data 圖2 訓(xùn)練集數(shù)據(jù)的分布情況
試驗(yàn)樣本數(shù)據(jù)采集儀器為T(mén)hermo Scientific Nicolet iS5傅里葉變換紅外光譜儀,光譜范圍:7 800~350 cm?1,采用KBr(溴化鉀)窗片.采集設(shè)置:掃描次數(shù)16次,分辨率4,數(shù)據(jù)間隔1.928 cm?1(掃描速度:0.10~2 cm/s).每個(gè)樣本重新裝樣后采集10次光譜數(shù)據(jù),模擬不同采集人員在紅外光譜采集過(guò)程中產(chǎn)生的人工誤差.
Min-max標(biāo)準(zhǔn)化處理,也稱(chēng)離差標(biāo)準(zhǔn)化,是對(duì)原始數(shù)據(jù)進(jìn)行線(xiàn)性變換,使處理后的數(shù)據(jù)映射在0~1之間,公式為
其中:Xmax為樣本數(shù)據(jù)的最大值,Xmin為樣本數(shù)據(jù)的最小值,Yi為映射在[0,1]區(qū)間上的投影.
KNN算法的核心思想:已知所有樣本集的類(lèi)別,那么某個(gè)測(cè)試樣本的類(lèi)別,是根據(jù)該樣本在特征空間中距離最近的K個(gè)相鄰樣本的占多數(shù)的類(lèi)別來(lái)判斷種類(lèi)歸屬.可見(jiàn)K的選取和距離計(jì)算是這一算法的關(guān)鍵,本文中經(jīng)過(guò)測(cè)試確定將參數(shù)n_neighbors設(shè)置為5.
RF算法利用多個(gè)決策樹(shù)對(duì)數(shù)據(jù)進(jìn)行分類(lèi),隨機(jī)是核心,一是隨機(jī)在原始訓(xùn)練數(shù)據(jù)中有放回地選取等量的數(shù)據(jù)作為訓(xùn)練樣本,二是在建立決策樹(shù)時(shí),隨機(jī)地選取一部分特征建立決策樹(shù).這兩種隨機(jī)使得各個(gè)決策樹(shù)之間的相關(guān)性小,進(jìn)一步提高模型的準(zhǔn)確性.每棵決策樹(shù)之間可以并行化處理,效率相對(duì)較高.本文訓(xùn)練集中有60個(gè)樣本,每個(gè)樣本的特征數(shù)為1 868,需要訓(xùn)練1個(gè)包含117棵樹(shù)的隨機(jī)森林,訓(xùn)練過(guò)程:
(1) 從原始的樣本集n里,利用bootstrap方法提取k個(gè)訓(xùn)練集,各個(gè)訓(xùn)練集的樣本個(gè)數(shù)為n;
(2) 分別學(xué)習(xí)k個(gè)訓(xùn)練集,建立k個(gè)決策樹(shù)模型.為改善決策樹(shù)間的差異,對(duì)抽取得到的訓(xùn)練樣本集的特征進(jìn)行隨機(jī)的抽取.用網(wǎng)格搜索法優(yōu)化參數(shù)n_estimators、max_depth,最終確定n_estimators=117,max_depth=7;
(3) 將k個(gè)決策樹(shù)的結(jié)果進(jìn)行組合,形成最終的結(jié)果.
將前面1.3節(jié)中處理后的樣本訓(xùn)練集光譜全波段數(shù)據(jù)分別導(dǎo)入KNN和RF基礎(chǔ)分類(lèi)模型,輸出均設(shè)置為三種添加劑可能的8種組合方式的種類(lèi)標(biāo)簽.
PCA的思想是將n維特征映射到k維空間上,k (1) 輸入數(shù)據(jù) 集X={X1,X2,X3,…,Xn},需要降 至k維; (2) 對(duì)所有樣本進(jìn)行中心化處理; (3) 計(jì)算樣本的協(xié)方差矩陣XXT,并對(duì)協(xié)方差矩陣XXT做特征值分解,計(jì)算其貢獻(xiàn)率,取累積貢獻(xiàn)率大于1的k個(gè)特征值對(duì)應(yīng)的特征向量W1,W2,W3,…,Wk; (4) 輸出提取的特征值所對(duì)應(yīng)的投影矩陣. 中紅外光譜區(qū)域(基本振動(dòng)區(qū)4 000~400 cm?1)包括了絕大多數(shù)有機(jī)和無(wú)機(jī)化合物的化學(xué)鍵振動(dòng)基頻區(qū),是化合物鑒定的重要區(qū)域.通過(guò)光譜鑒定或識(shí)別某種物質(zhì),重點(diǎn)在于搜索那些與該物質(zhì)相關(guān)的特征波段區(qū)域.如果可以,盡早排除非相關(guān)部分的無(wú)效波段,并解決光譜數(shù)據(jù)中通常存在的部分波段相關(guān)性過(guò)強(qiáng)的干擾問(wèn)題,有必要對(duì)光譜數(shù)據(jù)進(jìn)行波段優(yōu)化篩選,剔除高相關(guān)性干擾波段,可以極大提高識(shí)別準(zhǔn)確率和工作效率.本文通過(guò)分析GA與BPSO兩種仿生優(yōu)化算法各自對(duì)有效波段區(qū)域篩選的優(yōu)勢(shì),提出并設(shè)計(jì)了GA-BPSO混合優(yōu)化特征波段篩選方法及實(shí)施方案. GA是一類(lèi)借鑒生物界的進(jìn)化規(guī)律演化而來(lái)的隨機(jī)化搜索方法,原理是隨機(jī)產(chǎn)生一定數(shù)量的初始個(gè)體構(gòu)成原始種群,通過(guò)選擇、交叉和變異形成新種群,利用適應(yīng)度函數(shù)對(duì)個(gè)體評(píng)估,將適應(yīng)度高的個(gè)體遺傳到下一代,直到滿(mǎn)足終止條件,輸出優(yōu)化解.GA的運(yùn)行參數(shù)范圍設(shè)置如表1所示. 表1 GA參數(shù)范圍Table 1 Range of GA parameters 經(jīng)過(guò)GA優(yōu)化出的最佳個(gè)體染色體為n位0-1編碼組合,若基因編碼為1,建模時(shí)包括此波段;若為0,則不包括此波段.原始光譜進(jìn)行離差標(biāo)準(zhǔn)化處理后,將整條光譜 (1 868個(gè)數(shù)據(jù)點(diǎn)) 分為25個(gè)子區(qū)間,前 7個(gè)子區(qū)間分別有74個(gè)數(shù)據(jù)點(diǎn),后18個(gè)子區(qū)間有75個(gè)數(shù)據(jù)點(diǎn),將25個(gè)光譜子區(qū)間進(jìn)行0-1二進(jìn)制基因編碼,每個(gè)波段為1個(gè)基因.經(jīng)過(guò)測(cè)試確定GA的參數(shù):種群大小25,最大繁殖代數(shù)50,交叉概率為 0.6,變異概率為 0.01.將染色體所代表的訓(xùn)練集光譜波段數(shù)據(jù)分別輸入KNN和RF種類(lèi)識(shí)別基礎(chǔ)分類(lèi)模型進(jìn)行訓(xùn)練,將測(cè)試過(guò)程中所得到的準(zhǔn)確率作為適應(yīng)度函數(shù)進(jìn)行區(qū)間篩選,得到優(yōu)化波段區(qū)間組合. 特征選擇問(wèn)題本質(zhì)上是1個(gè)合適的0/1串選擇,串的長(zhǎng)度是原始數(shù)據(jù)集中的特征個(gè)數(shù)N,0是不被選擇,1則被選擇.尋找一個(gè)合適的0/1串最簡(jiǎn)單也最全面的方法就是暴力枚舉,也就是把所有的取值都計(jì)算1遍,共有2N種可能,這樣是不現(xiàn)實(shí)的.BPSO是在離散粒子群算法基礎(chǔ)上,約定位置向量和速度向量均為0、1值構(gòu)成.BPSO對(duì)每個(gè)粒子位置進(jìn)行二進(jìn)制編碼,用sigmoid函數(shù)將速度轉(zhuǎn)換到[0,1]區(qū)間,粒子速度代表每個(gè)位置為0或1的概率.則BPSO的速度和位置更新公式為 其中vid為第i個(gè)粒子在d維解空間的速度;xid為第i個(gè)粒子在d維解空間的位置;w為慣性系數(shù);c1、c2是學(xué)習(xí)因子,均為非負(fù)數(shù);r1、r2為分布在[0,1]區(qū)間的隨機(jī)值;Pid為個(gè)體最優(yōu)位置;Pg為全局最優(yōu)位置. BPSO在光譜特征變量篩選時(shí)的二進(jìn)制編碼方式:每個(gè)粒子對(duì)應(yīng)1個(gè)二進(jìn)制碼,其中數(shù)值1表示被選中,0則表示未被選中.對(duì)應(yīng)測(cè)試樣品光譜總波數(shù)點(diǎn)1 868個(gè),則粒子的長(zhǎng)度由1 868個(gè)0和1的字符串組合而成.尋優(yōu)過(guò)程中,每個(gè)粒子的位置不斷改變,對(duì)應(yīng)的頻率子集隨之變化.初始化粒子群,經(jīng)過(guò)測(cè)試設(shè)置相關(guān)參數(shù)列于表2中. 表2 BPSO參數(shù)設(shè)置Table 2 Parameter settings of BPSO 將粒子所代表的訓(xùn)練集光譜波段數(shù)據(jù)分別輸入KNN和RF種類(lèi)識(shí)別基礎(chǔ)分類(lèi)模型進(jìn)行訓(xùn)練,以當(dāng)前所得的總體分類(lèi)準(zhǔn)確率作為評(píng)價(jià)函數(shù),更新粒子的適應(yīng)度值、個(gè)體極值和群體極值,循環(huán)迭代直到達(dá)到最大迭代次數(shù),得到光譜波段篩選結(jié)果. 顯然,BPSO選取了測(cè)試樣品的光譜總波數(shù)點(diǎn),設(shè)置粒子的長(zhǎng)度達(dá)到1 868個(gè)數(shù)位,其中含有大量的冗余.對(duì)此,本文提出并設(shè)計(jì)了一種將GA與BPSO混合進(jìn)行特征波段優(yōu)選的方法,先利用GA篩選出有效光譜組合區(qū)間,再利用BPSO對(duì)組合區(qū)間進(jìn)行特征波數(shù)點(diǎn)篩選,從而使粒子的長(zhǎng)度被盡可能縮短,兩種模型的設(shè)置參數(shù)列于表3中. 表3 GA-BPSO參數(shù)設(shè)置Table 3 Parameter settings of GA-BPSO 將明顯已經(jīng)縮短的粒子所代表的訓(xùn)練集光譜波段數(shù)據(jù)分別輸入GA-KNN和GA-RF種類(lèi)識(shí)別基礎(chǔ)分類(lèi)模型進(jìn)行訓(xùn)練,以當(dāng)前所得的總體分類(lèi)準(zhǔn)確率作為評(píng)價(jià)函數(shù),更新粒子的適應(yīng)度值、個(gè)體極值和群體極值,循環(huán)迭代直到達(dá)到最大迭代次數(shù),得到GA-BPSO光譜波段篩選結(jié)果. 以KNN/RF種類(lèi)識(shí)別基礎(chǔ)分類(lèi)模型為基礎(chǔ),采用GA-BPSO混合優(yōu)化潤(rùn)滑油中紅外光譜特征波段篩選,構(gòu)建潤(rùn)滑油添加劑種類(lèi)識(shí)別增強(qiáng)分類(lèi)模型,其工作流程見(jiàn)圖3. Fig.3 Flow of GA-BPSO hybrid optimized feature bands enhanced classification model圖3 GA-BPSO混合優(yōu)選特征波段增強(qiáng)分類(lèi)模型流程圖 將原始光譜數(shù)據(jù)先經(jīng)離差標(biāo)準(zhǔn)化處理,結(jié)果如圖4所示. Fig.4 Standardization of raw spectral data圖4 原始光譜數(shù)據(jù)標(biāo)準(zhǔn)化 圖5所示為兩種基礎(chǔ)模型分別對(duì)三種添加劑的種類(lèi)識(shí)別準(zhǔn)確率結(jié)果統(tǒng)計(jì)圖,“o”為測(cè)試集樣本中添加劑的實(shí)際種類(lèi),“*”為模型預(yù)測(cè)輸出的預(yù)測(cè)種類(lèi),若重合則表示預(yù)測(cè)正確.表4列出了兩種基礎(chǔ)模型的種類(lèi)識(shí)別準(zhǔn)確率. 表4 KNN/RF基礎(chǔ)模型種類(lèi)識(shí)別準(zhǔn)確率Table 4 The accuracy of type recognition by KNN/RF basic model 圖6所示為兩種基礎(chǔ)模型經(jīng)PCA降維處理后分別對(duì)三種添加劑的種類(lèi)識(shí)別結(jié)果的模糊矩陣圖.表5~6為兩種基礎(chǔ)模型經(jīng)PCA降維處理后的種類(lèi)識(shí)別準(zhǔn)確率. 表5 PCA-KNN分類(lèi)精度Table 5 Classification accuracy of PCA-KNN 3.3.1 單一GA優(yōu)選光譜特征波段區(qū)間 單一GA優(yōu)選光譜特征波段區(qū)間結(jié)果見(jiàn)圖7.由圖7(a)可知,于KNN基礎(chǔ)模型共篩選出6個(gè)區(qū)間,分別是541.899 2~682.677 2 cm?1、827.312 3~1 253.503 cm?1、1 542.773~1 830.115 cm?1、2 265.948~2 408.655 cm?1、3 423.028~3 565.735 cm?1、3 712.298~3 855.005 cm?1,優(yōu)化篩選出的波段長(zhǎng)度為原波段長(zhǎng)度的35.9%.由圖7(b)可知,于RF基礎(chǔ)模型共篩選出7個(gè)區(qū)間,分別是541.899 2~682.677 2 cm?1、970.018 7~1 110.797 cm?1、1 398.138~1 685.48 cm?1、1 832.043~1 974.75 cm?1、3 133.758~3 276.465 cm?1、3 423.028~3 565.735 cm?1、3 865.933~3 999.64 cm?1,優(yōu)化篩選出的波段長(zhǎng)度為原波段長(zhǎng)度的32.0%. 3.3.2 單一BPSO優(yōu)選光譜特征波段區(qū)間 單一BPSO優(yōu)選光譜特征波段區(qū)間結(jié)果見(jiàn)表7.對(duì)KNN基礎(chǔ)模型,原始的1 868個(gè)光譜數(shù)據(jù)點(diǎn)被篩減到918個(gè),優(yōu)化篩選出的波段長(zhǎng)度為原波段長(zhǎng)度的49.1%.對(duì)RF基礎(chǔ)模型,原始的光譜數(shù)據(jù)點(diǎn)被篩減到884個(gè),優(yōu)化篩選出的波段長(zhǎng)度為原波段長(zhǎng)度的47.3%. 表7 單一BPSO特征波段區(qū)間篩選結(jié)果Table 7 Screening results of single BPSO feature band interval Fig.5 The results of type identification by (a) KNN/ (b) RF basic model圖5 (a) KNN和 (b) RF基礎(chǔ)模型種類(lèi)識(shí)別結(jié)果 Fig.6 The obfuscation matrix after PCA dimension reduction processing by (a) KNN and (b) RF圖6 (a) KNN和 (b) RF經(jīng)PCA降維后的模糊矩陣 表6 PCA-RF分類(lèi)精度Table 6 Classification accuracy of PCA-RF Fig.7 Screening results of single GA feature band interval by (a) KNN and (b) RF圖7 (a) KNN和 (b) RF單一GA特征波段區(qū)間篩選結(jié)果 3.3.3 GA-BPSO混合優(yōu)選光譜特征波段區(qū)間 GA-BPSO混合優(yōu)化光譜特征波段區(qū)間篩選結(jié)果列于表8中.KNN基礎(chǔ)模型的光譜數(shù)據(jù)點(diǎn)已經(jīng)從原始的1 868個(gè)光譜數(shù)據(jù)點(diǎn)被篩減到307個(gè),優(yōu)化篩選出的波段長(zhǎng)度為原波段長(zhǎng)度的16.4%.RF基礎(chǔ)模型的被篩減到295個(gè),為原波段長(zhǎng)度的15.8%. 表8 GA-BPSO混合特征波段區(qū)間篩選結(jié)果Table 8 Screening results of GA-BPSO mixed feature band interval 3.4.1 單一GA優(yōu)選的KNN/RF增強(qiáng)分類(lèi)模型測(cè)試結(jié)果 以單一GA優(yōu)選的區(qū)間組合波段作為輸入,兩類(lèi)增強(qiáng)模型輸出的種類(lèi)識(shí)別結(jié)果如圖8所示,種類(lèi)識(shí)別準(zhǔn)確率列于表9中. 表9 單一GA優(yōu)選特征波段區(qū)間的兩類(lèi)增強(qiáng)模型種類(lèi)識(shí)別準(zhǔn)確率Table 9 The recognition accuracy of two kinds of enhanced models by the single GA optimizes feature band interval Fig.8 Type recognition results of two kinds of enhanced models by the single GA optimizes feature band interval圖8 單一GA優(yōu)選特征波段區(qū)間的兩類(lèi)增強(qiáng)模型種類(lèi)識(shí)別結(jié)果 3.4.2 單一BPSO優(yōu)選的KNN/RF增強(qiáng)分類(lèi)模型測(cè)試結(jié)果 以單一BPSO優(yōu)選的區(qū)間組合波段作為輸入,兩類(lèi)增強(qiáng)模型輸出的種類(lèi)識(shí)別結(jié)果如圖9所示,種類(lèi)識(shí)別準(zhǔn)確率列于表10中. 表10 單一BPSO優(yōu)選特征波段區(qū)間的兩類(lèi)增強(qiáng)模型種類(lèi)識(shí)別準(zhǔn)確率Table 10 The recognition accuracy of two kinds of enhanced models by the single BPSO optimizes feature band interval 3.4.3 GA-BPSO混合優(yōu)選的KNN/RF增強(qiáng)分類(lèi)模型測(cè)試結(jié)果 將GA-BPSO混合優(yōu)選的區(qū)間組合波段作為輸入,兩類(lèi)增強(qiáng)模型輸出的種類(lèi)識(shí)別結(jié)果如圖10所示,種類(lèi)識(shí)別準(zhǔn)確率列于表11中. 表11 GA-BPSO混合優(yōu)選特征波段區(qū)間的兩類(lèi)增強(qiáng)模型種類(lèi)識(shí)別準(zhǔn)確率Table 11 The recognition accuracy of two kinds of enhanced models by the GA-BPSO hybrid optimizes feature band interval 綜合上述各項(xiàng)測(cè)試結(jié)果,將光譜全部波段、GA優(yōu)選波段、BPSO優(yōu)選波段和GA-BPSO混合優(yōu)選波段的KNN/RF基礎(chǔ)模型及增強(qiáng)模型,對(duì)測(cè)試集的20個(gè)未知樣品進(jìn)行種類(lèi)識(shí)別,識(shí)別準(zhǔn)確率對(duì)比如圖11所示. Fig.9 Type recognition results of two kinds of enhanced models by the single BPSO optimizes feature band interval圖9 單一BPSO優(yōu)選特征波段區(qū)間的兩類(lèi)增強(qiáng)模型種類(lèi)識(shí)別結(jié)果 由圖11中可以看到:1)采用光譜波段優(yōu)選的增強(qiáng)分類(lèi)模型,識(shí)別準(zhǔn)確率均優(yōu)于基礎(chǔ)分類(lèi)模型.其中GABPSO混合方法進(jìn)行潤(rùn)滑油添加劑種類(lèi)識(shí)別準(zhǔn)確率最高,且因?qū)嶋H參與模型識(shí)別的光譜波長(zhǎng)變量數(shù)最少,可使工作效率顯著提高;2)在使用同等優(yōu)選方法的情況下,RF模型的種類(lèi)識(shí)別準(zhǔn)確率要高于KNN模型.其中,GA-BPSO-RF獲得了最優(yōu)的測(cè)試結(jié)果. 為此,對(duì)GA-BPSO-RF展開(kāi)進(jìn)一步分析發(fā)現(xiàn),根據(jù)其他理化方法[32]已經(jīng)測(cè)得的結(jié)果可知T321在657 cm?1處的C-S-C振動(dòng)和在1 178 cm-1處的C-S(芳環(huán))振動(dòng);T534在1 500 cm?1處的N-H伸縮振動(dòng);T307在930~1 110 cm?1處的P-N振動(dòng)和2 150 cm?1處的P-S-N振動(dòng),這些振動(dòng)點(diǎn)位與本文3.3.1中所列的GA-RF優(yōu)選波段對(duì)比,獲得了很好的對(duì)應(yīng)關(guān)系,再經(jīng)過(guò)BPSO進(jìn)一步優(yōu)選特征波長(zhǎng)變量,則使最終的有效波段區(qū)間更加接近并圍繞在真實(shí)的振動(dòng)點(diǎn)位附近.對(duì)比GA-BPSO-RF增強(qiáng)模型與RF基礎(chǔ)模型,添加劑種類(lèi)識(shí)別的準(zhǔn)確率如圖12所示. Fig.10 Type recognition results of two kinds of enhanced models by the GA-BPSO hybrid optimizes feature band interval圖10 GA-BPSO混合優(yōu)選特征波段區(qū)間的兩類(lèi)增強(qiáng)模型種類(lèi)識(shí)別結(jié)果 Fig.11 Accuracy comparison between KNN/RF base model and enhanced model圖11 KNN/RF基礎(chǔ)模型及增強(qiáng)模型準(zhǔn)確率對(duì)比 Fig.12 The results of additive species identification by GABPSO-RF and RF圖12 GA-BPSO-RF和RF對(duì)添加劑進(jìn)行種類(lèi)識(shí)別結(jié)果 由圖12明顯可以看到,經(jīng)GA-BPSO混合優(yōu)選波段后,針對(duì)T534、T534+T307的種類(lèi)識(shí)別準(zhǔn)確率分別由60%和50%提升至80%和100%,整體分類(lèi)準(zhǔn)確率由原來(lái)的85%提升至97.5%. a.由RF所建的基礎(chǔ)分類(lèi)模型可以對(duì)設(shè)備潤(rùn)滑油微量添加劑進(jìn)行有效的多種類(lèi)同步識(shí)別,相比于傳統(tǒng)理化分析方法簡(jiǎn)單、快速且易于實(shí)現(xiàn). b.GA-BPSO優(yōu)化篩選特征波段,能夠有效削減KNN/RF基礎(chǔ)分類(lèi)模型的有效波段長(zhǎng)度并提高識(shí)別準(zhǔn)確率,且明顯優(yōu)于GA和BPSO單獨(dú)使用時(shí)的篩選結(jié)果,在極大地減輕運(yùn)行負(fù)擔(dān)的同時(shí),有效提高了模型多種類(lèi)同步識(shí)別的準(zhǔn)確率和穩(wěn)定性. c.GA-BPSO混合方法對(duì)特征波段的篩選效果最優(yōu),經(jīng)過(guò)其優(yōu)選后構(gòu)造的KNN/RF增強(qiáng)分類(lèi)模型均比對(duì)應(yīng)的基礎(chǔ)分類(lèi)模型各項(xiàng)性能上有顯著的提高,其中GA-BPSO-RF的測(cè)試效果超過(guò)GA-BPSO-KNN,可以作為一種高效的潤(rùn)滑油添加劑微量多種類(lèi)同步識(shí)別的重要手段.2.3 GA-BPSO混合優(yōu)化特征波段篩選
2.4 KNN/RF種類(lèi)識(shí)別增強(qiáng)分類(lèi)模型構(gòu)建
3 兩類(lèi)模型測(cè)試結(jié)果及分析
3.1 原始光譜數(shù)據(jù)離差標(biāo)準(zhǔn)化處理
3.2 KNN/RF種類(lèi)識(shí)別基礎(chǔ)分類(lèi)模型測(cè)試結(jié)果
3.3 原始光譜特征波段區(qū)間篩選結(jié)果
3.4 KNN/RF種類(lèi)識(shí)別增強(qiáng)分類(lèi)模型測(cè)試結(jié)果
3.5 測(cè)試結(jié)果綜合分析
4 結(jié)論