夏延秋, 王裕興, 馮 欣*, 蔡美榮
(1.華北電力大學(xué) 能源動(dòng)力與機(jī)械工程學(xué)院, 北京 102206;2.中國(guó)科學(xué)院蘭州化學(xué)物理研究所 固體潤(rùn)滑國(guó)家重點(diǎn)實(shí)驗(yàn)室, 甘肅 蘭州 730000)
潤(rùn)滑油是應(yīng)用廣泛的重要石化產(chǎn)品,主要由基礎(chǔ)油和添加劑組成[1].其中基礎(chǔ)油是潤(rùn)滑油的主要成分,對(duì)潤(rùn)滑油的黏溫性能、高低溫性能和揮發(fā)性等基礎(chǔ)性能起重要作用,添加劑用于改善基礎(chǔ)油的原有性能或賦予新的性能[2],通過(guò)調(diào)整添加劑的種類(lèi)和用量可以配制滿足不同需求的潤(rùn)滑油.人工研發(fā)新油品是一項(xiàng)繁瑣的工作,耗時(shí)費(fèi)力,且嚴(yán)重依賴(lài)人員經(jīng)驗(yàn)及多種昂貴測(cè)試設(shè)備.伴隨著信息科學(xué)的進(jìn)步,具有強(qiáng)大數(shù)據(jù)分析和數(shù)據(jù)處理能力的機(jī)器學(xué)習(xí)技術(shù)已延伸至摩擦潤(rùn)滑研究領(lǐng)域,從而減少試驗(yàn)的次數(shù)和降低試驗(yàn)研究成本[3-5].在組分與性能關(guān)系方面,Altay等[6]使用線性回歸(LR)、支持向量機(jī)(SVM)和高斯過(guò)程回歸(GPR)機(jī)器學(xué)習(xí)算法建立了精準(zhǔn)的鐵合金涂層磨損量預(yù)測(cè)模型;Wang等[7]利用小波神經(jīng)網(wǎng)絡(luò)(WNN)和遺傳算法(GA)模型,研究三種潤(rùn)滑油組分對(duì)三類(lèi)性能指標(biāo)的影響,預(yù)測(cè)結(jié)果比傳統(tǒng)的經(jīng)驗(yàn)公式計(jì)算值更接近試驗(yàn)值;Yu等[8]通過(guò)反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)和遺傳算法(GA)構(gòu)建潤(rùn)滑油抗磨性能預(yù)測(cè)模型,在尋找三種磷化合物添加劑用量最佳組合方面做了有益嘗試.
但是,機(jī)器學(xué)習(xí)方法作回歸預(yù)測(cè),可能會(huì)出現(xiàn)預(yù)測(cè)訓(xùn)練速度慢、陷入局部極值或過(guò)擬合等現(xiàn)象.潤(rùn)滑油組分種類(lèi)和含量與性能指標(biāo)的關(guān)聯(lián)關(guān)系是1個(gè)復(fù)雜的系統(tǒng),且經(jīng)常要盡量減少油樣性能試驗(yàn)樣本的需求,所以不僅要求構(gòu)建的模型具有強(qiáng)大的預(yù)測(cè)能力[9],而且還要求在小樣本情況下的潤(rùn)滑油性能預(yù)測(cè)具有良好的預(yù)測(cè)精度和泛化能力.支持向量機(jī)(SVM)在解決小樣本方面具有特有的優(yōu)勢(shì),而最小二乘支持向量機(jī)(LSSVM)對(duì)SVM進(jìn)行了改進(jìn),對(duì)數(shù)據(jù)處理有較好的準(zhǔn)確度,降低了求解難度,提高了求解速度[10-11].LSSVM是否適合解決小樣本潤(rùn)滑油性能預(yù)測(cè)問(wèn)題,一方面需要對(duì)LSSVM基礎(chǔ)模型的泛化能力和預(yù)測(cè)精度進(jìn)行驗(yàn)證,留一交叉驗(yàn)證法(LOOCV, Leave-one-out cross validation)被認(rèn)為適用于小樣本數(shù)據(jù)條件下的模型性能檢驗(yàn)[12-13],其可以用來(lái)解決模型驗(yàn)證問(wèn)題;另一方面需要篩選LSSVM回歸預(yù)測(cè)模型中嚴(yán)重影響預(yù)測(cè)結(jié)果的參數(shù)初始值的賦值策略[14],群智能(SI, Swarm intelligence)優(yōu)化技術(shù)通過(guò)模擬生物的群體行為,抽象出數(shù)學(xué)模型,其利用群體高智能的啟發(fā)式搜索,替代某些參數(shù)的人為設(shè)定或隨機(jī)生成,可以有效避免出現(xiàn)收斂速度慢和陷入局部最優(yōu)解的問(wèn)題.
本文中基于LSSVM構(gòu)建潤(rùn)滑油理化性能預(yù)測(cè)基礎(chǔ)模型,通過(guò)與隨機(jī)森林(RF)[15]、反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)、極限學(xué)習(xí)機(jī)(ELM)[16]和多元線性回歸(MLR)四種模型的對(duì)比分析,考核基礎(chǔ)模型對(duì)小樣本實(shí)例的預(yù)測(cè)精度和泛化能力;采用經(jīng)典的粒子群優(yōu)化算法(PSO)[17]、蜻蜓算法(DA)[18]和鯨魚(yú)優(yōu)化算法(WOA)[19]三種群智能搜索優(yōu)化方法,分別對(duì)核函數(shù)寬度(σ2)和正則化參數(shù)(γ)進(jìn)行尋優(yōu)選取,并構(gòu)建LSSVM混合模型,結(jié)合實(shí)例考察不同的參數(shù)優(yōu)化方法對(duì)模型的收斂速度、穩(wěn)定性及預(yù)測(cè)精度的影響.
選擇潤(rùn)滑油復(fù)合基礎(chǔ)油體系為測(cè)試對(duì)象,該油品由克拉瑪依KN4010 (礦物油)、美孚PAO40 (聚α-烯烴合成油)和納克PriEco 3000 (多元醇酯)復(fù)合而成,物理特性列于表1中.其中,礦物油價(jià)格低廉,來(lái)源可靠,作為降低潤(rùn)滑油成本的必要成分;聚α-烯烴是配制高性能潤(rùn)滑油較為理想的合成基礎(chǔ)油,具有良好的熱穩(wěn)定性和低溫性能;而合成酯類(lèi)基礎(chǔ)油的黏溫性能和環(huán)境友好性比較好,但水解穩(wěn)定性較差[20].將三者復(fù)合使用,可以優(yōu)勢(shì)互補(bǔ),避免各自存在的不足.
表1 基礎(chǔ)油物理特性Table 1 Physical properties of base oil
后續(xù)研究中,輸入數(shù)據(jù)為復(fù)合基礎(chǔ)油體系油品的KN4010、PAO40和PriEco 3000三種組分的質(zhì)量分?jǐn)?shù),輸出數(shù)據(jù)則選擇對(duì)應(yīng)的運(yùn)動(dòng)黏度(40 ℃)、黏度指數(shù)和旋轉(zhuǎn)氧彈三種性能指標(biāo).
為了觀察和測(cè)試不同成分配比對(duì)潤(rùn)滑油性能的影響,設(shè)計(jì)了30組試驗(yàn)樣本,具體各成分質(zhì)量分?jǐn)?shù)(ω)的設(shè)計(jì)方案列于表2中.
表2 樣本設(shè)計(jì)方案Table 2 Sample design solutions
在本次研究過(guò)程中,為使模型達(dá)到較好的預(yù)測(cè)效果,小樣本測(cè)試試驗(yàn)訓(xùn)練集大約取整個(gè)數(shù)據(jù)集的2/3~4/5.據(jù)此,將上述30組樣本數(shù)據(jù)進(jìn)行劃分,訓(xùn)練集樣本為樣本設(shè)計(jì)方案中的前21組(樣本編號(hào)1~21),測(cè)試集樣本為設(shè)計(jì)方案中后9組(樣本編號(hào)22~30).
LSSVM是以傳統(tǒng)SVM算法為基礎(chǔ)的一種改進(jìn)算法,將等式約束代替不等式約束,在構(gòu)造損失函數(shù)時(shí)應(yīng)用最小二乘準(zhǔn)則,實(shí)現(xiàn)將復(fù)雜二次規(guī)劃問(wèn)題轉(zhuǎn)化為線性方程組問(wèn)題的求解,從而降低計(jì)算的復(fù)雜程度,加快收斂速度,并且在非線性系統(tǒng)中效果會(huì)更好.基本原理如下:
給定訓(xùn)練樣本集 {(xi,yi)|i=1,2,...,n},其中,xi∈Rd為d維訓(xùn)練樣本輸入,yi∈R為訓(xùn)練樣本輸出,n為訓(xùn)練集樣本個(gè)數(shù).
用如下高維特征空間的線性函數(shù)對(duì)樣本進(jìn)行擬合:
式中: ω 為權(quán)系數(shù)向量,b為閾值,T為矩陣轉(zhuǎn)置符號(hào),輸入數(shù)據(jù)通過(guò)非線性映射函數(shù) φ (x)被映射到高維特征空間.
根據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小準(zhǔn)則,LSSVM回歸可以表示為約束優(yōu)化問(wèn)題,最優(yōu)ω 和b可經(jīng)下述函數(shù)最小化得到:
約束條件為
式中:γ為正則化參數(shù),J為目標(biāo)函數(shù),ζ是擬合誤差,i為樣本數(shù).通過(guò)調(diào)節(jié) γ 可以平衡 ζi在目標(biāo)函數(shù)中的權(quán)重,避免最小尋優(yōu)過(guò)程中出現(xiàn)過(guò)擬合問(wèn)題.
為解決LSSVM的優(yōu)化問(wèn)題,構(gòu)造如下拉格朗日函數(shù):
式中: αi為拉格朗日乘子,由KKT條件(Karysh-Khun-Tucker)計(jì)算得到:
消去變量 ω ,ζi,可得矩陣方程:
式中:
e1×n是1×n的單位行向量,en×1是n×1的單位列向量,K為核矩陣,E是n×n的單位矩陣.
由于模型的特征數(shù)較小并且與訓(xùn)練樣本數(shù)的比值大小適中,所以本次優(yōu)化問(wèn)題的求解可選擇RBF(徑向基)核函數(shù)作為核函數(shù),表達(dá)式如下:
式中:σ為核函數(shù)寬度系數(shù),如果 σ 較大,易把所有樣本點(diǎn)歸為同一類(lèi);反之則會(huì)出現(xiàn)過(guò)擬合問(wèn)題.
由以上各式求得b和a,最終由非線性方程變換得到線性模型,那么對(duì)于新的樣本x,則有LSSVM模型的輸出y為
留一交叉驗(yàn)證法(LOOCV)是一種特殊的交叉驗(yàn)證方法,用于衡量模型在數(shù)據(jù)集上的泛化能力.整個(gè)過(guò)程雖然計(jì)算繁瑣,但樣本利用率高,尤其適合在小樣本情況下進(jìn)行模型選擇,避免出現(xiàn)過(guò)擬合現(xiàn)象.操作步驟為在原有的訓(xùn)練集中只保留1個(gè)樣本用做測(cè)試,而將其他樣本歸入訓(xùn)練集;以此類(lèi)推,對(duì)集合中的其他樣本順次進(jìn)行迭代,直至遍歷訓(xùn)練集中的每一個(gè)樣本,如圖1所示.假如原訓(xùn)練集有n個(gè)樣本,那么模型需要訓(xùn)練n次 、測(cè)試n次.
群智能(SI)優(yōu)化算法來(lái)源于對(duì)昆蟲(chóng)、獸群、鳥(niǎo)群和魚(yú)群等生物群體行為的模仿,從中抽象出具有群體高智能的啟發(fā)式搜索數(shù)學(xué)模型,用于解決各類(lèi)優(yōu)化問(wèn)題,可以有效地避免收斂速度慢和陷入局部最優(yōu)解情況的發(fā)生.
對(duì)群智能優(yōu)化算法的研究一直非常活躍,其中粒子群優(yōu)化算法(PSO)是比較經(jīng)典的一種方法,最早由Eberhart和Kennedy于1995年提出,源于對(duì)鳥(niǎo)群捕食行為的研究,根據(jù)鳥(niǎo)自身及其同伴的飛行經(jīng)驗(yàn)來(lái)調(diào)整自己的飛行速度和位置最終實(shí)現(xiàn)更新與優(yōu)化.近年來(lái),新興的仿生群智能算法不斷涌現(xiàn),具有代表性的有:Seyedali等源于自然界中蜻蜓群體靜態(tài)的覓食行為和動(dòng)態(tài)的遷徙行為,于2016年提出了蜻蜓算法(DA, Dragonfly algorithm);Mirjalili等模擬鯨魚(yú)群包圍獵物、氣泡攻擊獵物和搜索獵物3個(gè)階段的捕食行為,于2016年提出鯨魚(yú)優(yōu)化算法(WOA, Whale optimization algorithm).以上這些群智能方法對(duì)問(wèn)題是否適用,尚需要多種類(lèi)型的試驗(yàn)來(lái)驗(yàn)證.
對(duì)于回歸模型,除LSSVM之外,目前應(yīng)用較多的算法還有隨機(jī)森林(RF)、反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)、極限學(xué)習(xí)機(jī)(ELM)及多元線性回歸(MRL)等.與LSSVM不同,RF通過(guò)組合多個(gè)決策樹(shù)算法對(duì)樣本訓(xùn)練得出最后預(yù)測(cè)結(jié)果,對(duì)異常值和噪聲具有較好的容忍度,在測(cè)試中根據(jù)樣本數(shù)量及特征數(shù)大小設(shè)置參數(shù)生長(zhǎng)樹(shù)的數(shù)目為500以及在每一個(gè)分裂節(jié)點(diǎn)處樣本預(yù)測(cè)器個(gè)數(shù)為1,其他為默認(rèn)值;BPNN通過(guò)反向傳播訓(xùn)練來(lái)不斷調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,使預(yù)測(cè)輸出不斷逼近期望輸出,在訓(xùn)練中根據(jù)輸入與輸出維數(shù)設(shè)置隱含層神經(jīng)元個(gè)數(shù)為5,又設(shè)置適宜的最大訓(xùn)練次數(shù)為1 000和學(xué)習(xí)率為0.01;ELM則隨機(jī)產(chǎn)生且保持不變的輸入層與隱含層間的連接權(quán)值、隱含層神經(jīng)元的閾值,通過(guò)設(shè)置隱含層神經(jīng)元個(gè)數(shù)訓(xùn)練模型,其測(cè)試中隱含層神經(jīng)元個(gè)數(shù)為5;多元線性回歸(MRL)是利用數(shù)理統(tǒng)計(jì)中回歸分析來(lái)研究1個(gè)應(yīng)變量依賴(lài)多個(gè)自變量的變化關(guān)系,來(lái)確定其定量關(guān)系的一種統(tǒng)計(jì)分析方法,在模型實(shí)踐中不需要額外設(shè)置參數(shù).顯然,這些方法各具優(yōu)勢(shì),通過(guò)潤(rùn)滑油樣本實(shí)例,構(gòu)建以上四種方法的潤(rùn)滑油性能預(yù)測(cè)模型,經(jīng)對(duì)比分析,評(píng)判LSSVM模型在解決小樣本潤(rùn)滑油性能預(yù)測(cè)問(wèn)題的預(yù)測(cè)精度和泛化能力.
Fig.1 Leave-one-out cross validation (LOOCV)圖1 留一交叉驗(yàn)證法(LOOCV)
對(duì)LSSVM模型預(yù)測(cè)性能影響較大的參數(shù)是核函數(shù)寬度(σ2)和正則化參數(shù)(γ):其中 σ2是核函數(shù)自帶的1個(gè)參數(shù),影響著數(shù)據(jù)映射到新特征空間的分布, σ2越大,支持向量越少, σ2值越小,支持向量越多,而支持向量的個(gè)數(shù)影響訓(xùn)練與預(yù)測(cè)的速度;γ是對(duì)誤差的寬容度,其過(guò)大或過(guò)小,都會(huì)使模型泛化能力變差.所以不合理的初始值設(shè)置, 將導(dǎo)致計(jì)算時(shí)間長(zhǎng)、效率差以及預(yù)測(cè)精度下降.為此,分別采用粒子群優(yōu)化算法(PSO)、蜻蜓算法(DA)和鯨魚(yú)優(yōu)化算法(WOA)三種群智能搜索策略對(duì)參數(shù)尋優(yōu),構(gòu)建LSSVM混合模型,總體步驟如下:
Step1:對(duì)樣本集進(jìn)行歸一化,分別設(shè)定五種群智能優(yōu)化算法運(yùn)行過(guò)程參數(shù)的初值,其中種群數(shù)(SearchAgents_no)為20,最大迭代次數(shù)(Max_iter)為100,參數(shù)尋優(yōu)區(qū)間為0.01~1 000;
Step2:初始化種群各個(gè)體位置,其位置代表參數(shù)σ2和 γ,將其代入LSSVM模型計(jì)算預(yù)測(cè)值與真實(shí)值的均方根誤差(RMSE)并定義為算法的適應(yīng)度函數(shù);
Step3:計(jì)算種群中每個(gè)個(gè)體的適應(yīng)度(fitness),選擇出當(dāng)前最優(yōu)適應(yīng)度值個(gè)體,將該個(gè)體位置設(shè)置為當(dāng)前的最優(yōu)位置;
Step4:經(jīng)過(guò)不斷迭代更新搜索位置,返回Step3,重新計(jì)算適應(yīng)度(fitness)并進(jìn)行比較,找出并更新至最優(yōu)位置,重復(fù)進(jìn)行,直至滿足結(jié)束條件;
Step5:將最后尋優(yōu)得到的 σ2和 γ參數(shù)再次代入到LSSVM基礎(chǔ)模型中,完成對(duì)LSSVM預(yù)測(cè)模型的訓(xùn)練過(guò)程.
混合模型工作流程示意圖如圖2所示.
本文中采用平均絕對(duì)百分誤差(MAPE, Mean absolute percentage error)、均方根誤差(RMSE, Root mean square error)和 決 定 系 數(shù) (R2, Coefficient of determination)作為模型綜合性能評(píng)價(jià)標(biāo)準(zhǔn),計(jì)算公式如下:
式中:n是 樣本總量,y?i為 測(cè)試樣本的預(yù)測(cè)值,yi為真實(shí)值.決定系數(shù)R2介于0到1之間,且越接近1,模型擬合度越高,性能越好.
按照試驗(yàn)方案配置30組試驗(yàn)樣本,加熱至60 ℃左右,恒溫?cái)嚢? h即可制備出所需試樣.并遵循相關(guān)行業(yè)制定的標(biāo)準(zhǔn),測(cè)定每組樣本的運(yùn)動(dòng)黏度(40 ℃,100 ℃)和旋轉(zhuǎn)氧彈等指標(biāo),并依據(jù)石油產(chǎn)品黏度指數(shù)計(jì)算法計(jì)算黏度指數(shù).為了直觀展示所設(shè)計(jì)的30組試驗(yàn)樣本,繪制三種性能指標(biāo)測(cè)試結(jié)果的空間分布圖(圖3),圖中以顏色表明輸入數(shù)據(jù)與輸出數(shù)據(jù)的對(duì)應(yīng)關(guān)系.
將樣本劃分完成的訓(xùn)練集和測(cè)試集數(shù)據(jù)代入模型中,分別建立基于RF、BPNN、ELM、MLR和LSSVM的理化性能預(yù)測(cè)模型.經(jīng)過(guò)反復(fù)多次測(cè)試,LSSVM的表現(xiàn)相對(duì)突出,而其余幾種算法模型的測(cè)試結(jié)果都出現(xiàn)較大的誤差,無(wú)法滿足本次研究需要.分別對(duì)幾種算法模型的3個(gè)理化指標(biāo)模型的MAPE、RMSE和R2進(jìn)行計(jì)算,其中縱坐標(biāo)為各指標(biāo)百分誤差值(Relative percentage error, RPE),結(jié)果如圖4所示.
Fig.2 Flow chart of hybrid model for lubricant performance prediction圖2 潤(rùn)滑油性能預(yù)測(cè)混合模型工作流程圖
Fig.3 Spatial distribution of test results圖3 測(cè)試結(jié)果空間分布圖
Fig.4 Evaluation of basic model predictions: (a) MAPE; (b) RMSE; (c) R2 圖4 基礎(chǔ)模型預(yù)測(cè)評(píng)價(jià):(a) MAPE;(b) RMSE;(c) R2
由圖4可以看出,RF在運(yùn)動(dòng)黏度(40 ℃)和黏度指數(shù)的預(yù)測(cè)上出現(xiàn)較大誤差;BPNN和ELM則是在旋轉(zhuǎn)氧彈上表現(xiàn)較差;MLR雖然在黏度指數(shù)和旋轉(zhuǎn)氧彈兩項(xiàng)指標(biāo)表現(xiàn)優(yōu)異,但是對(duì)于運(yùn)動(dòng)黏度(40 ℃)則是表現(xiàn)異常.而LSSVM對(duì)于3個(gè)理化性能的預(yù)測(cè)都表現(xiàn)出良好的預(yù)測(cè)性能,平均相對(duì)百分誤差都在6%以內(nèi),決定系數(shù)均在0.96以上.顯然,其余四種模型在指標(biāo)數(shù)據(jù)集上出現(xiàn)不同程度的誤差,而LSSVM適合潤(rùn)滑油基礎(chǔ)理化性能的預(yù)測(cè)模型.
在LSSVM的基礎(chǔ)模型中,兩個(gè)關(guān)鍵參數(shù)的產(chǎn)生是隨機(jī)選取的,具有不確定性,參數(shù)確定方法會(huì)嚴(yán)重影響模型訓(xùn)練時(shí)間和預(yù)測(cè)精度.本文中采用交叉驗(yàn)證(fold=10)的方式來(lái)調(diào)整參數(shù),而其參數(shù)確定仍是簡(jiǎn)單粗略的.從預(yù)測(cè)效果來(lái)看,還有不少改進(jìn)空間,需要更加強(qiáng)大的參數(shù)尋優(yōu)方法來(lái)解決.
按照2.5節(jié)中的步驟,分別構(gòu)建PSO-LSSVM、DALSSVM和WOA-LSSVM三種群智能搜索算法與LSSVM的混合預(yù)測(cè)模型,考察這三種混合模型在訓(xùn)練中的迭代進(jìn)化過(guò)程如圖5所示.
Fig.5 Iterative curves of three hybrid models: (a) kinematic viscosity; (b) viscosity index; (c) rotating oxygen bomb 圖5 三種混合模型迭代曲線:(a)運(yùn)動(dòng)黏度;(b)黏度指數(shù);(c)旋轉(zhuǎn)氧彈
經(jīng)過(guò)反復(fù)測(cè)試,對(duì)比三種混合模型的收斂速度、穩(wěn)定性以及收斂精度可知:PSO-LSSVM各項(xiàng)指標(biāo)都是最差的;DA-LSSVM的迭代速度較快,收斂穩(wěn)定性也較差,容易使模型陷入局部最優(yōu)解;WOA-LSSVM能夠使模型搜索到更優(yōu)的結(jié)果,其收斂精度和穩(wěn)定性均優(yōu)于其余的模型,并且收斂速度更快.因此,采用鯨魚(yú)優(yōu)化算法(WOA)對(duì)模型參數(shù)進(jìn)行優(yōu)化,可以使模型的預(yù)測(cè)效果更好.
以其中黏度指數(shù)為例,LSSVM經(jīng)過(guò)三種群智能算法尋優(yōu)之后的 γbest和 σ2best列于表3中.
表3 三種混合模型最佳參數(shù)Table 3 Optimal parameters of three hybrid models for kinematic viscosity
通過(guò)LSSVM、WOA-LSSVM以及文獻(xiàn)[7]中GAWNN分別建立模型,將全部劃分好的訓(xùn)練集和測(cè)試集代入三種模型中進(jìn)行預(yù)測(cè),其在3個(gè)性能指標(biāo)測(cè)試結(jié)果的相對(duì)百分誤差如圖6所示.
可以看出,經(jīng)過(guò)參數(shù)優(yōu)化后的模型WOA-LSSVM,在3個(gè)理化性能數(shù)據(jù)上都有優(yōu)異的表現(xiàn).其中,旋轉(zhuǎn)氧彈和黏度指數(shù)上都有較大提升;在運(yùn)動(dòng)黏度(40 ℃)上雖然與基礎(chǔ)模型表現(xiàn)相近,但是兩者預(yù)測(cè)精度已經(jīng)達(dá)到較好的程度.計(jì)算三種模型的MAPE、RMSE和R2,其中縱坐標(biāo)為各指標(biāo)誤差值,其對(duì)比圖如圖7所示.
WOA-LSSVM的三項(xiàng)誤差指標(biāo)與其他方法相比明顯較優(yōu),數(shù)據(jù)的擬合效果好,測(cè)試集的預(yù)測(cè)精度更高.由此可見(jiàn),WOA-LSSVM各項(xiàng)預(yù)測(cè)結(jié)果均明顯優(yōu)于GA-WNN和LSSVM,而對(duì)于基礎(chǔ)模型LSSVM表現(xiàn)不佳的黏度指數(shù)和旋轉(zhuǎn)氧彈兩個(gè)數(shù)據(jù)集上都有較大提升.
采用已經(jīng)劃分好的數(shù)據(jù)集代入模型取得的預(yù)測(cè)結(jié)果,對(duì)于未知樣本無(wú)法較好的表現(xiàn)出適用性.為了充分表現(xiàn)模型對(duì)于新樣本數(shù)據(jù)的預(yù)測(cè)能力,使用LOOCV法不斷重新劃分?jǐn)?shù)據(jù)集來(lái)訓(xùn)練數(shù)據(jù),以此考察模型的泛化能力.將30組樣本分別代入GA-WNN、LSSVM和WOA-LSSVM模型中,其在3個(gè)性能指標(biāo)數(shù)據(jù)集上測(cè)試結(jié)果的相對(duì)百分誤差如圖8所示.
綜合來(lái)看,WOA-LSSVM模型通過(guò)LOOCV法驗(yàn)證的相對(duì)百分誤差結(jié)果優(yōu)于其他兩種模型,而基礎(chǔ)模型LSSVM又優(yōu)于GA-WNN.同時(shí)計(jì)算三種模型的MAPE、RMSE和R2,其中縱坐標(biāo)為各指標(biāo)誤差值,結(jié)果如圖9所示.顯然,WOA-LSSVM與LSSVM和GAWNN相比,三項(xiàng)評(píng)價(jià)指標(biāo)都有較大提升,因此WOALSSVM具有更好的預(yù)測(cè)精度和泛化能力.
上述經(jīng)對(duì)比分析可知,群智能搜索優(yōu)化算法對(duì)模型的預(yù)測(cè)性能有較大提升,其中WOA-LSSVM模型具有更好的迭代速度和預(yù)測(cè)精度.用30組樣本(21組為訓(xùn)練集,其余9組為測(cè)試集)代入模型進(jìn)行預(yù)測(cè),將WOA迭代尋優(yōu)后的參數(shù) γbest, σ2best代入LSSVM中進(jìn)行預(yù)測(cè),結(jié)果列于表4中.
表4 WOA-LSSVM預(yù)測(cè)結(jié)果Table 4 Prediction results of WOA-LSSVM
WOA-LSSVM模型的預(yù)測(cè)結(jié)果與試驗(yàn)值的對(duì)比結(jié)果如圖10所示.
Fig.6 Prediction results of model: (a) kinematic viscosity; (b) viscosity index; (c) rotating oxygen bomb圖6 模型預(yù)測(cè)結(jié)果:(a)運(yùn)動(dòng)黏度;(b)黏度指數(shù);(c)旋轉(zhuǎn)氧彈
Fig.7 Evaluation of model predictions: (a) MAPE; (b) RMSE; (c) R2圖7 模型預(yù)測(cè)評(píng)價(jià):(a) MAPE;(b) RMSE;(c) R2
Fig.8 Prediction results of model by LOOCV: (a) kinematic viscosity; (b) viscosity index; (c) rotating oxygen bomb圖8 模型LOOCV法預(yù)測(cè)結(jié)果:(a)運(yùn)動(dòng)黏度;(b)黏度指數(shù);(c)旋轉(zhuǎn)氧彈
Fig.9 Evaluation of model by LOOCV: (a) MAPE; (b) RMSE; (c) R2圖9 模型LOOCV法評(píng)價(jià):(a) MAPE;(b) RMSE;(c) R2
計(jì)算WOA-LSSVM模型的MAPE、RMSE和R2列于表5中.
表5 WOA-LSSVM模型預(yù)測(cè)評(píng)價(jià)Table 5 Evaluation of WOA-LSSVM model predictions
將數(shù)據(jù)代入模型WOA-LSSVM測(cè)試后,可以看出數(shù)據(jù)的擬合結(jié)果良好,各項(xiàng)計(jì)算誤差指標(biāo)都處于較小范圍,在性能指標(biāo)預(yù)測(cè)上表現(xiàn)優(yōu)異.
a.通過(guò)對(duì)多種回歸模型的測(cè)試分析,發(fā)現(xiàn)LSSVM相較于其余模型具有良好的預(yù)測(cè)能力,適合于研究小樣本潤(rùn)滑油性能預(yù)測(cè)問(wèn)題.
b.群智能搜索算法對(duì)LSSVM基礎(chǔ)模型的正則化參數(shù)(γ)和核函數(shù)寬度(σ2)進(jìn)行參數(shù)尋優(yōu),可以顯著降低預(yù)測(cè)誤差.
c.混合模型WOA-LSSVM收斂速度更快,能夠搜索到更優(yōu)的結(jié)果,在各項(xiàng)性能上的預(yù)測(cè)精度和泛化能力最優(yōu).
Fig.10 Comparison of model prediction results: (a) kinematic viscosity (40 ℃); (b) viscosity index; (c) rotating oxygen bomb圖10 模型預(yù)測(cè)結(jié)果對(duì)比:(a)運(yùn)動(dòng)黏度(40 ℃);(b)黏度指數(shù);(c)旋轉(zhuǎn)氧彈