李志偉,蘇 宇,張 舜,王青春*
(1.北京林業(yè)大學(xué) 工學(xué)院,北京 100091;2.安徽路必達智能科技有限公司,安徽 合肥 230031)
隨著社會經(jīng)濟的快速發(fā)展、生活水平的顯著提高,汽車使用量快速增多,隨之帶來的汽車噪聲問題也越來越嚴(yán)重。噪聲會對人的聽力、視覺、神經(jīng)系統(tǒng)和內(nèi)分泌系統(tǒng)等造成傷害。汽車噪聲是道路交通噪聲的主要來源,輪胎是汽車噪聲重要的噪聲源之一,尤其是汽車的行駛速度達到70 km·h-1以上時,輪胎噪聲是汽車噪聲的主要組成部分[1]。為了減少噪聲污染,世界多國對輪胎噪聲有嚴(yán)格規(guī)定[2]。輪胎通常采用經(jīng)驗設(shè)計方法,其噪聲性能需對成品輪胎進行試驗來獲取,在設(shè)計輪胎花紋的初期很難對輪胎的噪聲性能進行有效評估,具有很大的盲目性[3]。因此,開發(fā)預(yù)測輪胎花紋噪聲值的模型顯得尤為重要。
對輪胎花紋噪聲值的預(yù)測研究通常采用理論解析方法得出若干半經(jīng)驗理論公式,或采用有限元分析方法對輪胎模型進行噪聲仿真。李福軍等[4]通過對不同花紋輪胎發(fā)聲機理的研究,建立預(yù)測數(shù)學(xué)模型,模擬計算花紋溝的發(fā)聲情況,結(jié)果顯示,花紋溝的深度和寬度對輪胎噪聲的影響不大,而花紋溝的角度對輪胎噪聲的影響較大。蔡昶文[5]采用數(shù)值仿真驗證泵吸噪聲理論,并對不同強制位移下輪胎花紋溝的泵吸噪聲進行分析,實現(xiàn)了對輪胎噪聲的量化模擬及預(yù)測。馮希金等[6]以輪胎花紋和胎冠進行三維建模得到的加速度場作為聲源,采用有限元方法對輪胎滾動噪聲進行分布預(yù)測,證明頻率在1 000 Hz以下的輪胎滾動噪聲主要是由花紋的沖擊振動引起的。然而,采用上述方法對輪胎噪聲進行預(yù)測的準(zhǔn)確率較低,花費時間較長,并且在實際運用中很難批量處理復(fù)雜花紋的輪胎,因此研究輪胎花紋結(jié)構(gòu)與花紋噪聲值之間的關(guān)系十分困難。
近年來,深度學(xué)習(xí)技術(shù)在人工智能領(lǐng)域有著飛速的發(fā)展,因其學(xué)習(xí)能力強、覆蓋范圍廣、適應(yīng)性好等優(yōu)點,在圖像識別、自然語言處理等領(lǐng)域有著廣泛應(yīng)用。S.LUCAS等[7]利用2個人工神經(jīng)網(wǎng)絡(luò)ANN1和ANN2分別預(yù)測了輪胎的花紋噪聲和非花紋噪聲,其中ANN1的輸入是由數(shù)字化三維胎面花紋計算得來的胎面輪廓譜和空氣體積速度譜。優(yōu)化后的神經(jīng)網(wǎng)絡(luò)能很好地預(yù)測車輛行駛過程中輪胎與路面相互作用引發(fā)的噪聲。清華大學(xué)的項大兵等[3]在大量不同花紋輪胎噪聲試驗的基礎(chǔ)上,建立了輪胎花紋幾何結(jié)構(gòu)與噪聲試驗結(jié)果之間的BP神經(jīng)網(wǎng)絡(luò)模型,采用該模型預(yù)測輪胎噪聲的準(zhǔn)確度達到了85%。韓國仁荷大學(xué)的L.SANGKWON 等[8]提取28條試驗輪胎花紋印痕的圖像特征,將花紋圖像和實測功率譜分別作為卷積神經(jīng)網(wǎng)絡(luò)(CNN)的輸入和輸出,預(yù)測功率譜與實測功率譜的相似度達到89%。
本工作提出了一種基于深度學(xué)習(xí)中CNN的預(yù)測方法,其不依賴于物理理論模型,而是提取輪胎花紋的圖像特征,通過訓(xùn)練學(xué)習(xí)輸出不同花紋圖像對應(yīng)預(yù)測噪聲值的數(shù)學(xué)模型,并對比研究CNN模型和BP神經(jīng)網(wǎng)絡(luò)模型對相同輪胎花紋噪聲值的預(yù)測精度。
基于CNN模型預(yù)測輪胎花紋噪聲值的流程如圖1所示,主要有對輸入圖像的預(yù)處理、構(gòu)建神經(jīng)網(wǎng)絡(luò)和預(yù)測輪胎花紋噪聲值幾部分。輪胎花紋圖像經(jīng)過處理后,直接輸入到搭建好的CNN中學(xué)習(xí)、訓(xùn)練,并預(yù)測噪聲值。
圖1 基于CNN模型預(yù)測輪胎花紋噪聲值的流程圖
輪胎花紋圖像在輸入CNN模型之前需要進行預(yù)處理。首先選取可以體現(xiàn)整個輪胎花紋特征的區(qū)域進行剪切,對剪切后的圖像進行銳化處理以增強花紋溝的邊緣輪廓,使花紋溝與花紋塊清晰可分辨,然后用高斯濾波等方式去除圖像上的噪點,對圖像進行優(yōu)化。忽略花紋深度造成的影響[2],將圖像進行灰度處理以突出花紋溝和花紋塊的形狀特征,如圖2所示。
圖2 輪胎花紋圖像處理
經(jīng)過灰度處理的輪胎花紋圖像的像素較大,為400×400,若直接輸入到CNN模型中,CNN提取圖像特征的時間過長,為了縮短CNN模型的訓(xùn)練時間,需要在不丟失與圖像噪聲有關(guān)信息的前提下,采用小波變換的方法將圖像的像素壓縮至100×100,壓縮前后圖像如圖3所示。
圖3 壓縮前后圖像
從圖3可以看出,壓縮前后圖像的花紋溝、花紋塊沒有明顯差異。
灰度化后圖像的像素為0~255,為減少圖像輸入CNN后模型的運算量,將灰度化后輪胎圖像的像素用公式(1)歸一化至0~1,即
式中,Pold為歸一化前的像素值,Pnew為歸一化后的像素值。
CNN在圖像識別領(lǐng)域有著重要的應(yīng)用,選擇CNN來預(yù)測輪胎花紋噪聲值。CNN是包含卷積操作、權(quán)值共享、局部連接的前饋神經(jīng)網(wǎng)絡(luò),其主要包括輸入層、卷積層、池化層、全連接層和輸出層[9]。輸入層的作用是將圖像輸入網(wǎng)絡(luò)。卷積層的作用是提取輸入圖像的信息,被提取的圖像信息被稱為圖像特征,圖像特征由圖像中的每個像素通過獨立或者組合的方式體現(xiàn),比如圖像的紋理特征、顏色特征等。池化層的作用是對圖像特征進行挑選,通過降低特征圖像的分辨率獲得具有空間不變性的特征,起到二次提取特征的作用[10],常見的池化操作有最大池化和平均池化。全連接層的作用是將池化層得到的特征矩陣轉(zhuǎn)化成一維的特征向量,數(shù)據(jù)將進行由多到少的映射,實現(xiàn)端到端的學(xué)習(xí)過程,提高網(wǎng)絡(luò)的魯棒性。數(shù)據(jù)從全連接層到輸出層會再一次減少,變成更低維的向量,這個向量即為噪聲預(yù)測值。本工作構(gòu)建的CNN模型結(jié)構(gòu)如圖4所示。CNN模型含有3個卷積層,每個卷積層后各有1個池化層,最后有1個全連接層。3個卷積層的卷積核大小均為3×3,分別有8,16和32個;3個池化層的池化核大小均為2×2,分別有8,16和32個?;y圖像經(jīng)過卷積、池化提取特征后,將二維數(shù)據(jù)壓縮成一維數(shù)據(jù)輸入到全連接層,全連接層的輸出數(shù)據(jù)即為輪胎花紋的噪聲值。為了提高模型的預(yù)測精度,本文在用CNN模型預(yù)測輪胎花紋噪聲值時,將不同輪胎花紋的噪聲值標(biāo)簽用公式(2)進行歸一化處理,即模型在訓(xùn)練和測試后得到的輸出值(P)均處于0~1之間,再將P通過公式(3)進行反歸一化處理,得到真實的噪聲值標(biāo)簽(Lt)。
圖4 CNN模型結(jié)構(gòu)
式中,L為當(dāng)前噪聲值標(biāo)簽,Lmin為最小噪聲值標(biāo)簽,Lmax為最大噪聲值標(biāo)簽。
本工作采用某公司提供的商用輪胎樣本進行花紋噪聲預(yù)測,樣本總數(shù)為94個,按照7∶3的比例將樣本隨機劃分為訓(xùn)練集和測試集,即將65個樣本的花紋灰度圖像作為訓(xùn)練集的輸入,將29個樣本的花紋灰度圖像作為測試集的輸入,輸出為輪胎花紋所對應(yīng)的噪聲值。
本工作采用的CNN模型是基于輪胎花紋圖片數(shù)據(jù)集,使用Python編程語言,在Tensorflow環(huán)境平臺搭建完成的。通常,CNN使用學(xué)習(xí)算法來調(diào)整其自由參數(shù)(偏差和權(quán)重),以獲得理想的網(wǎng)絡(luò)輸出。用于此目的的最常見的算法是反向傳播,反向傳播計算目標(biāo)(成本/損失/性能)函數(shù)的梯度,以確定如何調(diào)整網(wǎng)絡(luò)的參數(shù),以最小化影響性能的錯誤。本工作采用的AdaGrad算法是一種具有特定參數(shù)學(xué)習(xí)率的優(yōu)化器,可以根據(jù)參數(shù)在訓(xùn)練期間的更新頻率進行自適應(yīng)調(diào)整。該優(yōu)化算法在陡峭處的學(xué)習(xí)速率小,防止振蕩,在較為平緩處的學(xué)習(xí)速率較大,使參數(shù)能夠快速更新,在一定程度上可以避免越過極小值點,提高網(wǎng)絡(luò)模型預(yù)測的準(zhǔn)確度,學(xué)習(xí)效率較高。AdaGrad的計算公式如下:
式中:t為當(dāng)前迭代次數(shù);gi為函數(shù)第i次迭代的梯度;σt為所有梯度的均值平方根;Ψ為常數(shù),初始值為1×10-7(為了防止分母為0的情況);lr為學(xué)習(xí)率,初始值為0.01。
激活函數(shù)使用Relu,當(dāng)輸入值大于0時,輸出值等于輸入值,當(dāng)輸入值小于或等于0時,輸出值為0。由于輸出值總是非負數(shù),使用Relu可以消除激活函數(shù)中的“梯度消失”問題,這對CNN模型學(xué)習(xí)非常有幫助。損失函數(shù)采用均方誤差、評價函數(shù)采用平均絕對誤差來表示模型的預(yù)測值與真實值的偏差程度,從而衡量模型的可靠性。訓(xùn)練CNN模型的一個常見問題是過度擬合,導(dǎo)致經(jīng)過訓(xùn)練的網(wǎng)絡(luò)在測試集上的性能不佳,這會影響模型對未顯示的數(shù)據(jù)進行概括的能力,可以采用Dropout層隨機刪除部分神經(jīng)元以防止過度擬合,其參數(shù)值設(shè)置為0.2,表示隨機20%的神經(jīng)元為零權(quán)重。
而對于BP神經(jīng)網(wǎng)絡(luò)的測試訓(xùn)練,用到的輪胎花紋圖像樣本也為灰度圖像,用PCA降維法從中提取100個相互獨立的特征參數(shù)輸入到模型中。本工作構(gòu)建的BP神經(jīng)網(wǎng)絡(luò)也為3層,分別為輸入層、隱含層和輸出層,輸入層和隱含層各有100個神經(jīng)元。文獻[8]中BP神經(jīng)網(wǎng)絡(luò)的輸出層為10個神經(jīng)元,將輸出的預(yù)測噪聲值標(biāo)簽以1 dB為識別精度劃分為70,71,72...79,共10類。本工作為與CNN模型的預(yù)測效果進行對比,設(shè)定BP神經(jīng)網(wǎng)絡(luò)的輸出神經(jīng)元為1個,即輪胎通過噪聲的聲壓級水平。數(shù)據(jù)在隱含層和輸出層的傳遞函數(shù)均為tanh函數(shù),學(xué)習(xí)率為0.1,動量因子為0.1,經(jīng)過1 000次迭代訓(xùn)練,平均擬合誤差控制在0.2 dB以內(nèi)。
CNN模型訓(xùn)練過程中的損失函數(shù)與評價函數(shù)如圖5所示。
圖5 CNN模型訓(xùn)練過程中的損失函數(shù)和評價函數(shù)
從圖5可以看出,CNN模型經(jīng)過100次訓(xùn)練后的損失函數(shù)值可達到0.01,評價函數(shù)值可達到0.05,訓(xùn)練輪次為20次左右趨于穩(wěn)定。
模型訓(xùn)練結(jié)束后,用測試集的29個樣本對預(yù)報模型進行檢測,檢測結(jié)果誤差分析如表1所示。用公式(6)計算絕對誤差(AE),用公式(7)計算相對誤差(RE)。
表1 CNN模型檢測結(jié)果誤差分析
式中,Pc為每個測試集樣本的花紋噪聲預(yù)測值,T為每個測試集樣本的花紋噪聲真實值。
經(jīng)過計算,BP神經(jīng)網(wǎng)絡(luò)模型測試集中29個樣本噪聲值的平均絕對誤差為0.713 dB,平均相對誤差為0.95%;CNN模型測試集中29個樣本噪聲值的平均絕對誤差為0.591 dB,平均相對誤差為0.81%,其中15個樣本噪聲值的誤差在0~0.5 dB之間,9個樣本噪聲值的誤差在0.5~1.0 dB之間,5個樣本噪聲值的誤差大于1.0,可見CNN模型比BP神經(jīng)網(wǎng)絡(luò)的預(yù)測準(zhǔn)確度高。
在輪胎花紋噪聲值預(yù)測中,相比于BP神經(jīng)網(wǎng)絡(luò),采用CNN的優(yōu)點如下:(1)BP神經(jīng)網(wǎng)絡(luò)不能將圖像直接輸入到網(wǎng)絡(luò)模型中,需要提取一定數(shù)量的主成分特征來代替圖像,然后將主要成分特征輸入到BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí),而CNN在圖像處理、模式識別領(lǐng)域有著重大應(yīng)用,可以將圖片直接輸入CNN,通過卷積、池化操作來學(xué)習(xí)圖片的相應(yīng)特征,在模式分類領(lǐng)域其可以直接輸入原始圖像,減少對圖片復(fù)雜的初期預(yù)處理工作;(2)BP神經(jīng)網(wǎng)絡(luò)每一層都是全連接的,需要訓(xùn)練的參數(shù)多,導(dǎo)致模型學(xué)習(xí)速度慢,訓(xùn)練困難,而CNN具有局部感知和參數(shù)共享的特點,局部感知使每個神經(jīng)元不需要感知圖像中的全部像素,只需要感知其所對應(yīng)的局部區(qū)域,權(quán)值共享結(jié)構(gòu)降低了模型的復(fù)雜程度,減少了權(quán)值的數(shù)量,因此學(xué)習(xí)和訓(xùn)練的速度較快。
采用CNN預(yù)測輪胎花紋噪聲的結(jié)果仍然存在與真實值相差大于1 dB的情況,分析原因如下:(1)輸入CNN模型的輪胎花紋圖像只考慮花紋塊和花紋溝的排布形式,忽略花紋溝的深度和花紋壁的傾斜角度的影響;(2)采集的輪胎花紋樣本數(shù)量太少,對于深度學(xué)習(xí)網(wǎng)絡(luò),樣本數(shù)量越多,模型的學(xué)習(xí)和預(yù)測能力越好,魯棒性越強;(3)CNN模型的結(jié)構(gòu)層數(shù)、參數(shù)等還需要進一步優(yōu)化調(diào)整;(4)在劃分訓(xùn)練集和測試集時按照一定比例隨機劃分,導(dǎo)致模型每次的預(yù)測效果可能因樣本差異而不同。
輪胎花紋噪聲值受多種因素影響且每種因素非獨立作用,存在相互耦合的現(xiàn)象,現(xiàn)有的輪胎花紋噪聲預(yù)測方法難且預(yù)測精度低,針對這一問題,本工作基于圖像處理和深度學(xué)習(xí)搭建了預(yù)測不同輪胎花紋噪聲值的CNN模型,并對輸入CNN的噪聲值標(biāo)簽進行歸一化與反歸一化的處理,使該模型對花紋噪聲值的預(yù)測平均誤差達到0.591 dB,平均相對誤差能達到0.81%。與BP神經(jīng)網(wǎng)絡(luò)相比,CNN模型具有更高的預(yù)測精度,滿足輪胎花紋設(shè)計初期對噪聲值預(yù)測的準(zhǔn)確度要求,在輪胎投入生產(chǎn)之前,輪胎設(shè)計師可以利用預(yù)測花紋噪聲的數(shù)學(xué)模型對輪胎花紋進行噪聲值預(yù)測,從而對花紋的排布方式進行優(yōu)化,降低輪胎花紋噪聲,減少研發(fā)成本。