李晨玉
(天津?yàn)I海汽車工程職業(yè)學(xué)院,天津 300352)
汽車發(fā)動(dòng)機(jī)穩(wěn)定和可靠運(yùn)行對(duì)于車輛的性能和安全至關(guān)重要,實(shí)時(shí)監(jiān)測(cè)和診斷發(fā)動(dòng)機(jī)故障是確保汽車發(fā)動(dòng)機(jī)的穩(wěn)定和可靠運(yùn)行的重要保證。傳統(tǒng)的發(fā)動(dòng)機(jī)故障診斷方法通常依賴于傳感器數(shù)據(jù)和復(fù)雜的物理模型,其實(shí)施成本高且難以普及[1-2]。
近年來,隨著機(jī)器學(xué)習(xí)和信號(hào)處理技術(shù)的迅猛發(fā)展,為實(shí)時(shí)監(jiān)測(cè)和診斷發(fā)動(dòng)機(jī)故障提供了更具成本效益和可擴(kuò)展性的方法?;谝纛l特征的發(fā)動(dòng)機(jī)狀況識(shí)別技術(shù)基于車輛已有的音頻傳感器,對(duì)發(fā)動(dòng)機(jī)在運(yùn)行過程中產(chǎn)生的聲音信號(hào)進(jìn)行分析和識(shí)別,以評(píng)估發(fā)動(dòng)機(jī)健康狀況和檢測(cè)潛在故障[3]。音頻特征的提取是基于音頻信號(hào)的重要步驟,可以采用傅里葉變換、小波變換和時(shí)域特征提取等信號(hào)處理方法,將原始音頻信號(hào)轉(zhuǎn)化為具有代表性的特征向量。這些特征向量包含了發(fā)動(dòng)機(jī)運(yùn)行狀態(tài)的關(guān)鍵信息,如頻譜分布、能量分布和周期性特征等[4-6]。信號(hào)特征提取結(jié)束后,基于機(jī)器學(xué)習(xí)算法對(duì)提取的音頻特征進(jìn)行訓(xùn)練和分類,通過對(duì)大量標(biāo)記的訓(xùn)練樣本進(jìn)行學(xué)習(xí),能夠識(shí)別不同發(fā)動(dòng)機(jī)狀況下的特征模式,并為未知樣本進(jìn)行準(zhǔn)確的分類。
本文將深入探討基于音頻特征的汽車發(fā)動(dòng)機(jī)狀況識(shí)別技術(shù),系統(tǒng)論述了該技術(shù)研究進(jìn)展,并對(duì)其關(guān)鍵技術(shù)及方法進(jìn)行闡述,包括數(shù)據(jù)采集、特征提取、機(jī)器學(xué)習(xí)模型訓(xùn)練等關(guān)鍵步驟。研究成果期望能為汽車制造商和維修服務(wù)提供商提供一種新的發(fā)動(dòng)機(jī)狀況監(jiān)測(cè)和故障診斷方法,以提高車輛可靠性、安全性和維護(hù)效率。
國(guó)內(nèi)外關(guān)于基于音頻特征的汽車發(fā)動(dòng)機(jī)狀況識(shí)別技術(shù)的研究成果如表1所示[7-9]。調(diào)研結(jié)果表明,通過采用不同的信號(hào)處理和機(jī)器學(xué)習(xí)算法,以及提取不同的音頻特征,為發(fā)動(dòng)機(jī)故障診斷和狀況監(jiān)測(cè)提供了多樣化的方法和解決方案,為進(jìn)一步發(fā)展基于音頻特征的汽車發(fā)動(dòng)機(jī)狀況識(shí)別技術(shù)提供了重要的參考和借鑒。
表1 國(guó)內(nèi)外研究進(jìn)展
盡管國(guó)內(nèi)外研究學(xué)者取得了一系列的研究成果,但是基于音頻特征的汽車發(fā)動(dòng)機(jī)狀況識(shí)別技術(shù)仍然面臨一些挑戰(zhàn)和問題。首先,不同車型和駕駛條件可能會(huì)導(dǎo)致聲音信號(hào)的差異,需要更深入的研究來提高模型的泛化能力。其次,數(shù)據(jù)質(zhì)量和噪聲對(duì)診斷結(jié)果有著重要影響,因此需要進(jìn)一步優(yōu)化信號(hào)處理方法。此外,模型的可解釋性也是一個(gè)重要問題,特別是在實(shí)際應(yīng)用中需要解釋診斷結(jié)果的情況下。
基于音頻特征的汽車發(fā)動(dòng)機(jī)狀況識(shí)別技術(shù)依賴于有效的信號(hào)處理和特征提取方法,可以去除噪聲、增強(qiáng)信號(hào)質(zhì)量,并將信號(hào)轉(zhuǎn)換為更易于分析的形式。特征提取則通過提取關(guān)鍵特征來描述音頻信號(hào)的內(nèi)容和特性。本章介紹在基于音頻特征的發(fā)動(dòng)機(jī)狀況識(shí)別中常用的信號(hào)處理和特征提取方法。
2.1.1 預(yù)處理
音頻信號(hào)通常受到環(huán)境噪聲和其他干擾的影響,因此需要進(jìn)行預(yù)處理以去除這些干擾并提高信號(hào)質(zhì)量。常見的預(yù)處理方法包括降噪技術(shù),如維納濾波、中值濾波和小波閾值去噪;濾波技術(shù),如低通濾波和高通濾波;偽音移除方法,如自適應(yīng)偽音消除和譜減法等。當(dāng)噪聲類型不同時(shí),所采用的信號(hào)處理方法也不同,在實(shí)際應(yīng)用過程中需要根據(jù)不同的信號(hào)類型進(jìn)行處理方法的選擇,如表2所示。
表2 不同噪聲類型處理方法及特點(diǎn)
2.1.2 傅里葉變換
傅里葉變換是將時(shí)域信號(hào)轉(zhuǎn)換為頻域信號(hào)的重要工具。通過傅里葉變換,可以將音頻信號(hào)表示為頻譜圖,從中提取頻率分量、頻譜能量、頻譜形態(tài)等頻域特征。傅里葉變換可以采用快速傅里葉變換(FFT)算法實(shí)現(xiàn)高效計(jì)算。
2.1.3 小波變換
小波變換可以將信號(hào)分解成不同頻率的子帶,使時(shí)頻特性能夠同時(shí)表示。在發(fā)動(dòng)機(jī)狀況識(shí)別中,小波變換常用于分析發(fā)動(dòng)機(jī)振動(dòng)信號(hào),并提取與故障相關(guān)的特征。常見的小波變換方法包括離散小波變換(DWT)和連續(xù)小波變換(CWT)。
2.1.4 時(shí)間域特征提取
從音頻信號(hào)的時(shí)域波形中提取特征可以描述發(fā)動(dòng)機(jī)聲音的時(shí)域變化和統(tǒng)計(jì)特性。常用的時(shí)域特征包括時(shí)長(zhǎng)、峰值、均值、方差、時(shí)域波形形狀等。這些特征可以通過滑動(dòng)窗口分析、統(tǒng)計(jì)計(jì)算和數(shù)學(xué)模型來提取。
2.1.5 頻域特征提取
從音頻信號(hào)的頻譜圖中提取特征可以描述發(fā)動(dòng)機(jī)聲音的頻域分布和譜線特性。
1)頻譜能量。頻譜能量是指在不同頻率區(qū)間內(nèi)的信號(hào)能量分布情況,通過計(jì)算每個(gè)頻率區(qū)間內(nèi)的能量值,可以了解發(fā)動(dòng)機(jī)聲音在不同頻率范圍內(nèi)的能量分布情況。常見的頻譜能量特征包括總能量、能量集中度等。
2)頻譜峰值。頻譜峰值是指頻譜圖中具有最大幅值的頻率分量,主要用于表示發(fā)動(dòng)機(jī)聲音的主要頻率成分和譜線峰值的位置。常見的頻譜峰值特征包括主頻率、最高峰值幅度等。
3)頻率分量。在頻譜圖中具有顯著幅值的離散頻率點(diǎn)稱為頻率分量,通過提取頻率分量,可以識(shí)別出發(fā)動(dòng)機(jī)聲音中的特定頻率成分。常見的頻率分量特征包括頻率峰值位置、頻率帶寬等。
4)頻譜形態(tài)。頻譜形態(tài)描述了頻譜圖中的形狀和輪廓特征,可以反映發(fā)動(dòng)機(jī)聲音在不同頻率范圍內(nèi)的能量分布和頻譜線的形狀。常見的頻譜形態(tài)特征包括譜線斜率、譜線的寬度和形狀等。
2.2.1 算法選擇準(zhǔn)則
1)問題類型。根據(jù)問題的性質(zhì)和要求選擇合適的算法。例如,分類問題可以使用決策樹、支持向量機(jī)(SVM)、邏輯回歸等;回歸問題可以使用線性回歸、隨機(jī)森林等;聚類問題可以使用K均值聚類、DBSCAN等。
2)數(shù)據(jù)規(guī)模。考慮數(shù)據(jù)集的大小,選擇適合處理大規(guī)模數(shù)據(jù)的算法。例如,當(dāng)數(shù)據(jù)集非常龐大時(shí),深度學(xué)習(xí)算法(如神經(jīng)網(wǎng)絡(luò))可能更適合,而對(duì)于小規(guī)模數(shù)據(jù)集,傳統(tǒng)機(jī)器學(xué)習(xí)算法也能夠提供良好的性能。
3)特征空間。根據(jù)特征的類型和屬性選擇算法。例如,對(duì)于文本數(shù)據(jù),可以使用基于詞頻的方法(如樸素貝葉斯分類器),或者使用詞嵌入技術(shù)(如Word2Vec)來表示文本特征。
4)可解釋性要求。根據(jù)應(yīng)用需求,考慮算法的可解釋性。某些場(chǎng)景下,需要能夠理解算法的決策過程和結(jié)果,因此可以選擇基于規(guī)則的方法(如決策樹),而不是黑盒模型(如深度神經(jīng)網(wǎng)絡(luò))。
1)根據(jù)《廣州市建筑節(jié)能與綠色建筑“十三五”專項(xiàng)規(guī)劃》,到2020年,廣州市新建建筑全面執(zhí)行綠色建筑標(biāo)準(zhǔn),累計(jì)新增的綠色建筑總量約為8600萬m2;二星級(jí)以上綠色建筑占綠色建筑總量的比重達(dá)到20%以上,新增二星及以上綠色建筑總量約為1300 萬 m2;
5)計(jì)算資源和效率。考慮算法的計(jì)算復(fù)雜度和資源需求。某些算法可能需要大量的計(jì)算資源和時(shí)間進(jìn)行訓(xùn)練和推理,因此需要根據(jù)可用的資源和應(yīng)用場(chǎng)景進(jìn)行選擇。
6)魯棒性??紤]算法對(duì)異常值、噪聲和缺失數(shù)據(jù)的魯棒性。一些算法對(duì)數(shù)據(jù)質(zhì)量的要求較高,而其他算法則能夠更好地處理不完整或有噪聲的數(shù)據(jù)。
2.2.2 訓(xùn)練過程關(guān)鍵技術(shù)
1)數(shù)據(jù)準(zhǔn)備。將采集到的音頻數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集,確保數(shù)據(jù)集的平衡性和代表性。同時(shí),對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,如標(biāo)準(zhǔn)化、歸一化等。
2)特征選擇。根據(jù)研究需求和算法選擇準(zhǔn)則,選擇合適的音頻特征進(jìn)行訓(xùn)練??梢允褂锰卣鬟x擇方法,如相關(guān)性分析、特征重要性排序等。
3)模型選擇與訓(xùn)練。根據(jù)算法選擇準(zhǔn)則,選擇合適的機(jī)器學(xué)習(xí)算法進(jìn)行訓(xùn)練。常用的算法包括決策樹、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等。對(duì)選定的算法進(jìn)行訓(xùn)練,調(diào)整模型的超參數(shù)以提高性能。
4)模型評(píng)估。使用測(cè)試集評(píng)估訓(xùn)練好的模型性能。常見的評(píng)估指標(biāo)包括準(zhǔn)確率、召回率、精確度等,計(jì)算公式如下[10]。
準(zhǔn)確率(AC)是指模型正確預(yù)測(cè)為正類的樣本數(shù)占預(yù)測(cè)為正類的樣本總數(shù)的比例,是衡量模型對(duì)于正類預(yù)測(cè)準(zhǔn)確率的指標(biāo)。例如,如果一個(gè)分類模型對(duì)100個(gè)樣本進(jìn)行分類,其中有80個(gè)樣本分類正確,那么準(zhǔn)確率就是80%(0.8)。計(jì)算公式如式(1)所示
(1)
(2)
精確率(Pre)是指模型在所有預(yù)測(cè)為正類的樣本中,真正為正類的樣本占比。精確率適用于樣本類別平衡的情況,因?yàn)樗P(guān)注模型對(duì)于正類的識(shí)別準(zhǔn)確率,能夠較好地反映模型的分類性能。是衡量模型對(duì)于正類識(shí)別準(zhǔn)確率的指標(biāo)。例如,如果一個(gè)分類模型將100個(gè)樣本中的90個(gè)預(yù)測(cè)為正例,其中有85個(gè)樣本被正確分類為正例,而有5個(gè)樣本被錯(cuò)誤地分類為正例,那么精確率就是85%(0.85)。公式如式(3)所示
(3)
5)模型驗(yàn)證與調(diào)優(yōu)。進(jìn)行交叉驗(yàn)證和驗(yàn)證集驗(yàn)證,確保模型的泛化能力。根據(jù)驗(yàn)證結(jié)果進(jìn)行模型調(diào)優(yōu),如調(diào)整特征、調(diào)整模型結(jié)構(gòu)、增加訓(xùn)練數(shù)據(jù)等。
深度學(xué)習(xí)算法在音頻處理和模式識(shí)別方面的應(yīng)用已經(jīng)取得了顯著成果,并且在汽車發(fā)動(dòng)機(jī)狀況識(shí)別中有著巨大的潛力。深度學(xué)習(xí)模型如卷積神經(jīng)網(wǎng)絡(luò)(CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)可以更好地學(xué)習(xí)音頻特征的時(shí)序信息和復(fù)雜關(guān)系,從而提高發(fā)動(dòng)機(jī)狀況識(shí)別的性能。
深度學(xué)習(xí)模型通過多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),深度學(xué)習(xí)模型可以自動(dòng)地從原始音頻數(shù)據(jù)中提取高級(jí)的抽象特征。例如,CNN可以通過卷積和池化操作捕捉音頻信號(hào)的局部模式和頻域信息,而RNN則能夠建模音頻數(shù)據(jù)的時(shí)序依賴關(guān)系,使得模型能夠更好地理解和識(shí)別發(fā)動(dòng)機(jī)聲音的特征。此外,深度學(xué)習(xí)模型還具有良好的泛化能力[11],能夠適應(yīng)不同車型、發(fā)動(dòng)機(jī)類型和工況的音頻數(shù)據(jù)。通過大規(guī)模的訓(xùn)練數(shù)據(jù)和適當(dāng)?shù)恼齽t化方法,深度學(xué)習(xí)模型可以有效地避免過擬合問題,并提高對(duì)新數(shù)據(jù)的識(shí)別準(zhǔn)確性。
隨著傳感器技術(shù)的發(fā)展和數(shù)據(jù)采集能力的提升,多模態(tài)數(shù)據(jù)融合將在汽車發(fā)動(dòng)機(jī)狀況識(shí)別領(lǐng)域發(fā)揮越來越重要的作用,為故障預(yù)測(cè)和預(yù)防提供更可靠的手段。通過結(jié)合其他傳感器數(shù)據(jù),如振動(dòng)、溫度等,可以獲得更全面的發(fā)動(dòng)機(jī)狀態(tài)信息,提高故障檢測(cè)的準(zhǔn)確性,有助于及早發(fā)現(xiàn)潛在故障,采取相應(yīng)的維修和維護(hù)措施,提高汽車的可靠性和安全性。
實(shí)時(shí)性是汽車發(fā)動(dòng)機(jī)狀況識(shí)別技術(shù)的關(guān)鍵需求之一。及時(shí)監(jiān)測(cè)和識(shí)別發(fā)動(dòng)機(jī)的健康狀況對(duì)于保證行車安全和降低故障風(fēng)險(xiǎn)至關(guān)重要。實(shí)時(shí)性要求識(shí)別算法能夠在短時(shí)間內(nèi)對(duì)音頻數(shù)據(jù)進(jìn)行處理和分析,以快速準(zhǔn)確地判斷發(fā)動(dòng)機(jī)狀態(tài),具備高效的計(jì)算能力和快速的響應(yīng)時(shí)間。另一個(gè)發(fā)展方向是將發(fā)動(dòng)機(jī)狀況識(shí)別技術(shù)應(yīng)用于嵌入式設(shè)備上,將發(fā)動(dòng)機(jī)狀況識(shí)別技術(shù)集成到嵌入式系統(tǒng)中,可以實(shí)現(xiàn)在車輛內(nèi)部對(duì)發(fā)動(dòng)機(jī)狀態(tài)進(jìn)行實(shí)時(shí)監(jiān)測(cè)和診斷,不依賴外部的網(wǎng)絡(luò)連接或云服務(wù)。這樣的嵌入式應(yīng)用能夠提高系統(tǒng)的穩(wěn)定性、可靠性和安全性,同時(shí)減少對(duì)外部環(huán)境的依賴。
隨著發(fā)動(dòng)機(jī)工作狀態(tài)可能隨時(shí)間、環(huán)境和使用情況的變化而變化,自適應(yīng)學(xué)習(xí)和增量學(xué)習(xí)方法在基于音頻特征的汽車發(fā)動(dòng)機(jī)狀況識(shí)別技術(shù)中將變得更為重要。自適應(yīng)學(xué)習(xí)是指算法具備自我調(diào)整和優(yōu)化的能力,能夠根據(jù)實(shí)時(shí)數(shù)據(jù)的變化來更新模型和參數(shù),以適應(yīng)不同工況和環(huán)境。在發(fā)動(dòng)機(jī)狀況識(shí)別中,可以根據(jù)發(fā)動(dòng)機(jī)在不同工作狀態(tài)下產(chǎn)生的音頻特征變化,動(dòng)態(tài)調(diào)整模型的權(quán)重和閾值,從而提高識(shí)別的準(zhǔn)確性和穩(wěn)定性。
增量學(xué)習(xí)是指算法能夠在新數(shù)據(jù)到來時(shí),利用已有模型進(jìn)行快速更新和調(diào)整,以適應(yīng)新的情況。在發(fā)動(dòng)機(jī)狀況識(shí)別中,增量學(xué)習(xí)方法可以利用已有的訓(xùn)練模型,通過引入新的訓(xùn)練樣本進(jìn)行參數(shù)的調(diào)整和優(yōu)化,以適應(yīng)新的工況和變化,可以避免重新訓(xùn)練整個(gè)模型,節(jié)省計(jì)算資源和時(shí)間成本。
將音頻特征與其他傳感器數(shù)據(jù)(如振動(dòng)傳感器、溫度傳感器等)相結(jié)合,將會(huì)產(chǎn)生協(xié)同效應(yīng),彌補(bǔ)單一傳感器數(shù)據(jù)可能存在的局限性。例如,振動(dòng)傳感器可以捕捉到發(fā)動(dòng)機(jī)機(jī)械振動(dòng)產(chǎn)生的信號(hào),而溫度傳感器可以反映發(fā)動(dòng)機(jī)的熱特性,這些信息的結(jié)合有助于更準(zhǔn)確地判斷發(fā)動(dòng)機(jī)的工作狀態(tài)。其次,通過多模態(tài)數(shù)據(jù)融合,可以提高故障的檢測(cè)率和診斷的精確性,減少誤報(bào)和漏報(bào)的情況,從而增強(qiáng)了整體的發(fā)動(dòng)機(jī)健康監(jiān)測(cè)能力。
未來,隨著深度學(xué)習(xí)的應(yīng)用擴(kuò)展,更多先進(jìn)的深度學(xué)習(xí)模型將在發(fā)動(dòng)機(jī)故障診斷中發(fā)揮重要作用,從而進(jìn)一步提升診斷的精確性、效率和可靠性。深度學(xué)習(xí)模型能夠自動(dòng)從原始音頻數(shù)據(jù)中學(xué)習(xí)到更具有表征性的特征,無需人為干預(yù),同時(shí),深度學(xué)習(xí)模型的層次化特征學(xué)習(xí)能力使其能夠理解更高層次的語義信息,有助于區(qū)分不同發(fā)動(dòng)機(jī)故障模式之間微小的差異,提高診斷的精確度。
實(shí)時(shí)處理和邊緣計(jì)算將計(jì)算任務(wù)從云端轉(zhuǎn)移到車輛內(nèi)部可以大大減少數(shù)據(jù)傳輸延遲,實(shí)現(xiàn)更快速的發(fā)動(dòng)機(jī)狀況監(jiān)測(cè)和診斷響應(yīng),對(duì)于即時(shí)性要求高的駕駛決策和故障預(yù)警至關(guān)重要。此外,邊緣計(jì)算可以在車輛內(nèi)部完成數(shù)據(jù)處理,減少敏感數(shù)據(jù)傳輸?shù)皆贫说娘L(fēng)險(xiǎn),從而更好地保護(hù)用戶的隱私和數(shù)據(jù)安全。
本文綜述了基于音頻特征的汽車發(fā)動(dòng)機(jī)狀況識(shí)別技術(shù)的研究進(jìn)展。通過對(duì)國(guó)內(nèi)外相關(guān)研究的概述,可以得出以下結(jié)論:
1)基于音頻特征的發(fā)動(dòng)機(jī)狀況識(shí)別技術(shù)在汽車領(lǐng)域具有廣泛的應(yīng)用前景。通過分析和識(shí)別發(fā)動(dòng)機(jī)工作過程中產(chǎn)生的聲音信號(hào),可以實(shí)現(xiàn)對(duì)發(fā)動(dòng)機(jī)的健康狀況和潛在故障的判斷。
2)在信號(hào)處理與特征提取方面,預(yù)處理方法(如降噪技術(shù)、濾波技術(shù)和偽音移除方法)能夠去除噪聲和干擾,提高音頻信號(hào)質(zhì)量;頻域特征(如頻譜能量、頻譜峰值、頻率分量和頻譜形態(tài))能夠描述發(fā)動(dòng)機(jī)聲音的頻域分布和譜線特性。
3)在機(jī)器學(xué)習(xí)算法選擇與訓(xùn)練方面,應(yīng)根據(jù)問題的特點(diǎn)和需求選擇合適的算法,并結(jié)合合適的訓(xùn)練數(shù)據(jù)進(jìn)行模型訓(xùn)練。常用的機(jī)器學(xué)習(xí)算法包括支持向量機(jī)、隨機(jī)森林和深度學(xué)習(xí)模型(如卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò))。
4)未來的發(fā)展趨勢(shì)包括多模態(tài)數(shù)據(jù)融合、深度學(xué)習(xí)應(yīng)用擴(kuò)展以及實(shí)時(shí)處理和邊緣計(jì)算的應(yīng)用,可以提供更全面和準(zhǔn)確的發(fā)動(dòng)機(jī)狀況識(shí)別結(jié)果,及時(shí)監(jiān)測(cè)發(fā)動(dòng)機(jī)狀態(tài)、預(yù)測(cè)故障并采取相應(yīng)的措施。