王增政, 王巖松, 郭 輝, 袁 濤, 鄭立輝, 孫 裴
(上海工程技術(shù)大學(xué) 機(jī)械與汽車工程學(xué)院, 上海 201620)
目前,針對(duì)高速列車車內(nèi)聲品質(zhì)評(píng)價(jià)方式的研究,大多數(shù)還是沿用傳統(tǒng)的問卷調(diào)查和主觀評(píng)價(jià)實(shí)驗(yàn)等評(píng)價(jià)形式。 而高速列車車內(nèi)噪聲信號(hào)具有復(fù)雜性、多特征性,這種簡(jiǎn)易的評(píng)價(jià)方式用于評(píng)價(jià)高速列車車內(nèi)聲品質(zhì)的準(zhǔn)確性和合理性有待商榷。 因此,通過結(jié)合信號(hào)本身的心理聲學(xué)參數(shù)特性和人的主觀評(píng)價(jià)結(jié)果,利用多參數(shù)建立可以預(yù)測(cè)人的主觀評(píng)價(jià)結(jié)果的評(píng)價(jià)模型是非常有必要的。
高速列車車內(nèi)聲品質(zhì)主觀評(píng)價(jià)研究中,一般會(huì)根據(jù)評(píng)價(jià)對(duì)象和評(píng)價(jià)目標(biāo)進(jìn)行評(píng)價(jià)方法和評(píng)價(jià)模型的改進(jìn)。 Hardy采用了多種評(píng)價(jià)內(nèi)部噪聲環(huán)境的標(biāo)準(zhǔn),如:噪聲準(zhǔn)則(NC)、首選噪聲準(zhǔn)則(PNC)、噪聲等級(jí)(NR)、房間準(zhǔn)則(RC),研究軌道車輛噪聲抑制過程中的固有問題,確定了該噪聲與乘客響應(yīng)之間的關(guān)系;周家中基于交通網(wǎng)絡(luò)距離重新劃分影響范圍,用分距離影響帶的線型和指數(shù)型空間權(quán)重系數(shù)方程,構(gòu)建軌道列車交通客流的LS-SVM 預(yù)測(cè)模型,結(jié)果顯示,模型不僅可以簡(jiǎn)化數(shù)據(jù)的需求量,還能明顯提高客流量的預(yù)測(cè)精度,但受地域因素影響較大;孟凡雨以高速列車車內(nèi)噪聲聲品質(zhì)的評(píng)價(jià)參量和主觀評(píng)價(jià)結(jié)果分別作為輸入和輸出,確定網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù),建立具有預(yù)測(cè)主觀評(píng)價(jià)結(jié)果功能的BP 神經(jīng)網(wǎng)絡(luò)模型,研究聲音的物理屬性和心理聲學(xué)屬性之間的關(guān)系;鄭德署開發(fā)了一個(gè)基于NET 平臺(tái)的噪聲預(yù)測(cè)系統(tǒng),通過圖形化的形式展現(xiàn),實(shí)現(xiàn)了對(duì)噪聲的計(jì)算分析功能; Park 等利用具有不同語音噪聲比和背景噪聲水平的噪聲源與隔間噪聲進(jìn)行了兩次實(shí)驗(yàn),結(jié)果顯示語音隱私和煩惱受聲噪比的影響顯著。
而對(duì)于高速列車車內(nèi)聲音信號(hào)的聲音特性的篩選,以期用有效心理聲學(xué)參數(shù)量化表征主觀評(píng)價(jià)結(jié)果的研究還是相對(duì)較少,大部分還是用線性回歸模型進(jìn)行分析,難以很好地表達(dá)復(fù)雜的數(shù)據(jù),而且對(duì)于具有相關(guān)性的特征數(shù)據(jù)難以建模。 在此基礎(chǔ)上,區(qū)別于最小二乘支持向量機(jī),本文中的最小二乘法—支持向量機(jī)回歸(LS-SVR)首先利用最小二乘法(LS) 篩選得到樣本,再通過支持向量機(jī)回歸(SVR),建立高速列車車內(nèi)聲品質(zhì)預(yù)測(cè)模型。
車廂噪聲信號(hào)由數(shù)字人工頭記錄采集,并由LMS Test.lab 軟件同步記錄噪聲數(shù)據(jù)。 每個(gè)測(cè)點(diǎn)記錄4 種不同工況類型的信號(hào),根據(jù)ISO 3381:2005并結(jié)合實(shí)際情況選擇5 個(gè)測(cè)點(diǎn),人工頭在車廂內(nèi)安裝位置如圖1 和圖2 所示。 圖1 中人工頭的站姿高度為1.6 m,圖2 中人工頭的坐姿高度為1.2 m。 采集前用吊錘校準(zhǔn)人耳與車廂地面的垂直度。
圖1 人工頭站姿 Fig.1 Standing pose
圖2 人工頭坐姿Fig.2 Sitting pose
列車不同工況平穩(wěn)運(yùn)行時(shí),原始信號(hào)被記錄,每次記錄時(shí)長(zhǎng)17 s。 根據(jù)實(shí)驗(yàn)需要和標(biāo)準(zhǔn)要求,截取樣本時(shí)長(zhǎng)為5 s,目的是挑選合適的短時(shí)信號(hào),用于評(píng)價(jià)實(shí)驗(yàn)。 本著信號(hào)不重疊的原則,先由原始信號(hào)截取出每種工況下的3 個(gè)樣本,再根據(jù)每個(gè)樣本的A 計(jì)權(quán)值進(jìn)行擬合,常用的擬合方法有插值擬合和曲線擬合,插值擬合適合于理想測(cè)量情況(沒有測(cè)量誤差)的數(shù)據(jù)擬合,曲線插值則允許誤差存在。而在實(shí)際測(cè)量中有不可避免的系統(tǒng)誤差,所以選用曲線擬合。 曲線擬合的原理是最小二乘法原理,即根據(jù)樣本數(shù)據(jù)點(diǎn)擬合后,再反向挑選出與擬合線誤差平方最小的樣本點(diǎn)所在的樣本,即為實(shí)驗(yàn)聽音樣本。 這里對(duì)加速和減速工況下的原始樣本進(jìn)行截取時(shí),雖然速度區(qū)間有差異,但是本質(zhì)都是同一原始信號(hào)截取的,速度作為一個(gè)維度可以進(jìn)行比較。 而且5 s內(nèi)速度變化引起的變化量可以忽略,如勻速240 km/h 情況下,原始信號(hào)的3 個(gè)不同時(shí)間段內(nèi)的樣本點(diǎn)擬合,如圖3 所示。
圖3 同源信號(hào)不同時(shí)間段擬合Fig.3 Fitting of homologous signals of different time periods
目的是明確一階(直線)擬合和二階(曲線)擬合哪種擬合方式得到的擬合殘差平方和更低,即確定樣本中的時(shí)間和聲壓級(jí)之間的函數(shù)關(guān)系。 分別計(jì)算了擬合后各樣本點(diǎn)與擬合點(diǎn)間的殘差平方和,見表1。 由表1 可知,同源不同時(shí)間段的一階擬合殘差平方和最低。 故選擇原始信號(hào)的2~7 s 時(shí)間段作為實(shí)驗(yàn)樣本。 同理,按照此方法依次選取30 個(gè)實(shí)驗(yàn)樣本,得到樣本后分別計(jì)算樣本的聲壓級(jí)、粗糙度、尖銳度、抖動(dòng)度和指數(shù)等心理聲學(xué)參數(shù)值,見表2。
表1 殘差平方和Tab.1 Sum of squares of residuals
表2 樣本的心理聲學(xué)參數(shù)值Tab.2 Psychoacoustic parameter values of samples
首先,設(shè)計(jì)9 級(jí)語義評(píng)分表,結(jié)合數(shù)字等級(jí)評(píng)分法,賦予形容詞數(shù)字屬性,評(píng)分間隔為單位間隔。 在區(qū)分對(duì)聲音的“情感反應(yīng)”和“情感評(píng)價(jià)”的詞匯中,常用的有尖銳度、愉悅度、煩惱度。 尖銳度是可以通過人的分析能力判斷得出的,也就是對(duì)聲音情感上的評(píng)價(jià);而煩惱度在情感表達(dá)上則較復(fù)雜,是對(duì)聲音情感上的反應(yīng),這兩個(gè)都是主觀感覺的量化體現(xiàn)。 但是尖銳度在主觀的基礎(chǔ)上略微偏客觀。主觀評(píng)價(jià)指標(biāo)選擇“煩躁度”,相比于其他噪聲評(píng)價(jià)指標(biāo),高鐵內(nèi)部復(fù)雜噪聲給人帶來的煩躁程度更明顯,同時(shí)還設(shè)置具有“中性感覺”的樣本作為參照,避免評(píng)分差距過大,評(píng)分等級(jí)為“5”,主觀評(píng)價(jià)見表3。 參考聲樣本由課題組聲學(xué)專家在聽完所有樣本后根據(jù)聲學(xué)經(jīng)驗(yàn)選出,選出的所有參照樣本被試聽完后都認(rèn)同這種“中性感覺”。 30 個(gè)聲音打亂順序隨機(jī)呈現(xiàn),聽者獨(dú)自坐在隔音室,待聽者情緒平靜后,被指示用具有9 個(gè)等級(jí)的評(píng)分表對(duì)樣本進(jìn)行打分,從非常嘈雜到非常安靜。 30 個(gè)樣本由21 名評(píng)價(jià)者評(píng)價(jià)打分,21 名評(píng)價(jià)者中有14 位男性,7 位女性,每位評(píng)價(jià)者均沒有聽力障礙。 評(píng)價(jià)實(shí)驗(yàn)后,最終得到30×21 維數(shù)值矩陣,進(jìn)而將抽象復(fù)雜的主觀感受量化成數(shù)值,對(duì)聲音定量判斷的評(píng)價(jià)結(jié)果通常可以作為一個(gè)區(qū)間尺度被認(rèn)可。 評(píng)價(jià)實(shí)驗(yàn)前,對(duì)所有被試進(jìn)行聽音訓(xùn)練,訓(xùn)練的聲音在實(shí)驗(yàn)中不使用,被試會(huì)被告知這些聲音來自高鐵車廂噪聲。
表3 主觀評(píng)價(jià)表Tab.3 Subjective evaluation form
以30 個(gè)樣本作為橫向維度,21 名評(píng)價(jià)者作為縱向維度,并由這21 名評(píng)價(jià)者根據(jù)表3 對(duì)樣本進(jìn)行打分,最終得到30×21 維評(píng)價(jià)結(jié)果數(shù)值矩陣,對(duì)每個(gè)樣本的橫向主觀得分求和,并計(jì)算其算術(shù)平均值。30 個(gè)樣本的煩躁度得分均值,如圖4 所示。
圖4 樣本的實(shí)際得分均值Fig.4 Actual mean scores of the samples
支持向量機(jī)(SVM)是一類按監(jiān)督學(xué)習(xí)方式對(duì)數(shù)據(jù)進(jìn)行二元分類的廣義線性分類器,是建立在統(tǒng)計(jì)學(xué)習(xí)理論VC(Vapanik-Cher-vonenkis)維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小原理的基礎(chǔ)上的。 通過尋求最小結(jié)構(gòu)化風(fēng)險(xiǎn)來提高學(xué)習(xí)機(jī)泛化能力,實(shí)現(xiàn)經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍的最小化,從而達(dá)到在統(tǒng)計(jì)樣本較少的情況下,亦能獲得良好統(tǒng)計(jì)規(guī)律的目的,SVR 在解決小樣本、非線性及高維模式識(shí)別中表現(xiàn)出許多獨(dú)有的優(yōu)勢(shì)。 高速列車本身的特殊構(gòu)造決定列車內(nèi)部噪聲特性的復(fù)雜性,在對(duì)其做評(píng)價(jià)研究過程中,精確的選取噪聲數(shù)據(jù)樣本對(duì)分析心理聲學(xué)參量與評(píng)價(jià)結(jié)果之間的關(guān)系尤為重要,本文用最小二乘法對(duì)截取的車廂噪聲樣本進(jìn)行精確篩選后,再通過SVR預(yù)測(cè)分析,建立高速列車車內(nèi)聲品質(zhì)預(yù)測(cè)的最小二乘法——支持向量機(jī)回歸LS-SVR 評(píng)價(jià)模型。
將SVM 由分類問題推廣至回歸問題可以得到支持向量回歸(SVR)。
由最小二乘法反向篩選出的樣本計(jì)算的客觀參數(shù)和樣本的得分均值組成訓(xùn)練樣本{x,y},1,2,3,…,,x∈R,且∈,對(duì)于傳統(tǒng)回歸模型通常直接基于模型輸出() 與真實(shí)輸出之間的差別來計(jì)算損失,當(dāng)且僅當(dāng)() 與完全相同時(shí),損失才為0。 而SVR 假設(shè)() 與之間最多有的偏差,即僅當(dāng)兩者之間的差別絕對(duì)值大于時(shí)才計(jì)算損失,相當(dāng)于以() 為中心,構(gòu)建了一個(gè)寬度為2的間隔帶,于是SVR 問題可形式化,如式(1)所示:
其中,(,,,…,ω) 為法向量;為正則化常數(shù);l為不敏感損失函數(shù),如式(2)所示:
其中,為自變量,l() 為因變量。
再由式(3)分別對(duì),,ξ和^求偏導(dǎo)為0,可得SVR 的對(duì)偶問題,如式(4)所示:
對(duì)于上述不等式約束優(yōu)化問題,需要滿足前提KKT 條件,KKT 條件是解決最優(yōu)化問題時(shí)用到的約束方法,其一是對(duì)拉格朗日函數(shù)取極值時(shí)的必要條件;其二是對(duì)拉格朗日系數(shù)的約束優(yōu)化;KKT 條件公式表達(dá),如式(5)所示:
在滿足KKT 條件下,將式(2)對(duì)的偏導(dǎo)為0帶入到式(6)可得SVR 解,如式(7)所示:
由于高鐵噪聲中復(fù)雜的聲學(xué)特性,輸入的心理聲學(xué)參數(shù)和輸出的主觀評(píng)價(jià)結(jié)果之間存在復(fù)雜的非線性關(guān)系,所以引入核函數(shù)將原始空間映射到一個(gè)更高維的非線性特征空間進(jìn)行分析,常用的核函數(shù)有線性核、多項(xiàng)式核、高斯核等,由于本文中的樣本數(shù)據(jù)點(diǎn)具有多維度特征,而高斯核函數(shù)具有優(yōu)越的可分性和局域性,因此本文選用更穩(wěn)定且泛化能力更強(qiáng)的高斯核函數(shù),如式(8)所示:
則最后得到SVR 的非線性高維解,如下所示:
以上過程在代碼實(shí)現(xiàn)前,首先要設(shè)置好參數(shù),其中,種群數(shù)量設(shè)置為15;交叉概率設(shè)置為0.8;迭代次數(shù)設(shè)置為100;初始的,,由交叉驗(yàn)證后直接得到默認(rèn)值。 對(duì)原始樣本進(jìn)行多次訓(xùn)練預(yù)測(cè),最終的訓(xùn)練集預(yù)測(cè)結(jié)果如圖5 所示。
圖5 訓(xùn)練集樣本預(yù)測(cè)結(jié)果Fig.5 Training sample prediction results
為了進(jìn)一步驗(yàn)證LS-SVM 模型預(yù)測(cè)結(jié)果的準(zhǔn)確性,再隨機(jī)選取12 個(gè)噪聲樣本作為測(cè)試集,并與傳統(tǒng)多元回歸模型進(jìn)行比較。 12 個(gè)樣本都來自同一數(shù)據(jù)源,測(cè)試集中的數(shù)據(jù)點(diǎn)與訓(xùn)練集樣本中數(shù)據(jù)點(diǎn)的獲取方法相同。 測(cè)試集的預(yù)測(cè)值與實(shí)際值之間的預(yù)測(cè)結(jié)果對(duì)比如圖6 所示。 圖6 中測(cè)試集預(yù)測(cè)的達(dá)到0.85,說明測(cè)試集的預(yù)測(cè)效果較理想。
圖6 測(cè)試集樣本預(yù)測(cè)結(jié)果對(duì)比Fig.6 Comparison of testing sample prediction results
多元線性回歸是用多個(gè)影響因素作為自變量來解釋因變量的變化,通常用來研究自變量與因變量之間的線性關(guān)系。 LS-SVM 預(yù)測(cè)模型與多元回歸模型之間的測(cè)試集預(yù)測(cè)誤差率對(duì)比見表4,可以看出LS-SVM 模型的預(yù)測(cè)誤差率比多元回歸模型低,而且線性回歸模型的預(yù)測(cè)誤差率最大達(dá)到21.9%,進(jìn)而說明高鐵噪聲信號(hào)的心理聲學(xué)特性與主觀評(píng)價(jià)結(jié)果之間的非線性關(guān)系更明確,證明LS-SVM 評(píng)價(jià)模型針對(duì)高鐵噪聲評(píng)價(jià)時(shí)是適用的。
表4 模型測(cè)試集預(yù)測(cè)對(duì)比Tab.4 Comparison of prediction results of testing samples
高速列車車內(nèi)噪聲評(píng)價(jià)預(yù)測(cè)是高鐵噪聲評(píng)價(jià)中極為重要的一部分,不僅可以明確噪聲特性和人耳聽覺之間的關(guān)系,還能對(duì)車內(nèi)聲品質(zhì)的改善提供實(shí)際工程意義。 為得到更精準(zhǔn)的噪聲樣本集,本文首先通過最小二乘法對(duì)截取的噪聲樣本進(jìn)行曲線擬合;再反向挑選出原始樣本的樣本點(diǎn)與擬合點(diǎn)誤差平方和最小的樣本點(diǎn)所在的時(shí)間段,作為實(shí)驗(yàn)樣本。分別計(jì)算實(shí)驗(yàn)樣本的聲壓級(jí)、響度、粗糙度、尖銳度、抖動(dòng)度和AI 指數(shù)6 個(gè)心理聲學(xué)參數(shù)的算術(shù)平均值;結(jié)合語義細(xì)分法,并賦予每個(gè)詞性數(shù)字屬性,建立主觀評(píng)價(jià)表,對(duì)樣本進(jìn)行主觀評(píng)價(jià)實(shí)驗(yàn),得到評(píng)價(jià)結(jié)果;最后,結(jié)合SVR 建立高速列車的車內(nèi)聲品質(zhì)主觀評(píng)價(jià)LS-SVR 預(yù)測(cè)模型,并對(duì)模型進(jìn)行對(duì)比驗(yàn)證。實(shí)驗(yàn)結(jié)果說明LS-SVR 模型針對(duì)高速列車車內(nèi)聲品質(zhì)預(yù)測(cè)是適用有效的。