唐宇思, 王偉豪, 崔漢國(guó), 劉樹(shù)勇, 柴 凱
(1.海軍工程大學(xué) 動(dòng)力工程學(xué)院,武漢 430033; 2.海軍工程大學(xué) 艦船與海洋學(xué)院,武漢 430033)
混沌振動(dòng)信號(hào)快速識(shí)別是混沌應(yīng)用的關(guān)鍵問(wèn)題,國(guó)內(nèi)外學(xué)者開(kāi)展了深入研究。Robinson[1]利用Poincaré截面將復(fù)雜的動(dòng)力系統(tǒng)轉(zhuǎn)化到低維的空間中進(jìn)行研究,從而深入、直觀地展示了系統(tǒng)全局動(dòng)力學(xué)特點(diǎn);Mcdonough等[2]提出了周期軌道檢測(cè)法,其主要思想是通過(guò)統(tǒng)計(jì)吸引子中的短周期軌道重復(fù)的時(shí)長(zhǎng)來(lái)識(shí)別混沌信號(hào),但該方法容易受到噪聲影響;廖明等[3]通過(guò)計(jì)算功率譜是否具有1/f特征來(lái)判斷時(shí)間序列是否混沌;任輝等[4]研究了學(xué)習(xí)向量量化(learning vector quantization,LVQ)對(duì)Jeffcott轉(zhuǎn)子碰摩模型的非線性混沌時(shí)間序列的分類(lèi)能力,實(shí)現(xiàn)了對(duì)這類(lèi)混沌信號(hào)和其它響應(yīng)信號(hào)數(shù)據(jù)的聚類(lèi),為非線性信號(hào)分類(lèi)識(shí)別提供了一種方法;江亞?wèn)|等[5]在對(duì)混沌時(shí)間序列與隨機(jī)序列的不同特征進(jìn)行分析的基礎(chǔ)上,給出了一種基于小波神經(jīng)網(wǎng)絡(luò)的混沌時(shí)間序列判定-預(yù)測(cè)算法;Xie等[6]應(yīng)用辛幾何譜方法對(duì)非線性時(shí)間序列中的確定性機(jī)制進(jìn)行識(shí)別,該方法比傳統(tǒng)的奇異值分解(singular value decomposition, SVD)法更能揭示信號(hào)的本質(zhì)特征;席劍輝等[7]運(yùn)用擴(kuò)展卡爾曼濾波算法的跟蹤辨識(shí)特性,實(shí)現(xiàn)了對(duì)混沌系統(tǒng)主動(dòng)態(tài)方程的參數(shù)識(shí)別和多變量混沌序列的精確預(yù)測(cè)。
然而在信號(hào)的實(shí)時(shí)識(shí)別過(guò)程中,上述方法都存在計(jì)算量大、耗費(fèi)時(shí)間長(zhǎng)等問(wèn)題,特別是在艦艇輻射水聲混沌譜控制過(guò)程中,由于系統(tǒng)工況變化,需要實(shí)時(shí)調(diào)整混沌參數(shù)、控制區(qū)域時(shí),傳統(tǒng)方法不能為在線調(diào)整提供快速識(shí)別。近年來(lái)興起的深度卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural network,DCNN)模型在圖像識(shí)別領(lǐng)域獲得巨大成功,引起人們的極大關(guān)注[8]。因分類(lèi)準(zhǔn)確率高、響應(yīng)速度快,DCNN同樣適用于振動(dòng)信號(hào)的識(shí)別?;谝陨显?,本文設(shè)計(jì)了一種針對(duì)振動(dòng)信號(hào)分類(lèi)的DCNN模型,可實(shí)現(xiàn)混沌信號(hào)的快速識(shí)別。
Fukushima[9]首次將互相關(guān)運(yùn)算引入神經(jīng)網(wǎng)絡(luò),開(kāi)啟了利用卷積神經(jīng)網(wǎng)絡(luò)處理圖像的新紀(jì)元。典型的DCNN結(jié)構(gòu)如圖1所示。其構(gòu)建了多個(gè)能夠提取輸入數(shù)據(jù)特征的卷積層,通過(guò)共享權(quán)重和空間下采樣來(lái)獲得輸入數(shù)據(jù)平移及縮放不變的特征表示,最后利用多層全連接神經(jīng)網(wǎng)絡(luò)對(duì)特征分類(lèi),輸出分類(lèi)結(jié)果。
圖1 典型的DCNN結(jié)構(gòu)
(1)
在卷積運(yùn)算前,為了保證每次運(yùn)算后卷積層的寬度不至于縮減過(guò)小,對(duì)輸入數(shù)據(jù)的前后做補(bǔ)全(pad)運(yùn)算。同時(shí)為了用較少的權(quán)重元素來(lái)感知較大坐標(biāo)范圍的輸入,對(duì)卷積核進(jìn)行膨脹(dilate)。設(shè)輸入數(shù)據(jù)每行前補(bǔ)全Pr個(gè)元素,每列前補(bǔ)全Pc個(gè)元素,采樣步幅(stride)為S,膨脹系數(shù)為d,式(1)改進(jìn)為
(2)
其中,當(dāng)X的下標(biāo)小于1或大于其自身尺寸時(shí),表示補(bǔ)全的元素。為了便于計(jì)算,將輸入數(shù)據(jù)添加一個(gè)數(shù)值全為1的通道,從而用這一通道的權(quán)值矩陣表示偏置B。因此,式(2)進(jìn)一步優(yōu)化為
(3)
為了引入非線性特征,在卷積運(yùn)算后,將每個(gè)元素輸入一個(gè)非線性的激活函數(shù),激活后的值作為卷積層的輸出。常用的激活函數(shù)為整流線性單元(rectified linear units, ReLU),其數(shù)學(xué)表達(dá)式為
f(x)=max{0,x}
(4)
為了使用某一位置相鄰輸出的總體統(tǒng)計(jì)特征來(lái)代替網(wǎng)絡(luò)在該位置的輸出,設(shè)置了池化(pooling)操作。常用函數(shù)為最大池化函數(shù),即給出相鄰矩形區(qū)域內(nèi)的最大值,其數(shù)學(xué)表達(dá)式為
(5)
DCNN應(yīng)用多個(gè)卷積層完成對(duì)輸入數(shù)據(jù)的特征提取,然后利用全連接層(fully connected layer)對(duì)特征進(jìn)行分類(lèi)。全連接層中的每一級(jí)運(yùn)算可表示為
z=g(wTx+b)
(6)
(7)
式中,i=0,1,…,n,n為分類(lèi)數(shù)量。
由于DCNN在直接用于處理一維的振動(dòng)信號(hào)時(shí),不僅需要確定時(shí)間序列的采樣點(diǎn)數(shù),還要通過(guò)加大卷積核的尺寸來(lái)獲得序列前后的關(guān)聯(lián)特征,將導(dǎo)致網(wǎng)絡(luò)收斂過(guò)慢和過(guò)擬合問(wèn)題。因此,本文通過(guò)對(duì)二維混沌吸引子的特征提取來(lái)識(shí)別信號(hào)。首先通過(guò)相空間重構(gòu)(phase space reconstruction)[10]獲得振動(dòng)信號(hào)的相空間吸引子,再利用DCNN對(duì)信號(hào)的吸引子圖分類(lèi),不僅有利于DCNN的建模,還能清晰地突顯故障狀態(tài)下的系統(tǒng)動(dòng)力學(xué)特征,從而提高模型分類(lèi)的準(zhǔn)確率。
對(duì)于時(shí)間序列x,在坐標(biāo)系pOq中,使用延遲重構(gòu)法得到的吸引子圖,可以表示為一組直線段方程
(8)
式中,τ為延遲時(shí)間。為了滿足卷積神經(jīng)網(wǎng)絡(luò)的輸入要求,需要將吸引子圖映射到一個(gè)大小為W×H的二維像素圖,表示為張量A,即對(duì)矢量圖形做柵格化(rasterization)處理。計(jì)算圖形的橫向采樣序列r和縱向采樣序列c,以r為例
(9)
(10)
若kn>1或xn-xn+1=0,則將變量r和c,w和h位置互換,重復(fù)上述計(jì)算。最終得到輸入卷積模型的數(shù)據(jù)
(11)
卷積層和全連接層的設(shè)計(jì)參照AlexNet[11]的結(jié)構(gòu)參數(shù),并加入dropout層[12]來(lái)防止過(guò)擬合??紤]到識(shí)別吸引子圖時(shí),不存在物體與背景的邊緣識(shí)別問(wèn)題,因此減小前兩層的通道數(shù)以獲得更好的性能。全連接層的分類(lèi)識(shí)別中,由于本文需要實(shí)現(xiàn)的振動(dòng)信號(hào)分類(lèi)數(shù)量遠(yuǎn)小于AlexNet設(shè)計(jì)的分類(lèi)數(shù)量(1 000),因此逐層減小神經(jīng)元數(shù)量,從而減少特征冗余并防止過(guò)擬合。
根據(jù)以上闡述,設(shè)計(jì)模型結(jié)構(gòu)如圖2所示。
圖2 模型結(jié)構(gòu)示意圖
DCNN中各個(gè)神經(jīng)元的權(quán)重系數(shù)不能直接求得準(zhǔn)確解,本文通過(guò)標(biāo)簽數(shù)據(jù)對(duì)模型的訓(xùn)練得到最優(yōu)值,并利用批量梯度下降法訓(xùn)練模型。
(12)
利用Adam(adaptive moment estimation)算法[13]來(lái)更新網(wǎng)絡(luò)參數(shù),即權(quán)重和偏置。其本質(zhì)是梯度隨機(jī)目標(biāo)函數(shù)優(yōu)化算法,通過(guò)基于低階矩的自適應(yīng)估計(jì),從而自適應(yīng)調(diào)整學(xué)習(xí)率,可達(dá)到良好的訓(xùn)練效果。
設(shè)計(jì)如下不同的仿真信號(hào)
y1=sin 15πt
(13)
(14)
y3=(1+sin πt)·sin 25πt-1
(15)
τ≤t<τ+1
(16)
(17)
式中,t≥0,τ∈(N)。對(duì)上述5個(gè)信號(hào)進(jìn)行采樣,采樣頻率為1 kHz,采樣點(diǎn)數(shù)為10 000,得到時(shí)間序列xi,(i=1,2,3,4,5)。對(duì)混沌信號(hào),采用Lorenz系統(tǒng)
(18)
應(yīng)用Runge-Kutta法求解式(18),步長(zhǎng)為0.01,舍去前3 000個(gè)點(diǎn),取x分量的10 000個(gè)離散值作為序列x6。得到的6組仿真信號(hào)如圖3所示。
圖3 仿真信號(hào)時(shí)域圖
應(yīng)用第一最小互信息法[14]求延遲時(shí)間,重構(gòu)仿真信號(hào)的相平面吸引子圖,如圖4所示。
圖4 仿真信號(hào)的吸引子圖
為了提高分類(lèi)模型的魯棒性,在原信號(hào)中疊加噪聲信號(hào),生成多個(gè)數(shù)據(jù)樣本。具體步驟為:
步驟1選取采樣信號(hào)的第2 001~4 000點(diǎn)作為初始樣本。
步驟2針對(duì)每個(gè)樣本,隨機(jī)生成100個(gè)均值為0,方差為s(0≤s≤S)的高斯噪聲序列
(10)
式中:E(x2)為樣本序列的均方值;RSN為信噪比(signal noise ratio,SNR),這里設(shè)RSN=20。將這些噪聲序列疊加到樣本中,共得到600個(gè)不同的含噪樣本。
步驟3將600個(gè)樣本按照14∶3∶3的比例隨機(jī)劃分為訓(xùn)練集,驗(yàn)證集和測(cè)試集,得到的數(shù)據(jù)集如表1所示。
表1 仿真信號(hào)數(shù)據(jù)集
模型訓(xùn)練的參數(shù)設(shè)置如下。學(xué)習(xí)率(learning rate):0.000 1;批尺寸(batch size):420,即全數(shù)據(jù)集輸入;迭代次數(shù)(epoch):80。每迭代一次后,更新模型參數(shù),計(jì)算模型在測(cè)試集上的損失值和準(zhǔn)確率,以及模型在驗(yàn)證集上的準(zhǔn)確率。訓(xùn)練過(guò)程中,模型的訓(xùn)練損失、訓(xùn)練準(zhǔn)確率和測(cè)試準(zhǔn)確率如圖5所示。
(a) 損失函數(shù)隨迭代次數(shù)增加而逐漸下降
由圖5可知:損失函數(shù)隨迭代次數(shù)的增加而減小,經(jīng)過(guò)80次迭代之后,最終趨近于0;訓(xùn)練集和驗(yàn)證集的分類(lèi)準(zhǔn)確率隨迭代次數(shù)增加波動(dòng)上升,在迭代次數(shù)超過(guò)60次后,穩(wěn)定收斂到100%。用測(cè)試集中的樣本檢驗(yàn)訓(xùn)練后的模型,分類(lèi)準(zhǔn)確率如表2所示。
表2 仿真信號(hào)分類(lèi)準(zhǔn)確率
不難看出,本文所提模型對(duì)6類(lèi)仿真信號(hào)均能準(zhǔn)確識(shí)別。
本文采用雙勢(shì)阱單端磁吸式混沌振動(dòng)裝置[15]生成多種振動(dòng)信號(hào),試驗(yàn)裝置原理圖如圖6所示。該裝置通過(guò)調(diào)節(jié)激勵(lì)幅值和激勵(lì)頻率,能夠觀察到系統(tǒng)中出現(xiàn)的次諧波現(xiàn)象、超諧波現(xiàn)象以及系統(tǒng)中周期1運(yùn)動(dòng)的不同模式,并能在一定頻率和激勵(lì)幅值條件下產(chǎn)生持續(xù)穩(wěn)定的混沌振動(dòng)。
圖6 雙勢(shì)阱單端磁吸式混沌振動(dòng)裝置結(jié)構(gòu)圖
前期試驗(yàn)發(fā)現(xiàn),激振系統(tǒng)增益大于0.95時(shí),系統(tǒng)的動(dòng)力學(xué)行為非常豐富,可以產(chǎn)生包括混沌振動(dòng)在內(nèi)的不同模式。本節(jié)試驗(yàn)將激振系統(tǒng)的增益固定為 1,由小到大增加系統(tǒng)的激勵(lì)頻率,得到20組試驗(yàn)信號(hào),其中混沌信號(hào)10組,非混沌信號(hào)10組,采樣頻率為2 kHz,采樣時(shí)長(zhǎng)為5 s。部分信號(hào)及其吸引子圖如圖7所示。
圖7 部分試驗(yàn)信號(hào)時(shí)域圖及吸引子圖
為了得到更多的數(shù)據(jù)樣本,對(duì)采集到的信號(hào)作數(shù)據(jù)增強(qiáng)處理后,再劃分?jǐn)?shù)據(jù)集。具體步驟為:
步驟1選取試驗(yàn)信號(hào)采樣點(diǎn)的[(i-1)·S+1,(i-1)·S+L]段作為數(shù)據(jù)樣本,這里令S=600,L=3 200,共獲得80個(gè)信號(hào)樣本。
步驟3將這1 560個(gè)樣本按照14∶3∶3的比例隨機(jī)劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,得到的數(shù)據(jù)集如表3所示。
表3 試驗(yàn)信號(hào)數(shù)據(jù)集
模型訓(xùn)練參數(shù)為:學(xué)習(xí)率:0.000 05;批尺寸:546;迭代次數(shù):200。由于數(shù)據(jù)集尺寸過(guò)大,每一次迭代數(shù)據(jù)需要分兩批依次訓(xùn)練,每批數(shù)據(jù)訓(xùn)練完后更新模型參數(shù),每迭代一次后,計(jì)算模型在測(cè)試集上的損失值和準(zhǔn)確率,以及模型在驗(yàn)證集上的準(zhǔn)確率。訓(xùn)練過(guò)程中,模型的訓(xùn)練損失、訓(xùn)練準(zhǔn)確率和測(cè)試準(zhǔn)確率如圖8所示。
(a) 損失函數(shù)隨迭代次數(shù)增加而逐漸下降
由圖8可知,損失函數(shù)隨迭代次數(shù)的增加而減小,經(jīng)過(guò)200次迭代之后,最終趨近于0;訓(xùn)練集和驗(yàn)證集的分類(lèi)準(zhǔn)確率隨迭代次數(shù)增加波動(dòng)上升,在迭代次數(shù)超過(guò)150次后,測(cè)試準(zhǔn)確率穩(wěn)定收斂到100%,驗(yàn)證準(zhǔn)確率在98.72%和99.15%之間波動(dòng)。用測(cè)試集中的樣本檢驗(yàn)訓(xùn)練后的模型,分類(lèi)準(zhǔn)確率如表4所示。
表4 試驗(yàn)信號(hào)分類(lèi)準(zhǔn)確率
試驗(yàn)表明,本文所提模型能夠快速準(zhǔn)確識(shí)別混沌信號(hào)。
(1) 針對(duì)混沌振動(dòng)信號(hào)識(shí)別中傳統(tǒng)方法難以快速識(shí)別的問(wèn)題,提出了一種基于相空間重構(gòu)和深度卷積神經(jīng)網(wǎng)絡(luò)的智能識(shí)別方法。針對(duì)卷積神經(jīng)網(wǎng)絡(luò)對(duì)二維圖像識(shí)別能力強(qiáng)的特點(diǎn),利用時(shí)間延遲法將振動(dòng)信號(hào)映射到二維像素圖中,隨后基于AlexNet設(shè)計(jì)DCNN模型對(duì)得到的像素圖進(jìn)行分類(lèi)識(shí)別。與傳統(tǒng)的計(jì)算混沌特征指數(shù)的方法相比,所提方法計(jì)算量小、識(shí)別速度快,可有效地應(yīng)用于混沌信號(hào)的實(shí)時(shí)識(shí)別。
(2) 通過(guò)試驗(yàn)數(shù)據(jù)測(cè)試,所提方法能達(dá)到98%以上的識(shí)別準(zhǔn)確率,響應(yīng)快、實(shí)時(shí)性好。因此,在工程實(shí)際中具有極強(qiáng)的潛在應(yīng)用價(jià)值。