李亞光,李蒙
(1.華電煤業(yè)集團(tuán)有限公司,北京市 西城區(qū) 100035;2.北京交通大學(xué)機(jī)械與電子控制工程學(xué)院,北京市 海淀區(qū) 100044)
惡劣多變的環(huán)境是風(fēng)力發(fā)電機(jī)故障頻發(fā)的主要原因[1-6]。一般情況下,風(fēng)機(jī)的各個(gè)系統(tǒng)中都安裝有各類狀態(tài)監(jiān)測(cè)傳感器,并由數(shù)據(jù)采集與監(jiān)視控制(supervisory control and data acquisition,SCADA)系統(tǒng)對(duì)監(jiān)測(cè)參數(shù)進(jìn)行記錄和保存[7]。一旦有異常發(fā)生,設(shè)備的故障信息將反饋到多維傳感器參數(shù)中[8]。因此,利用SCADA數(shù)據(jù)進(jìn)行早期異常檢測(cè),將有利于實(shí)現(xiàn)風(fēng)電機(jī)組的狀態(tài)評(píng)估和故障預(yù)警。
通常情況下,故障檢測(cè)與隔離(fault detection and isolation,F(xiàn)DI)的方法有2個(gè)關(guān)鍵過程:1)從復(fù)雜數(shù)據(jù)中提取有效特征;2)利用先驗(yàn)知識(shí)或機(jī)器學(xué)習(xí)技術(shù)實(shí)現(xiàn)故障分類。值得注意的是,這2個(gè)步驟都需要明顯的標(biāo)簽信息(正常或異常標(biāo)簽)作為訓(xùn)練智能分類算法的基本要素[9-10]。但在實(shí)際的風(fēng)機(jī)SCADA系統(tǒng)中,幾乎不可能獲得足夠的標(biāo)簽數(shù)據(jù)。這是因?yàn)檎_\(yùn)行時(shí)間比故障發(fā)生時(shí)間長(zhǎng)很多,導(dǎo)致數(shù)據(jù)稀疏是不可避免的。另外,SCADA的監(jiān)控?cái)?shù)據(jù)和故障信息大多是分開記錄的,它們之間的相關(guān)性只能在故障發(fā)生后由人工來完成。這種非智能化的記錄和分類工作是巨大的,也是不現(xiàn)實(shí)的。因此,利用不完善的無標(biāo)簽數(shù)據(jù)來完成風(fēng)電機(jī)組的FDI任務(wù)充滿了挑戰(zhàn)。
深度學(xué)習(xí)方法[11]以其良好的非線性逼近性能已經(jīng)在數(shù)據(jù)挖掘和智能故障診斷中得到了廣泛應(yīng)用[12]。與淺層神經(jīng)網(wǎng)絡(luò)相比,一些深度學(xué)習(xí)算法[13],如多層感知器、深度神經(jīng)網(wǎng)絡(luò)(deep neural network,DNN)、長(zhǎng)短期記憶網(wǎng)絡(luò)(long-short-term memory,LSTM)和卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)等,均可以模擬人類真實(shí)的學(xué)習(xí)過程,并從數(shù)據(jù)中挖掘有價(jià)值的信息。Jiang等人[14]提出了一種多尺度卷積神經(jīng)網(wǎng)絡(luò),用以有效地學(xué)習(xí)高層故障特征。Yang等人[15]利用LSTM遞歸神經(jīng)網(wǎng)絡(luò)挖掘SCADA信號(hào)中隱藏的時(shí)空關(guān)系,實(shí)現(xiàn)了風(fēng)機(jī)齒輪故障的分類。面對(duì)SCADA系統(tǒng)采集的大量文本數(shù)據(jù),近年來的研究工作創(chuàng)新性地將其轉(zhuǎn)化為圖像或地圖形式,然后利用圖像識(shí)別算法進(jìn)行異常檢測(cè)和識(shí)別。例如,文獻(xiàn)[16-17]將振動(dòng)信號(hào)轉(zhuǎn)換成時(shí)域譜,應(yīng)用CNN提取故障特征。然而,上述網(wǎng)絡(luò)的實(shí)現(xiàn)需要基于有監(jiān)督的和足夠標(biāo)簽的學(xué)習(xí)環(huán)境下進(jìn)行,這在實(shí)際應(yīng)用中卻很難實(shí)現(xiàn)。
使用無監(jiān)督學(xué)習(xí)構(gòu)造的深度神經(jīng)網(wǎng)絡(luò)也相對(duì)成熟[18],相應(yīng)的算法主要包括受限玻爾茲曼機(jī)(restricted Boltzmann machine,RBM)或自動(dòng)編碼器(auto-encoder,AE)。深度置信網(wǎng)絡(luò)(deep belief network,DBN)[19]、去噪自編碼器(denoise auto-encoder,DAE)[20]和堆疊自編碼器(stacked auto-encoder,SAE)[21]是最具代表性的無監(jiān)督深度神經(jīng)網(wǎng)絡(luò)。Qin等[22]用DBN診斷風(fēng)力發(fā)電機(jī)行星齒輪箱故障,提出了改進(jìn)的Logistic-sigmoid單元和脈沖特征法,解決了DBN在反向傳播中容易出現(xiàn)梯度消失的問題。Qin等[23]在多層BP神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上建立了一個(gè)深度SAE網(wǎng)絡(luò),利用來自SCADA系統(tǒng)的方位數(shù)據(jù),通過無監(jiān)督貪婪學(xué)習(xí)對(duì)SAE網(wǎng)絡(luò)神經(jīng)元進(jìn)行逐層訓(xùn)練,再將訓(xùn)練后的權(quán)值作為深度BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值。此外,Zhao等[24]還提出了一種基于多層Boltzmann機(jī)的深度自編碼網(wǎng)絡(luò),以實(shí)現(xiàn)風(fēng)力發(fā)電機(jī)組部件的早期異常檢測(cè)和故障檢測(cè)。
目前,隨著應(yīng)用領(lǐng)域的不斷變化,對(duì)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)進(jìn)行改進(jìn)主要有加深網(wǎng)絡(luò)層次、丟包與丟包連接、批量規(guī)范化等方法。其中,增加非相鄰隱含層之間的連接邊(添加邊)方法是目前神經(jīng)網(wǎng)絡(luò)緩解梯度消失的研究熱點(diǎn)。從網(wǎng)絡(luò)結(jié)構(gòu)上看,通過加邊改進(jìn)使得傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)成為一個(gè)小世界神經(jīng)網(wǎng)絡(luò),已可應(yīng)用于風(fēng)力發(fā)電的功率預(yù)測(cè)[25]和風(fēng)機(jī)變槳系統(tǒng)的故障診斷[26]。因此,本文結(jié)合風(fēng)電機(jī)組的SCADA數(shù)據(jù)特點(diǎn),基于深度自動(dòng)編碼網(wǎng)絡(luò)的原型結(jié)構(gòu),提出一種深度小世界神經(jīng)網(wǎng)絡(luò)(deep small-world neural network,DSWNN),以期進(jìn)一步解決風(fēng)電機(jī)組的早期故障檢測(cè)與預(yù)警問題。未標(biāo)記的風(fēng)電機(jī)組SCADA數(shù)據(jù)被用于預(yù)先訓(xùn)練DSWNN原型以提取隱含特征。通過隨機(jī)加邊法將規(guī)則神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)化為一個(gè)小世界網(wǎng)絡(luò),并在有監(jiān)督的情況下利用標(biāo)記數(shù)據(jù)訓(xùn)練重構(gòu)的DSWNN模型,對(duì)網(wǎng)絡(luò)的全局參數(shù)進(jìn)行微調(diào)。
由于實(shí)際運(yùn)行中風(fēng)速的隨機(jī)變化和干擾,固定的故障判斷閾值往往不合理,容易造成誤報(bào)警。本文提出一種基于極值理論的自適應(yīng)閾值作為異常檢測(cè)判斷的準(zhǔn)則。通過上述方法構(gòu)造的DSWNN模型具有良好的深度挖掘數(shù)據(jù)特性。最后,以風(fēng)力機(jī)變槳系統(tǒng)為例,驗(yàn)證了該方法的有效性和準(zhǔn)確性。
深度自編碼網(wǎng)絡(luò)是一種在輸入層和輸出層之間具有多個(gè)隱含層的深度神經(jīng)網(wǎng)絡(luò)。該網(wǎng)絡(luò)的參數(shù)通過對(duì)輸入數(shù)據(jù)逐層進(jìn)行無監(jiān)督學(xué)習(xí)來初始化,然后利用有監(jiān)督學(xué)習(xí)進(jìn)行微調(diào),在較高的輸出層產(chǎn)生更復(fù)雜的特征,并且學(xué)習(xí)到的復(fù)雜特征將隨著輸入數(shù)據(jù)的變化而保持不變?;谏疃茸跃幋a網(wǎng)絡(luò)結(jié)構(gòu),本文在非相鄰隱含層之間增加了額外的神經(jīng)元連接,進(jìn)而構(gòu)建了由多個(gè)RBM堆棧組成的具有4個(gè)隱含層的深度小世界神經(jīng)網(wǎng)絡(luò),如圖1所示。它的訓(xùn)練過程包括預(yù)訓(xùn)練、小世界轉(zhuǎn)換和微調(diào)3個(gè)階段,用于獲取DSWNN模型的參數(shù)。
圖1 深度小世界神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig. 1 Structure of DSWNN model
DSWNN模型的原型是一個(gè)具有多個(gè)基于特定能量的隨機(jī)RBM的深度自動(dòng)編碼網(wǎng)絡(luò)。圖2所示RBM結(jié)構(gòu)具有一個(gè)可見層和一個(gè)隱含層,其中可見神經(jīng)元與隱含神經(jīng)元完全相連。
圖2 RBM結(jié)構(gòu)Fig. 2 Structure of RBM
多層RBM的訓(xùn)練是在無監(jiān)督環(huán)境下逐層實(shí)現(xiàn)的,可作為DSWNN原型的預(yù)訓(xùn)練過程。經(jīng)過逐層預(yù)訓(xùn)練后得到整個(gè)網(wǎng)絡(luò)的權(quán)值,將被記錄并用作后續(xù)監(jiān)督訓(xùn)練(微調(diào))的優(yōu)先值。
小世界網(wǎng)絡(luò)是介于完全隨機(jī)和完全規(guī)則之間的中間網(wǎng)絡(luò)[27]。應(yīng)用小世界網(wǎng)絡(luò)的特性對(duì)人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行改進(jìn)[28],主要有2種方式:重連變換和加邊變換,如圖3所示。
圖3 小世界網(wǎng)絡(luò)轉(zhuǎn)換的方式Fig. 3 Transformation way of small-world network
以每層4個(gè)神經(jīng)元的4層BP神經(jīng)網(wǎng)絡(luò)為例,重連變換首先隨機(jī)斷開相鄰層神經(jīng)元之間的連接,然后與非相鄰層神經(jīng)元之間隨機(jī)地建立新的連接。而加邊變換沒有斷開過程,它只在不改變?nèi)魏卧歼叺那闆r下在非相鄰層神經(jīng)元之間添加新的連接。新增連接的位置都是隨機(jī)分布在所有網(wǎng)絡(luò)神經(jīng)元之間的,網(wǎng)絡(luò)的隨機(jī)程度用概率p來描述。
式中nad和nor分別為新添加的連接數(shù)和原始連接數(shù)。
圖4給出了從常規(guī)網(wǎng)絡(luò)到隨機(jī)網(wǎng)絡(luò)的隨機(jī)加邊變換過程。當(dāng)p=0或p=1時(shí),網(wǎng)絡(luò)是完全規(guī)則或完全隨機(jī)的。當(dāng)p介于0和1之間時(shí),網(wǎng)絡(luò)具有小世界屬性。因此,利用特征路徑長(zhǎng)度L(p)和聚類系數(shù)C(p)對(duì)小世界結(jié)構(gòu)性質(zhì)進(jìn)行量化,并探討中間區(qū)域(0<p<1)的特性。
圖4 從規(guī)則BP神經(jīng)網(wǎng)絡(luò)到隨機(jī)網(wǎng)絡(luò)的隨機(jī)加邊過程Fig. 4 Random add-edge procedure from a regular BP neural network to a random one
特征路徑長(zhǎng)度L(p)是衡量網(wǎng)絡(luò)中所有連接邊平均長(zhǎng)度的全局性質(zhì),聚類系數(shù)C(p)是描述網(wǎng)絡(luò)中連接邊密度的局部性質(zhì)。圖5顯示了圖1中描述的4個(gè)隱含層DSWNN的L(p)和C(p)隨p變化的規(guī)范化值??梢杂^察到,隨著p的增加,L(p)急劇下降,而C(p)下降相對(duì)緩慢。當(dāng)p接近0.1時(shí),得到了一個(gè)大C(p)和一個(gè)小L(p),這表明DSWNN的拓?fù)浣Y(jié)構(gòu)具有最好的小世界性質(zhì)。因此,新添加的邊連接數(shù)是原始連接數(shù)的10%。
圖5 圖1中描述的4個(gè)隱含層DSWNN的L(p)和C(p)Fig. 5 L(p) and C(p) for the four-hidden-layer DSWNN described in figure 1
本文選擇了加邊變換方法來重建DSWNN模型。假設(shè)DSWNN模型有H(H=1,2,3,…,i,…)個(gè)隱含層,第i個(gè)隱含層有N個(gè)神經(jīng)元,第i+1個(gè)隱含層有M個(gè)神經(jīng)元。當(dāng)p=0時(shí),DSWNN模型是一個(gè)規(guī)則網(wǎng)絡(luò),第i層和i+1層之間的權(quán)重矩陣Wi被描述為
因此,整個(gè)隱含層的連接矩陣W可以表示為
當(dāng)p=0.1時(shí),DSWNN不斷開原始網(wǎng)絡(luò)中的連接,只在非相鄰隱含層中的神經(jīng)元之間生成連接。矩陣W中的對(duì)角線權(quán)重不會(huì)改變,因?yàn)檫B接不會(huì)斷開。整個(gè)隱含層的全局Wa可以表示為
經(jīng)過逐層預(yù)訓(xùn)練和小世界轉(zhuǎn)換后,利用反向傳播有監(jiān)督學(xué)習(xí)BP算法對(duì)DSWNN進(jìn)行微調(diào),并在微調(diào)過程中優(yōu)化隱含層的參數(shù),最終得到了DSWNN模型的全局優(yōu)化參數(shù)。在此過程中,DSWNN模型的初始參數(shù)由訓(xùn)練前參數(shù)(權(quán)值和偏差)和小世界轉(zhuǎn)換得到的連接權(quán)值組成。由于微調(diào)只完成基于這些初始參數(shù)的局部搜索,因此在優(yōu)化過程中大大縮短了收斂時(shí)間。
本文將tanh函數(shù)作為隱含層的激活函數(shù),將Softmax函數(shù)作為頂層分類器的激活函數(shù)。選擇公式(6)中所示的交叉熵[29]作為測(cè)量誤差的代價(jià)函數(shù)C。
式中:k為輸出層中的神經(jīng)元數(shù)量;tk為輸出層期望的輸出標(biāo)簽值;ak為輸出層實(shí)際預(yù)測(cè)值。
RBM訓(xùn)練過程可以看作DSWNN模型權(quán)值參數(shù)的初始化,克服了權(quán)值參數(shù)隨機(jī)初始化容易陷入局部最優(yōu)和訓(xùn)練時(shí)間長(zhǎng)的缺點(diǎn)。對(duì)于故障的檢測(cè),可以使用大量未標(biāo)記的SCADA數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,使用少量標(biāo)記的數(shù)據(jù)進(jìn)行微調(diào)。這樣,訓(xùn)練后的DSWNN比深度自編碼網(wǎng)絡(luò)或BP網(wǎng)絡(luò)更為優(yōu)化。
在異常檢測(cè)中,利用訓(xùn)練好的DSWNN模型預(yù)測(cè)SCADA信號(hào)的未來值,并利用預(yù)測(cè)值與實(shí)際值之間的預(yù)測(cè)誤差EP來判斷異常。定義為
式中:X為SCADA數(shù)據(jù)的當(dāng)前值;X^為DSWNN模型的預(yù)測(cè)輸出。
一般來說,設(shè)定閾值并將其與EP進(jìn)行比較是評(píng)估風(fēng)電機(jī)組是否發(fā)生故障的最常用和最有效的方法。風(fēng)機(jī)正常運(yùn)行時(shí),SCADA信號(hào)均在閾值范圍內(nèi)。一旦出現(xiàn)異常,這些監(jiān)測(cè)信號(hào)之間的隱式關(guān)系將被打破,一個(gè)或多個(gè)信號(hào)值將突然超過閾值發(fā)出報(bào)警。確定異常情況的規(guī)則定義為
式中Rth是閾值。
然而,閾值的設(shè)置范圍往往很廣,且經(jīng)常在初次設(shè)置后保持不變。一方面,閾值內(nèi)的故障將無法診斷;另一方面,隨機(jī)風(fēng)速引起的一些偶然波動(dòng)將被誤診為故障。因此,本文提出了一種基于極值理論的自適應(yīng)閾值估計(jì)方法,用于監(jiān)測(cè)EP的變化趨勢(shì),檢測(cè)EP的異常變化。
假設(shè)X1,X2,…,Xn是分布函數(shù)為F(x)的獨(dú)立隨機(jī)變量的n個(gè)樣本向量。每個(gè)樣本向量Xi在一段時(shí)間內(nèi)包含一定數(shù)量的值。Mn=max(X1,X2,…,Xn)表示n個(gè)樣本向量的最大值。對(duì)于一組Mn,概率分布函數(shù)可以描述為
式中:an和bn分別是比例參數(shù)和位置參數(shù);β是形狀參數(shù)。
大量正常的SCADA數(shù)據(jù)被用來訓(xùn)練DSWNN模型,也被用來計(jì)算EP值。由于數(shù)據(jù)大多為正態(tài)分布,EP的均值是穩(wěn)定的,但其方差數(shù)據(jù)應(yīng)該是非平穩(wěn)的。因此,比例參數(shù)an和位置參數(shù)bn分別表示為:
式中:δ0和δt均為常值系數(shù);g(t)是描述受不斷變化的SCADA數(shù)據(jù)影響的可變運(yùn)行條件的函數(shù)。然后,用于確定警告的最終自適應(yīng)閾值可以通過以下方法計(jì)算:
式中:ρ為置信度,由累積分布函數(shù)法計(jì)算而得;參數(shù)an、bn和β可通過最大似然估計(jì)方法來獲得。
為了測(cè)試所提出DSWNN模型的性能,在故障識(shí)別、預(yù)測(cè)和分類方面做實(shí)例分析。實(shí)驗(yàn)數(shù)據(jù)來源于某風(fēng)電場(chǎng)30臺(tái)2 MW風(fēng)電機(jī)組一年的SCADA系統(tǒng)數(shù)據(jù)。另外,為了增加對(duì)比度,采用了經(jīng)典DBN和DNN模型作為對(duì)比測(cè)試方法。俯仰故障主要分為俯仰傳感器故障和執(zhí)行器故障。變槳傳感器故障是由編碼器盤上的灰塵、葉片變槳軸承調(diào)整不正確、溫度和濕度超出可接受范圍或校準(zhǔn)不當(dāng)引起的。葉片變槳距傳感器和執(zhí)行器的這些故障經(jīng)常出現(xiàn),導(dǎo)致轉(zhuǎn)子不平衡引起汽輪機(jī)結(jié)構(gòu)負(fù)荷,影響浮動(dòng)平臺(tái)的穩(wěn)定性。這些故障主要與俯仰角、俯仰力矩、俯仰電機(jī)等信號(hào)有關(guān)。用于訓(xùn)練DSWNN、DBN和DNN模型的特定監(jiān)控SCADA參數(shù)如表1所示。
表1 風(fēng)機(jī)變槳系統(tǒng)監(jiān)測(cè)參數(shù)Tab. 1 Monitoring parameters of wind turbine pitch system
風(fēng)力機(jī)的3個(gè)葉片具有3組獨(dú)立同步的變槳驅(qū)動(dòng)裝置。當(dāng)風(fēng)速突然變化,葉片需要頻繁改變槳距角時(shí),3個(gè)槳距驅(qū)動(dòng)器的同步動(dòng)作失效往往導(dǎo)致多個(gè)故障同時(shí)發(fā)生。表2記錄了2017年1月1日發(fā)生的多次報(bào)警記錄。經(jīng)證實(shí),主要原因是3個(gè)葉片的俯仰動(dòng)作經(jīng)后期維護(hù)后不同步。這種故障是由典型的機(jī)械磨損引起的,其故障特征將隱藏在SCADA數(shù)據(jù)中。因此,所監(jiān)測(cè)的相關(guān)信號(hào)可以表示為
表2 風(fēng)機(jī)變槳系統(tǒng)故障報(bào)警記錄Tab. 2 Fault alarm record of wind turbine pitch system
使用數(shù)據(jù)集XA訓(xùn)練DSWNN、DBN和DNN模型,然后使用記錄的故障SCADA數(shù)據(jù)計(jì)算預(yù)測(cè)的均方誤差,結(jié)果見圖6。
從圖6(c)可以看出,在時(shí)間t3之前,DSWNN獲得的預(yù)測(cè)誤差在自適應(yīng)閾值范圍內(nèi)波動(dòng)。但t3后,誤差接近其上限,然后逐漸超過其上限。根據(jù)表2報(bào)警記錄,第一個(gè)名為“俯仰角1不同步”的故障發(fā)生在07:58:12。這意味著DSWNN可以在實(shí)際停機(jī)時(shí)間前大約3 h檢測(cè)到異常,從而為俯仰系統(tǒng)的維護(hù)提供了足夠的時(shí)間。對(duì)比圖6(a)和圖6(b)可知,DNN和DBN模型分別可以提前1.1 h和2.3 h預(yù)測(cè)出故障,均比本文所提出的DSWNN模型預(yù)測(cè)時(shí)間短。此外,DSWNN模型的計(jì)算誤差在3種模型中也最小,說明DSWNN模型可以從正常的SCADA數(shù)據(jù)中提取更充分的動(dòng)態(tài)特征。因此,一方面,用DSWNN模型來描述俯仰系統(tǒng)的動(dòng)態(tài)特性更為準(zhǔn)確,且可更早地檢測(cè)出早期故障。另一方面,自適應(yīng)閾值可以有效地跟蹤預(yù)測(cè)誤差,以提高預(yù)測(cè)模型的適應(yīng)性,為系統(tǒng)減少誤報(bào)和漏報(bào)提供了更準(zhǔn)確的判斷依據(jù)。
圖6 故障預(yù)測(cè)誤差Fig. 6 Fault prediction error
為了驗(yàn)證所提出的多故障分類方法的準(zhǔn)確性,根據(jù)SCADA系統(tǒng)的實(shí)際報(bào)警信息,選取了9個(gè)典型或頻繁的基本故障作為分類目標(biāo)。表3列出了具體的故障,其中F1~F9表示9個(gè)故障報(bào)警,F(xiàn)10表示無故障狀態(tài)。同樣,采用DBN和DNN作為比較模型,3個(gè)模型采用相同的網(wǎng)絡(luò)結(jié)構(gòu):1)輸入神經(jīng)元數(shù)量為12個(gè),對(duì)應(yīng)于表1中描述的12維參數(shù);2)輸出神經(jīng)元數(shù)量為10個(gè),分別對(duì)應(yīng)于表3中的10個(gè)分類;3)3種模型均選擇5個(gè)隱含層,每層30個(gè)神經(jīng)元。具體而言,DSWNN模型在預(yù)訓(xùn)練過程中有5個(gè)RBM,小世界轉(zhuǎn)換過程中的概率設(shè)為p=0.1。與DSWNN相比,DBN模型沒有小世界轉(zhuǎn)換的過程,它只包括2個(gè)過程:預(yù)訓(xùn)練和微調(diào)。DNN模型是一種標(biāo)準(zhǔn)的多層前向神經(jīng)網(wǎng)絡(luò),其訓(xùn)練過程遵循誤差反向傳播原理。
表3 故障列表Tab. 3 Fault list
在數(shù)據(jù)準(zhǔn)備方面,將實(shí)驗(yàn)數(shù)據(jù)分為20 000段訓(xùn)練數(shù)據(jù)和6 000段驗(yàn)證數(shù)據(jù)。此外,每個(gè)故障類別都包含一定數(shù)量的故障數(shù)據(jù),數(shù)據(jù)分布如表4所示。值得注意的是,提供的所有數(shù)據(jù)片段都是根據(jù)相應(yīng)的故障類型進(jìn)行標(biāo)記的。在模型訓(xùn)練過程中,DSWNN和DBN首先由去掉標(biāo)簽的數(shù)據(jù)片段進(jìn)行預(yù)訓(xùn)練,然后用這些標(biāo)簽的數(shù)據(jù)片段進(jìn)行微調(diào)。簡(jiǎn)單地說,神經(jīng)網(wǎng)絡(luò)模型使用所有標(biāo)記數(shù)據(jù)進(jìn)行訓(xùn)練和驗(yàn)證,這些訓(xùn)練和驗(yàn)證是在有監(jiān)督的環(huán)境下進(jìn)行的。
表4 實(shí)驗(yàn)數(shù)據(jù)的分配Tab. 4 Confusion information of the experimental data
圖7給出了3個(gè)模型的分類精度。通過與混淆矩陣中所示的錯(cuò)誤分類條件比較,神經(jīng)網(wǎng)絡(luò)模型可以很容易地判斷F3、F5、F6和F8的錯(cuò)誤,因?yàn)檫@些真實(shí)的否定會(huì)導(dǎo)致嚴(yán)重的后果。F3、F5為電氣故障,其發(fā)生具有較強(qiáng)的隨機(jī)性和偶然性。F6和F8與槳距角有關(guān),而槳距角應(yīng)該由風(fēng)速、風(fēng)力、槳距角編碼器和葉根扭矩等監(jiān)測(cè),這些故障的原因是隨機(jī)風(fēng)速對(duì)葉片的影響很大。診斷上述故障的基本要求是,所使用的分類算法應(yīng)具有從多個(gè)運(yùn)行數(shù)據(jù)中挖掘隱含特征的能力。
圖7 3種神經(jīng)網(wǎng)絡(luò)對(duì)10種故障分類精度的比較Fig. 7 Comparison of three neural networks in classification accuracy of 10 types of faults
然而,這正是神經(jīng)網(wǎng)絡(luò)模型所缺乏的,因?yàn)樗木W(wǎng)絡(luò)參數(shù)是由隨機(jī)初始化產(chǎn)生的,沒有任何理論基礎(chǔ)。眾所周知,參數(shù)直接影響分類結(jié)果。DSWNN和DBN模型使用了預(yù)訓(xùn)練來獲得更好的網(wǎng)絡(luò)參數(shù),并且它們對(duì)所有故障的分類精度都比DNN模型顯示出更好的性能(見圖7(b)和7(c))。但故障F4和F5的診斷準(zhǔn)確率也有所下降,這可能是由訓(xùn)練數(shù)據(jù)中缺乏故障數(shù)據(jù)所致。
此外,還同時(shí)記錄了3個(gè)模型在訓(xùn)練過程中的全局變化誤差,如圖8所示。從圖中可以看出,DSWNN、DBN和DNN的收斂時(shí)間分別為255、210、168 s。DSWNN的計(jì)算時(shí)間最長(zhǎng),這是因?yàn)樗陬A(yù)訓(xùn)練和微調(diào)之間有一個(gè)小世界轉(zhuǎn)換過程。在0~110 s間隔內(nèi),DSWNN和DBN的訓(xùn)練誤差幾乎達(dá)到階段穩(wěn)定,這是因?yàn)榫W(wǎng)絡(luò)處于訓(xùn)練前階段,其多個(gè)RBM達(dá)到了能量守恒。在110~130 s范圍內(nèi),DSWNN和DBN由無監(jiān)督訓(xùn)練變?yōu)橛斜O(jiān)督訓(xùn)練,訓(xùn)練誤差突然減小,出現(xiàn)新的低收斂值。在124 s時(shí),DSWNN的訓(xùn)練誤差在短時(shí)間內(nèi)增加,這是由小世界轉(zhuǎn)換后網(wǎng)絡(luò)結(jié)構(gòu)中增加的邊的附加權(quán)值引起的。DSWNN重新跟蹤隨機(jī)的新添加邊,導(dǎo)致短期誤差增加。
圖8 DSWNN、DBN和DNN的訓(xùn)練誤差Fig. 8 Training error of DSWNN, DBN, and DNN
提出了一種基于無監(jiān)督學(xué)習(xí)的風(fēng)電機(jī)組早期異常檢測(cè)DSWNN模型。DSWNN模型是深度自編碼網(wǎng)絡(luò)和小世界神經(jīng)網(wǎng)絡(luò)的有效結(jié)合,可以更準(zhǔn)確地模擬風(fēng)力發(fā)電機(jī)的動(dòng)態(tài)行為?;趯?shí)際案例的仿真分析得出如下結(jié)論:
1)自適應(yīng)閾值能夠有效地跟蹤預(yù)測(cè)誤差,減少誤報(bào)。因此,所提出的基于極值理論的自適應(yīng)閾值方法可以應(yīng)用于風(fēng)電機(jī)組的實(shí)時(shí)監(jiān)測(cè),減少風(fēng)速波動(dòng)和外界干擾對(duì)風(fēng)電機(jī)組異常檢測(cè)的影響。
2)與DBN和DNN算法相比,DSWNN模型具有更小、更準(zhǔn)確的預(yù)測(cè)誤差,證明了DSWNN模型具有深度網(wǎng)絡(luò)特征和更好的學(xué)習(xí)能力。
3)結(jié)合DSWNN模型和自適應(yīng)閾值,能夠提前3 h預(yù)測(cè)變槳距系統(tǒng)故障,可用于后續(xù)的風(fēng)電機(jī)組異常檢測(cè)和故障診斷。