王華秋,王 斌
(1.重慶理工大學 兩江人工智能學院, 重慶 401135; 2.重慶理工大學 計算機科學與工程學院, 重慶 400054)
空氣壓縮機是一種用來壓縮空氣的設備,種類多樣,其中螺桿式空壓機已成為當今空氣壓縮機發(fā)展的新主流[1]。螺桿式空氣壓縮機具有結構簡單、易損件少、配件更換方便、噪聲小及運轉安全可靠、單級壓比大、效率高等優(yōu)點[2]。因而其在工業(yè)生產中的應用越來越廣泛,又因其在生產中的廣泛應用,各種故障也時常出現,逐漸受到人們的關注。如果在空壓機的運行過程中出現了問題,而不能及時發(fā)現,將會帶來各種無法預計的后果與損失。因此,對空壓機運行狀態(tài)的監(jiān)控、研究與分析對于空壓機的正常運行,保障生產生活的持續(xù)良好進行意義重大。
文獻[3]對空壓機運行過程中的各種故障做了分析,其中排氣溫度異常是一個十分常見的運行故障現象。對于空壓機排氣溫度的監(jiān)測主要還是基于傳統(tǒng)的傳感器和設置固定的故障閾值。文獻[4]使用云推理的方法預測葉絲干燥筒壁溫度,而文獻[5]在對冷水機組運行性能的預測中使用了基于改進BP神經網絡的方法。因此,如果在空壓機的運行狀態(tài)監(jiān)測方引入一些基于數據的機器學習方法,就能有效提高監(jiān)測的效率與準確性。
2006年,Hinton等學者開啟了深度學習的浪潮[6]。所謂深度學習,其本質目的是提取特征,手段是通過大規(guī)模的數據樣本對復雜的網絡模型進行訓練,以此來提高預測和分類精度。深度信念網絡屬于深度學習技術的一種,它是由Hinton等學者提出。這種網絡利用受限玻爾茨曼機(RBM)組成深度神經網絡,同時將訓練分為預訓練和微調兩部分,解決了一些傳統(tǒng)的神經網絡所具有的深層網絡訓練困難、易陷入局部最優(yōu)以及需要大量的帶標記的訓練樣本的缺點。在語音、文字識別方面已有許多應用方向與實際案例,同時在故障監(jiān)測、診斷方面也有許多應用[7]。本文將深度信念網絡的優(yōu)勢應用于空壓機排氣溫度預測,提出一種新的空壓機排氣溫度監(jiān)測方法,以實現空壓機運行過程中的異常監(jiān)測。
深度信念網絡(deep belief network,DBN)是一種典型的深度學習(Deep Learning)方法[8]。它由多個神經元疊加而成,其組成元件是受限制玻爾茲曼機(RBM),同時也屬于一種概率生成模型。RBM是一種神經感知器,由一個可視層和一個隱藏層構成,可視層與隱藏層的神經元之間為雙向全連接。其中,任意兩個相連的神經元之間有一個權值表示其連接強度。同時,每個RBM的隱藏層作為下一個RBM的可視層,并最終構建成整個網絡。圖1是由3個RBM組成的深度信念網絡。深度信念網絡的整個訓練過程分為無監(jiān)督的預訓練和有監(jiān)督的微調兩部分。
圖1 深度信念網絡結構
預訓練是使用未進行標注的數據集對每一層受限制玻爾茲曼機分別進行單獨訓練,然后自下而上,把下層受限制玻爾茲曼機隱藏層作為上層受限制玻爾茲曼機的可視層繼續(xù)訓練??傮w來說,它是通過一個非監(jiān)督貪婪逐層方法進行預訓練獲得權重[9]。
設定RBM中可視層與隱藏層神經元都只有激活與未激活兩種狀態(tài),分別用1與0表示。給定一組狀態(tài)(v,h)表示可視層與隱藏層,則一個有n個可視層和m個隱藏層的RBM的能量函數可定義為:
(1)
式中θ={w,b,a}是RBM的參數,vi表示可視層的狀態(tài),hj表示隱藏層的狀態(tài),bi表示可視層的偏置,aj表示隱藏層的偏置,wij則表示連接可視層和隱藏層的權重。
基于該能量函數定義一個可視層與隱藏層的聯(lián)合概率分布為
(2)
其中Z為歸一化因子,公式為
可得聯(lián)合概率分布P(v,h;θ)的邊際分布為
(3)
使用最大似然估計法對上式進行最大化求得RBM參數θ,然后應用對比散度方法求出RBM的參數θ={w,b,a},更新規(guī)則為:
Δwij=ε(〈vihj〉P(h|v)-〈vihj〉recon)
(4)
Δbi=ε(〈vi〉P(h|v)-〈vi〉recon)
(5)
Δaj=ε(〈hj〉P(h|v)-〈hj〉recon)
(6)
式中:ε為學習率,〈·〉P(h|v)代表P(h|v)分布下偏導函數的極限,〈·〉recon表示重構模型分布下的偏導函數的極限。
當預訓練完成后,網絡會獲得一個較好的網絡初始值,但這還不是最優(yōu)的,所以需要對網絡進行微調。具體做法是:利用反向傳播神經網絡(BP),將其設置在深度信念網絡的最后一層,將最后的RBM的隱藏層即輸出層作為BP的輸入層,然后利用有標簽的數據集進行由下至頂的有監(jiān)督的訓練,實現對深度信念網絡在預訓練階段生成的參數進行優(yōu)化微調,使模型更加準確。深度信念網絡巧妙地將無監(jiān)督與有監(jiān)督學習合二為一,優(yōu)勢互補,避免了BP網絡容易陷入局部極小的弊端,同時縮短了收斂時間,加快了訓練速度。
深度網絡的難點體現在網絡的訓練過程中[10],學習率、權值初始化、網絡層數、單層神經元數等訓練參數對模型起決定性的影響。其中,學習率的設定特別重要,傳統(tǒng)的方法是人工設定,往往并非最佳設定。后果學習率是設定太高可能導致無法收斂,而學習率設定太低又會造成學習速度太慢,增加了實驗的成本。為解決這一問題,提高DBN的性能,本文引入了一種基于動態(tài)學習率的DBN訓練方法。所謂動態(tài)學習率,就是在RBM結構的訓練過程中,自適應動態(tài)調整學習率。其具體內容如下:
根據前后的重構誤差自適應調整學習率,定義P(h|v)分布下偏導函數的極限〈·〉P(h|v),重構模型分布下的偏導函數的極限〈·〉recon之間的誤差為:
Ω=〈·〉P(h|v)-〈·〉recon
(7)
將學習率更新為:
(8)
其中,λ是學習率的調整系數,而參數更新規(guī)則可改為:
(9)
(10)
(11)
其中,γ為更新過程的慣性系數,可以減少學習過程中的震動,使其更加穩(wěn)定。t表示在參數更新序列中本次更新的參數,t-1則表示上次更新的參數。
為了建立基于DBN的空壓機排氣溫度預測模型,需要先確定參與模型建立的具體參數。因為該空壓機運行參數眾多,若要降低模型的復雜程度同時降低訓練量,另外為了剔除一些相關性太低的參數對模型的影響,需要對各參數與空壓機排氣溫度的相關性進行分析,然后選取相關性較高的參數參與建模。
在一般研究中,常用Pearson相關性系數做相關性分析[11],其計算公式為
(12)
利用一段時間的空壓機正常運轉數據對各項參數與空壓機排氣溫度進行相關性分析,得到各參數的相關系數。通常情況下相關系數在1.0~0.8為極強相關,0.8~0.6則是強相關,0.6~0.4是中等相關,而0.4~0就只是弱相關到不相關。因此,取其中相關系數大于0.4的參數作為模型輸入變量,最后得到7個相關性較強的參數如表1所示。
表1 參數相關性系數
將上面選取的7個相關性較高的運行參數作為底層的輸入層,然后構建基于深度信念網絡的空壓機排氣溫度模型。深度信念網絡的結構主要參數是網絡層數以及每層網絡的具體神經元個數。為了使模型的預測精度達到最優(yōu),需要對網絡使用枚舉法,以確定每個參數的最佳值。因此,在本文實驗中,選取了2018年6月19日到25日的空壓機運轉數據作為訓練集,一方面用于試驗確定空壓機溫度模型的具體網絡結構參數;另一方面用于模型參數確定后的模型訓練。經過多次實驗以及參考文獻[12]的參數選取方法后確定了最優(yōu)的模型網絡結構參數,其具體結構為4層,包括底部的輸入層,中間的兩個隱含層以及頂部的輸出層,每層具體神經元數量為7-25-5-1。
在確定了模型具體結構后,使用選取的數據集作為訓練樣本,對模型進行訓練。隨著訓練周期的不斷增加,模型預測結果的準確率也在增加且增長趨勢逐漸變緩。最后,根據模型準確率以及訓練時間成本的考慮,確定訓練周期為200。之后選取2018年6月26日到30日的數據作為測試數據集,對模型進行預測準確率的具體測試。
另外,為了確定基于DBN模型的方法是否有更好的效果,分別使用基于BP神經網絡、SVM算法、RBF神經網絡的方法進行溫度預測。最后,將基于DBN方法的結果與以上3種方法進行對比。圖2和圖3分別表示了4種預測方法的具體預測值以及預測殘差。
圖2 模型預測結果對比
圖3 模型預測殘差特性對比
由圖2、3可以看出:在空壓機的正常運轉過程中,基于DBN的模型預測方法的預測值與實際值之間的距離明顯小于基于BP神經網絡、SVM算法、RBF神經網絡的模型預測方法的預測值與實際值之間的偏離程度,基于DBN的預測方法殘差明顯更小。
另外,為了更直觀地表現幾種預測方法的預測效果,使用回歸預測的3個常用評估指標平均標準誤差(MAE)、平均平方誤差(MSE)、平均百分比誤差(MAPE)來對4種預測方法進行效果評估,對比結果如表2所示。從表2的對比結果可以看出:因BP神經網絡易陷入局部極小,故預測精度較低;而SVM方法與RBF神經網絡方法雖也有較高的精度,但因為基于DBN的預測方法是一種深度學習方法,能夠利用深度模型提取更復雜的參數關系,因此能獲得更為精確的預測結果。
當使用以上模型預測出排氣溫度后要對其值是否異常進行確定,因此需要確定一個故障閾值用以監(jiān)測運行過程中的異常變化。本文選取了核密度估計的方法用以確定故障閾值,其具體監(jiān)測機制是在得到模型預測溫度之后,才能得到預測值的殘差特性,然后檢查其是否超出了設定好的故障閾值。當其超出故障閾值后,就可以激發(fā)后續(xù)的一系列告警、通知、維護措施。使用核密度估計方法,可以估計一個序列分布的密度函數。本文就是通過對模型預測殘差特性序列進行核密度估計從而獲得其密度函數,然后根據密度函數可以得到所需的故障閾值。
表2 模型預測性能評估
因為缺少豐富詳細的空壓機異常運行數據,于是進行故障模擬。具體方法是通過對測試樣本數據中實際的排氣溫度值逐個添加0.01度的累計溫度偏移。該方法的目的是為了模擬排氣溫度異常情況中的排氣溫度過高以及其溫度逐漸升高的過程。分別使用4種方法進行溫度預測,4種方法的預測殘差以及故障閾值如圖4所示。
圖4 殘差值與故障閾值
通過圖4的比較可以看出:隨著排氣溫度實際值不斷增高即模擬的故障程度不斷增強,預測結果的殘差值也不斷變大。可以發(fā)現4種方法都檢測出了異常故障的發(fā)生,但明顯基于深度信念網絡的方法最早達到了預設的故障閾值。因此說,基于深度信念網絡的方法能夠較早發(fā)現空壓機運行過程中的異常情況,驗證了本文所提方法是準確、有效的。
針對螺桿式空壓機排氣溫度異常故障的監(jiān)測,本文提出了一種基于深度信念網絡的螺桿式空壓機排氣溫度監(jiān)測方法。經過實驗分析模型具體參數,選取了合適的模型結構,構建了基于深度信念網絡的空壓機排氣溫度預測模型。采用核密度估計方法對空壓機的故障閾值進行了設定,并利用模擬故障的方式對模型進行了對比測試。在基于BP神經網絡的方法的測試中可以看出:本文提出的基于深度信念網絡的方法更為高效、準確,能夠準確、及時地發(fā)現空壓溫度異常,明顯優(yōu)于基于BP神經網絡、SVM算法、RBF神經網絡的預測方法,說明本方法性能優(yōu)異、預測有效。另一方面,本方法有很好的拓展性,經過修改與優(yōu)化可以進一步應用于空壓機其他故障的監(jiān)測與診斷,甚至可應用于與空壓機類似的其他機械裝置的故障監(jiān)測與診斷。