李杰其 ,胡良兵
1.中國(guó)科學(xué)院 合肥物質(zhì)科學(xué)研究院 等離子體物理研究所,合肥 230031
2.中國(guó)科學(xué)技術(shù)大學(xué),合肥 230026
在工業(yè)中,設(shè)備維護(hù)是很重要的環(huán)節(jié),直接影響到設(shè)備的運(yùn)行時(shí)間和設(shè)備的工作效率。然而,設(shè)備剩余壽命需要被準(zhǔn)確預(yù)測(cè),故障需要被及時(shí)識(shí)別和處理,才能避免在生產(chǎn)過(guò)程中停機(jī)。根據(jù)文獻(xiàn)[1]所述,可將維護(hù)策略分為如下三類(lèi)。
(1)故障維護(hù):一種簡(jiǎn)單的維護(hù)策略,設(shè)備發(fā)生故障時(shí)停止生產(chǎn)并更換零件。單一零件的突然失效會(huì)導(dǎo)致相關(guān)零件的故障率上升,增加生產(chǎn)成本。
(2)預(yù)防性維護(hù):一種定期執(zhí)行的維護(hù)策略,通過(guò)計(jì)劃時(shí)間表或生產(chǎn)經(jīng)驗(yàn),以預(yù)測(cè)過(guò)程、設(shè)備故障。但是由于可能會(huì)采取不必要的維護(hù)措施,導(dǎo)致成本增加。
(3)預(yù)測(cè)性維護(hù):使用預(yù)測(cè)工具對(duì)設(shè)備的剩余壽命進(jìn)行預(yù)測(cè),這種方法要求對(duì)機(jī)器狀態(tài)或運(yùn)行過(guò)程進(jìn)行持續(xù)監(jiān)控,需要?dú)v史數(shù)據(jù)處理(例如機(jī)器學(xué)習(xí)技術(shù))、完整性因素分析(例如視覺(jué)方面、磨損、不同于原始顏色等)、統(tǒng)計(jì)推斷方法和工程方法的推理,所以這種方法可以預(yù)測(cè)設(shè)備早期的故障并提供解決方案。
每種維護(hù)方式各有特色,選擇故障維護(hù)策略會(huì)使得維護(hù)行為具有滯后性,設(shè)備發(fā)生風(fēng)險(xiǎn)性很高;選擇預(yù)防性維護(hù)策略,這種預(yù)見(jiàn)性維護(hù)的干預(yù)會(huì)導(dǎo)致設(shè)備的使用時(shí)間下降。高效的維護(hù)策略可以改善設(shè)備的狀況,降低設(shè)備故障率,降低維護(hù)成本,同時(shí)延長(zhǎng)設(shè)備壽命。預(yù)測(cè)性維護(hù)是通過(guò)對(duì)設(shè)備狀態(tài)實(shí)施周期性監(jiān)視、預(yù)測(cè)剩余壽命、評(píng)價(jià)設(shè)備狀況和產(chǎn)生相應(yīng)邏輯的一套技術(shù)。傳統(tǒng)的預(yù)測(cè)性維護(hù)方法主要是基于物理模型,基本思想是基于物理性質(zhì)的固定的物理公式去擬合設(shè)備、零部件的健康狀態(tài)或壽命。這種方法要求研究人員有很深的工程物理背景知識(shí),通常采用復(fù)雜的物理公式,借助于過(guò)多的物理模型而忽略了數(shù)據(jù)本身的規(guī)律,預(yù)測(cè)準(zhǔn)確度較低。
目前,伴隨著5G 技術(shù)的工業(yè)4.0 時(shí)代到來(lái),工業(yè)系統(tǒng)可以采集大量的數(shù)據(jù),包括工業(yè)生產(chǎn)線(xiàn)的運(yùn)行過(guò)程、發(fā)生的事件和報(bào)警信息等。預(yù)測(cè)性維護(hù)系統(tǒng)可對(duì)設(shè)備數(shù)據(jù)進(jìn)行系統(tǒng)分析和處理,建立和訓(xùn)練預(yù)測(cè)模型,制定維護(hù)策略并及時(shí)調(diào)整,可以有效地降低維修成本、減少機(jī)器故障、減少維修停機(jī)、減少備件庫(kù)存、增加備件壽命、增加產(chǎn)量、提高操作員的安全性、提升維修驗(yàn)證可靠性、提升整體利潤(rùn)等。人工智能中的機(jī)器學(xué)習(xí)已經(jīng)成為許多應(yīng)用中開(kāi)發(fā)智能預(yù)測(cè)算法的有力工具。
機(jī)器學(xué)習(xí),通過(guò)自主學(xué)習(xí)大量數(shù)據(jù)中存在的規(guī)律,獲得新經(jīng)驗(yàn)和知識(shí)從而提高計(jì)算機(jī)智能,使得計(jì)算機(jī)擁有類(lèi)似人類(lèi)的決策能力?;趯W(xué)習(xí)形式的不同通常可將機(jī)器學(xué)習(xí)算法分為監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)以及強(qiáng)化學(xué)習(xí)三類(lèi)。
(1)監(jiān)督學(xué)習(xí):給學(xué)習(xí)算法提供標(biāo)記的數(shù)據(jù)和所需的輸出,對(duì)于每一個(gè)輸入,學(xué)習(xí)者都被提供了一個(gè)回應(yīng)的目標(biāo)。監(jiān)督學(xué)習(xí)被用于解決分類(lèi)和回歸的問(wèn)題。常見(jiàn)的算法有:決策樹(shù)、人工神經(jīng)網(wǎng)絡(luò)算法、支持向量機(jī)、樸素貝葉斯、隨機(jī)森林等。
(2)無(wú)監(jiān)督學(xué)習(xí):給學(xué)習(xí)算法提供的數(shù)據(jù)是未標(biāo)記的,并且要求算法識(shí)別輸入數(shù)據(jù)中的模式,主要是建立一個(gè)模型,對(duì)輸入的數(shù)據(jù)進(jìn)行解釋?zhuān)⒂糜谙麓屋斎?。主要用于解決聚類(lèi)和降維問(wèn)題,常見(jiàn)的算法有:聚類(lèi)算法、降維算法。
(3)強(qiáng)化學(xué)習(xí):該算法與動(dòng)態(tài)環(huán)境相互作用,把環(huán)境的反饋?zhàn)鳛檩斎?,通過(guò)學(xué)習(xí)選擇能達(dá)到其目標(biāo)的最優(yōu)動(dòng)作。強(qiáng)化學(xué)習(xí)這一方法背后的數(shù)學(xué)原理與監(jiān)督、非監(jiān)督學(xué)習(xí)略有差異。監(jiān)督、非監(jiān)督學(xué)習(xí)更多地應(yīng)用了統(tǒng)計(jì)學(xué),而強(qiáng)化學(xué)習(xí)更多地結(jié)合了離散數(shù)學(xué)、隨機(jī)過(guò)程這些數(shù)學(xué)方法[2]。常見(jiàn)的算法有:馬爾可夫決策過(guò)程等。
作為人工智能的核心,機(jī)器學(xué)習(xí)的主要功能是使得計(jì)算機(jī)模擬或?qū)崿F(xiàn)人類(lèi)的學(xué)習(xí)行為,通過(guò)獲取新的信息,不斷對(duì)模型進(jìn)行訓(xùn)練以提高模型的泛化能力[3]。由于機(jī)器學(xué)習(xí)具有強(qiáng)大的數(shù)據(jù)處理能力,該方法廣泛應(yīng)用于數(shù)據(jù)挖掘、語(yǔ)音識(shí)別、計(jì)算機(jī)視覺(jué)、故障診斷與壽命預(yù)測(cè)等領(lǐng)域?;跈C(jī)器學(xué)習(xí)的剩余壽命預(yù)測(cè)方法是預(yù)測(cè)性維護(hù)方法的一個(gè)重要分支,能夠較為準(zhǔn)確地對(duì)剩余壽命進(jìn)行預(yù)測(cè),成為維護(hù)策略評(píng)估的重要指標(biāo)。
建立用于預(yù)測(cè)性維護(hù)應(yīng)用的機(jī)器學(xué)習(xí)模型包括以下幾個(gè)步驟:歷史數(shù)據(jù)選擇;數(shù)據(jù)預(yù)處理;模型選擇、模型訓(xùn)練和模型驗(yàn)證;模型維護(hù)[4]。歷史數(shù)據(jù)選擇,即收集和存儲(chǔ)設(shè)備運(yùn)行過(guò)程中產(chǎn)生的數(shù)據(jù)集,以便為機(jī)器學(xué)習(xí)模型設(shè)計(jì)選擇有價(jià)值的數(shù)據(jù),其目的是獲取與系統(tǒng)狀況相關(guān)的信息[5]。通過(guò)數(shù)據(jù)預(yù)處理步驟,對(duì)數(shù)據(jù)進(jìn)行處理和分析收集的數(shù)據(jù),可以使系統(tǒng)更好地解釋數(shù)據(jù)。數(shù)據(jù)預(yù)處理步驟包括數(shù)據(jù)轉(zhuǎn)換(標(biāo)準(zhǔn)化)、數(shù)據(jù)清理(缺失數(shù)據(jù)處理和異常值去除)和數(shù)據(jù)縮減(維度縮減和數(shù)量縮減),以保證數(shù)據(jù)能夠被機(jī)器學(xué)習(xí)模型有效地處理。模型的開(kāi)發(fā)步驟包括:選擇模型、訓(xùn)練模型、驗(yàn)證模型。模型維護(hù)可以隨著時(shí)間的推移保持模型性能,因?yàn)楣I(yè)生產(chǎn)可能會(huì)隨著時(shí)間的推移而發(fā)生變化,導(dǎo)致模型性能下降。
機(jī)器學(xué)習(xí)算法在壽命預(yù)測(cè)中應(yīng)用最多是基于神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、聚類(lèi)算法和隨機(jī)森林,并在這些算法的基礎(chǔ)上靈活運(yùn)用其他算法或模型進(jìn)行優(yōu)化改進(jìn),從而提高壽命預(yù)測(cè)的精度。
人工神經(jīng)網(wǎng)絡(luò)是受生物神經(jīng)元啟發(fā)的智能計(jì)算技術(shù)[6],是一種模仿動(dòng)物神經(jīng)網(wǎng)絡(luò)行為特征,進(jìn)行分布式并行信息處理的算法數(shù)學(xué)模型。這種網(wǎng)絡(luò)依靠系統(tǒng)的復(fù)雜程度,通過(guò)調(diào)整內(nèi)部大量節(jié)點(diǎn)之間相互連接的關(guān)系,從而達(dá)到處理信息的目的,具有自動(dòng)學(xué)習(xí)和總結(jié)的能力。其主要包含輸入層、隱含層及輸出層,常用于解決分類(lèi)、回歸等問(wèn)題。人工神經(jīng)網(wǎng)絡(luò)模型以原始測(cè)量數(shù)據(jù)或基于原始測(cè)量數(shù)據(jù)所提取的特征為輸入,通過(guò)一定的訓(xùn)練算法不斷調(diào)整網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù),利用優(yōu)化后的網(wǎng)絡(luò)在線(xiàn)預(yù)測(cè)設(shè)備的剩余壽命,并根據(jù)預(yù)測(cè)結(jié)果判斷設(shè)備的維護(hù)策略。
Biswal等人[7]采用人工神經(jīng)網(wǎng)絡(luò)提出一種用于模擬風(fēng)力渦輪機(jī)的模型,該模型能夠模擬風(fēng)力渦輪機(jī)關(guān)鍵部件的故障工況,也可以用缺陷的部件替換健康的部件,從而收集健康和故障工況下的渦輪機(jī)的振動(dòng)數(shù)據(jù),再通過(guò)人工神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè),對(duì)設(shè)備健康狀態(tài)進(jìn)行預(yù)測(cè)識(shí)并別決定維護(hù)策略,實(shí)驗(yàn)結(jié)果準(zhǔn)確性為92.6%。Gebraeel 等人[8]基于BP 神經(jīng)網(wǎng)絡(luò)建立單個(gè)軸承和批量軸承的壽命預(yù)測(cè)模型,利用壽命周期內(nèi)的振動(dòng)監(jiān)測(cè)信息,以一定權(quán)重融合各軸承指數(shù)回歸模型參數(shù),同時(shí)進(jìn)行參數(shù)在線(xiàn)更新,有效保證壽命預(yù)測(cè)的準(zhǔn)確性。Bezazi等人[9]采用基于多層感知器的人工神經(jīng)網(wǎng)絡(luò)對(duì)復(fù)合材料結(jié)構(gòu)監(jiān)測(cè)數(shù)據(jù)進(jìn)行建模,通過(guò)極大似然估計(jì)和貝葉斯推理對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,結(jié)果表明該模型具有較好的泛化能力。Wang 等人[10]提出一種極限學(xué)習(xí)機(jī)模型,避免隱含層神經(jīng)元的數(shù)目選擇問(wèn)題,實(shí)現(xiàn)了非平穩(wěn)序列的在線(xiàn)預(yù)測(cè)。Kolokas等人[11]使用運(yùn)行期間的過(guò)程傳感器數(shù)據(jù),實(shí)時(shí)檢測(cè)某工業(yè)陽(yáng)極生產(chǎn)設(shè)備的實(shí)時(shí)故障,并將人工神經(jīng)網(wǎng)絡(luò)與其他機(jī)器學(xué)習(xí)進(jìn)行了比較。Sheng等人[12]針對(duì)齒輪壽命預(yù)測(cè)問(wèn)題,提出一種基于權(quán)值放大的長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò),并加入一種將隱含層的輸入權(quán)值和遞歸權(quán)值進(jìn)行不同程度放大的注意機(jī)制,結(jié)果表明預(yù)測(cè)方法具有更高的精度。更多基于人工神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)性維護(hù)研究的最新論文見(jiàn)表1。
基于人工神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)性維護(hù)技術(shù)的主要優(yōu)勢(shì)包括:訓(xùn)練模型基于歷史數(shù)據(jù),不需要專(zhuān)家知識(shí)決策;人工神經(jīng)網(wǎng)絡(luò)的穩(wěn)定性較強(qiáng),數(shù)據(jù)的少量波動(dòng)不會(huì)影響模型。
然而,人工神經(jīng)網(wǎng)絡(luò)有一些缺點(diǎn):訓(xùn)練模型有概率獲得有悖于維護(hù)策略的結(jié)論;為獲得最合適的人工神經(jīng)網(wǎng)絡(luò)模型,可能會(huì)花費(fèi)很多時(shí)間;人工神經(jīng)網(wǎng)絡(luò)是一種“黑箱”算法,無(wú)法對(duì)神經(jīng)網(wǎng)絡(luò)模型輸出的預(yù)測(cè)結(jié)果進(jìn)行解釋?zhuān)蝗斯ど窠?jīng)網(wǎng)絡(luò)需要大量的數(shù)據(jù)集才能正確學(xué)習(xí)。
支持向量機(jī)是執(zhí)行分類(lèi)和回歸任務(wù)的另一種廣泛使用的機(jī)器學(xué)習(xí)方法,具有高精度[19]。它是一類(lèi)按監(jiān)督學(xué)習(xí)方式對(duì)數(shù)據(jù)進(jìn)行二元分類(lèi)的廣義線(xiàn)性分類(lèi)器,其決策邊界是對(duì)學(xué)習(xí)樣本求解的最大邊距超平面,具有稀疏性和穩(wěn)健性。支持向量機(jī)可以通過(guò)核方法進(jìn)行非線(xiàn)性分類(lèi),是常見(jiàn)的核學(xué)習(xí)方法之一。支持向量機(jī)根據(jù)用途可分為支持向量回歸機(jī)SVR和支持向量分類(lèi)機(jī)SVC。
Susto 等人[20]提出基于支持向量機(jī)的多類(lèi)分類(lèi)器,可以識(shí)別由于累積效應(yīng)和違規(guī)使用而在機(jī)器上發(fā)生的故障。Nieto等人[21]提出一種基于混合粒子群優(yōu)化算法和支持向量機(jī)算法的模型,用于預(yù)測(cè)航天器發(fā)動(dòng)機(jī)的工況,解決了支持向量機(jī)訓(xùn)練過(guò)程中超參數(shù)的優(yōu)化問(wèn)題,提高了設(shè)備工況預(yù)測(cè)精度。Maior等人[22]提出一種將經(jīng)驗(yàn)?zāi)B(tài)分解與支持向量機(jī)相結(jié)合的方法,可以實(shí)現(xiàn)退化數(shù)據(jù)分析和剩余壽命預(yù)測(cè),結(jié)果表明該方法能夠改善電動(dòng)機(jī)的剩余壽命預(yù)測(cè)性能。Mathew等人[23]使用改進(jìn)回歸核的支持回歸向量的支持向量機(jī)來(lái)預(yù)測(cè)剩余壽命,通過(guò)一組模擬時(shí)間序列對(duì)算法進(jìn)行測(cè)試,其結(jié)果表明所提出的支持向量回歸模型優(yōu)于標(biāo)準(zhǔn)支持向量回歸模型。Song等人[24]采用支持向量機(jī)對(duì)電池容量進(jìn)行預(yù)測(cè),利用卡爾曼濾波對(duì)輸出信號(hào)進(jìn)行優(yōu)化,該方法減少了系統(tǒng)噪聲和測(cè)量不確定性因素的影響,實(shí)現(xiàn)了對(duì)電池剩余壽命的長(zhǎng)期預(yù)測(cè)。Lasisi 等人[25]比較了支持向量機(jī)、隨機(jī)森林和三層貝葉斯概率模型來(lái)檢測(cè)鐵路軌道的缺陷。戴邵武等人[26]提出基于時(shí)域特征和支持向量機(jī)的滾動(dòng)軸承退化趨勢(shì)預(yù)測(cè)方法,準(zhǔn)確地預(yù)測(cè)了滾動(dòng)軸承全壽命故障周期。王瀛洲等人[27]提出一種基于蟻獅優(yōu)化和支持向量回歸的方法,利用蟻獅優(yōu)化算法優(yōu)化核參數(shù),有效提高鋰離子電池剩余使用壽命預(yù)測(cè)的準(zhǔn)確性和魯棒性。Liu等人[28]利用支持向量機(jī)建立了橡膠材料疲勞壽命預(yù)測(cè)模型,提出一種重力搜索算法來(lái)優(yōu)化支持向量機(jī)的參數(shù),提升了預(yù)測(cè)精度和預(yù)測(cè)效率。更多基于支持向量機(jī)的預(yù)測(cè)性維護(hù)研究的最新論文見(jiàn)表2。
支持向量機(jī)算法的優(yōu)勢(shì)在于:學(xué)習(xí)過(guò)程簡(jiǎn)單、訓(xùn)練速度快;在預(yù)測(cè)性維護(hù)中可以解決設(shè)備工況識(shí)別問(wèn)題,簡(jiǎn)單分類(lèi)問(wèn)題處理較為精確;在參數(shù)優(yōu)化方面可以結(jié)合先進(jìn)的算法進(jìn)行優(yōu)化,提高分類(lèi)準(zhǔn)確率。
但支持向量機(jī)也存在一些問(wèn)題:選擇合適的核函數(shù)較為困難;在進(jìn)行大規(guī)模數(shù)據(jù)訓(xùn)練時(shí)間時(shí)間較長(zhǎng);最終模型不容易理解和解釋?zhuān)粚?shí)際應(yīng)用與仿真模型相適應(yīng)比較困難[34];無(wú)法解決多分類(lèi)問(wèn)題;理論上只能提供次優(yōu)解。
聚類(lèi)是一種無(wú)監(jiān)督的學(xué)習(xí)算法,可以對(duì)大量未知標(biāo)注的數(shù)據(jù)集,按數(shù)據(jù)的內(nèi)在相似性將數(shù)據(jù)集劃分為多個(gè)類(lèi)別,主要目的是找到數(shù)據(jù)集的聚類(lèi),以便彼此接近的樣本與同一個(gè)聚類(lèi)相關(guān)聯(lián),而彼此遠(yuǎn)離的樣本與不同的聚類(lèi)相關(guān)聯(lián)[29]。傳統(tǒng)的聚類(lèi)算法可以分為五類(lèi):基于劃分的聚類(lèi)、基于網(wǎng)格的聚類(lèi)、基于層次的聚類(lèi)、基于密度的聚類(lèi)、基于模型的聚類(lèi)。近年來(lái)產(chǎn)生了多種新的聚類(lèi)算法:基于粒度的聚類(lèi)算法、基于熵的聚類(lèi)算法、不確定聚類(lèi)算法、譜聚類(lèi)算法、核聚類(lèi)算法等[35]。
表1 人工神經(jīng)網(wǎng)絡(luò)在預(yù)測(cè)性維護(hù)中的最新應(yīng)用
表2 支持向量機(jī)在預(yù)測(cè)性維護(hù)中的最新應(yīng)用
Durbhaka 等人[36]通過(guò)對(duì)振動(dòng)信號(hào)使用聚類(lèi)來(lái)分析風(fēng)力渦輪機(jī)的工況,預(yù)測(cè)渦輪機(jī)的工況并對(duì)故障類(lèi)型進(jìn)行分類(lèi),通過(guò)對(duì)零部件的替換和校正,進(jìn)而避免突然故障,通過(guò)加入CRA方法,使得聚類(lèi)算法預(yù)測(cè)準(zhǔn)確性達(dá)到93%。Eke等人[37]提出聚類(lèi)算法可以用于自動(dòng)提取變壓器絕緣油中溶解氣體數(shù)據(jù)中的簇,識(shí)別導(dǎo)致故障的每個(gè)集群的特征,使用聚類(lèi)算法識(shí)別出四個(gè)聚類(lèi):高能電弧放電、油溫變化、生成氣體速率、油液循環(huán)周期,結(jié)果表明該模型可以較好預(yù)測(cè)設(shè)備工況。Mathew等人[38]比較多種機(jī)器學(xué)習(xí)(聚類(lèi)算法、支持向量機(jī)等)來(lái)預(yù)測(cè)渦輪風(fēng)扇發(fā)動(dòng)機(jī)的故障,并給出各種方法的優(yōu)缺點(diǎn)。Uhlmann等人[39]提出一種聚類(lèi)算法來(lái)識(shí)別機(jī)床數(shù)據(jù)(平臺(tái)溫度、處理室中氧氣百分比和處理室壓力)的簇,識(shí)別數(shù)據(jù)中的四個(gè)聚類(lèi):操作條件、氣體保護(hù)系統(tǒng)的故障條件、壓力系統(tǒng)的故障條件以及使機(jī)床保持待機(jī)狀態(tài)的故障條件。Amruthnath等人[40]比較大量聚類(lèi)算法,用于從排氣風(fēng)扇的振動(dòng)數(shù)據(jù)中進(jìn)行故障預(yù)測(cè),獲得較為準(zhǔn)確的結(jié)果。張旺等人[41]提出了首先對(duì)雙通道信號(hào)分別進(jìn)行Hilbert 包絡(luò)解調(diào)去除噪聲,對(duì)處理后的信號(hào)進(jìn)行全矢融合提取主振矢,再采用聚類(lèi)方法對(duì)主振矢信號(hào)進(jìn)行分析,解決了軸承突發(fā)故障特征并不明顯的問(wèn)題,其預(yù)測(cè)精度達(dá)到90.64%。李媛媛等人[42]提出采用模糊C均值算法,并以待測(cè)狀態(tài)隸屬于正常狀態(tài)的程度作為性能評(píng)判指標(biāo)的方法,解決了轉(zhuǎn)盤(pán)軸承剩余壽命預(yù)測(cè)過(guò)程中的提取能夠反映轉(zhuǎn)盤(pán)軸承壽命狀態(tài)的特征向量和建立合理的預(yù)測(cè)模型問(wèn)題,為轉(zhuǎn)盤(pán)軸承的故障診斷和剩余壽命預(yù)測(cè)的研究提供了一種新思路。更多基于聚類(lèi)算法的預(yù)測(cè)性維護(hù)研究的最新論文見(jiàn)表3。
聚類(lèi)算法可以通過(guò)新樣本再訓(xùn)練來(lái)改變簇的中心,在處理大數(shù)據(jù)集上表現(xiàn)出良好的性能;聚類(lèi)問(wèn)題的研究趨勢(shì)將會(huì)向更快、更有理論保證的方向發(fā)展,隨著新的分析技術(shù)的發(fā)展,新的理論結(jié)果依然在不斷出現(xiàn),有良好的發(fā)展前景[47]。
但其也存在一些問(wèn)題:訓(xùn)練數(shù)據(jù)中的噪聲會(huì)對(duì)最終結(jié)果造成重大影響;無(wú)法自動(dòng)確定簇的數(shù)量;數(shù)據(jù)輸入順序?qū)ψ罱K結(jié)果有影響;無(wú)法處理可分離非線(xiàn)性數(shù)據(jù)集;初始點(diǎn)選取會(huì)極大地影響聚類(lèi)的結(jié)果。
隨機(jī)森林法最初是由Leo[48]提出的。隨機(jī)森林在以決策樹(shù)為基學(xué)習(xí)器構(gòu)建bagging 集成的基礎(chǔ)上,進(jìn)一步在決策樹(shù)的訓(xùn)練過(guò)程中引入了隨機(jī)屬性選擇進(jìn)行預(yù)測(cè)。它用隨機(jī)的方式建立一個(gè)森林,森林由許多決策樹(shù)組成,每一棵決策樹(shù)之間沒(méi)有關(guān)聯(lián),利用多棵樹(shù)對(duì)樣本進(jìn)行訓(xùn)練并預(yù)測(cè)。當(dāng)變量的數(shù)量大于樣本的數(shù)量時(shí),隨機(jī)森林表現(xiàn)出良好的性能[49]。決策樹(shù)算法有ID3、C4.5、CRAT、SLIQ等。
表3 聚類(lèi)算法在預(yù)測(cè)性維護(hù)中的最新應(yīng)用
隨機(jī)森林被用于生成動(dòng)態(tài)預(yù)測(cè)模型。Kusiak 等人[50]使用狀態(tài)數(shù)據(jù)和運(yùn)行數(shù)據(jù)來(lái)設(shè)計(jì)隨機(jī)森林模型,為風(fēng)力渦輪機(jī)工況監(jiān)測(cè)提出了改進(jìn)方案。Santos等人[51]提出隨機(jī)森林來(lái)預(yù)測(cè)鼠籠式感應(yīng)電動(dòng)機(jī)的定子繞組短路故障。Su等人[52]的研究提出一種硬盤(pán)故障檢測(cè)系統(tǒng),用于實(shí)時(shí)預(yù)測(cè)故障硬盤(pán)和驅(qū)動(dòng)器故障,其系統(tǒng)過(guò)程包括兩個(gè)階段:批量訓(xùn)練,其中使用歷史數(shù)據(jù)生成和訓(xùn)練隨機(jī)森林模型;實(shí)時(shí)預(yù)測(cè),它使用從終端用戶(hù)設(shè)備收集的數(shù)據(jù)來(lái)進(jìn)行預(yù)測(cè)。實(shí)時(shí)預(yù)測(cè)的準(zhǔn)確性達(dá)到85%。Kulkarni等人[53]應(yīng)用隨機(jī)森林模型來(lái)預(yù)測(cè)制冷和冷藏系統(tǒng)故障,其方法正確性能夠達(dá)到89%。Paolanti等人[54]提出一個(gè)利用來(lái)自各種傳感器、可編程邏輯控制器和通信協(xié)議的數(shù)據(jù)來(lái)預(yù)測(cè)設(shè)備工況的隨機(jī)森林模型,雖然決策樹(shù)可能會(huì)過(guò)度擬合,但在大多數(shù)情況下可以避免,因?yàn)闆Q策樹(shù)可以處理隨機(jī)特征子集并從這些子集構(gòu)建更小的樹(shù)[48-49,55]。更多基于隨機(jī)森林的預(yù)測(cè)性維護(hù)研究的最新論文見(jiàn)表4。
隨機(jī)森林的優(yōu)勢(shì)在于:隨機(jī)森林是一類(lèi)判別模型,支持分類(lèi)問(wèn)題、回歸問(wèn)題和多分類(lèi)問(wèn)題;隨機(jī)森林結(jié)合其他算法,得到更優(yōu)的預(yù)測(cè)結(jié)果,可以將新的理論引入隨機(jī)森林,結(jié)合不同的算法提升模型預(yù)測(cè)的性能[60];決策樹(shù)越多,可以提供越多的觀(guān)察結(jié)果作為預(yù)測(cè)的依據(jù)[38];在某些情況下,決策樹(shù)可以減少波動(dòng),增強(qiáng)隨機(jī)森林模型泛化能力[61]。
隨機(jī)森林方法也有缺點(diǎn):少量的決策樹(shù)的分類(lèi)能力有限,只有產(chǎn)生大量的決策樹(shù)才有可能得到有效的分類(lèi)效果[60],與其他機(jī)器學(xué)習(xí)相比需要更多的計(jì)算時(shí)間;不能很好地處理非平衡數(shù)據(jù),隨機(jī)選取的訓(xùn)練集加劇了數(shù)據(jù)的非平衡性;對(duì)連續(xù)性變量的處理需要進(jìn)行離散化,分析計(jì)算節(jié)點(diǎn)分裂標(biāo)準(zhǔn)花費(fèi)大量時(shí)間;通過(guò)剪枝的方法避免決策樹(shù)的過(guò)擬合問(wèn)題會(huì)提高算法的復(fù)雜性,性能提升有局限性[62]。
預(yù)測(cè)性維護(hù)是工業(yè)大數(shù)據(jù)和人工智能方向的一個(gè)重要的應(yīng)用場(chǎng)景,針對(duì)設(shè)備的故障和失效問(wèn)題,從被動(dòng)的故障維護(hù)到主動(dòng)的預(yù)測(cè)和綜合規(guī)劃管理,研究人員不斷提供新思路和新方法。
應(yīng)用預(yù)測(cè)性維護(hù)的設(shè)備或系統(tǒng),其產(chǎn)生的故障是由于漸進(jìn)式的功能衰退超過(guò)臨界值導(dǎo)致的。對(duì)設(shè)備進(jìn)行性能退化評(píng)估和剩余壽命預(yù)測(cè)具有很好的前景,其預(yù)測(cè)模型具有較高的準(zhǔn)確率,是預(yù)測(cè)性維護(hù)策略決策的可靠依據(jù)。本文提出一種面向本地設(shè)備的預(yù)測(cè)性維護(hù)系統(tǒng)架構(gòu)(如圖1所示),為后續(xù)研究提供思路。
圖1 面向本地設(shè)備的預(yù)測(cè)性維護(hù)系統(tǒng)框架
本系統(tǒng)架構(gòu)主要是基于對(duì)設(shè)備運(yùn)行時(shí)產(chǎn)生的大量歷史、實(shí)時(shí)數(shù)據(jù)進(jìn)行收集、處理、分析、建模來(lái)實(shí)現(xiàn)的,對(duì)模型預(yù)測(cè)的設(shè)備剩余壽命進(jìn)行分級(jí),通過(guò)模擬仿真構(gòu)造專(zhuān)家策略庫(kù),根據(jù)分級(jí)對(duì)應(yīng)的策略對(duì)設(shè)備進(jìn)行維護(hù),它所遵循的預(yù)測(cè)性運(yùn)維流程主要包括以下步驟。
(1)數(shù)據(jù)獲?。和ㄟ^(guò)模擬仿真和傳感器測(cè)量獲得目標(biāo)設(shè)備或系統(tǒng)的全壽命數(shù)據(jù)。
表4 隨機(jī)森林在預(yù)測(cè)性維護(hù)中的最新應(yīng)用
(2)數(shù)據(jù)處理:包括數(shù)據(jù)預(yù)處理和特征提取,對(duì)數(shù)據(jù)進(jìn)行過(guò)濾和整理,識(shí)別數(shù)據(jù)中工況信息,剔除非重要變量,通過(guò)特征提取的方法得到衰退特征,供模型訓(xùn)練使用。
(3)模型訓(xùn)練:選擇適當(dāng)機(jī)器學(xué)習(xí)模型,利用經(jīng)處理后的全壽命數(shù)據(jù)進(jìn)行訓(xùn)練,獲得在不同工況下可以對(duì)設(shè)備或系統(tǒng)剩余壽命進(jìn)行準(zhǔn)確預(yù)測(cè)的模型。
(4)工況檢測(cè):通過(guò)傳感器收集當(dāng)前設(shè)備或系統(tǒng)數(shù)據(jù),并通過(guò)模型提供的工況識(shí)別庫(kù)判斷設(shè)備或系統(tǒng)是否失效,并作出反饋。
(5)壽命預(yù)測(cè):在設(shè)備或系統(tǒng)未失效情況下,用預(yù)測(cè)模型對(duì)其剩余壽命進(jìn)行預(yù)測(cè),并作出反饋。
(6)策略制定:根據(jù)系統(tǒng)故障預(yù)測(cè)的仿真,可以驗(yàn)證維護(hù)和維修策略的可行性,并將論證結(jié)果導(dǎo)入專(zhuān)家策略庫(kù)中作為方案。
(7)策略執(zhí)行:當(dāng)系統(tǒng)失效時(shí),根據(jù)工況識(shí)別庫(kù)的反饋信息進(jìn)行故障診斷,決定設(shè)備或系統(tǒng)的維修策略;當(dāng)系統(tǒng)未失效時(shí),根據(jù)剩余壽命預(yù)測(cè)結(jié)果進(jìn)行故障預(yù)測(cè),決定設(shè)備或系統(tǒng)的維護(hù)和保養(yǎng)策略。
此外,根據(jù)實(shí)際情況還可以加入剩余壽命可視化、數(shù)據(jù)存儲(chǔ)再訓(xùn)練、數(shù)據(jù)檢查等步驟。
由于預(yù)測(cè)性維護(hù)面向不同的目標(biāo)設(shè)備時(shí),選取的預(yù)測(cè)模型不唯一,故對(duì)模型選擇提出了比較高的要求。機(jī)器學(xué)習(xí),包括人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、聚類(lèi)算法和隨機(jī)森林等,已經(jīng)成功地應(yīng)用于預(yù)測(cè)性維護(hù)應(yīng)用中。隨著工業(yè)設(shè)備維護(hù)要求的不斷提高,預(yù)測(cè)模型也需要不斷發(fā)展出新的理論和方法來(lái)適應(yīng)日趨復(fù)雜的生產(chǎn)環(huán)境。
(1)將新的理論引入機(jī)器學(xué)習(xí)算法。以隨機(jī)森林為例,由于隨機(jī)森林算法本身就是Bagging算法與Random Subaspace 算法結(jié)合而得到的新的算法,因此在隨機(jī)森林的基礎(chǔ)上再增加新的算法一直是許多專(zhuān)家學(xué)者研究的重點(diǎn)[60]。新算法與預(yù)測(cè)性維護(hù)技術(shù)進(jìn)行正確結(jié)合,可以提升預(yù)測(cè)準(zhǔn)確性。
(2)將新的數(shù)據(jù)預(yù)處理方法與機(jī)器學(xué)習(xí)算法結(jié)合。訓(xùn)練數(shù)據(jù)集的質(zhì)量決定了模型訓(xùn)練的準(zhǔn)確度,因此將數(shù)據(jù)進(jìn)行有效數(shù)據(jù)處理之后進(jìn)行模型訓(xùn)練,將提高模型的質(zhì)量。同時(shí),機(jī)器學(xué)習(xí)模型訓(xùn)練需要大量的訓(xùn)練數(shù)據(jù),而實(shí)際中獲得的小樣本數(shù)據(jù)的情況居多,因此如何利用機(jī)器學(xué)習(xí)算法對(duì)小樣本數(shù)據(jù)的設(shè)備進(jìn)行壽命預(yù)測(cè)與故障診斷也是需要攻堅(jiān)的一個(gè)難點(diǎn)[2]。
由于5G技術(shù)和工業(yè)4.0時(shí)代的到來(lái),面對(duì)大規(guī)模生產(chǎn)的工業(yè)設(shè)備,通過(guò)工業(yè)物聯(lián)網(wǎng)將設(shè)備的工況數(shù)據(jù)上傳至服務(wù)器,生產(chǎn)廠(chǎng)家可以將獲得的大量設(shè)備數(shù)據(jù)進(jìn)行分析處理、訓(xùn)練建模、制定維護(hù)策略、實(shí)時(shí)更新、專(zhuān)家會(huì)診,進(jìn)而優(yōu)化服務(wù)。基于物聯(lián)網(wǎng)技術(shù)的預(yù)測(cè)性維護(hù)策略相比于面向本地設(shè)備的預(yù)測(cè)性維護(hù)策略不同,其效率更高、適配性更強(qiáng)、準(zhǔn)確率更高。本文提出一種基于物聯(lián)網(wǎng)技術(shù)的預(yù)測(cè)性維護(hù)系統(tǒng)架構(gòu)(如圖2所示),為后續(xù)研究提供思路。
圖2 基于物聯(lián)網(wǎng)技術(shù)的預(yù)測(cè)性維護(hù)系統(tǒng)框架
本系統(tǒng)架構(gòu)主要是基于物聯(lián)網(wǎng)技術(shù),通過(guò)對(duì)設(shè)備維護(hù)策略分別提供線(xiàn)上線(xiàn)下服務(wù),現(xiàn)場(chǎng)收集設(shè)備數(shù)據(jù)和控制數(shù)據(jù),經(jīng)過(guò)現(xiàn)場(chǎng)決策系統(tǒng)判斷和反饋,并上傳數(shù)據(jù)至集團(tuán)大數(shù)據(jù)平臺(tái)進(jìn)行智能分析和數(shù)據(jù)挖掘,最新成果下載至現(xiàn)場(chǎng)決策系統(tǒng)并應(yīng)用于之后的預(yù)測(cè)性維護(hù)策略。它所遵循的預(yù)測(cè)性運(yùn)維流程主要包括以下步驟。
(1)信息感知:通過(guò)各類(lèi)傳感器收集現(xiàn)場(chǎng)設(shè)備數(shù)據(jù),由無(wú)線(xiàn)終端上傳至數(shù)據(jù)采集系統(tǒng),同時(shí)上傳控制器等設(shè)備數(shù)據(jù),經(jīng)數(shù)據(jù)整理后進(jìn)入現(xiàn)場(chǎng)決策系統(tǒng)。通過(guò)為設(shè)備開(kāi)發(fā)傳感技術(shù),提高數(shù)據(jù)數(shù)量和質(zhì)量,當(dāng)有更多高質(zhì)量訓(xùn)練數(shù)據(jù)可用時(shí),預(yù)測(cè)性維護(hù)策略將更具可靠性[63]。
(2)現(xiàn)場(chǎng)決策:邊緣計(jì)算網(wǎng)關(guān)主要完成感知信息處理、在線(xiàn)診斷分析和實(shí)時(shí)反饋控制三個(gè)方面的工作[64]。感知信息處理和前文中數(shù)據(jù)處理相同,為設(shè)備狀態(tài)數(shù)據(jù)分析和挖掘提供數(shù)據(jù)基礎(chǔ);在線(xiàn)診斷分析通過(guò)不同工況下的預(yù)測(cè)模型,對(duì)設(shè)備運(yùn)行數(shù)據(jù)的實(shí)時(shí)分析和狀態(tài)的在線(xiàn)識(shí)別;實(shí)時(shí)反饋控制,根據(jù)狀態(tài)判斷結(jié)果,通過(guò)本地專(zhuān)家策略庫(kù),自動(dòng)生成相應(yīng)控制邏輯。
(3)智能分析:現(xiàn)場(chǎng)設(shè)備數(shù)據(jù)、決策數(shù)據(jù)和維護(hù)結(jié)果等通過(guò)網(wǎng)絡(luò)上傳至設(shè)備生產(chǎn)集團(tuán)的大數(shù)據(jù)平臺(tái)進(jìn)行智能分析和數(shù)據(jù)挖掘,產(chǎn)生新的預(yù)測(cè)模型和維護(hù)策略,通過(guò)網(wǎng)絡(luò)下載至現(xiàn)場(chǎng)決策系統(tǒng)進(jìn)行更新。智能分析系統(tǒng)還可根據(jù)數(shù)據(jù)反饋調(diào)整設(shè)備運(yùn)行參數(shù),以達(dá)到增加設(shè)備壽命、提升生產(chǎn)效率、提升生產(chǎn)安全性等目的。集團(tuán)大數(shù)據(jù)平臺(tái)利用智能分析解決的問(wèn)題和解決方案如表5所示。
物聯(lián)網(wǎng)技術(shù)為預(yù)測(cè)性維護(hù)策略提供了高效的解決方案,同時(shí)也提出了更高的要求,需要相關(guān)技術(shù)的不斷革新。目標(biāo)系統(tǒng)越復(fù)雜,現(xiàn)場(chǎng)采集的信息越多,傳輸效率越低,而復(fù)雜的數(shù)據(jù)也考驗(yàn)現(xiàn)場(chǎng)設(shè)備的計(jì)算力。5G技術(shù)的出現(xiàn),為數(shù)據(jù)傳輸問(wèn)題提供了解決方案,同時(shí)也為現(xiàn)場(chǎng)決策系統(tǒng)提升計(jì)算能力提供了更多選擇,但由于5G 技術(shù)與工業(yè)生產(chǎn)結(jié)合經(jīng)驗(yàn)較少,還需專(zhuān)家學(xué)者進(jìn)一步研究。
表5 問(wèn)題與解決方案
預(yù)測(cè)性維護(hù)技術(shù)作為工業(yè)生產(chǎn)領(lǐng)域的一個(gè)重要研究方向,近年來(lái)受到了越來(lái)越多的關(guān)注。鑒于機(jī)器學(xué)習(xí)領(lǐng)域不斷進(jìn)行創(chuàng)新,本文系統(tǒng)地介紹了基于機(jī)器學(xué)習(xí)的預(yù)測(cè)性維護(hù)技術(shù)相關(guān)研究現(xiàn)狀,從機(jī)器學(xué)習(xí)算法入手,重點(diǎn)介紹了四種常見(jiàn)的算法,分析了面向特定設(shè)備的剩余壽命預(yù)測(cè)方法和特性,列舉了近些年來(lái)最新的研究成果和優(yōu)勢(shì),并從系統(tǒng)架構(gòu)、預(yù)測(cè)模型和物聯(lián)網(wǎng)技術(shù)的角度對(duì)未來(lái)研究進(jìn)行展望。隨著工業(yè)4.0 時(shí)代的到來(lái),預(yù)測(cè)性維護(hù)技術(shù)將會(huì)為工業(yè)生產(chǎn)帶來(lái)革新,極大提高設(shè)備的安全性、提升保養(yǎng)效率、降低生產(chǎn)成本、提升生產(chǎn)效率。預(yù)測(cè)性維護(hù)技術(shù)在5G技術(shù)和人工智能技術(shù)的背景下,具有廣闊的應(yīng)用前景和研究?jī)r(jià)值。