丁 華, 呂彥寶,3, 崔紅偉, 劉 俊, 牛銳祥, 孟祥龍, 施 瑞
(1. 太原理工大學(xué) 機(jī)械與運(yùn)載工程學(xué)院,太原 030024; 2. 煤礦綜采裝備山西省重點(diǎn)實(shí)驗(yàn)室,太原 030024;3. 江陰興澄特種鋼鐵有限公司,江蘇 無(wú)錫 214429; 4. 山西煤礦機(jī)械制造股份有限公司,太原 030031)
在物聯(lián)網(wǎng)、大數(shù)據(jù)、邊緣計(jì)算、人工智能等新興信息化技術(shù)的推動(dòng)下,礦山安全生產(chǎn)管理也不斷向智能化、智慧化的方向發(fā)展[1-3]。刮板輸送機(jī)是綜采工作面唯一與采煤機(jī)和液壓支架配套使用的運(yùn)輸設(shè)備,其工況差、負(fù)載大、受沖擊多,工作過程中極易出現(xiàn)故障,實(shí)現(xiàn)刮板輸送機(jī)實(shí)時(shí)精確的故障診斷對(duì)提高綜采工作面智能化水平,促進(jìn)煤礦智化建設(shè)具有重要意義。
由于刮板輸送機(jī)具有多變量、強(qiáng)耦合和非線性等特點(diǎn),建立復(fù)雜部件與系統(tǒng)的數(shù)學(xué)或物理模型十分困難,數(shù)據(jù)驅(qū)動(dòng)的故障診斷方法逐漸獲得重視并成為故障診斷領(lǐng)域的重要研究熱點(diǎn)[4]。該方法大致分為以下兩個(gè)方面[5]:
一是基于信號(hào)處理算法的研究,即利用快速傅里葉變換、經(jīng)驗(yàn)小波變換、解析模態(tài)分解法等信號(hào)分析方法,通過與理論計(jì)算或經(jīng)驗(yàn)知識(shí)比對(duì),實(shí)現(xiàn)對(duì)故障部位、類型甚至程度的判定。文獻(xiàn)[6]利用經(jīng)驗(yàn)小波變換和時(shí)頻區(qū)間分量重構(gòu)的方法,構(gòu)建了用來反映信號(hào)沖擊頻域分布特征的時(shí)頻峭度譜,以此實(shí)現(xiàn)軸承的故障檢測(cè)。文獻(xiàn)[7]利用解析模態(tài)分析法提取滾動(dòng)軸承故障頻段的信號(hào)并求其頻譜,以此來判斷提取的信號(hào)中是否有故障頻率。
二是基于機(jī)器學(xué)習(xí)算法的研究,機(jī)器學(xué)習(xí)時(shí)期分為3個(gè)階段。第一階段為連接主義,即利用基于漸進(jìn)理論構(gòu)建的感知機(jī)、人工神經(jīng)網(wǎng)絡(luò)等模型,對(duì)信號(hào)處理后的故障特征自動(dòng)分類。文獻(xiàn)[8]選取振動(dòng)信號(hào)時(shí)域特征參數(shù)作為軸承故障特征,基于雙層螢火蟲算法的神經(jīng)網(wǎng)絡(luò)識(shí)別多負(fù)載工況下的軸承故障。第二階段為統(tǒng)計(jì)學(xué)習(xí),即利用基于統(tǒng)計(jì)學(xué)理論構(gòu)建的支持向量機(jī)等模型,對(duì)信號(hào)處理后的故障特征自動(dòng)分類。文獻(xiàn)[9]利用經(jīng)驗(yàn)解析模態(tài)分解和正交監(jiān)督線性局部切線空間對(duì)齊的方法提取軸承故障特征,通過最小二乘支持向量機(jī)實(shí)現(xiàn)軸承故障在小樣本下的有效診斷。第三階段為深度學(xué)習(xí),即在連接主義的基礎(chǔ)上結(jié)合卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)、深度殘差網(wǎng)絡(luò)等模型,對(duì)信號(hào)自動(dòng)提取特征和分類。文獻(xiàn)[10]將多尺度一維卷積神經(jīng)網(wǎng)絡(luò)中卷積核數(shù)目和尺度作為粒子群優(yōu)化的粒子,在非經(jīng)驗(yàn)指導(dǎo)下獲取最優(yōu)參數(shù),對(duì)風(fēng)機(jī)基礎(chǔ)螺栓進(jìn)行松動(dòng)識(shí)別。文獻(xiàn)[11]將基于注意力機(jī)制的擠壓與激勵(lì)網(wǎng)絡(luò)結(jié)構(gòu)引入到殘差神經(jīng)網(wǎng)絡(luò)殘差塊之中,識(shí)別載荷變化以及信號(hào)受到噪聲污染工況下的軸承故障。
然而,第一類方法僅能有效地識(shí)別某類特定的工況,泛化能力低且提取故障特征的過程十分依賴人工經(jīng)驗(yàn),存在計(jì)算過程復(fù)雜和耗時(shí)的問題。第二類方法的前兩個(gè)階段能夠有效地自動(dòng)識(shí)別多類故障,但仍需人工經(jīng)驗(yàn)提取故障特征。第三個(gè)階段實(shí)現(xiàn)了故障特征的自動(dòng)提取和多類故障的識(shí)別,但隨著傳感器產(chǎn)生的海量數(shù)據(jù)和深度學(xué)習(xí)模型網(wǎng)絡(luò)深度的不斷加深,傳統(tǒng)的集中式云計(jì)算深度學(xué)習(xí)模型存在診斷延時(shí)和通訊成本顯著增加的問題。
近年來,邊緣計(jì)算和深度學(xué)習(xí)理論的融合為解決上述問題提供了可行的解決方法[12-15]。文獻(xiàn)[16]提出了一種面向邊緣計(jì)算的深度學(xué)習(xí)分布式深度神經(jīng)網(wǎng)絡(luò)(distributed deep neural network, DDNN)模型,通過邊緣端模型樣本置信度判斷,可提前退出部分樣本,減少后續(xù)網(wǎng)絡(luò)層的樣本量和通訊量,文獻(xiàn)[17]針對(duì)CNN復(fù)雜模型需要使用強(qiáng)大的硬件來訓(xùn)練和部署,提出了卷積特征袋(convolutional bag-of-features, CBoF)的池化方法。該方法結(jié)合特征袋模型,將可訓(xùn)練的徑向基函數(shù)神經(jīng)元用于量化最終卷積層的激活,減少了網(wǎng)絡(luò)中的參數(shù)數(shù)量,解決了邊緣端計(jì)算和存儲(chǔ)能力有限而受到限制的問題?;谏鲜隼碚?本文提出一種基于分布式深度神經(jīng)網(wǎng)絡(luò)的刮板輸送機(jī)啟停工況故障診斷方法,將刮板輸送機(jī)監(jiān)測(cè)數(shù)據(jù)轉(zhuǎn)化的二維圖像樣本作為輸入,利用邊緣端設(shè)置的退出點(diǎn),對(duì)網(wǎng)絡(luò)置信度高的樣本進(jìn)行提前退出和分類,無(wú)需向云端發(fā)送任何信息,對(duì)于邊緣端退出點(diǎn)無(wú)法處理的樣本,將其在共享卷積層的特征向量發(fā)送到云端,使用額外的神經(jīng)網(wǎng)絡(luò)層執(zhí)行進(jìn)一步的推理,并輸出最終的分類診斷結(jié)果。該方法使邊緣端和云端計(jì)算資源利用率得到最大化,避免診斷過程中通訊資源的浪費(fèi),解決大量數(shù)據(jù)因遠(yuǎn)距離傳輸而導(dǎo)致的診斷延時(shí)問題,尤其是CBoF的引入,使得邊緣端模型參數(shù)得到量化,改善邊緣端計(jì)算能力和存儲(chǔ)能力不足的缺陷,顯著提升DDNN的診斷性能。
刮板輸送機(jī)是一種以撓性體作為牽引機(jī)構(gòu)的連續(xù)輸送機(jī)械,主要由機(jī)頭(尾)傳動(dòng)部、中間部、推移裝置及附屬裝置等組成。刮板輸送機(jī)負(fù)載量大、運(yùn)距長(zhǎng)、啟動(dòng)頻繁,故障產(chǎn)生源頭集中在啟動(dòng)和停機(jī)狀態(tài),根據(jù)實(shí)際故障數(shù)據(jù)統(tǒng)計(jì)和故障機(jī)理,對(duì)刮板輸送機(jī)的過載停機(jī)、卡鏈停機(jī)、重負(fù)載啟動(dòng)、啟動(dòng)功率不平衡和重復(fù)啟動(dòng)5種啟停工況故障進(jìn)行分析和識(shí)別。
通過對(duì)2020—2021年度某礦業(yè)集團(tuán)4個(gè)煤礦智能綜采工作面刮板輸送機(jī)啟停故障的統(tǒng)計(jì),刮板輸送機(jī)過載停機(jī)、卡鏈停機(jī)、重負(fù)載啟動(dòng)、啟動(dòng)功率不平衡和重復(fù)啟動(dòng)5種啟停故障的具體統(tǒng)計(jì)數(shù)據(jù)如表1所示。其中過載停機(jī)故障率在40%以上,因過載停機(jī)后未及時(shí)清理負(fù)載的煤炭,導(dǎo)致重負(fù)載啟動(dòng)和啟動(dòng)功率不平衡的故障率之和接近過載停機(jī)的故障率,重復(fù)啟動(dòng)故障率在15%上下浮動(dòng),卡鏈停機(jī)故障率占比較小,穩(wěn)定在2%以下。上述統(tǒng)計(jì)數(shù)據(jù)為刮板輸送機(jī)啟停工況故障診斷的必要性提供了事實(shí)依據(jù)。根據(jù)刮板輸送機(jī)啟停工況故障機(jī)理,各故障原因分析如下:
表1 2020—2021年度某礦業(yè)集團(tuán)智能綜采
(1) 過載停機(jī)。在實(shí)際生產(chǎn)過程中,刮板輸送機(jī)經(jīng)常出現(xiàn)因片幫、垮頂、負(fù)荷過重,導(dǎo)致減速器和電機(jī)處于超負(fù)荷狀態(tài),進(jìn)而出現(xiàn)死機(jī)現(xiàn)象,影響整個(gè)輸送機(jī)的可靠性。
(2) 卡鏈停機(jī)。刮板輸送機(jī)在運(yùn)行過程中,由于其底層運(yùn)輸大量的煤石而產(chǎn)生較多的浮煤、碎石等雜物、溜槽對(duì)口的錯(cuò)位、現(xiàn)場(chǎng)工作人員未嚴(yán)格按照刮板輸送機(jī)的操作流程進(jìn)行操作等原因,導(dǎo)致刮板輸送機(jī)出現(xiàn)卡鏈現(xiàn)象,當(dāng)刮板輸送機(jī)發(fā)生卡鏈故障時(shí),刮板會(huì)產(chǎn)生扭擺,易出現(xiàn)斷鏈?zhǔn)鹿蔥18]。
(3) 重載啟動(dòng)。在實(shí)際生產(chǎn)過程中,為了確保整個(gè)綜采工作面的安全生產(chǎn)或出現(xiàn)一些突發(fā)事故的情況下,常要求刮板輸送機(jī)停機(jī)配合檢查,而在再次啟動(dòng)時(shí),由于刮板機(jī)上的原煤未及時(shí)清理,刮板輸送機(jī)常處于滿載或者超載狀態(tài)。刮板輸送機(jī)經(jīng)常在重載工況下啟動(dòng),會(huì)造成強(qiáng)烈的機(jī)械沖擊,進(jìn)而可能燒壞電機(jī)、使鏈條斷裂、將鏈輪上的齒輪打壞等[19-20]。
(4) 啟動(dòng)功率不平衡。由于刮板輸送機(jī)啟動(dòng)前的負(fù)載大小、位置及機(jī)頭機(jī)尾電動(dòng)機(jī)的啟動(dòng)時(shí)間差等因素,使得負(fù)載功率無(wú)法按比例分配至刮板輸送機(jī)的不同電機(jī),出現(xiàn)電機(jī)功率不平衡的現(xiàn)象。嚴(yán)重的功率不平衡可能造成設(shè)備零部件壽命縮短、電機(jī)燒毀、運(yùn)行效率降低等問題[21]。
(5) 重復(fù)啟動(dòng)。刮板輸送機(jī)在啟動(dòng)時(shí),因變頻器電路或信號(hào)反饋問題,導(dǎo)致刮板輸送機(jī)多次啟動(dòng)的現(xiàn)象,刮板輸送機(jī)的重復(fù)啟動(dòng),加速了零件的磨損,影響其使用壽命。
CNN是基于卷積運(yùn)算與深度網(wǎng)絡(luò)結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),主要由卷積層、批歸一化(batch normalization,BN)層、激活層、池化層、全連接層等組成。
卷積層通過卷積核的移動(dòng)實(shí)現(xiàn)輸入數(shù)據(jù)的降維和特征提取,其內(nèi)部包含多個(gè)卷積核,每個(gè)卷積核都對(duì)應(yīng)一個(gè)權(quán)重系數(shù)與一個(gè)偏差。卷積層運(yùn)算數(shù)學(xué)表達(dá)式為
(1)
BN層通過引入均值和方差的運(yùn)算,使數(shù)據(jù)同分布、更穩(wěn)定,加快網(wǎng)絡(luò)訓(xùn)練速度,使模型收斂更快。其數(shù)學(xué)表達(dá)式為
(2)
式中:μ為同時(shí)輸入的一組數(shù)值的均值;σ為這組數(shù)值的方差;ε為一個(gè)極小的數(shù),防止分母為零。
激活函數(shù)在網(wǎng)絡(luò)學(xué)習(xí)中可以實(shí)現(xiàn)數(shù)據(jù)之間的非線性擬合。通常使用線性整流函數(shù)作為激活函數(shù),其函數(shù)數(shù)學(xué)表達(dá)式為
f(x)=max(0,x)
(3)
池化層對(duì)卷積后的特征進(jìn)行進(jìn)一步降維和提取,常用的有平均池化和最大池化,原理分別是輸出核覆蓋范圍內(nèi)所有數(shù)的平均值和最大值。
全連接層將卷積和池化的輸出進(jìn)行非線性擬合,通過softmax分類器,實(shí)現(xiàn)提取特征與樣本標(biāo)記的對(duì)應(yīng)。
DCNN具有多層結(jié)構(gòu),其表達(dá)學(xué)習(xí)也是層級(jí)分布的,對(duì)輸入向量而言,海量數(shù)據(jù)的遠(yuǎn)距離傳輸及其神經(jīng)網(wǎng)絡(luò)的逐層傳輸都會(huì)帶來延遲,而且隨著運(yùn)算參數(shù)不斷累積,計(jì)算耗能也逐層增多。DDNN作為一種面向邊緣計(jì)算的深度神經(jīng)網(wǎng)絡(luò),具有分布式計(jì)算層次結(jié)構(gòu),不僅能在云端進(jìn)行深度神經(jīng)網(wǎng)絡(luò)的推理,還能在邊緣端上使用神經(jīng)網(wǎng)絡(luò)的淺層部分進(jìn)行快速、本地化推理。DDNN由邊緣端小型神經(jīng)網(wǎng)絡(luò)模型和云端較大的神經(jīng)網(wǎng)絡(luò)模型組成,其框架如圖1所示。邊緣端小型模型可以快速地進(jìn)行初始特征提取,在置信度可信的情況下,對(duì)數(shù)據(jù)進(jìn)行退出并輸出分類結(jié)果,邊緣端未退出的數(shù)據(jù)會(huì)傳遞到云端的大型網(wǎng)絡(luò)模型中,進(jìn)行下一步的特征處理和分類。DDNN與傳統(tǒng)集中式云計(jì)算的神經(jīng)網(wǎng)絡(luò)相比,具有識(shí)別精度高、通信成本低的優(yōu)點(diǎn)。
圖1 DDNN框架Fig.1 The framework of DDNN
雖然DDNN模型的推理在分布式計(jì)算層次結(jié)構(gòu)上分布,但其可以在單個(gè)強(qiáng)大的服務(wù)器或云端進(jìn)行訓(xùn)練。與大多數(shù)傳統(tǒng)神經(jīng)網(wǎng)絡(luò)訓(xùn)練不同,DDNN模型至少有兩個(gè)出口點(diǎn),在訓(xùn)練時(shí),通過對(duì)每個(gè)出口損失值的加權(quán)求和,實(shí)現(xiàn)整個(gè)網(wǎng)絡(luò)的聯(lián)合訓(xùn)練,使每個(gè)出口點(diǎn)相對(duì)于其模型深度能夠達(dá)到良好的準(zhǔn)確性。模型使用softmax交叉熵?fù)p失函數(shù)作為優(yōu)化目標(biāo),其數(shù)學(xué)表達(dá)式為
(4)
(5)
zk=fexitn(xk,θ)
(6)
DDNN模型通過加權(quán)損失函數(shù)對(duì)各個(gè)出口的損失值加權(quán)求和,并采用SGD(stochastic gradient descent)方法更新模型參數(shù),加權(quán)損失函數(shù)數(shù)學(xué)表達(dá)式為
(7)
DDNN模型分支對(duì)輸入圖像進(jìn)行快速地初始特征提取,在置信度可信的情況下,分支出口點(diǎn)對(duì)樣本進(jìn)行退出并輸出分類結(jié)果,采用歸一化熵閾值作為分支對(duì)樣本的預(yù)測(cè)置信度,其數(shù)學(xué)表達(dá)式為
(8)
式中:C為所有標(biāo)簽的集合;x為概率向量;η?[0,1]。
η=0為置信度為1,η=1為置信度為0,使用多個(gè)預(yù)先配置的出口閾值T作為對(duì)樣本預(yù)測(cè)置信度的衡量標(biāo)準(zhǔn)。如果分支出口點(diǎn)對(duì)預(yù)測(cè)結(jié)果有信心(即,η≤T)則退出樣本并輸出分類結(jié)果,否則,將未退出樣本在共享卷積塊中的圖像特征傳遞到主干,進(jìn)行下一步的特征提取和分類。
傳統(tǒng)集中式云計(jì)算模型的推理通訊成本是將全部樣本直接傳輸?shù)皆贫?而DDNN模型推理是在分布式計(jì)算層次結(jié)構(gòu)上分布的,其將分支嵌入到靠近數(shù)據(jù)源的邊緣端,而主干則嵌入到云端。由于分支靠近數(shù)據(jù)源,故DDNN模型推理通訊成本只考慮將分支中未退出樣本在共享卷積塊中的特征圖像傳輸?shù)皆贫酥鞲傻耐ㄓ嵙?DDNN通訊成本期望數(shù)學(xué)表達(dá)式為
c=4(1-r)fo
(9)
式中:r為分支退出樣本百分比;f為共享卷積塊向主干輸出的特征圖像尺寸;o為共享卷積塊向主干輸出特征圖像的通道數(shù),常數(shù)4指在64位普通的Windows系統(tǒng)中,一個(gè)32位浮點(diǎn)數(shù)占據(jù)4 B。
DDNN 在邊緣側(cè)的全連接層節(jié)點(diǎn)越多,邊緣側(cè)模型越復(fù)雜,分類能力越強(qiáng),邊緣設(shè)備的計(jì)算開銷也會(huì)增加,但邊緣側(cè)計(jì)算和存儲(chǔ)資源有限,對(duì)此,需要在邊緣設(shè)備資源和誤差之間實(shí)現(xiàn)一個(gè)平衡,CBoF通過對(duì)神經(jīng)網(wǎng)絡(luò)壓縮編碼,可以大幅度減少參數(shù)計(jì)算量。CBoF模型結(jié)構(gòu)如圖2所示。
圖2 CBoF模型結(jié)構(gòu)Fig.2 Model structure of CBoF
構(gòu)建CBoF 模型的關(guān)鍵步驟有3個(gè),分別是圖像特征提取、構(gòu)造視覺詞典以及圖像的直方圖表示。
(1) 圖像特征提取,轉(zhuǎn)化后的二維圖像送入邊緣側(cè)模型后經(jīng)卷積層自動(dòng)提取特征向量。
(2) 構(gòu)造視覺詞典,通過特征向量與視覺單詞的相似度來確定視覺詞典中視覺單詞的個(gè)數(shù),特征向量與視覺詞典的相似度用徑向基函數(shù)(radial basis function,RBF)來計(jì)算,RBF第k個(gè)神經(jīng)元的輸出表示為
[φ(X)]k=exp(-‖X-Vk‖2/σk)
(10)
式中:X為特征向量;Vk為RBF的第k個(gè)神經(jīng)元的中心;σk為核函數(shù)的寬度參數(shù)。
(3) 圖像的直方圖表示,視覺詞典得到了特征圖關(guān)于各視覺中心的相似性度量,圖像的直方圖表示需要對(duì)量化特征進(jìn)行統(tǒng)計(jì)。計(jì)算公式表示為
(11)
式中:φ(Xij)=([φ(Xij)]1,…,[φ(Xij)]Nk)T∈RNk;Nk為RBF神經(jīng)元個(gè)數(shù)。
基于第2章基礎(chǔ)理論,所搭建的DDNN模型結(jié)構(gòu)如圖3所示。模型由共享卷積塊、分支和主干組成,主干和分支各有一個(gè)退出點(diǎn)。將CBoF放置在分支最后一個(gè)卷積塊后面代替全連接層,以量化卷積塊最終輸出的特征向量,減少模型運(yùn)算參數(shù);主干采用殘差網(wǎng)絡(luò)塊和全局平均池化層結(jié)構(gòu),用來代替全連接層,增加特征向量的流動(dòng)性,減少模型參數(shù)量;通過分支和主干的聯(lián)合訓(xùn)練,實(shí)現(xiàn)故障特征的識(shí)別和分類。
圖3 DDNN模型結(jié)構(gòu)Fig.3 Model structure of the DDNN
模型參數(shù)如表2所示。模型卷積層全部采用3×3卷積核堆疊的方式提取輸入圖像的特征向量,以提高卷積層的感受野和非線性表達(dá)能力。共享卷積核的個(gè)數(shù)設(shè)為1,用來減少共享卷積塊與主干臨近卷積塊之間的通訊量并最大程度的保留原始圖像特征。分支兩個(gè)卷積層的卷積核個(gè)數(shù)分別為4和8,主干中前兩個(gè)卷積層的卷積核個(gè)數(shù)為8,其余卷積層的卷積核個(gè)數(shù)為32,卷積層的填充為1,卷積核移動(dòng)步長(zhǎng)為1。
表2 DDNN模型參數(shù)Tab.2 Model parameters of the DDNN
構(gòu)建的DDNN模型故障診斷流程如圖4所示,主要包括數(shù)據(jù)預(yù)處理、云端模型訓(xùn)練、云邊協(xié)同推理三部分。
圖4 DDNN模型故障診斷流程Fig.4 DDNN model fault diagnosis process
3.2.1 數(shù)據(jù)預(yù)處理
時(shí)域信號(hào)到矩陣的轉(zhuǎn)換過程如圖5所示。首先在大量連續(xù)樣本中選取一維時(shí)間序列信號(hào),選取方式為每784個(gè)信號(hào)點(diǎn)截取一次,即K=28,然后將一維時(shí)間序列信號(hào)轉(zhuǎn)換的矩陣進(jìn)行灰度化處理生成二維圖像,此外,為更充分地提取二維圖像的邊緣特征,再對(duì)其進(jìn)行padding=2的數(shù)據(jù)預(yù)處理。矩陣到圖像的轉(zhuǎn)換數(shù)學(xué)表達(dá)式為
圖5 信號(hào)到矩陣的轉(zhuǎn)換過程Fig.5 Signal to matrix conversion process
(12)
式中:p為二維圖像的像素強(qiáng)度;L為數(shù)據(jù)灰度值;a,b?[1,K];K為二維圖像的邊長(zhǎng)尺寸。
通過上述數(shù)據(jù)轉(zhuǎn)換方式,對(duì)一維時(shí)域信號(hào)的曲線形數(shù)據(jù)重新排布,生成CNN擅長(zhǎng)處理的圖像數(shù)據(jù),利用CNN的自適應(yīng)學(xué)習(xí),實(shí)現(xiàn)對(duì)一維時(shí)域信號(hào)故障特征的提取和識(shí)別。
3.2.2 云端模型訓(xùn)練
使用Pytorch深度學(xué)習(xí)框架和Python編程語(yǔ)言構(gòu)建DDNN故障診斷模型,涉及到的參數(shù)設(shè)置如下:激活函數(shù)為Relu,目標(biāo)函數(shù)為交叉熵?fù)p失函數(shù),優(yōu)化器為隨機(jī)梯度下降(stochastic gradient descent,SGD),batch size為16,動(dòng)量參數(shù)為0.9,初始學(xué)習(xí)率為0.1,學(xué)習(xí)率衰減值為0.000 1,迭代次數(shù)為100。
3.2.3 云邊協(xié)同推理
訓(xùn)練好的模型完成參數(shù)遷移后,將測(cè)試集輸入到模型中,在分支出口處將測(cè)試集樣本的置信度η與設(shè)置的閾值T進(jìn)行比較,若η≤T,則退出樣本,輸出邊緣端故障診斷結(jié)果;否則,將其在共享卷積塊中的特征圖輸入到云端主干模型進(jìn)一步推理,輸出云端故障診斷結(jié)果。
以上述礦業(yè)集團(tuán)煤礦1的61120智能綜采工作面前置SGZ-764/630型刮板輸送機(jī)為試驗(yàn)對(duì)象,試驗(yàn)平臺(tái)包括刮板輸送機(jī)、變頻器、組合開關(guān)、順槽集控中心、汾西華益智慧云平臺(tái)等,如圖6所示。
圖6 試驗(yàn)平臺(tái)Fig.6 The test platform
以刮板輸送機(jī)啟停工況故障機(jī)理和變頻器中電流傳感器、電壓傳感器、頻率傳感器反映出來的機(jī)頭機(jī)尾電流、轉(zhuǎn)速參數(shù)值作為故障判定依據(jù),其中,傳感器返回的數(shù)據(jù)類型為float32,采樣頻率為每秒4次,通訊協(xié)議為Modbus。采樣數(shù)據(jù)通過專線傳輸?shù)皆破脚_(tái)數(shù)據(jù)中心,每個(gè)參數(shù)值的提取方式為每49 s提取一次并將其按時(shí)間順序轉(zhuǎn)換成7×28的矩陣,通過上述4個(gè)參數(shù)轉(zhuǎn)化矩陣的垂直堆疊和數(shù)據(jù)灰度處理,生成一個(gè)28×28的灰度圖像。數(shù)據(jù)集共8 400個(gè)灰度圖像樣本,包括過載停機(jī)、卡鏈停機(jī)、重負(fù)載啟動(dòng)、啟動(dòng)功率不平衡、重復(fù)啟動(dòng)5種故障工況和輕負(fù)載啟動(dòng)、正常停機(jī)2種正常工況,數(shù)據(jù)集按照5∶1的比例劃分為訓(xùn)練集和測(cè)試集,樣本具體組成信息如表3所示。
數(shù)據(jù)轉(zhuǎn)換圖像的方法不僅可以在二維空間內(nèi)更直觀地表征一維數(shù)據(jù)的分布變化,而且卷積運(yùn)算在計(jì)算機(jī)領(lǐng)域多用于減少圖像復(fù)雜度、降低計(jì)算負(fù)擔(dān)。此外,利用卷積層自動(dòng)挖掘圖像特征,避免了人工提取特征向量過程中計(jì)算復(fù)雜、耗時(shí)以及人為因素導(dǎo)致的局限性等弊端。轉(zhuǎn)換圖像如圖7所示。其整體等分為四部分,從上到下依次為機(jī)頭電流、機(jī)尾電流、機(jī)頭轉(zhuǎn)速和機(jī)尾轉(zhuǎn)速,圖像中不同深度的黑白色帶對(duì)應(yīng)不同的數(shù)值,數(shù)據(jù)由小到大顯示為由黑到白。
圖7 轉(zhuǎn)換圖像結(jié)構(gòu)示意圖Fig7 Structure diagram of transformed image
刮板輸送機(jī)主要技術(shù)參數(shù)如表4所示。在運(yùn)行過程中,電流持續(xù)高于額定電流且突然大范圍波動(dòng),轉(zhuǎn)速驟降為零視為卡鏈停機(jī),電流呈指數(shù)上升的趨勢(shì)和轉(zhuǎn)速階梯下降為零視為過載停機(jī)。
表4 SGZ-764/630型刮板輸送機(jī)主要技術(shù)參數(shù)
故障停機(jī)時(shí)域曲線及轉(zhuǎn)換圖像如圖8所示。圖8(a)電流的指數(shù)上升和轉(zhuǎn)速階梯下降為零的特征,映射出圖8(b)電流位置末端由黑驟變?yōu)榛业纳珟?轉(zhuǎn)速位置末端由白變黑的色帶顯著拉長(zhǎng)。圖8(c)機(jī)尾電流的大范圍波動(dòng)和轉(zhuǎn)速驟降為零的特征,對(duì)應(yīng)圖8(d)機(jī)尾電流位置末端黑灰色帶的相互交替,轉(zhuǎn)速位置末端由白變黑的較短色帶。
圖8 刮板輸送機(jī)故障停機(jī)時(shí)域曲線及其轉(zhuǎn)換圖像Fig.8 Time domain curve of scraper conveyor fault shutdown and its transformation image
將額定電流的70%作為重負(fù)載和輕負(fù)載判定依據(jù),機(jī)頭機(jī)尾電流差值與平均值比值的35%作為啟動(dòng)功率不平衡判定依據(jù),即整個(gè)啟動(dòng)過程中,當(dāng)機(jī)頭機(jī)尾電流差值與平均值比值小于35%時(shí),若瞬時(shí)電流過后電流維持在140 A以上,則視為重負(fù)載啟動(dòng),否則視為輕負(fù)載啟動(dòng);當(dāng)機(jī)頭機(jī)尾電流差值與平均值比值大于35%時(shí),視為啟動(dòng)功率不平衡。啟動(dòng)時(shí)域曲線及轉(zhuǎn)換圖像如圖9所示,圖9(a)和圖9(c)各自機(jī)頭機(jī)尾電流值及差值在圖9(b)和圖9(d)的機(jī)頭機(jī)尾電流位置分別映射出不同深度的色帶。
圖9 刮板輸送機(jī)啟動(dòng)故障時(shí)域曲線及其轉(zhuǎn)換圖像Fig.9 Time domain curve of scraper conveyor startup fault and its transformation image
刮板輸送機(jī)在啟動(dòng)時(shí),因變頻器電路或信號(hào)反饋問題,導(dǎo)致刮板輸送機(jī)多次啟動(dòng)的現(xiàn)象視為重復(fù)啟動(dòng)。重復(fù)啟動(dòng)的時(shí)域曲線及轉(zhuǎn)換圖像如圖10所示。圖10(a)機(jī)頭機(jī)尾電流、轉(zhuǎn)速頻繁為零的特征,在圖10(b)映射出機(jī)頭機(jī)尾電流、轉(zhuǎn)速位置黑灰色帶的頻繁交替。
圖10 刮板輸送機(jī)重復(fù)啟動(dòng)時(shí)域曲線及其轉(zhuǎn)換圖像Fig.10 Time domain curve of scraper conveyor repeated start and its transformation image
為使分支進(jìn)行更多的判別特征學(xué)習(xí),使更多的樣本以較高置信度提前退出,將分支給予全部加權(quán)值(即W分支=1),主干權(quán)重加權(quán)值進(jìn)行遞減以尋求最優(yōu)值。試驗(yàn)預(yù)先將分支CBoF層中的字典數(shù)設(shè)為10進(jìn)行變量控制,其結(jié)果如表5所示,當(dāng)W主干=0.3時(shí)出現(xiàn)拐點(diǎn),與主干和分支均賦予全部加權(quán)值相比,分支單獨(dú)推理精度提高了0.66%。此外,主干單獨(dú)推理精度的穩(wěn)定,反映出主干訓(xùn)練損失函數(shù)值足夠小,分支損失函數(shù)值的變化對(duì)其影響甚微。
表5 權(quán)重加權(quán)值對(duì)分支和主干單獨(dú)推理精度的影響
在分支與主干的權(quán)重加權(quán)值確定后,需對(duì)分支CBoF層字典數(shù)進(jìn)行確定,選擇不同大小的詞典數(shù)進(jìn)行試驗(yàn),分別為10~100,間隔為10,試驗(yàn)結(jié)果如表6所示。字典數(shù)與分支單獨(dú)推理精度呈現(xiàn)一定的周期波動(dòng)趨勢(shì),當(dāng)字典數(shù)為10時(shí),分支單獨(dú)推理精度最高,達(dá)到了96.93%,此外,主干單獨(dú)推理精度的穩(wěn)定,也反映出分支字典數(shù)導(dǎo)致分支損失函數(shù)值的變化對(duì)主干影響甚微。
表6 字典數(shù)對(duì)分支和主干單獨(dú)推理精度的影響
DDNN不同的分支出口閾值T對(duì)其識(shí)別精度的影響,如表7所示。當(dāng)T=0時(shí)分支出口樣本退出率為0,樣本全部交由主干進(jìn)行單獨(dú)推理,當(dāng)T=0.5時(shí),分支出口樣本退出率為100%,樣本全部交由分支進(jìn)行單獨(dú)推理,二者的識(shí)別精度分別為99.0%,96.93%。而當(dāng)T=0.1和T=0.2時(shí),分支出口樣本退出率為73%和88.71%,樣本由分支和主干進(jìn)行協(xié)同推理,分支識(shí)別精度都達(dá)到了100%。
表7 不同閾值對(duì)DDNN模型的影響
故障診斷模型效果除了考慮識(shí)別精度外,還應(yīng)考慮推理速度、通訊成本和模型參數(shù)量。DDNN模型協(xié)同推理與單獨(dú)推理效果對(duì)比,如表8所示。分支單獨(dú)推理的DDNN(T=0.5)參數(shù)量少,推理速度快,適合布置在靠近數(shù)據(jù)源的邊緣端,因此通訊成本可忽略不計(jì),但識(shí)別精度過低,僅為96.93%;主干單獨(dú)推理的DDNN(T=0)參數(shù)量大,需要較大的計(jì)算資源,因邊緣端計(jì)算資源有限,故將其布置在云端。與DDNN(T=0)相比,分支與主干協(xié)同推理的DDNN(T=0.2)在增加DDNN(T=0.5)的539×103個(gè)參數(shù)后,識(shí)別精度提高到了99.5%,推理速度提高了22%。灰度圖像經(jīng)padding=2的數(shù)據(jù)預(yù)處理后,輸入尺寸變?yōu)?2×32,輸入通道數(shù)仍為1,由表2可知,數(shù)據(jù)預(yù)處理后的圖像經(jīng)共享塊后的輸出尺寸和通道數(shù)分別為32×32和1,其輸出尺寸計(jì)算公式為
表8 DDNN模型協(xié)同推理與單獨(dú)推理效果對(duì)比
f=?(i+2s-k)/s」+1
(13)
式中:f為輸出尺寸;i為輸入尺寸;s為步長(zhǎng);k為卷積核尺寸; ?>·>」為向下取整。
由表7可知,當(dāng)DDNN閾值T分別為0和0.2時(shí),分支退出率l分別為0和88.71%,根據(jù)式(10)可知,DDNN(T=0)通訊成本期望為4 096 B,而DDNN(T=0.2)通訊成本期望為462 B,僅占前者通訊成本期望的11.28%,明顯降低了推理的通信成本。分支與主干的協(xié)同推理在融合分支與主干單獨(dú)推理性能的同時(shí),使不同難易程度的推理任務(wù)按需分配到邊緣端和云端,使邊緣端和云端計(jì)算資源有效利用率得到最大化,進(jìn)一步提高了識(shí)別精度。
在機(jī)器學(xué)習(xí)領(lǐng)域中,混淆矩陣是一種用特定的矩陣來呈現(xiàn)算法性能的可視化效果,特別用于監(jiān)督學(xué)習(xí),其每一行代表預(yù)測(cè)類別,每一列代表實(shí)際類別,可以非常容易地表明多個(gè)類別是否有混淆。DDNN協(xié)同推理與單獨(dú)推理混淆矩陣,如圖11所示。在分支單獨(dú)推理的DDNN(T=0.5)混淆矩陣中,標(biāo)簽0、標(biāo)簽5、標(biāo)簽6的識(shí)別精度均為100%,標(biāo)簽4識(shí)別精度僅為84%,最易被誤識(shí)別,被誤識(shí)別為標(biāo)簽3和標(biāo)簽5的個(gè)數(shù)分別為18和14。與DDNN(T=0.5)相比,在主干單獨(dú)推理的DDNN(T=0)混淆矩陣中,除標(biāo)簽5的識(shí)別精度降低以外,其他標(biāo)簽的識(shí)別精度均有所提高,說明在邊緣端未被識(shí)別出的復(fù)雜樣本,在計(jì)算資源強(qiáng)大的云端得到了很好的識(shí)別,但也從側(cè)面反映出云端為了識(shí)別少量復(fù)雜樣本需要承擔(dān)大量簡(jiǎn)單樣本的計(jì)算任務(wù),造成了云端計(jì)算資源的浪費(fèi);標(biāo)簽5中有7個(gè)簡(jiǎn)單樣本在邊緣端能夠被識(shí)別,而在云端卻未被識(shí)別,說明某些簡(jiǎn)單樣本在云端復(fù)雜化,識(shí)別效果適得其反;在分支與主干協(xié)同推理的DDNN(T=0.2)分支混淆矩陣中,數(shù)據(jù)集88.71%的簡(jiǎn)單樣本全部被識(shí)別出,其中,數(shù)據(jù)集標(biāo)簽0和標(biāo)簽2全部被識(shí)別出,DDNN(T=0.2)主干的混淆矩陣中,數(shù)據(jù)集剩余的11.29%復(fù)雜樣本僅7個(gè)標(biāo)簽4被誤識(shí)別為標(biāo)簽3,其余樣本全部被識(shí)別出。由此可見,DDNN(T=0.2)將不同難易程度的樣本在邊緣端和云端進(jìn)行了有效的分配。
圖11 DDNN模型協(xié)同推理與單獨(dú)推理混淆矩陣Fig.11 DDNN confusion matrix for cooperative inference and independent inference
t-分布鄰域分布(t-distributed stochastic neighbor embedding,t-SNE)[22]是一種非線性降維算法,其將高維空間數(shù)據(jù)點(diǎn)之間的歐式距離轉(zhuǎn)換為條件概率來表達(dá)點(diǎn)與點(diǎn)之間的相似度,使高維數(shù)據(jù)點(diǎn)映射到低維也具有同樣的相似度,非常適用于將高維數(shù)據(jù)降維到二維或者三維進(jìn)行可視化。DDNN協(xié)同推理與單獨(dú)推理t-SNE可視化結(jié)果,如圖12所示。
圖12 DDNN模型協(xié)同推理與單獨(dú)推理t-SNE可視化結(jié)果Fig.12 DDNN t-SNE visualization results for cooperative inference and independent inference
由圖12可知,分支單獨(dú)推理的DDNN(T=0.5)和主干單獨(dú)推理的DDNN(T=0) t-SNE可視化結(jié)果中,存在某些標(biāo)簽決策邊界不明顯的問題,而分支與主干協(xié)同推理的DDNN(T=0.2)分支和主干t-SNE可視化結(jié)果中,均不存在標(biāo)簽間決策邊界不明顯的問題??梢?DDNN(T=0.2)分支和主干均能對(duì)分配樣本的高維特征完成較好的分離和匯聚。
為了驗(yàn)證分布式深度神經(jīng)網(wǎng)絡(luò)在故障診斷當(dāng)中相對(duì)于傳統(tǒng)模型的優(yōu)勢(shì),采用AlexNet、LeNet-5、InceptionV3傳統(tǒng)模型在識(shí)別精度、參數(shù)量、推理速度和通訊成本4個(gè)方面進(jìn)行對(duì)比試驗(yàn),對(duì)比結(jié)果如表9所示。相比于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型,DDNN(T=0.2)識(shí)別精度最高,達(dá)到了99.50%;模型參數(shù)量?jī)H次于參數(shù)量最少的InceptionV3,約超出后者參數(shù)量的1/4,但二者的推理速度基本持平;傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型云端推理過程前,需將圖像全部發(fā)送至云端,因傳感器傳輸?shù)臄?shù)據(jù)類型為32位浮點(diǎn)數(shù),且一個(gè)32位浮點(diǎn)數(shù)占據(jù)4 B,故發(fā)送一張28×28的浮點(diǎn)灰度圖像至云端所需的通訊成本等于模型自身的通訊成本期望,均為3 136 B,而DDNN(T=0.2)因其邊緣端提前退出機(jī)制,通訊成本期望僅占上述傳統(tǒng)模型的14.7%;推理速度雖稍遜于AlexNet、LeNet-5,但其他方面均占較大優(yōu)勢(shì)。綜上分析,DDNN(T=0.2)模型表現(xiàn)最優(yōu)。
表9 DDNN模型與傳統(tǒng)模型對(duì)比結(jié)果
采用公開的西儲(chǔ)大學(xué)軸承數(shù)據(jù)集[23]對(duì)DDNN模型的泛用性進(jìn)行驗(yàn)證,因軸承在實(shí)際工作場(chǎng)景中負(fù)載和噪聲不斷變化,故選取各類負(fù)載(0,0.75 kW,1.50 kW,2.25 kW)條件下的振動(dòng)信號(hào),并在其基礎(chǔ)上添加信噪比分別為-3 dB,0,3 dB,6 dB,9 dB的高斯白噪聲,且各信噪比噪聲的樣本數(shù)量與未添加噪聲的樣本數(shù)量相同,數(shù)據(jù)集處理方式與刮板輸送機(jī)啟停工況時(shí)域信號(hào)的處理方式相同,其樣本具體組成信息如表10所示。
表10 樣本具體組成信息Tab.10 Sample specific composition information
4.8.1 模型抗噪及泛化能力分析
DDNN模型在負(fù)載及噪聲混合場(chǎng)景中的測(cè)試結(jié)果,如表11所示。與無(wú)噪聲混合負(fù)載場(chǎng)景中DDNN測(cè)試結(jié)果相比,雖然在負(fù)載和噪聲混合噪聲場(chǎng)景中,噪聲的干擾使一部分樣本復(fù)雜化,導(dǎo)致分支樣本退出率減少,通訊成本增加了50%,模型推理時(shí)間略微增加,但主干模型依然能夠達(dá)到98.60%的識(shí)別精度,模型整體精度更是達(dá)到99.27%,表現(xiàn)出一定的抗噪能力。由3.6節(jié)可知,與集中式云計(jì)算神經(jīng)網(wǎng)絡(luò)相比,DDNN模型在保持高精度的同時(shí),依然可以降低32%的通訊成本。
表11 DDNN模型在負(fù)載和噪聲混合場(chǎng)景中的測(cè)試結(jié)果
DDNN模型在單一噪聲混合負(fù)載場(chǎng)景中的測(cè)試結(jié)果,如表12所示??梢钥闯鲂旁氡却笮∨c其對(duì)振動(dòng)信號(hào)的干擾強(qiáng)度大致成正比關(guān)系,雖然各信噪比場(chǎng)景中模型分支退出樣本的數(shù)量有所差異,但均達(dá)到了100%的識(shí)別精度,其中,當(dāng)信噪比為-3 dB時(shí)的噪聲對(duì)振動(dòng)信號(hào)的干擾最大,但主干模型依然能夠達(dá)到94.67%的識(shí)別精度,模型的整體識(shí)別精度則達(dá)到了96%以上,當(dāng)信噪比分別為3 dB,6 dB,9 dB時(shí),模型的整體精度均在99.5%以上,表現(xiàn)出一定的泛化能力。由3.6節(jié)可知,相比于集中式云計(jì)算的神經(jīng)網(wǎng)絡(luò)模型,DDNN模型在各信噪比下的通訊成本均少于前者。
表12 DDNN模型在單一噪聲混合負(fù)載場(chǎng)景中的測(cè)試結(jié)果Tab.12 Results of DDNN in a single noise mixed load scenario
4.8.2 模型泛用能力分析
在負(fù)載和噪聲混合噪聲場(chǎng)景的軸承數(shù)據(jù)集中,DDNN協(xié)同推理與單獨(dú)推理效果對(duì)比,如表13所示。根據(jù)對(duì)比結(jié)果,分支單獨(dú)推理的DDNN(T=0.7)在參數(shù)量、推理速度、通訊成本依然存在優(yōu)勢(shì),但識(shí)別精度過低,僅為97.13%;與主干單獨(dú)推理的DDNN(T=0)相比,分支與主干協(xié)同推理的DDNN(T=0.2)在增加DDNN(T=0.7)的560 k個(gè)參數(shù)后,識(shí)別精度提高到了99.27%,推理速度提高了20%,通訊成本降低了48%。可見DDNN不僅可以在刮板輸送機(jī)電流轉(zhuǎn)速信號(hào)數(shù)據(jù)集中實(shí)現(xiàn)邊緣端和云端計(jì)算資源的有效利用、通訊成本的降低和識(shí)別精度的提高,而且在軸承振動(dòng)信號(hào)數(shù)據(jù)集中也同樣適用,試驗(yàn)論證了DDNN模型具有一定的泛用性。
表13 DDNN模型協(xié)同推理與單獨(dú)推理效果對(duì)比
(1) 基于分布式深度神經(jīng)網(wǎng)絡(luò)的刮板輸送機(jī)啟停工況故障診斷方法,通過邊緣端與云端模型的協(xié)同推理,實(shí)現(xiàn)了刮板輸送機(jī)高精度、低通訊、低時(shí)延的啟停工況故障診斷,提高了設(shè)備監(jiān)測(cè)維護(hù)的智能化水平。
(2) DDNN模型將簡(jiǎn)單和復(fù)雜計(jì)算任務(wù)按需分配到邊緣端和云端,使邊緣端和云端計(jì)算資源利用率得到最大化,與傳統(tǒng)的故障診斷模型相比,DDNN在識(shí)別精度、模型參數(shù)量、推理速度和通訊成本4個(gè)方面表現(xiàn)出了顯著的優(yōu)勢(shì)。
(3) 所提方法具有一定的泛用性能,在不同對(duì)象、不同類型的數(shù)據(jù)集中仍然有較好的表現(xiàn),為其他礦山設(shè)備關(guān)鍵零部件的故障診斷提供了借鑒和參考。