吳昊臻 許燕 周建平 謝欣岳 彭東
摘要:抽油機故障診斷對于保障油氣田的穩(wěn)定運行至關(guān)重要。針對已有基于深度學習的故障診斷模型參數(shù)量大導致應用范圍受限的問題,提出一種基于空洞卷積和懲罰機制的卷積神經(jīng)網(wǎng)絡模型。該模型在淺層神經(jīng)網(wǎng)絡部署不同空洞卷積率的空洞殘差模塊,高效獲取示功圖輪廓特征的同時降低了模型參數(shù)量。其次,將懲罰機制融入Softmax損失函數(shù),增強模型診斷氣體影響等難分樣本的故障準確率。采用抽油機實況數(shù)據(jù)集進行實驗驗證,結(jié)果表明該模型參數(shù)量為0.94 M,浮點型計算量為165.24 M。與MobileNetV3相比,改進后的算法模型在準確率同為96.6%的前提下參數(shù)量減少了3.30 M,浮點型計算量減少了52.22 M,更易部署在資源受限的故障診斷平臺。
關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡;抽油機;故障診斷;空洞卷積;損失函數(shù)
中圖分類號:TP183文獻標識碼: ADOI:10.3969/j.issn.1007-791X.2024.01.0040
引言
隨著淺層油藏的開采殆盡,現(xiàn)有的油田逐漸向著深層油藏發(fā)展,而地層深處環(huán)境復雜,抽油機易受氣、液、砂等多種因素干擾,一旦發(fā)生故障將會造成極大的經(jīng)濟損失[1]。因此,對抽油機進行高效故障診斷的研究有很強的現(xiàn)實意義。由于井下工況難以直接監(jiān)測,人們設計了間接反映井下工況的抽油機示功圖,根據(jù)示功圖反映的不同輪廓特征可以對抽油機的故障類型做出判斷[2]。現(xiàn)階段抽油機故障診斷方法主要分為傳統(tǒng)方法和深度學習方法,傳統(tǒng)方法首先對示功圖圖像分析獲取各類典型特征[3](如點、面積、方差等)并建立樣本庫,通過機器學習的方式(如支持向量機[4]、極限學習機[5])進行故障種類識別,實現(xiàn)抽油機故障診斷。但傳統(tǒng)的故障診斷模型的搭建過于依賴研究者的經(jīng)驗,設計分類器等各個部分的最優(yōu)解容易導致整體模型的局部最優(yōu)解,從而影響故障診斷的準確率。
近年來隨著深度學習的出現(xiàn),基于卷積神經(jīng)網(wǎng)絡的目標識別方法被廣泛應用于機械故障診斷領域[6],并在抽油機故障診斷方面有一定的發(fā)展。文獻[7]提出將卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks,CNN)引入抽油機故障診斷中,通過對LeNet5模型做出改進,減少了模型參數(shù),加快了模型收斂速度,使診斷準確率達到89.3%,驗證了CNN應用于抽油機故障診斷的可行性。文獻[8]將深層卷積神經(jīng)網(wǎng)絡模型DenseNet應用于抽油機故障診斷,獲得了93.8%的準確率,驗證了加深網(wǎng)絡模型的層數(shù)可以顯著提高抽油機故障診斷的準確率。文獻[9]在MobliNetV2的基礎上引入注意力機制,增強模型對示功圖輪廓特征的提取能力。同時其提出注意力損失函數(shù)抑制易分樣本對模型訓練的貢獻,在輕量級模型中準確率達到95.1%,但模型參數(shù)量增加至4.6 M。
現(xiàn)有研究中雖然考慮到了示功圖圖像輪廓特征更為重要和示功圖數(shù)據(jù)集存在易分樣本與難分樣本區(qū)別的特點,但所使用的注意力機制反而增加了模型的參數(shù)量,而且沒有考慮到示功圖數(shù)據(jù)集中易分樣本自身準確率極高的特點。因此,為了滿足更快更準確地進行抽油機故障診斷的需要和順應油田數(shù)據(jù)處理邊緣化的發(fā)展需求,在保證準確率的前提下應盡可能地減少故障診斷模型的參數(shù)量,以期未來能夠在嵌入式端進行部署應用。同時考慮到示功圖數(shù)據(jù)集中易分樣本自身擁有極高準確率,產(chǎn)生的損失值較低的特點,更應對難分樣本進行處理,增強難分樣本對模型的貢獻度,將訓練集中在準確率較低的樣本上。
基于上述問題與分析,本文提出基于空洞卷積和懲罰機制的卷積神經(jīng)網(wǎng)絡(Dilated Convolutional and Penalty Mechanism-CNN,DCPM-CNN)智能診斷方法。該方法使用空洞卷積快速擴大模型淺層所獲得的感受野,從而減少模型達到最優(yōu)效果所需要的參數(shù)量。其次,提出一種懲罰系數(shù)用于Softmax損失函數(shù)中,提高難分樣本在反向傳播時的貢獻度。使用新疆準噶爾東部某油田作業(yè)區(qū)實況數(shù)據(jù)集對模型性能進行驗證。通過對比性能指標發(fā)現(xiàn),相較于現(xiàn)有抽油機故障診斷方法,改進后的模型擁有更小的參數(shù)量和更高的準確率。
1DCPM-CNN模型
1.1網(wǎng)絡結(jié)構(gòu)
對現(xiàn)有輕量級CNN進行分析,MobileNetV1[10]模型提出了深度可分離卷積使參數(shù)量大幅下降,實現(xiàn)了網(wǎng)絡的輕量化,但單一通道的連續(xù)卷積往往會導致權(quán)重更新時的梯度過于極端,最終導致模型過擬合或欠擬合。ShuffleNetV1[11]模型提出了通道混洗操作實現(xiàn)深度可分離卷積后各通道的特征交互,有效避免了過擬合問題的出現(xiàn)。
本文針對示功圖線條稀疏性的圖像特點和輪廓特征更為重要的卷積特征要求,基于空洞卷積、深度可分離卷積和通道混洗操作的特點,設計了空洞殘差(Dilated Convolution Residual,DCR)模塊和深度多維混合(Depthwise Multidimensional Shuffle,DMS)模塊,在保證準確率的前提下,達到了大幅減少模型參數(shù)量的研究目的。其次,提出一種懲罰損失函數(shù)(Penalized Softmax,P-Softmax),提高難分樣本對模型的貢獻度。模型整體結(jié)構(gòu)如圖1所示。
DCPM-CNN在輸入特征進行普通卷積和最大池化操作之后,通過兩層DCR模塊疊加快速擴大感受野,且該模塊僅位于模型的第3~6層,避免了深層網(wǎng)絡在應用空洞卷積時由于輸入特征尺寸過小導致的相鄰信息丟失問題。得益于DCR模塊在淺層獲得的大感受野,將深層部分的DMS模塊減少至8個,并采用[2、4、2]的紡錐形結(jié)構(gòu)保證深層特征圖的多層次獲取,提高輸出特征信息表達力的同時降低了整體模型的參數(shù)量。各部分的模型參數(shù)如表1所示。在DMS模塊之后使用一個通道數(shù)為1 024的1×1卷積層和全局池化層增強網(wǎng)絡的非線性以及將特征圖大小降至1×1。最后對全連接層的輸出使用懲罰損失函數(shù)P-Softmax替代Softmax損失函數(shù)。
對于給定計算預算,DCPM-CNN可以在淺層產(chǎn)生更廣泛的輪廓特征,這對于示功圖的故障診斷至關(guān)重要,意味著高層語義的快速獲取和無效干擾信息的快速消除。此外,在DCPM-CNN中,深度可分離卷積僅在深層特征圖上執(zhí)行,因為雖然深度可分離卷積的理論浮點型運算量非常低,但它在現(xiàn)有TensorFlow等框架下的數(shù)據(jù)提取仍存在問題,導致深度可分離卷積雖然在深層網(wǎng)絡的實現(xiàn)效果很好,但在淺層網(wǎng)絡的運算時間與效果都差強人意,這與空洞卷積的運算特點產(chǎn)生了互補,使模型整體達到最優(yōu)效果。
1.2空洞殘差模塊
現(xiàn)有的抽油機故障診斷模型在提取示功圖輪廓特征時往往忽略了示功圖線條稀疏性和存在大量空白無用信息的圖像特點,針對這一示功圖圖像特點引入了空洞卷積(Dilated Convolution,DConv)操作??斩淳矸e最初被提出用于小波分解的相關(guān)研究[12],現(xiàn)多用于高層圖像語義特征的多維提取[13-14]。如圖2所示,空洞卷積的主要思想是使用零來間隔填充卷積核,在參數(shù)量不變的前提下實現(xiàn)感受野的增長,更快地篩除示功圖中空白無用的信息,而更大的感受野代表著空洞卷積的輸出所包含的特征信息比普通卷積的映射范圍更大,使神經(jīng)網(wǎng)絡更關(guān)注示功圖輪廓特征變化。使用普通卷積時,第i層的感受野尺寸為
使用空洞卷積時,第i層的感受野尺寸為
式中,si為第i層的步距,kdilated為空洞卷積等效卷積核大小,k為普通卷積核大小,r為空洞卷積率。
基于上述空洞卷積的特點,構(gòu)建了一種DCR模塊應用于淺層卷積神經(jīng)網(wǎng)絡中,加快示功圖輪廓特征的提取,從而在保證準確率的前提下減少模型的參數(shù)量和計算量。DCR模塊結(jié)構(gòu)如圖3所示,考慮到空洞卷積層連續(xù)疊加可能會導致的網(wǎng)格效應和遠距離信息沒有相關(guān)性問題,在卷積結(jié)構(gòu)設計時遵循混合空洞卷積HDC[15]準則。模塊采用3×3卷積核,空洞卷積率r=[2、5]兩層級聯(lián)空洞卷積快速獲取示功圖輪廓特征,同時在輸出端使用殘差結(jié)構(gòu)與輸入特征疊加以削減空洞卷積帶來的影響,隨后使用BN層和Relu層增加輸出特征的非線性和避免過擬合。沒有采用常規(guī)的r=[1、2、5]組合,是因為在淺層神經(jīng)網(wǎng)絡增加卷積層會導致模型參數(shù)增加5 184個,但由于3×3卷積核太小導致準確率提高困難。經(jīng)實驗最終選擇了r=[2、5]的組合。由式(1)、(2)可得,當r = [1、1]時DCR模塊的感受野為5×5,當r=[2、5]時感受野為15×15,是前者的9倍。
1.3深度多維混合模塊
深度可分離卷積近年來被廣泛應用于新型的輕量級卷積網(wǎng)絡結(jié)構(gòu)中[16-17],通過深度卷積(Depthwise Convolution,DWConv)與逐點卷積(Pointwise Convolution,PWConv)配合,在減少參數(shù)量的同時使輸出特征矩陣通道維度保持不變。普通卷積與深度可分離卷積的浮點型計算量為
式中,{DK,DK}為卷積核大小,{DF,DF,M}為輸入特征圖,{DF,DF,N}為輸出特征圖,ZDW+PW為深度可分離卷積層浮點型計算量,Zcon2d為普通卷積層浮點型計算量。
由式(6)可見若取常用DK=3,則理論上普通卷積的浮點型計算量是深度可分離卷積的9倍。根據(jù)示功圖線條稀疏性和圖形輪廓更為重要的特點,結(jié)合1.2中的空洞卷積特性,在如圖4所示的深度可分離卷積模塊基礎上進行改進,改進后的DMS模塊結(jié)構(gòu)如圖5所示。將輸入通道拆分為兩組后,每路的通道數(shù)為原來的1/2,主路使用卷積核大小3×3,空洞卷積率r=1的DWConv配合兩個1×1的PWConv完成升降維操作,在卷積操作的同時大幅減少模塊的參數(shù)量。由于DMS模塊部署在深層特征圖上,為了減少空洞卷積導致的信息丟失,支路部分使用了一個卷積核大小3×3,空洞卷積率r=2的DWConv和1×1的PWConv。帶有空洞卷積核的DWConv能夠快速篩除示功圖中的無用信息,同時獲得更豐富的卷積特征,1×1的PWConv配合BN層和Relu層,在增強輸出卷積特征的非線性的同時增加維度至與主路相同。主路和支路的通道合并后使用通道混洗操作完成多通道特征信息的交互,進一步增強DMS模塊輸出特征的信息表達力。
1.4懲罰損失函數(shù)
在抽油機工況數(shù)據(jù)集中,抽油桿斷脫、柱塞頭出工作筒、雙凡爾同時漏失等典型故障均有著與其他示功圖明顯的區(qū)分特征。這些易分樣本在模型訓練過程中較易識別正確,診斷準確率高,而氣體影響、供液不足的示功圖輪廓特征較為相近,診斷準確率較低。因此模型訓練時更應集中訓練此類難分樣本。
目前卷積神經(jīng)網(wǎng)絡中常用的Softmax損失函數(shù)[18]為
式中,yi為當前樣本所屬故障種類的概率值,N是樣本的類別數(shù)。
Softmax損失函數(shù)的函數(shù)值與樣本的yi值直接相關(guān),沒有樣本傾向性。而考慮到示功圖數(shù)據(jù)集中易分樣本自身準確率極高,因此需要增強難分樣本的模型貢獻度。為實現(xiàn)這一目的,對現(xiàn)有的A-Softmax[19]、AM-Softmax[20]等多種改進損失函數(shù)總結(jié)后發(fā)現(xiàn),其改進反映在神經(jīng)網(wǎng)絡反向傳播中是當權(quán)重與特征的夾角θ增大時,cos(mθ+m)+m會產(chǎn)生比cos(θ)更小的值,yi值下降,從而提高難分樣本的Loss函數(shù)值?;谶@種思想提出一種懲罰機制增大難分樣本的損失值,提高神經(jīng)網(wǎng)絡訓練時對于難分樣本的關(guān)注度,最終的P-Softmax損失函數(shù)定義為
式中,值1.8是經(jīng)實驗選出的適合示功圖數(shù)據(jù)集的超參數(shù)。本文的懲罰損失函數(shù)存在以下特性:1)對于易分樣本,樣本預測概率yi趨近于1,懲罰系數(shù)趨近于0.9,損失值減小,抑制易分樣本的損失貢獻;2)對于難分樣本,樣本預測概率yi趨近于0,懲罰系數(shù)趨近于1.8,損失值增大,增強難分樣本的損失貢獻。這種懲罰機制不但增強了難分樣本對模型參數(shù)訓練的貢獻度,而且損失值的增大加快了模型初期的收斂速度。
2抽油機故障診斷實驗
2.1數(shù)據(jù)集及參數(shù)設置
實驗數(shù)據(jù)來自新疆準噶爾東部某油田作業(yè)區(qū),通過無線示功儀采集獲得示功圖圖像,圖片重構(gòu)至224×224尺寸,再經(jīng)歸一化、二值化完成圖片的預處理工作,數(shù)據(jù)集總量為15 229張,經(jīng)專家標定分類為正常示功圖、供液不足、氣體影響、雙凡爾同時漏失、游動凡爾漏失、出砂、活塞碰泵、抽油桿斷脫、柱塞頭出工作筒等9種抽油機典型故障。每種故障的典型示功圖如圖6所示,其中S為抽油機驢頭懸點位移,P為抽油機泵載荷。為保持樣本平衡,對抽油桿斷脫等樣本進行數(shù)據(jù)增強。最終各典型故障示功圖訓練集每類1 000張,測試集每類250張,標簽索引分配結(jié)果如表2所示。
實驗運行環(huán)境為Windows 7(64位)操作系統(tǒng),搭載NVIDIA GeForce GTX 960M,Intel Core i7-4710MQ CPU @ 2.50 GHz,計算機內(nèi)存為16 GB,Anaconda 4.13.0,CUDA 10.1編程平臺,cuDNN 7.6,基于開源深度學習框架TensorFlow 2.8開發(fā)環(huán)境,使用Python 3.7編程語言,模型訓練中隨機梯度下降法,動量設為0.9。根據(jù)GPU的內(nèi)存和數(shù)據(jù)集實際情況,批處理設置為16,初始學習率為0.001。
2.2實驗結(jié)果及分析
為了驗證DCPM-CNN模型的有效性,對ResNet50[21]、VGG16等多個經(jīng)典卷積神經(jīng)網(wǎng)絡進行對比實驗,選取參數(shù)量、浮點型運算量,準確率對模型的性能進行評估。同時與文獻[9]、文獻[22]提出的抽油機故障診斷模型做對比。表3為示功圖數(shù)據(jù)集在不同神經(jīng)網(wǎng)絡的訓練情況對比。
實驗結(jié)果表明:1)ResNet50、VGG16模型參數(shù)量,浮點型計算量均過大,并不適用于硬件環(huán)境受限的抽油機故障診斷設備中。2)DCPM-CNN在同等量級的網(wǎng)絡模型中達到了最高的96.6%,與MobileNetV3持平,超過AlexNet、ShuffleNetV2和現(xiàn)有的抽油機故障診斷模型。3)在模型參數(shù)量和計算量方面,輕量級神經(jīng)網(wǎng)絡方面DCPM-CNN模型僅為0.94 M和165.24 M,相比MobileNetV3減少了3.30 M(77.8%)和52.22 M(24.0%),比ShuffleNetV2減少0.34 M(26.5%)而浮點型運算僅增加了20.98 M。經(jīng)以上對比分析,DCPM-CNN在保證了準確率的前提下參數(shù)量和浮點型運算量都達到了較低的量級,充分降低抽油機故障診斷模型運行所占用的系統(tǒng)資源。
表4展示了DCPM-CNN模型對示功圖各類典型故障的診斷效果。對訓練好的DCPM-CNN模型進行典型故障樣本的正確率驗證,每類隨機抽取樣本圖片300張(不屬于訓練集樣本)做驗證。表中數(shù)據(jù)為5次實驗取平均值。采用精確率(Precision)作為性能指標,其代表模型預測的某類故障中預測正確所占的比例,計算公式為
式中,NTP為真實值為1,預測值也為1的所有樣本數(shù)量,NFP為真實值為0,預測值為1的所有樣本數(shù)量。
由表中數(shù)據(jù)可得:1)作為抽油機一級故障的抽油桿斷脫,柱塞頭出工作筒驗證精確率達到99%以上,保證了嚴重突發(fā)情況時診斷系統(tǒng)的可靠性;2)難分樣本中供液不足、氣體影響的精確率均達到了94%以上。能夠滿足故障診斷系統(tǒng)對難分故障診斷精度的要求。圖7為驗證集測試所得的混淆矩陣圖,其中坐標軸0~8依次代表正常、供液不足、氣體影響、雙凡爾同時漏失、游動凡爾漏失、出砂、活塞碰泵、抽油桿斷脫、柱塞頭出工作筒,縱軸表示樣本的實際工況標簽,水平軸表示樣本的預測工況標簽。所有正確的預測均位于表格的對角線上,以便直觀地檢查識別結(jié)果中的錯誤。由圖可得本研究提出的DCPM-CNN的實際診斷效果良好。
DCPM-CNN模型的核心特點在于淺層DCR模塊對于模型整體性能的影響,為了探究不同空洞卷積率對示功圖故障診斷的影響,選擇常用的幾組空洞卷積率組合進行對比實驗,實驗中所有的卷積核尺寸為k=3。結(jié)果如表5所示,可以看出隨著空洞卷積率的增大,準確率和訓練時間不斷增加,但r=[6、12]時的準確率有所下降。這是由于空洞卷積實際計算時卷積核不連續(xù),需要多次訪存才能獲取目標數(shù)據(jù)導致。因此并不是空洞卷積率越大越好。經(jīng)實驗效果最好的組合為r=[2、5],相比于普通卷積操作,正確率提高了1.0%。
為了進一步驗證本文的DMS模塊和P-Softmax損失函數(shù)的有效性,通過融合實驗進行性能對比分析,設計三種不同的模型方案,對比指標是模型訓練時間和準確率。
方案一:模型3~6層為DCR模塊,7~30層為深度可分離卷積模塊,損失函數(shù)為Softmax。
方案二:模型3~6層為DCR模塊,7~30層為DMS模塊,損失函數(shù)為Softmax。
方案三:模塊3~6層為DCR模塊,7~30層為DMS模塊,損失函數(shù)為P-Softmax。
表6為DCPM-CNN的融合實驗性能對比,實驗結(jié)果表明:1)在使用DMS模塊替換深度可分離卷積模塊后,憑借多個維度的卷積特征疊加和通道混洗操作,準確率增加了1.4%,證明DMS模塊有效性的同時也側(cè)面印證了空洞卷積對于示功圖特征提取的有效性;2)引入懲罰機制,通過改變不同樣本的貢獻度,使模型訓練過程中較多地關(guān)注難分樣本,在訓練時間少量增加的情況下準確率又增加了0.9%。
將帶有懲罰機制的P-Softmax損失函數(shù)應用于3種不同的輕量級CNN模型,并與Softmax損失函數(shù)進行準確率對比。圖8為MobileNetV3、ShuffleNetV2和DCPM-CNN模型在示功圖數(shù)據(jù)集上的訓練結(jié)果。在應用了P-Softmax損失函數(shù)后,3種輕量級CNN模型的準確率分別提高了0.6%、0.9%和0.9%,進一步證明了懲罰損失函數(shù)的普適性。
最后,設計對比實驗驗證DCPM-CNN模型的普適性和魯棒性,將MobileNetV3、ShuffleNetV2和DCPM-CNN模型應用于有代表性的MINIST和Flower測試數(shù)據(jù)集,實驗結(jié)果如表7所示。結(jié)果表明DCPM-CNN在典型自然圖像的Flower數(shù)據(jù)集上,由于淺層使用空洞卷積導致圖像細粒度信息少量丟失,準確率略差于MobileNetV3,而在充分體現(xiàn)輪廓特征重要性的MNIST數(shù)據(jù)集上準確率明顯高于現(xiàn)有模型,進一步證明了DCPM-CNN更適用于如抽油機故障診斷、工業(yè)草圖識別、路面裂痕監(jiān)測等需要充分獲取全局特征信息的情況。
3結(jié)論
針對抽油機故障診斷模型參數(shù)量大、應用受限的問題,本文提出了一種基于空洞和懲罰機制的卷積神經(jīng)網(wǎng)絡模型DCPM-CNN,相較于經(jīng)典網(wǎng)絡模型主要有以下三點改進:
1) 針對示功圖圖像無用信息過多的特點,構(gòu)建DCR模塊應用于淺層神經(jīng)網(wǎng)絡,利用空洞卷積的大感受野快速過濾無用信息,獲取輪廓語義特征,進而減少模型效果達到最優(yōu)所需要的參數(shù)量。
2) 構(gòu)建DMS模塊,使用通道混洗操作避免深度可分離模塊可能導致的過擬合問題,通過空洞卷積與普通卷積的特征重用輸出多種分辨率特征,提高模型的故障診斷精度。
3) 針對氣體影響等典型故障易構(gòu)成難分樣本且示功圖數(shù)據(jù)集中易分樣本高準確率的特點,提出一種懲罰機制增強難分樣本對模型的貢獻度。
通過與現(xiàn)有經(jīng)典網(wǎng)絡模型以及其他文獻提出的模型對比,DCPM-CNN模型在同等量級下?lián)碛凶罡叩臏蚀_率(96.6%)和最小的參數(shù)量(0.94 M),可以滿足實際抽油機故障診斷任務的需求。
參考文獻
[1] 張乃祿,孫換春,郭永宏,等.基于示功圖的油井工況智能分析 [J].油氣田地面工程,2011,30(4):7-9.
ZHANG N L,SUN H C,GUO Y H,et al.Intelligent analysis of oil well working conditions based on display power diagram [J].Oil-gas Field Surface Engineering,2011,30(4):7-9.
[2] 楊永江.淺談抽油機異常示功圖的解釋分析 [J].化學工程與裝備,2018(9):44-46.
YANG Y J.Interpretation and analysis of abnormal power diagram of pumping machine [J].Chemical Engineering and Equipment,2018(9):44-46.
[3] ZHANG R,WANG Z,WANG X,et al.Integrated diagnostics method and application of ground and down hole working condition in rod pumping well [J].Journal of Applied Science and Engineering,2018,21(4):615-624.
[4] LV X,WANG H,ZHANG X,et al.An evolutional SVM method based on incremental algorithm and simulated indicator diagrams for fault diagnosis in sucker rod pumping systems [J].Journal of Petroleum Science and Engineering,2021,203:1-17.
[5] LI K,HAN Y,WANG T.A novel prediction method for down-hole working conditions of the beam pumping unit based on 8-directions chain codes and online sequential extreme learning machine [J].Journal of Petroleum Science and Engineering,2018,160:285-301.
[6] 姜萬錄,李振寶,雷亞飛,等.基于深度學習的滾動軸承故障診斷與性能退化程度識別方法 [J].燕山大學學報,2020,44(6):526-536.
JIANG W L,LI Z B,LEI Y F.et al.Deep learning based rolling bearing fault diagnosis and performance degradation degree recognition method [J].Journal of Yanshan University,2020,44(6):526-536.
[7] 劉寶軍.基于CNN卷積神經(jīng)網(wǎng)絡的示功圖診斷技術(shù) [J].西安石油大學學報(自然科學版),2018,33(5):70-75.
LIU B J.Research on diagnostic technique of indicator diagram based on CNN convolution neural network [J].Journal of Xi′an Shiyou University (Natural Science Edition),2018,33(5):70-75.
[8] 段志剛,李漢周,司志梅,等.基于遷移學習的示功圖診斷方法 [J].石油化工自動化,2022,58(1):72-76.
DUAN Z G,LI H Z,SI Z M,et al.Diagnosis method of indicator diagram based on transferring learning [J].Automation in Petro-chemical Industry,2022,58(1):72-76.
[9] 杜娟,劉志剛,宋考平,等.基于卷積神經(jīng)網(wǎng)絡的抽油機故障診斷 [J].電子科技大學學報,2020,49(5):751-757.
DU J,LIU Z G,SONG K P,et al.Fault diagnosis of pumping unit based on convolutional neural network [J].Journal of University of Electronic Science and Technology of China,2020,49(5):751-757.
[10] ANDREW G H,ZHU M L,CHEN B,et al.Mobilenets:efficient convolutional neural networks for mobile vision applications [J].Applied Intelligence,2019,50(1):107-118.
[11] ZHANG X,ZHOU X,LIN M,et al.ShuffleNet:an extremely efficient convolutional neural network for mobile devices [C]// 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition,Salt Lake City,USA,2018:6848-6856.
[12] HOLSCHNEIDER M,KRONLAND-MARTINET R,MORLET J,et al.A real-time algorithm for signal analysis with the help of the wavelet transform [C]// Wavelets:Inverse Problems and Theoretical Imaging.Berlin/Heidelberg:1990:286-297.
[13] 王丹,李琦,梁棟,等.基于多尺度全卷積與CRF的路面裂縫檢測算法 [J].燕山大學學報,2021,45(4):367-376.
WANG D,LI Q,LIANG D,et al.Road crack detection algorithms based on multi-scale fully convolution and CRF [J].Journal of Yanshan University,2021,45(4):367-376.
[14] 楊云航,閔連權(quán).采用空洞卷積的多尺度融合草圖識別模型 [J].西安電子科技大學學報,2021,48(5):92-99.
YANG Y H,MIN L Q.Multi-scalefusion sketch recognition model by dilated convolution [J].Journal of Xidian University,2021,48(5):92-99.
[15] WANG P,CHEN P,YUAN Y,et al.Understanding convolution for semantic segmentation [C]// 2018 IEEE Winter Conference on Applications of Computer Vision,Lake Tahoe,USA,2018:1451-1460.
[16] HOWARD A,SANDLER M,CHU G,et al.Searching for mobilenetv3 [C]// Proceedings of the IEEE/CVF International Conference on Computer Vision,Seoul,Korea,2019:1314-1324.
[17] TAN M,LE Q.Efficientnetv2:smaller models and faster training [C]// International Conference on Machine Learning,2021:10096-10106.
[18] 任進軍,王寧.人工神經(jīng)網(wǎng)絡中損失函數(shù)的研究 [J].甘肅高師學報,2018,23(2):61-63.
REN J J,WANG N.Research on cost function in artificial neural network [J].Journal of Gansu Normal University,2018,23(2):61-63.
[19] LIU W,WEN Y,YU Z,et al.Large-margin softmax loss for convolutional neural networks [C]// International Conference on Machine Learning,New York,USA,2016:507-516.
[20] WANG F,CHENG J,LIU W,et al.Additive margin softmax for face verification[J].IEEE Signal Processing Letters,2018,25(7):926-930.
[21] HE K,ZHANG X,REN S,et al.Deep residual learning for image recognition [C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,Las Vegas,USA,2016:770-778.
[22] 段友祥,李鈺,孫歧峰,等.改進的Alexnet模型及在油井示功圖分類中的應用 [J].計算機應用與軟件,2018,35(7):226-230.
DUAN Y X,LI Y,SUN Q F,et al.Improved alexnet model and using in dynamometer card classification [J].Computer Applications and Software,2018,35(7):226-230.
Fault diagnosis of pumping unit based on convolutional neural network
WU Haozhen1,XU Yan1,ZHOU Jianping1,XIE Xinyue1,2,PENG Dong1
(1. College of Mechanical Engineering,Xinjiang University,Urumqi,Xinjiang 830039,China;
2. Xinjiang Golden Calf Energy IOT Technology Co. Ltd.,Karamay,Xinjiang 834008,China)
Abstract:Pumping unit fault diagnosis is crucial to ensure the stable operation of oil and gas fields.The current fault diagnosis of pumping unit based on deep learning model has the problem that the number of parameters is too large,and it is difficult to be widely used in actual production.Considering the real demand for reducing system resource usage of the fault diagnosis model,a novel convolutional neural network is established based on dilated convolution and penalty mechanism in this study.In this model,dilated convolution residual blocks of different dilated convolution rates are deployed in the shallow neural network to efficiently acquire the contour features of the dynamometer card and reduce the number of model parameters.Moreover,the penalty mechanism is integrated into the Softmax loss function to enhance the influence of indistinguishable samples (such as gas influence) on the fault diagnosis model.Experimental validation is conducted with the data set made from actual working conditions of the pumping unit.When the accuracy rate is 96.6%,the number of parameters acquired by this model is 0.94 M,which is decreased by 3.30 M in MobileNetV3 model.Similarly,the floating-point operations calculated by this model is 165.24 M,which are also decreased by 52.22 M in MobileNetV3 model.In conclusion,the convolutional neural network holds potentially promising in the resource-constrained platform of actual production.
Keywords: convolutional neural network;pumping unit;fault diagnosis;dilated convolution;loss function