王華偉,史天運*,閆永利
(1.中國鐵道科學研究院電子計算技術研究所,北京100083;2.中國鐵路總公司工電部,北京100844)
鐵路運輸設備是鐵路運輸生產的基礎,是鐵路運輸安全有序的可靠保證,鐵路機務、車輛、供電、工務、電務各專業(yè)分別建設了設備管理相關系統(tǒng),已部分實現(xiàn)運輸設備的專業(yè)化管理.然而對于運輸設備的統(tǒng)一管理和綜合評價還存在很大困難.管理單元是鐵路運輸設備監(jiān)控、維修、管理及分析決策的基礎對象和基本單位,因此運輸設備單元劃分合理與否,不僅會影響設備管理及決策分析的準確性,而且會影響設備的檢修和維護工作效率.
因此,需要結合運輸設備特點和管理需要,將鐵路運輸設備分成顆粒適度、便于管理、易于數(shù)據(jù)化的設備單元,從而實現(xiàn)運輸設備的統(tǒng)一化、標準化管理,為設備管理及狀態(tài)綜合評價提供支撐.
單元化管理思想是來源于精益化管理,是成組技術理論的一個成功應用.王祖錦等[1]把單元化管理思想運用到物流管理行業(yè),為精益物流管理提供了堅實的管理基礎;邵敏華等[2]開展了公路管理單元動態(tài)劃分技術研究;何洋等[3]開展鐵路工務維修管理單元劃分方法研究,為鐵路運輸設備單元化管理提供了成功的借鑒.然而,目前對于鐵路運輸設備統(tǒng)一的單元劃分方法尚無相關研究,因此開展鐵路運輸設備單元劃分方法研究,對于運輸設備綜合管理具有一定的創(chuàng)新性,具有非常重要的意義.
本文在分析鐵路運輸設備構成的基礎上,總結提出鐵路運輸設備單元劃分原則,基于K-means聚類算法開展鐵路運輸設備單元劃分方法研究,并經過實踐驗證方法的科學性和合理行.
鐵路運輸設備構成按其應用特點可分為固定設備設施、移動設備、安全監(jiān)測設備等幾大類[4].具體分類如表1所示.
表1 鐵路運輸設備構成Table 1 Railway transportation equipment constituent
充分考慮鐵路各專業(yè)運輸設備管理需求,鐵路運輸設備單元劃分要遵循以下6個原則.
(1)單元劃分的唯一性和獨立性.
每個單元的劃分明確區(qū)別于其他單元.保證運輸設備單元劃分的唯一性是管理單元的基礎工作,每個獨立的單元標識將是管理單元的“身份證”,直接影響到后續(xù)管理單元的管理及技術狀態(tài)數(shù)據(jù)的標準化.應同時符合兩方面的要求:一方面,應在運輸設備綜合管理系統(tǒng)中能準確、迅速地確定其單元身份;另一方面,符合用戶管理習慣,并能在現(xiàn)場應用中準確定位.
(2)單元劃分的完整性和簡化性.
按照運輸設備技術狀態(tài)管理全壽命周期綜合管理及狀態(tài)評價的需要,各相關專業(yè)運輸設備及組件都要包含在單元劃分范圍內,避免漏項,力求所有單元劃分的完整性.同時,通過評價單元的劃分,能夠使運輸設備管理及評價工作簡化便捷,方便運用管理.
(3)生產組織及后期維護的便捷性.
鐵路運輸設備技術狀態(tài)管理是一個復雜的系統(tǒng)化工程,涉及到設備從投產應用到報廢全壽命周期的監(jiān)測、檢修、維護等諸多環(huán)節(jié),設備管理單元的劃分必須能夠有效定位到相關設備,反映出問題所在,并能夠把設備單元存在的問題與后期的維修養(yǎng)護進行管理.所以說,設備單元的劃分不僅僅要考慮提高管理和分析的效率,而且要考慮到后期生產組織及后期維護的便捷性.
(4)技術狀態(tài)數(shù)據(jù)采集單元與理論分析模型的統(tǒng)一性.
運輸設備技術狀態(tài)管理實質上就是采集運輸設備單元全壽命周期內的履歷數(shù)據(jù)、檢測監(jiān)控數(shù)據(jù)、檢修維護數(shù)據(jù)等動靜態(tài)單元數(shù)據(jù),構建設備狀態(tài)分析評價模型,對設備性能、健康狀態(tài)等進行分析評價.因此,為保證理論分析的連貫性、科學性與一致性,對于設備技術狀態(tài)的管理單元的劃分,要與理論分析模型保持一致,保證技術狀態(tài)數(shù)據(jù)采集單元與理論分析模型的統(tǒng)一性.
(5)單元劃分粒度的適應性.
指運輸設備單元劃分粒度要適應各專業(yè)不同的運輸設備管理需要及分析需求,分析哪些技術狀態(tài)屬性成為單元劃分的依據(jù),應視系統(tǒng)目標的側重點找出影響系統(tǒng)決策分析的主要屬性,對于不同性質的單元,提供靈活的、適宜的、粒度不同的單元劃分標準.
(6)與生產布局和管理決策的一致性.
管理單元的劃分要考慮數(shù)據(jù)分析后的利用價值,將為運輸設備施工維修作業(yè)提供合理的方法和建議,優(yōu)化檢修作業(yè)流程,提高檢修作業(yè)效率.因此,運輸設備管理單元的劃分要充分考慮生產布局及管理決策的需要,保持與生產力布局和管理決策的統(tǒng)一性,全面提升運輸設備的管理及智能維修水平.
K-means算法是經典的劃分聚類方法之一,算法效率較高,在大規(guī)格數(shù)據(jù)聚類時得到較為廣泛的應用.K-means算法的基本原理是:首先設定k為參數(shù),確定需要將含有n個對象的數(shù)據(jù)集劃分成k個類,隨機地選取k個對象作為初始聚類中心;然后,對于剩余的每個對象,根據(jù)距離公式計算該對象到每一個初始聚類中心的距離,將計算好的數(shù)據(jù)對象劃分到最近的類中;最后重新計算每個類中心,不斷重復這個過程,直到準則函數(shù)收斂[5-6].K-means通常采用平方誤差準則函數(shù)進行收斂,其定義為
式中:E是數(shù)據(jù)集中所有對象的平方誤差的總和;p是數(shù)據(jù)集中的點;mi是類Ci的平均值.
K-means聚類算法流程如圖1所示.
圖1 聚類分析算法流程圖Fig.1 Flow chart of cluster analysis algorithm
鐵路運輸設備單元劃分的目的就是將各類運輸設備設施分成便于監(jiān)控管理、易于維護和量化分析的設備設施單元,滿足設備監(jiān)測、檢修、維護、管理分析的需要.因而對于運輸設備單元的劃分要綜合考慮設備日常監(jiān)測、檢修維護和管理分析過程中的重點因素,選擇構建完整、科學、客觀的設備單元劃分指標,本文選擇的鐵路運輸設備單元劃分指標如表2所示.
表2 鐵路運輸設備單元劃分指標Table 2 Railway transportation equipment unit division index
基于K-means聚類算法的運輸設備單元劃分模型具體實現(xiàn)如圖2所示.
圖2 基于K-means聚類算法的運輸設備單元劃分模型Fig.2 Unit division model of railway transportation equipment based on K-means clustering algorithm
按照運輸設備單元劃分原則,結合設備技術狀態(tài)屬性信息,現(xiàn)以電務通信設備為例對設備單元劃分算法原理及實現(xiàn)流程進行說明[7-8],基于K-means的通信專業(yè)運輸設備單元劃分步驟如下.
Step 1設所有要納入大數(shù)據(jù)平臺管理的通信設備設施及相關設備組件類別集合為S,S1,S2,…,Sn表示每類通信設備及組件,比如通信機房、通信鐵塔、通信光纜、通信電纜、分插復用設備、交流配電設備等,則有
Step 2準備樣本數(shù)據(jù).
①選取通信設備或組件的m個特征指標,若用P1,P2,P3,…,Pm表示,則
②根據(jù)管理需求及專家經驗,按照表2選取特征指標,P1,P2,P3,…,P8,分別代表日常監(jiān)測信息來源、日常檢查周期、中修周期、大修周期、報廢周期、設備所屬類別、安裝位置、設備基礎信息來源等,從不同通信設備類別中按該類別設備所占總設備數(shù)量的比重選取48類通信設備單元劃分樣本建立矩陣S,如表3所示.
表3 鐵路通信設備單元劃分樣本Table 3 Railway communication equipment unit division sample
③由于通信設備單元劃分屬性參數(shù)中既有定性指標,又有定量指標,且各指標數(shù)值的量綱不一致,因此特將樣本矩陣數(shù)據(jù)做統(tǒng)一的歸一化處理[9],如表4所示.
表4 鐵路通信設備單元劃分歸一化樣本Table 4 Railway communication equipment unit division sample normalization
Step 3根據(jù)聚類需要,初始化聚類中相關參數(shù),所選參數(shù)在計算迭代過程中可以調整優(yōu)化.
①確定數(shù)據(jù)集S需要劃分的聚類個數(shù)k;
②設定迭代次數(shù)為X,令X=1;
③在數(shù)據(jù)集S中,隨機選取k個數(shù)據(jù)對象,將這k個數(shù)據(jù)對象設定為初始聚類中心,即有C1(X),C2(X),C3(X),…,Ck(X)等k個初始聚類中心點;
④設定與聚類中心的距離參數(shù)ξ;
⑤選定數(shù)據(jù)樣本點與聚類中心的距離計算公式,利用歐幾里得距離公式式(4)進行計算.
式中:i=1,2,…,n;j=1,2,…,k.
Step 4利用式(4)分別計算樣本點與聚類中心的距離,確定樣本數(shù)據(jù)點歸屬的類.如果滿足,那么
式中:C(z)表示以Cz(X)為中心點的聚類,即數(shù)據(jù)點Si歸屬于C(z)類.
Step 5若計算完成后,某分類C(z)中的樣本數(shù)為零,則k=k-1,去掉該分類.
Step 6令X=X+1,計算新的k個聚類中心點.
式中:Nj為C(j)類中的樣本個數(shù).
Step 7計算平方誤差準則函數(shù)E的值為
Step 8判斷是否滿足條件|E(I)-E(I-1) |<ξ,若滿足,則算法結束;否則,返回Step4,繼續(xù)執(zhí)行迭代,直至結束.
利用Matlab的聚類函數(shù)按上述步驟對通信設備樣本進行聚類劃分,設D為各類數(shù)據(jù)點到其對應的聚類中心的距離平方和,利用D值作為聚類親和程度的衡量指標.隨著聚類數(shù)量k的變化,對應的D值變化結果如圖3所示.結果表明,當參數(shù)k=4時,D的變化趨于緩和,不再出現(xiàn)大幅的波動,因此最終聚類合適的分類個數(shù)為4,如果數(shù)量過少,劃分各類中單元關系不緊密,如果數(shù)量過多,資源分類過細,造成管理的繁瑣與不便.因此我們將最終的單元劃分數(shù)目k值設定為4.當k=4時,通信設備單元劃分結果如表5所示.
圖3 D-k關系對應曲線Fig.3 D-krelation curve
表5 鐵路通信設備單元一級聚類結果Table 5 Railway communication equipment unit first level clustering result
由表5實驗結果可以看出,基于K-means聚類的運輸設備單元劃分與傳統(tǒng)的按設備類別分類方式存在不同程度的差異:比如通信機房,按照傳統(tǒng)的設備分類方式,應與通信接入點、通信鐵塔、通信桿柱等歸為一類,同屬于通信基礎設施;而利用本文提出的單元劃分方法,通信機房則與電源等動力設備等歸為一類,原因是電源設備幾乎都安裝在通信機房內,且通信機房與電源等技術狀態(tài)參數(shù)都由動環(huán)監(jiān)測系統(tǒng)進行動態(tài)監(jiān)測,技術狀態(tài)分析和管理有著密切的關聯(lián)關系,相比之下,通信機房與其他基礎設施在狀態(tài)監(jiān)測與分析評價方面基本沒有太多關聯(lián)關系.再如電源設備,在傳統(tǒng)的設備分類中,其與其他通信設備屬于同一類,而本文提出的方法則將電源設備與其他通信設備分開,原因是電源設備無論從狀態(tài)監(jiān)測、檢修維護還是管理分析,本質上跟其他普通通信設備存在差異.
由此可見,本文提出的基于K-means聚類的運輸設備單元劃分比傳統(tǒng)的按設備類別分類,更符合設備技術狀態(tài)管理和分析的需求,其與傳統(tǒng)方式設備分類方式的具體對比如表6所示.
表6 本方法與傳統(tǒng)的人工設備劃分方法對比Table 6 The comparison between the proposed method and the traditional manual division method
總之,本文提出的基于K-means聚類的運輸設備單元劃分結合了設備日常監(jiān)測、檢修維護和管理分析等各類因素,與傳統(tǒng)的單純根據(jù)設備類別進行的設備分類方式相比較有明顯的優(yōu)勢,具有很好的實用價值,更適合于運輸設備生產組織、設備維護技術及狀態(tài)分析和管理.
本文對鐵路運輸設備構成進行了分析,明確了運輸設備管理及單元劃分的范圍,總結分析了運輸設備單元劃分原則,研究提出基于K-means聚類的鐵路運輸設備單元劃分方法,并選取電務通信專業(yè)運輸設備的樣本數(shù)據(jù)進行了方法驗證,實驗效果良好.今后,要考慮到專業(yè)管理的差異性,利用該方法更好地實現(xiàn)對其他專業(yè)設備管理單元的劃分.
[1]王祖錦.物流單元化管理及專業(yè)單元化器具系列連載之一物流單元化管理的基本思想[J].物流技術與應用,2006,11(4):96-98.[WANG Z J.Logistics management on unit load system(Ⅰ)the basic concept of logistics management on unit load system[J].Logistics&Material Handling,2006,11(4):96-98.]
[2]邵敏華,孫立軍.公路管理單元動態(tài)劃分技術與數(shù)據(jù)模型研究[J].同濟大學學報(自然科學版),2004,32(3):343-347.[SHAO M H,SUN L J.Research on segmentation technique and data modeling in highway management system[J].Journal of Tongji University,2004,32(3):343-347.]
[3]何洋,劉明亮,陳容淮,等.鐵路工務維修管理單元劃分方法研究[J].鐵道標準設計,2016,60(11):14-18.[HE Y,LIU M L,CHEN R H,et al.Research on railway maintenance managementunitdivision method[J].Railway Standard Design,2016,60(11):14-18.]
[4]吳芳.鐵路運輸設備[M].北京:中國鐵道出版社,2007.[WU F.Railway transportation equipment[M].Beijing:China Railway Press,2007.]
[5]楊陽.數(shù)據(jù)挖掘K-means聚類算法的研究[D].長沙:湖南師范大學,2015.[YANG Y.Research on K-means clustering algorithm in data mining[D].Changsha:Hunan Normal University,2015.]
[6]HONG Y,KWONG S.Learning assignment order of instancesforthe constrained K-meansclustering algorithm[J].IEEE Transactions on Systems Man&Cybernetics Part B Cybernetics A Publication of the IEEE Systems Man&Cybernetics Society,2009,39(2):568-574.
[7]關云鴻.改進K-均值聚類算法在電信客戶分類中的應用[J].計算機仿真,2011,28(8):138-140.[GUAN Y H.Application of improved K-means algorithm in telecom customer segmentation[J]. Computer Simulation,2011,28(8):138-140.]
[8]趙莉,候興哲,胡君,等.基于改進K-means算法的海量智能用電數(shù)據(jù)分析[J].電網技術,2014,38(10):2715-2720.[ZHAO L,HOU X Z,HU J,et al.Improved K-means algorithm based analysis on massive data of intelligent power utilization[J]. Power System Technology,2014,38(10):2715-2720.]
[9]趙興浩,鄧兵,陶然.分數(shù)階傅里葉變換數(shù)值計算中的量綱歸一化[J].北京理工大學學報,2005,25(4):360-364.[ZHAO X H,DENG B,TAO R.Dimensional normalization in the digital computation of the fractional fourier transform[J].Transactions of Beijing Institute of Technology,2005,25(4):360-364.]