郭珊珊,張 立,崔 威,王志紅,趙貝貝
(1.國網河南省電力公司,河南 鄭州 450000;2.華北電力大學(北京),北京 102206)
采購環(huán)節(jié)是提高企業(yè)效益的源頭,為了適應新形勢下的發(fā)展,電網企業(yè)對采購管理提出了更高、更嚴的標準。由于電網企業(yè)服務類采購對象種類多、數量大,合理地采購方法可以顯著提高工作效率,減少采購費用的支出,所以對每類需求選取適合地采購組織方式具有重要的戰(zhàn)略意義。
在快速聚類與系統(tǒng)聚類模型方面,國內外學者在不同方面進行了應用。在混合聚類運用方面,將快速聚類與系統(tǒng)聚類相結合的混合聚類方法對交通數據進行分析,并以經典的silhouette評價指標作為聚類終止條件制定了相應時段的控制方案[1]。在快速聚類運用方面,使用K-means聚類和商業(yè)自動數據挖掘工具KXEN提出了江蘇常州電信客戶細分的解決方案[2]。計算Web服務的相似性,并使用該數據生成K均值聚類算法的集群[3]。采用兩階段K均值聚類來識別第一階段的不可信度指數,根據第二階段的索引對用戶進行聚類,得到可靠的聚類信息[4]。從數據挖掘技術,客戶的供電可靠性要求、客戶價值和客戶行為三個維度,建立細分指標體系,利用K-means聚類法建立客戶細分模型[5]。在K-means算法改進方面,應用改進的K-means算法進行客戶聚類,將該方法與經典K均值和分層方法的其他聚類算法進行比較[6]。在系統(tǒng)聚類運用方面,加權的系統(tǒng)聚類方法通過對不同的客戶特征賦予不同的權重,達到對客戶的聚類結果更符合企業(yè)經營目標的目的[7]。應用系統(tǒng)聚類建立圖書館讀者細分模型,進而提出了四種不同的細分方式[8]。通過文獻綜述可知,國內外學者對聚類模型的應用都偏向于一種方法的使用,本文將快速聚類與系統(tǒng)聚類進行綜合應用,使得服務類項目的分類更加準確,從而有效提高服務類采購質量,保證采購高效性。
(1)系統(tǒng)聚類的基本思想為:對于位置類別的樣本或變量,依據相應的定義把他們分為若干類,分類過程是一個逐步減小類別的過程,在每一個聚類層次,必須滿足“類內差異小、類間差異大”的原則,直至歸為一類。評價聚類效果指標一般是方差,距離小的樣品所組成的類方差較小。樣本距離計算方法較多,本文用歐氏距離計算方法:
系統(tǒng)聚類過程操作步驟如下:
①設初始模式樣本共有N個,每個樣本自成一類,即建立N類,計算各類之間的距離(初始時即為各樣本間的距離),得到一個N*N維的距離矩陣D(0)。這里,標號(0)表示聚類開始運算前的狀態(tài)。
②假設前一步聚類運算中已求得距離矩陣D(n),n為逐次聚類合并的次數,則求D(n)中的最小元素。如果它是)和)兩類之間的距離,則將)和)兩類合并為一類由此建立新的分類:
④返回第二步,重復計算及合并,直到得到滿意的分類結果(如:達到所需的聚類數目,或D(n)中的最小分量超過給定閾值D等)。
(2)快速聚類的基本思想為將給定的樣本劃分為K類,K預先指定?;谑咕垲愋阅苤笜俗钚』?,所用的聚類準則函數是聚類集中每一個樣本點到該類中心的距離平方之和,并使其最小化。
聚類過程操作步驟如下:
①為每個聚類確定一個初始聚類中心,這樣,就有K個初始聚類中心。
②將樣本集中的樣本Xi按照最小距離原則分配到最鄰近聚類Zj。
通過上述實驗結果分析,芪桂通痹湯治療糖尿病周圍神經病變,能明顯改善疼痛麻木情況,且對神疲怠乏,自汗畏風,面色蒼白,心悸納呆等征象改善較對照組明顯,治療總有效率明顯高于對照組。經觀察應用芪桂通痹湯的病人未發(fā)現任何毒副作用。
③使用每個聚類中的樣本均值作為新的聚類中心。重復步驟②直到聚類中心不再變。
電網企業(yè)服務類采購組織方式包括框架協議采購、定點采購、集中批次采購、授權采購四種類別。國網公司為了優(yōu)化服務類集約化管理體系,深化標準化、信息化手段的應用,推進服務類管理創(chuàng)新,提升服務類集約管理水平,主要采取框架協議采購、定點采購、集中批次采購的組織方式,包含了服務類的絕大部分。授權采購不屬于依法必須招標且未納入總部集中采購目錄范圍的采購需求,所以本文服務類聚類圍繞授權之外的三種方式展開。本文將快速聚類收斂快的特點與系統(tǒng)聚類精度高的特點有機結合,形成混合聚類模型。指標數據應用SPSS19.0統(tǒng)計軟件進行聚類分析。首先利用系統(tǒng)聚類精度高的優(yōu)點,提供的類別距離譜系圖確定最優(yōu)分類數,然后用快速聚類得到最終分類并根據方差分析輸出表判斷類與類中心差異是否顯著,依據分析之后的聚類成員表確定各類項目組成員,對每大類的項目成員總體進行歸納總結項目特點,并分析適用的采購組織方式。
以國網河南省電力公司2014~2016年服務類需求計劃數據為例展開分析,通過對服務類項目總體的特征分析,主要選取四個參與分析的變量,分別為:①金額,②采購頻次,③服務商數量,④需求部門數量。按照2014~2016年國網河南省上報的服務類需求計劃統(tǒng)計表,采購金額數據選取項目平均值,采購頻次選取2014~2016年需求采購上報的總計次數,供應商數量根據供應商資質、位置等條件統(tǒng)計,需求部門選取項目平均個數。數據統(tǒng)計如表1所示。
(1)系統(tǒng)聚類過程操作
①在SPSS變量視圖中先定義好變量(如圖1所示)。
②將采集好的數據輸入數據視圖(如圖2所示)。
③將輸入的數據進行系統(tǒng)聚類分析(如圖3所示)。
④結果分析。由系統(tǒng)聚類得到圖4所示的樹狀圖,樹狀圖各變量分類均勻且明顯,可知收集數據指標可以用來做分類依據。
(2)快速聚類用SPSS軟件進行具體操作
①首先指定分類數為三類,在右側選項卡中選擇所要輸出的表格,選擇“初始類中心”、“ANOVA表”和“每個個案聚類信息”(如圖5所示)。
②結果分析。為了檢驗快速聚類采購金額、采購頻次、供應商數量這三個類中心之間的差異是否顯著,進行方差分析,由表2“方差分析表”輸出表可知精確p值均小于0.05,可知所分類各類中心差異顯著,分類效果較好。
F檢驗應僅用于描述性目的,因為選中的聚類將被用來最大化不同聚類中的案例間的差別。觀測到的顯著性水平并未據此進行更正,因此無法將其解釋為是對聚類均值相等這一假設的檢驗。
由表3輸出表“每個聚類中的案例數”可知分類大致情況,第一類包含12個個案,第二類包含9個個案,第三類包含6個個案,并沒有缺失的服務類個案。
表1 國網河南省2014~2016年服務類需求計劃表
圖1 定義變量視圖
(1)聚類1組分析結果。由快速聚類得出聚類1組包括電網項目前期可研、勘察設計、非生產性技改(10KV以下)、大修項目設計(10KV以下)、技改大修項目監(jiān)理(10KV以下)、工程造價咨詢、前期核準評價、大件運輸、變電一、二次設備運維檢修、輸電、配電設備運維檢修、直流設備運維檢修、在線監(jiān)測裝置、儀器儀表維護12等個服務。 經過對聚類1組成員整體特征分析可得該組具有以下特點:①及時性要求高;②采購頻次高;③價格敏感度高;④執(zhí)行調整多;⑤全生命周期服務要求高。
由聚類第1組成員的整體特點結合框架協議采購的適用情況可知,聚類1組適合采用框架協議方法??蚣懿少徃m合采購頻次高、數量大、服務穩(wěn)定可靠度高的項目,項目價格的可調整性較大。
(2)聚類2組分析結果。聚類2組包括生產輔助設施、生產標識牌、環(huán)境檢測維護、消防設施、安防、技防設施維護、設備返廠大修維護、保險、信息技術的開發(fā)設計及維修、物業(yè)服務、車輛維修、公務印刷、出版和會展、視頻制作等9類服務。經過對聚類2組成員整體特征分析可得該組具有以下特點:①價格相對確定;②區(qū)域性強;③工作量輕;④技術、經濟標準明確;⑤一次性方式。
圖2 定義數據視圖
圖3 系統(tǒng)聚類分析圖
圖4 使用平均連接組間樹狀圖
由聚類2組的整體特點結合定點采購的適用情況,可得聚類2組成員更適合采用定點采購方式,采購工作量較輕,價格相對波動性小的項目。
(3)聚類3組分析結果。聚類3組包括設備監(jiān)造、科技研發(fā)和咨詢、管理咨詢、車輛租賃、培訓和會議等6類服務,對聚類3組成員整體特征分析可得該組具有以下特點:①通用性強;②價格敏感度高;③供應商數量多;④采購頻次高;⑤專業(yè)性強。
由聚類3組的整體特點結合集中批次采購的適用情況,可得聚類3組成員更適用于集中批次采購,適用于供應商數量多,價格相對波動較大的情況。
圖5 K均值聚類分析圖
表2 方差分析表
從電網企業(yè)服務類采購現狀進行分析,首先建立了采購金額、采購頻次、供應商數量的三個維度的指標體系,其次運用系統(tǒng)聚類進行分析,分析分類效果和指標選取效果,最后運用快速聚類將服務類分為三個類別。混合聚類在種類繁多的電網企業(yè)服務類需求采購分類中的應用,使服務類采購組織方式精準性增加、系統(tǒng)工作效率提高、時間成本得到節(jié)約,對國網公司服務類采購具有重要的現實意義。
表3 快速聚類案例數輸出表每個聚類中的案例數
[1]姚佼,徐潔瓊.基于混合聚類的城市道路多時段控制研究[J].計算機應用研究,2016,33(11):3274-3278.
[2]Luo Y,Cai Q,Xi H,et al.Customer Segmentation for Telecom with the k-means Clustering Method[J].Information Technology Journal,2013,12(3):409-413.
[3]Vijayan A S,Balasundaram S R.Effective Web-Service Discovery Using K-Means Clustering[C]//Distributed Computing and Internet Technology.Springer Berlin Heidelberg,2013:455-464.
[4]Wu C,Qiu W,Zheng Z,et al.QoS Prediction of Web Services Based on Two-Phase K-Means Clustering[C]//IEEE International Conference on Web Services,2015:161-168.
[5]張曉春,倪紅芳,李娜.基于數據挖掘的供電企業(yè)客戶細分方法及模型研究[J].科技與管理,2013,15(6):104-109.
[6]Kohan N M,Moghaddam M P,Bidaki S M,et al.Comparison of Modified K-means and hierarchical algorithms in customers load curves clustering for designing suitable tariffs in electricity market[C]//Universities Power Engineering Conference,2008:1-5.
[7]原忠虎,李佳,張博.一種加權的系統(tǒng)聚類方法及應用[J].沈陽大學學報(自然科學版),2014,26(3):201-207.
[8]聶珍.一種基于系統(tǒng)聚類的圖書館讀者細分模型[J].現代情報,2009,29(9):158-161.