摘 要
結(jié)算是根據(jù)清單招投標(biāo)文件、圖紙和工程實(shí)際,在竣工驗(yàn)收后結(jié)合變更、簽證等憑證,做出符合實(shí)際的審核結(jié)果。本文介紹了數(shù)據(jù)挖掘技的概念,探討了電網(wǎng)建設(shè)項(xiàng)目利用結(jié)算數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,促進(jìn)概算編制更加合理。
【關(guān)鍵詞】電網(wǎng)建設(shè) 竣工結(jié)算 數(shù)據(jù)挖掘 批準(zhǔn)概算
合理編制概算能實(shí)現(xiàn)成本控制、達(dá)到結(jié)算較批復(fù)概算降低合理的目標(biāo)。本文探討了對電網(wǎng)建設(shè)項(xiàng)目的竣工結(jié)算數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,預(yù)測概算,促進(jìn)概算編制合理化,達(dá)到結(jié)算較概算降低率在合理區(qū)間內(nèi)。
1 數(shù)據(jù)挖掘概念及方法
1.1 數(shù)據(jù)挖掘概述
數(shù)據(jù)挖掘由數(shù)據(jù)清理、集成、選擇、變換、挖掘、模式評估、知識表示等幾個步驟組成,通過對大量數(shù)據(jù)進(jìn)行提煉、分析與轉(zhuǎn)換,最終獲取關(guān)鍵的目標(biāo)值,其價(jià)值在于利用數(shù)據(jù)挖掘改善預(yù)測模型。
1.2 數(shù)據(jù)挖掘技術(shù)
1.2.1 數(shù)據(jù)分類
通過對樣本數(shù)據(jù)進(jìn)行分析,確定數(shù)據(jù)對象的特征,建立合理的分類模型,找出數(shù)據(jù)對象的共同點(diǎn),并按分類標(biāo)準(zhǔn)對數(shù)據(jù)進(jìn)行分類,常用的分類方法有決策樹、統(tǒng)計(jì)分析等。
1.2.2 關(guān)聯(lián)分析
關(guān)聯(lián)是指在數(shù)據(jù)挖掘中找出目標(biāo)數(shù)據(jù)的相關(guān)關(guān)系,其目的是找出每一組數(shù)據(jù)間隱藏的關(guān)聯(lián)規(guī)律,通過置信度、相關(guān)系數(shù)等參數(shù)描述關(guān)聯(lián)性強(qiáng)弱。
1.2.3 聚類分析
聚類分析是將離散、無明顯規(guī)律數(shù)據(jù)按一定的規(guī)則進(jìn)行劃分,使屬于同一類別的數(shù)據(jù)間的相似性大,不同類別中的數(shù)據(jù)間的相似性小,發(fā)現(xiàn)數(shù)據(jù)的分布模式及數(shù)據(jù)屬性之間的相互關(guān)系,增強(qiáng)了人們對數(shù)據(jù)的認(rèn)識能力。
1.2.4 時間序列分析
分析具有時間變化特性的數(shù)據(jù)集合,挖掘數(shù)據(jù)變化的規(guī)律特征,研究數(shù)據(jù)序列的周期性、趨勢等。
1.2.5 偏差分析
偏差分析是檢測數(shù)據(jù)集中間顯著不同于其它數(shù)據(jù)的對象,尋找觀測結(jié)果與參照值之間有意義的差別,發(fā)現(xiàn)屬于背景噪聲的數(shù)據(jù)。偏差分析能發(fā)現(xiàn)不滿足規(guī)則的特例、分類中的反常實(shí)例等等。
1.2.6 預(yù)測
通過分析數(shù)據(jù)對象之間的變化規(guī)律,建立科學(xué)的預(yù)測模型,對數(shù)據(jù)未來變化進(jìn)行計(jì)算分析。常用的預(yù)測方法有回歸分析、神經(jīng)網(wǎng)絡(luò)、模糊邏輯、遺傳算法等。
1.3 數(shù)據(jù)挖掘的一般步驟
數(shù)據(jù)挖掘的一般過程通常包括3個階段:數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、結(jié)果評價(jià)與表達(dá)。
數(shù)據(jù)準(zhǔn)備階段,提取目標(biāo)數(shù)據(jù)集,完成數(shù)據(jù)選擇、噪音消除、缺失數(shù)據(jù)推算、無效數(shù)據(jù)刪除、數(shù)據(jù)值分類等準(zhǔn)備工作,經(jīng)過預(yù)處理數(shù)據(jù)進(jìn)行平滑、聚集、概化、規(guī)范化、特征構(gòu)造等方法形成適合數(shù)據(jù)挖掘的形式。數(shù)據(jù)挖掘階段,結(jié)合統(tǒng)計(jì)分析、決策樹、粗糙集、神經(jīng)網(wǎng)絡(luò)、遺傳算法等常用數(shù)據(jù)挖掘算法,挖掘數(shù)據(jù)之間潛在的規(guī)律和特征進(jìn)行建模。結(jié)果評價(jià)與表達(dá)階段,對模型進(jìn)行準(zhǔn)確性、可理解性、實(shí)際性能等進(jìn)行評估,確定有效模型,利用數(shù)據(jù)挖掘的結(jié)果。
1.4 常用的數(shù)據(jù)挖掘方法
數(shù)據(jù)挖掘與統(tǒng)計(jì)學(xué)、模式識別、數(shù)據(jù)庫和數(shù)據(jù)倉庫、算法、高性能計(jì)算等技術(shù)相結(jié)合形成不同的挖掘技術(shù)。常用的數(shù)據(jù)挖掘技術(shù)包括統(tǒng)計(jì)分析方法、決策樹方法、神經(jīng)網(wǎng)絡(luò)方法、模糊邏輯方法、遺傳算法、粗糙集方法。
2 基于數(shù)據(jù)挖掘技術(shù)的電網(wǎng)建設(shè)結(jié)算數(shù)據(jù)預(yù)處理
2.1 結(jié)算數(shù)據(jù)統(tǒng)計(jì)、分類
根據(jù)地市公司電網(wǎng)建設(shè)實(shí)際,目前地市供電公司主要負(fù)責(zé)35kV、110kV和220kV電網(wǎng)建設(shè)工程,工程涉及類型較多、數(shù)量大?;跊Q策樹方法的結(jié)算數(shù)據(jù)分類模型,能夠?qū)⒋罅康慕Y(jié)算數(shù)據(jù)先按照電壓等級排列到,然后根據(jù)工程類型、建設(shè)性質(zhì)實(shí)現(xiàn)逐層劃分。
結(jié)算數(shù)據(jù)通過決策樹的統(tǒng)計(jì)、分類處理,有助于進(jìn)行有效的樣本篩選和分類,準(zhǔn)確定位重點(diǎn)分析數(shù)據(jù)對象的效率,為結(jié)算數(shù)據(jù)分析工作提供全面的數(shù)據(jù)來源。
2.2 結(jié)算數(shù)據(jù)指標(biāo)確立
通過對電網(wǎng)建設(shè)工程結(jié)算數(shù)據(jù)進(jìn)行分析,找出對結(jié)算數(shù)據(jù)影響最大的部分指標(biāo),構(gòu)成指標(biāo)集。
2.2.1 結(jié)算數(shù)據(jù)變化偏差分析
結(jié)算變化偏差分析是通過研究多項(xiàng)工程實(shí)際結(jié)算數(shù)據(jù)的變化情況,將整體結(jié)算費(fèi)用變化分解為若干指標(biāo)變化的集合,量化各項(xiàng)指標(biāo)的變化情況及對整體變化的影響程度。輸變電工程結(jié)算數(shù)據(jù)由多個指標(biāo)在不同程度上反映,各指標(biāo)之間的相關(guān)性很難直觀確定,屬于高緯度數(shù)據(jù),在進(jìn)行統(tǒng)計(jì)分析時具有很大的復(fù)雜性。主成分分析法能在盡量減少信息丟失的情況下,對高維數(shù)據(jù)進(jìn)行降維,將多項(xiàng)影響指標(biāo)轉(zhuǎn)化為少數(shù)幾個關(guān)鍵指標(biāo)。
2.2.2 數(shù)據(jù)屬性特征選擇
(1)變電站工程屬性:主變?nèi)萘?、主變臺數(shù)、各等級電壓出線回?cái)?shù)、各等級電壓出線形式、無功容量、各等級電壓母線分段形式、中性點(diǎn)接地方式、短路電流水平、控制電纜長度、電力電纜長度、占地面積、建筑面積、構(gòu)架形式、各類型場地平整土方量、擋土墻體積、護(hù)坡面積、各類地基處理體積等。
(2)架空送電線路工程相屬性:單回長度、雙回長度、地形系數(shù)、導(dǎo)線型號、地線型號、平均檔距、各形式基礎(chǔ)體積、鐵塔數(shù)量、接地土石方、各類型跨越情況等。
(3)電纜送電線路工程屬性:電纜型號、電纜數(shù)量、電纜敷設(shè)形式、電纜終端型號、電纜終端數(shù)量等。
(4)通信工程屬性:光端機(jī)設(shè)備型號、光端機(jī)數(shù)量、PCM型號、PCM數(shù)量、各型號配線架數(shù)量、普通光纜型號、普通光纜數(shù)量等。
(5)光纜線路工程屬性:光纜型號、光纜長度、地形系數(shù)、張力場個數(shù)等。
由于大部分與數(shù)據(jù)挖掘的任務(wù)是不相關(guān)的,過多的屬性將導(dǎo)致數(shù)據(jù)挖掘過程花費(fèi)時間長以及計(jì)算結(jié)果失真,因此首先需要對每種類型工程的屬性進(jìn)行過濾,提高挖掘結(jié)果的合理性。對于原始屬性中屬于同一類性質(zhì)的屬性進(jìn)行屬性轉(zhuǎn)換等方式進(jìn)行壓縮,比如架空送電線路工程中地形屬性含有峻嶺、山地、丘陵、平地、沼澤、河網(wǎng)等,可以通過各自占比并加權(quán)平均來表示。對于屬性中非數(shù)量的數(shù)據(jù)需要進(jìn)行量化處理,在原始數(shù)據(jù)中如導(dǎo)線型號、光纜型號、電壓等級等定性屬性,導(dǎo)、地線型號屬性以截面積計(jì)算,光纜型號屬性以芯數(shù)考慮。不同的工程類型,取決的屬性不存在相關(guān)性,不歸為一類數(shù)據(jù)集。電壓等級存在三種情況,可設(shè)定220kV為1,110kV為2,35kV為3。建設(shè)性質(zhì)存在三種情況,可設(shè)定新建為1,擴(kuò)建為2,改造為3。
2.2.3 數(shù)據(jù)歸一化
采用標(biāo)準(zhǔn)數(shù)據(jù)格式才能夠保證算法的可執(zhí)行和準(zhǔn)確性,因此需對原始數(shù)據(jù)進(jìn)行歸一化處理,使不同屬性值之間具有可比性。
2.2.4 數(shù)據(jù)去噪
由于電網(wǎng)建設(shè)工程本身的特點(diǎn),積累下來的結(jié)算數(shù)據(jù)記錄中存在某些異常,偏離期望值的孤立點(diǎn),因此必須對這些異常噪聲數(shù)據(jù)進(jìn)行剔除,一般采用聚類算法對異常數(shù)據(jù)進(jìn)行去噪進(jìn)行訓(xùn)練,否則提取結(jié)算數(shù)據(jù)間的規(guī)律將容易導(dǎo)致結(jié)果不收斂,模型偏離實(shí)際。
3 基于數(shù)據(jù)挖掘技術(shù)的電網(wǎng)建設(shè)概算預(yù)測
根據(jù)結(jié)算數(shù)據(jù)準(zhǔn)備、分類、指標(biāo)建立、數(shù)據(jù)轉(zhuǎn)換等工作,利用智能算法技術(shù),建立預(yù)測模型,將初步設(shè)計(jì)的新工程的關(guān)鍵指標(biāo)作為輸入量,得到輸出概算,為概算編制及評審工作提供參考,促進(jìn)概算編制更加合理。
對結(jié)算數(shù)據(jù)應(yīng)用數(shù)據(jù)挖掘技術(shù),開展電網(wǎng)建設(shè)工程概算預(yù)測按如下順序。
結(jié)算數(shù)據(jù)收集、數(shù)據(jù)分類、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)處理、智能算法、模型建立、工程指標(biāo)、概算預(yù)測。
通過分析大量電網(wǎng)建設(shè)工程結(jié)算數(shù)據(jù),挖掘結(jié)算變化的內(nèi)在規(guī)律,以結(jié)算數(shù)據(jù)為研究對象,通過統(tǒng)計(jì)分析、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)去噪等數(shù)據(jù)預(yù)處理技術(shù),結(jié)合神經(jīng)網(wǎng)絡(luò)技術(shù)、模糊數(shù)學(xué)、遺傳算法、支持向量機(jī)等預(yù)測等方法建立有效的預(yù)測模型,對概算進(jìn)行有效的預(yù)測。
4 結(jié)論
在電網(wǎng)建設(shè)工程的概算預(yù)測研究中,由于工程指標(biāo)多,指標(biāo)間關(guān)系復(fù)雜,概算預(yù)測比較困難。通過對電網(wǎng)建設(shè)工程結(jié)算數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,將原有指標(biāo)進(jìn)行合并降維,得到關(guān)鍵指標(biāo),去掉奇異噪聲數(shù)據(jù),對數(shù)據(jù)進(jìn)行清洗,利用智能算法建立預(yù)測模型,得出合理的概算,控制工程投資在合理范圍內(nèi),最終達(dá)到結(jié)算較概算降低率控制在合理區(qū)間內(nèi)。
參考文獻(xiàn)
[1]JiaweiHan,MichelineKamber,JianPei,范明,孟小峰譯.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2012.
[2]王明星,劉鋒.數(shù)據(jù)挖掘常用分類算法研究[J].電腦知識與技術(shù),2013(09):7667-7668.
[3]王東坡.基于數(shù)據(jù)挖掘技術(shù)的水利工程管理[J].吉林水利,2014(06):38-39.
[4]牛東曉,劉金朋,許超晨,張宏運(yùn).輸變電工程造價(jià)管理中的數(shù)據(jù)挖掘技術(shù)應(yīng)用研究[J].華東電力,2012(04):541-542.
[5]叢珅.淺析基于數(shù)據(jù)挖掘的數(shù)字檔案信息管理研究[J].民營科技,2014(01):29-30.
[6]秦莉花,李晟,陳曉陽等.數(shù)據(jù)挖掘的分類、工具及模型的概述[J].現(xiàn)代計(jì)算機(jī),2013(11):20.
[7]王穎.數(shù)據(jù)挖掘技術(shù)在電力線路工程造價(jià)管理中的應(yīng)用研究[D].重慶:重慶大學(xué),2008:8-9.
作者簡介
艾濤(1985-),男,碩士研究生學(xué)歷?,F(xiàn)為國網(wǎng)湖北省電力公司黃岡供電公司工程師,從事電網(wǎng)建設(shè)技術(shù)工作。
作者單位
國網(wǎng)湖北省電力公司黃岡供電公司 湖北省黃岡市 438000