国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機(jī)器學(xué)習(xí)算法的輸電線(xiàn)路工程投資預(yù)測(cè)

2022-07-28 07:46盧文飛袁競(jìng)峰張嘉澍管維亞張建峰
科學(xué)技術(shù)與工程 2022年17期
關(guān)鍵詞:線(xiàn)路預(yù)測(cè)指標(biāo)

盧文飛, 袁競(jìng)峰*, 張嘉澍, 管維亞, 張建峰

(1.東南大學(xué)土木工程學(xué)院, 南京 211189; 2.國(guó)網(wǎng)江蘇省電力有限公司經(jīng)濟(jì)技術(shù)研究院, 南京 210008)

輸電線(xiàn)路是電網(wǎng)工程的重要組成部分,作為國(guó)家電力的輸送通道,是滿(mǎn)足國(guó)民生產(chǎn)和生活對(duì)電力需求的重要保障。在中國(guó)新一輪電改中提出按“準(zhǔn)許成本加合理收益”的原則進(jìn)行核價(jià),就是為了引導(dǎo)企業(yè)節(jié)約成本、提高投資效益,對(duì)于不合理、無(wú)效的投資不納入輸配電價(jià)核算[1]。因此,提高輸電線(xiàn)路工程投資預(yù)測(cè)精度對(duì)有效規(guī)劃工程投資、進(jìn)行工程方案經(jīng)濟(jì)比選、提高工程效率、實(shí)現(xiàn)資源合理配置具有重要意義。而傳統(tǒng)的根據(jù)定額概預(yù)算來(lái)確定工程投資的方法無(wú)法有效利用歷史數(shù)據(jù),且由于技術(shù)方案深度不足,定額的不確定性很高,存在計(jì)算復(fù)雜且預(yù)測(cè)精度低的弊端,已經(jīng)不能滿(mǎn)足市場(chǎng)經(jīng)濟(jì)發(fā)展的需求[2]。因此,研究智能化的輸電線(xiàn)路工程投資預(yù)測(cè)方法,是簡(jiǎn)化輸電線(xiàn)路工程投資預(yù)測(cè)工作流程,提升預(yù)測(cè)精度的迫切需要。

在電網(wǎng)工程的投資預(yù)測(cè)中,以往學(xué)者主要通過(guò)研究造價(jià)控制指標(biāo)的方式來(lái)估算輸電線(xiàn)路工程投資。如王歡林等[3]提出了包括基礎(chǔ)工程指標(biāo)、桿塔工程指標(biāo)、架線(xiàn)工程指標(biāo)等估算指標(biāo)體系的架空線(xiàn)路工程投資估算方法;鄧怡卿等[4]在識(shí)別線(xiàn)路工程的典型技術(shù)方案的基礎(chǔ)上,確定了新建工程典型技術(shù)方案的造價(jià)控制指標(biāo)。而宋倩蕓等[5]在全壽命周期原理的基礎(chǔ)上,建立了增量配電網(wǎng)工程投資的線(xiàn)性模型,但是由于輸電線(xiàn)路工程投資的估算是一個(gè)非線(xiàn)性、多變量的復(fù)雜系統(tǒng)求解問(wèn)題,通過(guò)指標(biāo)估算往往難以對(duì)輸電線(xiàn)路工程進(jìn)行準(zhǔn)確、客觀的投資預(yù)測(cè)。而隨著智能算法在國(guó)內(nèi)外的深入研究,已經(jīng)有學(xué)者將反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(support vector machine,SVM)、遺傳算法(genetic algorithm,GA)等應(yīng)用于電力工程投資的預(yù)測(cè)中?;谏鲜鏊惴?,眾多學(xué)者開(kāi)展了大量的研究。孫安黎等[6]和凌云鵬等[7]以線(xiàn)路工程影響因素為BP神經(jīng)網(wǎng)絡(luò)的輸入,構(gòu)建BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型。Niu等[8]將輸變電工程分為改造項(xiàng)目和新建項(xiàng)目?jī)纱箢?lèi),基于GA算法和粒子群優(yōu)化(particle swarm optimization,PSO)構(gòu)建了輸變電工程的成本預(yù)測(cè)模型,驗(yàn)證了GA算法應(yīng)用于輸變電工程的成本預(yù)測(cè)比PSO算法更準(zhǔn)確。Yi等[9]從成本構(gòu)成角度提取了輸電線(xiàn)路工程自然、技術(shù)和經(jīng)濟(jì)指標(biāo),構(gòu)建了基于最小二乘支持向量機(jī)(least squares support vector machine,LSSVM)智能成本預(yù)測(cè)模型,可為線(xiàn)路工程項(xiàng)目投資決策提供較為準(zhǔn)確的參考。雖然現(xiàn)有模型能實(shí)現(xiàn)對(duì)輸電線(xiàn)路工程的投資預(yù)測(cè),但是這些模型在預(yù)測(cè)中也存在著短板:神經(jīng)網(wǎng)絡(luò)樣本需求量大,訓(xùn)練時(shí)間長(zhǎng),容易出現(xiàn)局部最優(yōu)化的問(wèn)題,尤其在小樣本時(shí)過(guò)學(xué)習(xí)、泛化能力差等問(wèn)題較為突出,此外其解釋性較差,算法參數(shù)設(shè)置復(fù)雜也使得其應(yīng)用存在難點(diǎn)[10];支持向量機(jī)模型在解決非線(xiàn)性、高維數(shù)、小樣本、局部最優(yōu)化方面有很大的改善,但是其在模型參數(shù)設(shè)置上存在著盲目性,在處理輸電工程時(shí)易導(dǎo)致誤差較大的問(wèn)題[8];而在遺傳算法中其變異率、交叉率等復(fù)雜參數(shù)的設(shè)置也使得其應(yīng)用難以推廣[11]。

而極端梯度提升(extreme gradient boosting,XGBoost)算法是機(jī)器學(xué)習(xí)算法中梯度提升(gradient boosting machines,GBM)的實(shí)現(xiàn)路徑之一,被稱(chēng)為用于有監(jiān)督學(xué)習(xí)的性能最好的算法之一,它可以用于回歸和分類(lèi)問(wèn)題[12]。XGBoost算法能夠采用多線(xiàn)程并行計(jì)算,計(jì)算速度快,魯棒性高,泛化能力強(qiáng),且該模型基于樹(shù)結(jié)構(gòu)無(wú)需對(duì)采集到的多種數(shù)據(jù)進(jìn)行歸一化,特別適宜于處理高維數(shù)、非線(xiàn)性的電力數(shù)據(jù)[13-14]。目前,XGBoost算法已經(jīng)被應(yīng)用于電壓穩(wěn)定性評(píng)估[15]、負(fù)荷預(yù)測(cè)[16]、故障診斷[17]、變電站工程投資預(yù)測(cè)[18]等領(lǐng)域,但未在輸電線(xiàn)路工程投資預(yù)測(cè)中應(yīng)用。而輸電線(xiàn)路工程具有不可預(yù)測(cè)因素多、非線(xiàn)性、小樣本的特點(diǎn),非常適合用XGBoost算法進(jìn)行建模。因此,現(xiàn)采用XGBoost算法構(gòu)建輸電線(xiàn)路工程投資預(yù)測(cè)模型,以輸電線(xiàn)路中最常見(jiàn)的架空輸電線(xiàn)路工程為對(duì)象,首先,基于相關(guān)性分析構(gòu)建架空線(xiàn)路工程投資預(yù)測(cè)指標(biāo)體系;其次,基于XGBoost在實(shí)際工程數(shù)據(jù)訓(xùn)練集上訓(xùn)練出投資預(yù)測(cè)模型,并應(yīng)用新的測(cè)試集評(píng)價(jià)模型效果。

1 XGBoost算法原理

基于以往關(guān)于XGBoost算法的相關(guān)研究[12,14,17,19-20],主要介紹XGBoost算法原理。提升樹(shù)算法是基于決策樹(shù)構(gòu)建的,也就是所謂的分類(lèi)回歸樹(shù)(classification and regression tree,CART)。對(duì)于一項(xiàng)回歸任務(wù),CART根據(jù)一個(gè)變量的邊界在每一級(jí)將數(shù)據(jù)集劃分為兩個(gè)子集,直到達(dá)到用戶(hù)設(shè)置的樹(shù)的最大深度[21],表達(dá)式為

(1)

式(1)中:R1(j,s)和R2(j,s)分別為兩個(gè)子集,s為變量的劃分邊界;xj為第j個(gè)樣本的輸入。在每個(gè)葉子節(jié)點(diǎn),計(jì)算葉子節(jié)點(diǎn)(node)的均方誤差MSEnode,公式為

(2)

(3)

(4)

該算法將尋找變量邊界的最佳解,以使代價(jià)函數(shù)最小。一旦它成功地將訓(xùn)練集分割成兩部分,它就會(huì)使用相同的邏輯分割子集,然后再依次遞歸地分割子集。一旦達(dá)到最大深度,或者無(wú)法找到減少誤差的分割,它就停止遞歸。然而,CART樹(shù)在處理沒(méi)有正則化的回歸任務(wù)時(shí),容易出現(xiàn)過(guò)擬合。解決這個(gè)問(wèn)題的一個(gè)策略是通過(guò)打包一組估計(jì)量來(lái)實(shí)現(xiàn)集成,在這種情況下,這意味著集成多個(gè)CART模型。

圖1 XGBoost算法決策樹(shù)示意圖Fig.1 Decision tree of XGBoost algorithm

(5)

式(5)中:ft(xi)=wq(x),ft∈F,而ft(xi)為第t棵樹(shù)輸入為xi(即輸電線(xiàn)路工程投資的第i個(gè)輸入特征)時(shí)的結(jié)果,F(xiàn)為CART樹(shù)所在空間,下角標(biāo)q(x)為樣本x對(duì)應(yīng)的葉子節(jié)點(diǎn)索引號(hào),每個(gè)ft都對(duì)應(yīng)獨(dú)立的決策樹(shù)結(jié)構(gòu)q與葉子節(jié)點(diǎn)權(quán)重w;T為CART樹(shù)的數(shù)量。

XGBoost擬合殘差的過(guò)程就是累加樹(shù)的過(guò)程,其表達(dá)式為

(6)

XGBoost的目標(biāo)函數(shù)由誤差項(xiàng)和正則項(xiàng)組成,記為

(7)

(8)

當(dāng)XGBoost模型進(jìn)行如式(6)中的第t次迭代后,其目標(biāo)函數(shù)就可表示為

(9)

式(9)中:n為迭代總次數(shù)。將式(9)采用二階泰勒展開(kāi)后可得

(10)

式(10)中:Ij={i|q(xi)=j}為所有映射到葉子節(jié)點(diǎn)j的樣本索引集合;wj為葉子節(jié)點(diǎn)j的權(quán)重;gi為一階導(dǎo)數(shù);hi為二階導(dǎo)數(shù)。

(11)

(12)

將式(12)代入式(10)即得到目標(biāo)函數(shù)值的最優(yōu)解為

(13)

(14)

式(14)中:IL與IR分別為分裂后左右節(jié)點(diǎn)的實(shí)例集,并且有I=IL∪IR;增益表示的是節(jié)點(diǎn)分裂后損失函數(shù)的減少值[20]。在每次分裂時(shí),都會(huì)選增益最大的節(jié)點(diǎn)。當(dāng)樹(shù)達(dá)到了深度閾值或全部節(jié)點(diǎn)分裂時(shí)滿(mǎn)足Lsplit<0,則樹(shù)不再分裂,此時(shí)有最優(yōu)的集成樹(shù)模型。

2 輸電線(xiàn)路工程投資預(yù)測(cè)模型構(gòu)建流程及效果評(píng)價(jià)

2.1 輸電線(xiàn)路工程投資預(yù)測(cè)流程

圖2展示了基于XGBoost算法的輸電線(xiàn)路工程投資預(yù)測(cè)總體流程,主要包括下列4個(gè)步驟。

步驟1輸電線(xiàn)路工程投資預(yù)測(cè)指標(biāo)體系確定。預(yù)測(cè)指標(biāo)體系的確定是建立基于XGBoost算法的輸電線(xiàn)路工程投資預(yù)測(cè)模型的基礎(chǔ)。構(gòu)建時(shí)要考慮指標(biāo)之間存在的多重共線(xiàn)性等因素會(huì)對(duì)模型的構(gòu)建產(chǎn)生影響,導(dǎo)致過(guò)擬合的情況,因此需要對(duì)選取的指標(biāo)體系進(jìn)行相關(guān)性分析,對(duì)于相關(guān)性高的指標(biāo)進(jìn)行刪除,去相關(guān)性,防止出現(xiàn)過(guò)擬合現(xiàn)象。

步驟2歷史投資數(shù)據(jù)的獲取與清洗。確定指標(biāo)體系后,依據(jù)指標(biāo)體系獲取投資預(yù)測(cè)數(shù)據(jù)。通常獲取的歷史投資數(shù)據(jù)中包含很多缺失值與噪聲數(shù)據(jù)。獲取歷史數(shù)據(jù)之后,可采用Python進(jìn)行缺失值和重復(fù)值的檢索,刪除重復(fù)值,對(duì)缺失值進(jìn)行插補(bǔ)。

步驟3基于XGBoost算法進(jìn)行輸電線(xiàn)路工程投資預(yù)測(cè)模型構(gòu)建。首先,將清洗后的全部歷史數(shù)據(jù)劃分為訓(xùn)練集(70%)與測(cè)試集(30%);其次,把訓(xùn)練集采用交叉驗(yàn)證進(jìn)行模型訓(xùn)練,優(yōu)化參數(shù),直到滿(mǎn)足可靠性要求。

步驟4模型結(jié)果有效性的評(píng)價(jià)。在訓(xùn)練集上得到投資預(yù)測(cè)模型后,將測(cè)試集數(shù)據(jù)輸入到訓(xùn)練好的投資預(yù)測(cè)模型中,輸出預(yù)測(cè)值,并通過(guò)計(jì)算擬合優(yōu)度(R2)、均方根誤差(root mean squared error,RMSE)、平均絕對(duì)百分比誤差(mean absolute percentage error,MAPE)、平均絕對(duì)誤差(mean absolute error,MAE)等指標(biāo),對(duì)模型效果進(jìn)行評(píng)價(jià)。

圖2 基于XGBoost算法的輸電線(xiàn)路工程投資預(yù)測(cè)流程Fig.2 Investment prediction process of transmission line project based on XGBoost algorithm

2.2 交叉驗(yàn)證

在數(shù)據(jù)量不足的研究中,樣本排序的隨機(jī)性及劃分方式對(duì)預(yù)測(cè)結(jié)果影響很大,單一劃分的測(cè)試集與驗(yàn)證集存在不能充分利用樣本信息以至于預(yù)測(cè)模型有效性不足的問(wèn)題。K折交叉驗(yàn)證基于無(wú)重復(fù)抽樣技術(shù)降低了預(yù)測(cè)結(jié)果對(duì)數(shù)據(jù)劃分方法的敏感性,能夠有效的提高結(jié)果的可靠性[22]。將全部的數(shù)據(jù)分為訓(xùn)練集和測(cè)試集,在訓(xùn)練集中使用交叉驗(yàn)證來(lái)確定網(wǎng)絡(luò)結(jié)構(gòu),選取模型的最優(yōu)參數(shù),在測(cè)試集上對(duì)模型進(jìn)行驗(yàn)證,用于評(píng)估模型性能。

K折交叉驗(yàn)證被廣泛采用作為模型選擇標(biāo)準(zhǔn)。在交叉驗(yàn)證中,將數(shù)據(jù)集分成K個(gè)相等大小的子集,K-1折用于模型構(gòu)建,剩余1折用于模型驗(yàn)證。這意味著模型構(gòu)建比模型驗(yàn)證過(guò)程更受重視。在迭代K次的過(guò)程中,K份子集的每一份都被依次分配為驗(yàn)證數(shù)據(jù)。每次試驗(yàn)都會(huì)得到相應(yīng)的評(píng)價(jià)指標(biāo)。K次結(jié)果的評(píng)價(jià)指標(biāo)的均值作為對(duì)模型精度的估計(jì),在實(shí)踐中,K的典型選擇范圍為5~10[23],研究的K值選擇5。

2.3 模型效果評(píng)價(jià)

為驗(yàn)證模型預(yù)測(cè)效果,要選取評(píng)價(jià)指標(biāo)對(duì)模型性能進(jìn)行評(píng)價(jià)。由于單一指標(biāo)無(wú)法準(zhǔn)確地判斷模型優(yōu)劣,因此結(jié)合以往學(xué)者模型評(píng)價(jià)經(jīng)驗(yàn)[14,20],綜合選取擬合優(yōu)度(R2)、均方根誤差(RMSE)、平均絕對(duì)誤差(MAE)、平均絕對(duì)百分比誤差(MAPE)4個(gè)性能評(píng)價(jià)指標(biāo)對(duì)所開(kāi)發(fā)模型的性能進(jìn)行評(píng)價(jià),其計(jì)算公式分別為

(15)

(16)

(17)

(18)

3 算例分析

3.1 架空線(xiàn)路工程投資預(yù)測(cè)指標(biāo)體系構(gòu)建

3.1.1 架空線(xiàn)路工程特點(diǎn)及費(fèi)用組成

輸電線(xiàn)路通常分為兩類(lèi):架空輸電線(xiàn)路與地下輸電線(xiàn)路工程。架空輸電線(xiàn)路通過(guò)將導(dǎo)線(xiàn)架設(shè)在桿塔上進(jìn)行電能傳輸,具有施工簡(jiǎn)便、結(jié)構(gòu)清晰、檢修維修方便等特點(diǎn),其比地下電纜輸電的投資成本更低、建設(shè)周期更短,因此,廣泛地應(yīng)用于電能輸送中。

輸電線(xiàn)路工程造價(jià)由兩部分組成:本體工程造價(jià)和其他造價(jià),而其他造價(jià)僅約占總造價(jià)的20%。架空輸電線(xiàn)路的本體工程按照費(fèi)用構(gòu)成可以分為基礎(chǔ)工程、架線(xiàn)工程、桿塔工程、附件工程、接地工程和輔助工程,而其中又以桿塔工程、基礎(chǔ)工程、架線(xiàn)工程在本體費(fèi)用構(gòu)成中占比最大[9]。在考慮架空線(xiàn)路工程投資預(yù)測(cè)指標(biāo)時(shí),可以根據(jù)費(fèi)用的組成方式,提取關(guān)鍵要素,進(jìn)行指標(biāo)篩選。

3.1.2 架空線(xiàn)路工程投資預(yù)測(cè)指標(biāo)體系構(gòu)建

對(duì)于機(jī)器學(xué)習(xí)來(lái)說(shuō),決定機(jī)器學(xué)習(xí)上限的是特征與數(shù)據(jù),算法與模型只是接近這個(gè)上限而已,因此預(yù)測(cè)指標(biāo)體系是影響預(yù)測(cè)結(jié)果的可靠性的關(guān)鍵因素?!秶?guó)家電網(wǎng)公司輸變工程通用設(shè)計(jì)》把地形條件、海拔高度、回路數(shù)、桿塔形式、導(dǎo)線(xiàn)規(guī)格、氣象條件等作為輸電線(xiàn)路通用設(shè)計(jì)模塊的主要技術(shù)條件,根據(jù)《國(guó)家電網(wǎng)公司輸變工程通用設(shè)計(jì)》中指出的主要技術(shù)條件,以及以往研究者對(duì)于架空線(xiàn)路工程投資指標(biāo)選取的經(jīng)驗(yàn)[6-7,9,24],選取了如表1所示的14個(gè)指標(biāo)。

表1 架空線(xiàn)路工程投資預(yù)測(cè)指標(biāo)體系Table 1 Indicators for overhead line projects investment prediction

根據(jù)上述篩選出的指標(biāo),首先對(duì)其進(jìn)行Person相關(guān)系數(shù)分析,避免存在多重共線(xiàn)性所造成的信息冗余[13],引起投資預(yù)測(cè)模型出線(xiàn)過(guò)擬合的現(xiàn)象。Person系數(shù)是衡量變量之間關(guān)系強(qiáng)度的一個(gè)常見(jiàn)統(tǒng)計(jì)量,計(jì)算公式為

(19)

圖3中,右側(cè)的刻度顏色展示了不同相關(guān)系數(shù)對(duì)應(yīng)的顏色深淺。如果兩個(gè)指標(biāo)之間的相關(guān)性越高則顏色越淺,高相關(guān)性的指標(biāo)對(duì)于機(jī)器學(xué)習(xí)分類(lèi)器而言屬于冗余變量,可能導(dǎo)致過(guò)擬合或者導(dǎo)致預(yù)測(cè)精度下降??梢钥闯觯x取的架線(xiàn)工程投資預(yù)測(cè)指標(biāo)相關(guān)性超過(guò)0.9的有兩組(圖中紅色方框標(biāo)記),分別是基礎(chǔ)混凝土總量和基礎(chǔ)鋼材量(Person系數(shù)為0.92),導(dǎo)線(xiàn)量和土石方量(Person系數(shù)為0.9)。為了降低指標(biāo)之間的相關(guān)性,對(duì)于具有高度線(xiàn)性相關(guān)的兩組指標(biāo)隨機(jī)選取其中一個(gè)進(jìn)行刪除。刪除土石方量和基礎(chǔ)鋼材量之后,總共剩余12個(gè)指標(biāo)構(gòu)成投資預(yù)測(cè)指標(biāo)體系,最終形成的投資預(yù)測(cè)指標(biāo)及其編號(hào)如表2所示。

圖3 指標(biāo)相關(guān)性熱力圖Fig.3 The heat map of index correlation

在預(yù)測(cè)對(duì)象方面,如果只預(yù)測(cè)架空線(xiàn)路工程總投資,則無(wú)法反映架空線(xiàn)路工程總體的投資狀況。因此,在預(yù)測(cè)結(jié)果輸出中同時(shí)選擇了本體投資費(fèi)用(O1),靜態(tài)投資費(fèi)用(O2)和動(dòng)態(tài)投資費(fèi)用(O3)作為預(yù)測(cè)對(duì)象。

3.2 案例數(shù)據(jù)

模型的數(shù)據(jù)源自國(guó)網(wǎng)某省公司自2016—2020年的實(shí)際架空線(xiàn)路工程數(shù)據(jù),前期刪除了空缺值較多的和有重復(fù)的樣本,對(duì)于剩余樣本中仍然存在的部分指標(biāo)空缺值,采用回歸插補(bǔ)法填充該類(lèi)指標(biāo)。完成數(shù)據(jù)清洗后,將測(cè)試集和訓(xùn)練集的劃分比例確定為7∶3,模型構(gòu)建在Python 3.7的環(huán)境下進(jìn)行。

3.3 預(yù)測(cè)結(jié)果

根據(jù)架空線(xiàn)路工程投資預(yù)測(cè)流程,利用訓(xùn)練集中的數(shù)據(jù),基于XGBoost算法采用交叉驗(yàn)證的方式進(jìn)行模型訓(xùn)練,再在測(cè)試集上用訓(xùn)練好的模型進(jìn)行效果的評(píng)價(jià)。通過(guò)將在訓(xùn)練集上訓(xùn)練好的模型對(duì)測(cè)試集數(shù)據(jù)進(jìn)行預(yù)測(cè),輸出基于XGBoost算法的線(xiàn)路工程投資預(yù)測(cè)模型真實(shí)值與預(yù)測(cè)值的對(duì)比,如圖4所示,其中藍(lán)色柱狀圖為樣本真實(shí)值,橙色折線(xiàn)圖為樣本的模型預(yù)測(cè)值,橫軸為樣本在測(cè)試集中的樣本序號(hào),縱軸為投資額。

表2 投資預(yù)測(cè)指標(biāo)及其編號(hào)Table 2 Investment prediction index and its number

從本體工程投資額(O1)、靜態(tài)投資額(O2)、動(dòng)態(tài)投資額(O3)的預(yù)測(cè)值與真實(shí)值的對(duì)比圖可以看出,工程投資的預(yù)測(cè)值曲線(xiàn)與真實(shí)值曲線(xiàn)基本一致,這說(shuō)明基于XGBoost算法的投資預(yù)測(cè)模型預(yù)測(cè)效果良好,可以為架空線(xiàn)路投資者提供較為準(zhǔn)確的參考。

圖4 預(yù)測(cè)結(jié)果Fig.4 Prediction results

3.4 模型效果評(píng)價(jià)

為了對(duì)模型的效果進(jìn)行對(duì)比評(píng)價(jià),選取了神經(jīng)網(wǎng)絡(luò)模型和SVM模型對(duì)線(xiàn)路工程投資數(shù)據(jù)進(jìn)行了訓(xùn)練和測(cè)試,采用2.2節(jié)中模型效果評(píng)價(jià)所述指標(biāo),得出預(yù)測(cè)效果如表3所示。

從表3的預(yù)測(cè)效果評(píng)價(jià)指標(biāo)來(lái)看,基于XGBoost構(gòu)建的投資預(yù)測(cè)模型的擬合優(yōu)度均達(dá)到0.9以上,接近于1,較神經(jīng)網(wǎng)絡(luò)模型和SVM都要高,說(shuō)明基于XGBoost算法的架空線(xiàn)路投資預(yù)測(cè)模型的擬合性較好。從誤差結(jié)果來(lái)看,平均絕對(duì)誤差(MAE)和均方根誤差(RMSE)都是顯示觀測(cè)值與真實(shí)值之間的偏差,當(dāng)預(yù)測(cè)值與真實(shí)值越吻合時(shí)其值越小,從表3可以直觀地看出XGBoost模型的兩個(gè)誤差值較于神經(jīng)網(wǎng)絡(luò)模型和SVM模型都要?。黄骄^對(duì)百分比誤差(MAPE)為0%時(shí)為完美模型,大于100%則為劣質(zhì)模型,即越小越好,基于XGBoost的預(yù)測(cè)模型偏差都控制在30%左右,相較于神經(jīng)網(wǎng)絡(luò)模型和SVM模型有較大優(yōu)勢(shì)。同時(shí),雖然SVM的擬合優(yōu)度相較于神經(jīng)網(wǎng)絡(luò)模型有一定優(yōu)勢(shì),但是綜合RMSE、MAE和MAPE的結(jié)果來(lái)看,模型的整體效果仍欠佳,而XGBoost模型的各項(xiàng)性能都明顯優(yōu)于SVM和神經(jīng)網(wǎng)絡(luò)模型,說(shuō)明XGBoost模型的整體效果更佳,更適用于到架空輸電線(xiàn)路工程投資預(yù)測(cè)。

表3 不同模型投資預(yù)測(cè)效果對(duì)比Table 3 Comparison for investment prediction effect on different models

3.5 指標(biāo)重要性分析

XGBoost算法中,在模型構(gòu)建完成后,可以通過(guò)計(jì)算各指標(biāo)在所有樹(shù)中作為劃分特征的頻率來(lái)推導(dǎo)出各指標(biāo)的重要程度,為模型的建立提供依據(jù),所得對(duì)于不同預(yù)測(cè)對(duì)象而言指標(biāo)重要性前10的結(jié)果如圖5所示。對(duì)于本體投資來(lái)說(shuō),I12(基礎(chǔ)混凝土總量)、I10(路徑長(zhǎng)度(折單))、I4(海拔高度)三者的影響程度最高;對(duì)于靜態(tài)投資和動(dòng)態(tài)投資來(lái)說(shuō),I12(基礎(chǔ)混凝土總量)、I10(路徑長(zhǎng)度(折單))、I6(耐張轉(zhuǎn)角塔基數(shù))三者的影響程度最高。基礎(chǔ)混凝土總量反映了基礎(chǔ)工程量的多少,路徑長(zhǎng)度(折單)則表征著架線(xiàn)工程的投資,而基礎(chǔ)工程和架線(xiàn)工程又是架空線(xiàn)路工程最為關(guān)鍵的組成部分,這也反映了基礎(chǔ)工程和架線(xiàn)工程造價(jià)在架空線(xiàn)路工程總造價(jià)中所占比例較高,與實(shí)際情況相符。海拔高度通過(guò)影響氣象條件、地形的變化等對(duì)架線(xiàn)工程、基礎(chǔ)工程、桿塔工程、接地工程、輔助工程等造成較大的影響,從而使得其在本體投資中影響顯著。耐張轉(zhuǎn)角塔對(duì)鋼材等的耗費(fèi)較高,且通常會(huì)影響輸電線(xiàn)路基礎(chǔ),從而影響到整個(gè)工程的投資。由此可見(jiàn),在架空線(xiàn)路工程投資中,基礎(chǔ)混凝土的工程量、路徑長(zhǎng)度(折單)、海拔高度、耐張轉(zhuǎn)角塔基數(shù)等是投資者應(yīng)該重點(diǎn)關(guān)注的工程指標(biāo)。

圖5 指標(biāo)重要性Fig.5 The importance of indices

4 結(jié)論

隨著電力體制改革的推進(jìn),電網(wǎng)企業(yè)經(jīng)營(yíng)將受到政府有關(guān)部門(mén)嚴(yán)格的投資監(jiān)管。而電網(wǎng)企業(yè)目前尚未實(shí)現(xiàn)科學(xué)、智能化的精準(zhǔn)投資機(jī)制,投資預(yù)測(cè)尚無(wú)完善的理論與方法支撐,因此,提出了基于XGBoost算法的輸電線(xiàn)路工程投資預(yù)測(cè)方法,通過(guò)采用相關(guān)性分析去除關(guān)聯(lián)性高的指標(biāo),得到輸電線(xiàn)路投資預(yù)測(cè)指標(biāo)體系,然后基于投資預(yù)測(cè)指標(biāo)體系和XGBoost算法在實(shí)際工程數(shù)據(jù)訓(xùn)練集上構(gòu)建投資預(yù)測(cè)模型,并在測(cè)試集數(shù)據(jù)上對(duì)模型效果進(jìn)行了檢驗(yàn)。得出了以下結(jié)論。

(1)XGBoost模型對(duì)本體工程投資、靜態(tài)投資和動(dòng)態(tài)投資的預(yù)測(cè)都能達(dá)到90%以上的擬合優(yōu)度,相較于神經(jīng)網(wǎng)絡(luò)模型和SVM模型,XGBoost模型預(yù)測(cè)結(jié)果的準(zhǔn)確率更高,偏差更小,能為決策者提供較為可靠的投資依據(jù)。

(2)該模型可對(duì)指標(biāo)重要性進(jìn)行排序,能對(duì)預(yù)測(cè)模型進(jìn)行合理的解釋?zhuān)瑸橥顿Y者指明了關(guān)鍵控制指標(biāo),提升了模型的可信度與可用性。

(3)建立的輸電線(xiàn)路工程智能化投資預(yù)測(cè)的方法體系,進(jìn)一步豐富了電網(wǎng)投資規(guī)劃的理論體系,有助于提升電網(wǎng)投資精益化管理水平。

創(chuàng)新性地將XGBoost應(yīng)用于輸電線(xiàn)路工程投資預(yù)測(cè)中,能實(shí)現(xiàn)前期通過(guò)輸入少量輸電線(xiàn)路工程特征即可輸出較為準(zhǔn)確的投資預(yù)測(cè)值,同時(shí)能輸出輸電線(xiàn)路工程投資預(yù)測(cè)指標(biāo)的重要性程度,有望在實(shí)際工程預(yù)測(cè)中得到廣泛應(yīng)用。

猜你喜歡
線(xiàn)路預(yù)測(cè)指標(biāo)
無(wú)可預(yù)測(cè)
選修2-2期中考試預(yù)測(cè)卷(A卷)
選修2-2期中考試預(yù)測(cè)卷(B卷)
選修2—2期中考試預(yù)測(cè)卷(A卷)
超高壓架空輸電線(xiàn)路工程建設(shè)施工分析
主要宏觀經(jīng)濟(jì)指標(biāo)及債券指標(biāo)統(tǒng)計(jì)表
主要宏觀經(jīng)濟(jì)指標(biāo)及債券指標(biāo)統(tǒng)計(jì)表
經(jīng)典線(xiàn)路 多彩風(fēng)情
主要宏觀經(jīng)濟(jì)指標(biāo)及債券指標(biāo)統(tǒng)計(jì)表
淺談110kV—220kV輸電線(xiàn)路的運(yùn)行與維護(hù)管理
广丰县| 平乐县| 堆龙德庆县| 抚顺县| 水富县| 榆社县| 西昌市| 香港| 疏勒县| 嘉鱼县| 昌宁县| 大化| 锡林郭勒盟| 大英县| 玉林市| 旺苍县| 阜宁县| 江阴市| 青龙| 温州市| 天祝| 泽库县| 若羌县| 镇原县| 高台县| 凉山| 桐庐县| 涟水县| 乌什县| 加查县| 本溪市| 鹰潭市| 和硕县| 肇州县| 射洪县| 县级市| 健康| 阳东县| 龙江县| 息烽县| 安龙县|