吳晨曦,李博亞,孫弼洋,鐘素鵬
(國網(wǎng)浙江省電力有限公司超高壓分公司,杭州 310000)
輸電線路是電力傳輸?shù)闹饕M成部分,也是電力系統(tǒng)安全運行的重要保障[1]。輸電線路的運行環(huán)境復(fù)雜多變、分布區(qū)域極廣、搭建成本高、運維檢修難度大,正確判斷其運行狀態(tài)對提高電力系統(tǒng)安全性具有重要意義。考慮到輸電線路種類繁多,關(guān)于其外部環(huán)境和內(nèi)部結(jié)構(gòu)的數(shù)據(jù)信息存在冗余,電網(wǎng)工作人員多依據(jù)主觀經(jīng)驗提取重要指標(biāo)對線路進(jìn)行畫像構(gòu)建,采用基于自回歸[2]和主成分分析[3]的方法對輸電線路各狀態(tài)因素進(jìn)行權(quán)重評分,綜合總分對輸電線路進(jìn)行評估。該方法受人為主觀因素影響較大,很大程度上依靠電網(wǎng)技術(shù)人員的經(jīng)驗,因而推廣泛化能力較弱。
在輸電線路畫像建立方面,傳統(tǒng)研究大多使用K-means[4]算法對海量輸電線路數(shù)據(jù)進(jìn)行降維和聚類,但K-means算法需要事先給定聚類數(shù)量,而且聚類數(shù)量的選取大多依據(jù)電網(wǎng)技術(shù)人員的主觀經(jīng)驗,很大程度上影響了聚類效果。近年來,隨著機(jī)器學(xué)習(xí)技術(shù)在計算機(jī)視覺[5]、自然語言處理[6]、優(yōu)化調(diào)度[7]等諸多領(lǐng)域的廣泛應(yīng)用,電網(wǎng)技術(shù)人員嘗試基于網(wǎng)絡(luò)和學(xué)習(xí)的算法[8]對輸電線路建立狀態(tài)畫像。傳統(tǒng)的機(jī)器學(xué)習(xí)[9]算法主要有人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、貝葉斯方法、組合方法、K 近鄰方法、決策樹等。張琦等[10]結(jié)合粗糙集理論中的決策表化簡算法,利用人工神經(jīng)網(wǎng)絡(luò)對輸電線路的歷史狀態(tài)信息進(jìn)行特征聚類;但是當(dāng)出現(xiàn)數(shù)據(jù)規(guī)模大、特征信息多的情況時,人工神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和收斂速度不夠理想。石萬宇等[11]利用支持向量機(jī)對輸電線路狀態(tài)因素信息進(jìn)行聚類,然后依據(jù)輸電線路歷史狀態(tài)建立回歸模型;該回歸模型有較好的泛化能力,但特征提取能力不強(qiáng)。文獻(xiàn)[12]利用貝葉斯方法對輸電線路的外部環(huán)境和內(nèi)部結(jié)構(gòu)信息進(jìn)行聚類,評估當(dāng)前環(huán)境下輸電線路的狀態(tài);貝葉斯方法雖然具有良好的聚類性能,但計算時間較長,不利于實際應(yīng)用。上述算法雖然能夠完成一定程度的聚類分析,但對數(shù)據(jù)的特征提取和降維能力有限,需要人工提取海量數(shù)據(jù)特征,才能達(dá)到較好的評估效果。
在輸電線路狀態(tài)評估方面,目前流行的方法是自回歸綜合移動平均線法[13]及其變體。該方法雖然在處理基于時間序列的設(shè)備狀態(tài)評估問題上取得了較好效果,但仍存在如下不足:模型基于回歸方法進(jìn)行狀態(tài)評估,缺乏輸入與輸出之間的非線性表達(dá);在統(tǒng)計檢驗時,需要對數(shù)據(jù)分布等信息做出一些假設(shè)(比如滿足恒定標(biāo)準(zhǔn)差準(zhǔn)則),但是該假設(shè)在實際電網(wǎng)場景中并不適用;該方法不適用于輸入數(shù)據(jù)量較大情況下的狀態(tài)評估。隨著深度學(xué)習(xí)的不斷發(fā)展,深度神經(jīng)網(wǎng)絡(luò)[14]表現(xiàn)出良好的性能,能夠?qū)崿F(xiàn)對海量數(shù)據(jù)進(jìn)行非線性映射,具有更強(qiáng)的數(shù)據(jù)特征提取和理解能力。目前,以LSTM(長短期記憶)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)和稀疏自動編碼機(jī)為代表的深度學(xué)習(xí)模型在輸電線路狀態(tài)畫像與評估領(lǐng)域得到廣泛應(yīng)用。深度置信網(wǎng)絡(luò)[15]由多層受限玻爾茲曼機(jī)和單層反向傳播網(wǎng)絡(luò)構(gòu)成,可以利用海量輸電線路數(shù)據(jù)對輸電線路進(jìn)行狀態(tài)評估。但是,深度置信網(wǎng)絡(luò)需要大量帶標(biāo)簽的數(shù)據(jù),收斂速度較慢,且容易陷入局部最優(yōu)困境。深度卷積神經(jīng)網(wǎng)絡(luò)[16]利用輸電線路的現(xiàn)場照片,對桿塔、導(dǎo)地線、絕緣子、金具等設(shè)備進(jìn)行目標(biāo)檢測和狀態(tài)評估,其評估準(zhǔn)確率受圖片質(zhì)量、數(shù)量及計算資源等影響較大。LSTM 網(wǎng)絡(luò)[17]采用遺忘門、輸入門和輸出門3種門控單元提取輸電線路畫像的固有特征和數(shù)據(jù)標(biāo)簽,具有較好的輸電線路狀態(tài)評估效果。上述深度學(xué)習(xí)模型需要大量的數(shù)據(jù)訓(xùn)練來提高網(wǎng)絡(luò)的特征提取能力,同時大規(guī)模的梯度反向傳播也給計算資源帶來嚴(yán)峻的挑戰(zhàn)。
基于此,本文按照先聚類后回歸的順序,提出一種基于自適應(yīng)自組織神經(jīng)網(wǎng)絡(luò)和雙向LSTM網(wǎng)絡(luò)的輸電線路狀態(tài)畫像與評估模型。首先,對輸電線路的海量數(shù)據(jù)進(jìn)行降維解耦,自適應(yīng)地提取出幾類最具代表性的核心數(shù)據(jù)信息。然后,將核心數(shù)據(jù)送入雙向LSTM 網(wǎng)絡(luò),對模型進(jìn)行雙向訓(xùn)練,提升模型對輸電線路狀態(tài)的評估精度。自適應(yīng)自組織神經(jīng)網(wǎng)絡(luò)的引入極大地降低了數(shù)據(jù)規(guī)模,減少后續(xù)網(wǎng)絡(luò)的運算量,同時有效避免了人為主觀因素的影響;雙向LSTM 網(wǎng)絡(luò)對降維后的代表性數(shù)據(jù)進(jìn)行監(jiān)督學(xué)習(xí),其雙向?qū)W習(xí)與評估的特性可以更好地對樣本數(shù)據(jù)進(jìn)行特征提取,在合理運算量下得到更高的輸電線路狀態(tài)評估精度。以某省部分輸電線路數(shù)據(jù)作為訓(xùn)練樣本,將本文方法與常用的人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、稀疏編碼器等方法進(jìn)行對比,以驗證本文方法的評估準(zhǔn)確率。
本文聚焦輸電線路的畫像建立與狀態(tài)評估問題。輸電線路設(shè)備畫像旨在從公共安全類(塔基滑坡、雷擊、覆冰等)、地理信息類(桿塔位置坐標(biāo)、標(biāo)識球坐標(biāo)等)、實時檢測類(絕緣子泄漏電流、架空線溫度等)、屬性標(biāo)簽類(電纜規(guī)格型號、家族缺陷等)和運維信息類(基礎(chǔ)、金具、絕緣子、導(dǎo)地線、緊縮銷、接續(xù)管狀態(tài))等多元數(shù)據(jù)中,提取出能夠描述線路運行狀態(tài)的核心指標(biāo),并進(jìn)行具象化展示。線路評估是根據(jù)當(dāng)前輸電線路信息,結(jié)合線路歷史數(shù)據(jù),對線路的當(dāng)前狀態(tài)進(jìn)行評價(“正?!被颉爱惓!保?。由于輸電線路狀態(tài)量信息繁多冗雜,各數(shù)據(jù)信息之間存在耦合關(guān)聯(lián),直接針對所有狀態(tài)信息進(jìn)行狀態(tài)畫像和評估會消耗大量的計算資源,評估結(jié)果也不理想。為此,本文引入一種先聚類后回歸的方法,提出一種基于自適應(yīng)自組織神經(jīng)網(wǎng)絡(luò)的輸電線路畫像模型:對輸電線路的狀態(tài)信息進(jìn)行降維聚類,提取核心特征,減少數(shù)據(jù)規(guī)模,建立線路的狀態(tài)畫像;基于具有核心代表性特征的線路信息,設(shè)計雙向LSTM 網(wǎng)絡(luò),將前向?qū)W習(xí)和反向?qū)W習(xí)相結(jié)合,進(jìn)行模型的雙向訓(xùn)練與評估,建立輸電線路底層數(shù)據(jù)與其狀態(tài)的非線性映射關(guān)系。這種先聚類后回歸的方法可大幅減少計算時間,降低計算資源消耗,并可得到更好的評估效果。
本文旨在對電網(wǎng)場景下輸電線路的海量數(shù)據(jù)信息進(jìn)行深入挖掘。輸電線路包括桿塔、導(dǎo)地線、絕緣子等內(nèi)部設(shè)施數(shù)據(jù)和雷擊、覆冰、污閃等外部條件數(shù)據(jù),線路的數(shù)據(jù)信息量極大且存在較多冗余,因此引入自適應(yīng)自組織神經(jīng)網(wǎng)絡(luò)模型,提取出最具有代表性的幾類指標(biāo)信息,構(gòu)建輸電線路畫像,同時無需工作人員事先給出聚類數(shù)量,以便對輸電線路狀態(tài)進(jìn)行評估。
動態(tài)生長自組織神經(jīng)網(wǎng)絡(luò)為兩層人工神經(jīng)網(wǎng)絡(luò),其輸入為某段輸電線路的多元數(shù)據(jù)信息X=(x1,x2,…,xN)∈RN。動態(tài)生長自組織神經(jīng)網(wǎng)絡(luò)的輸出為競爭層神經(jīng)元的權(quán)重M=(m1,m2,…,mZ)∈RZ。令輸出神經(jīng)元的初始數(shù)量Z=4,對其權(quán)重進(jìn)行隨機(jī)初始化。與自組織神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程相似,在每個迭代時刻t隨機(jī)挑選一個輸入神經(jīng)元x(t),在歐氏空間中,距離x(t)最近的輸出神經(jīng)元即為獲勝神經(jīng)元c(t),計算公式為:
獲勝神經(jīng)元及鄰域神經(jīng)元向輸入神經(jīng)元x(t)靠近,滿足赫布學(xué)習(xí)規(guī)則:
式中:δ(t)為計算參數(shù),δ(t)=0.8×0.97t-1;α(t)為學(xué)習(xí)率,其初始值為0.9,每20個迭代周期減少5%。隨著迭代過程不斷進(jìn)行,輸出神經(jīng)元逐步學(xué)習(xí)網(wǎng)絡(luò)輸入的模式和規(guī)律,逐漸成為輸入數(shù)據(jù)的類中心。
為使自組織神經(jīng)網(wǎng)絡(luò)[18]能夠自適應(yīng)尋找合適的聚類數(shù),引入平均量化誤差概念來控制輸出神經(jīng)元的分裂與聚合。假設(shè)輸入神經(jīng)元的平均權(quán)重,則使用初始量化誤差einit作為衡量輸出神經(jīng)元分裂聚合的依據(jù):
式中:ei為輸出神經(jīng)元mi(t)對輸入的量化誤差;N為輸入神經(jīng)元的數(shù)量;nC為以輸出神經(jīng)元mi(t)為類中心的輸入神經(jīng)元數(shù)量,這類輸入神經(jīng)元構(gòu)成集合Ci。若ei>τ1·einit(τ1為分裂系數(shù),取0.8),則該輸出神經(jīng)元分裂為兩個神經(jīng)元,否則不分裂;若ei<τ2·einit(τ2為聚合系數(shù),取0.2),則該神經(jīng)元進(jìn)行聚合操作,即與最近的其他輸出神經(jīng)元合二為一,形成新的輸出神經(jīng)元。
輸電線路狀態(tài)評估模型通常利用人工或算法選取關(guān)鍵指標(biāo),采用自回歸或主成分分析法來確定各指標(biāo)的權(quán)重。這些方法受技術(shù)人員主觀經(jīng)驗影響,對線路狀態(tài)的評估不夠準(zhǔn)確。為此,本文基于上述自適應(yīng)自組織神經(jīng)網(wǎng)絡(luò)提取的輸電線路核心信息,使用雙向LSTM 網(wǎng)絡(luò),將前向?qū)W習(xí)和反向?qū)W習(xí)相結(jié)合,進(jìn)行模型的雙向訓(xùn)練與評估,建立輸電線路底層數(shù)據(jù)與其狀態(tài)的非線性映射關(guān)系,提高電網(wǎng)場景[19]下輸電線路狀態(tài)評估的準(zhǔn)確率。LSTM 網(wǎng)絡(luò)一般包括遺忘門、輸入門和輸出門,如圖1所示,其中:下標(biāo)t表示當(dāng)前時刻,t-1表示上一時刻,下同;xt為連接輸入層的輸入向量;ht為隱含層輸出;ct為記憶單元狀態(tài);σ為Sigmoid函數(shù)。遺忘門決定是否保留或刪除現(xiàn)有的信息;輸入門指定新信息將被添加到內(nèi)存的程度;輸出門控制單元中現(xiàn)有的值是否對輸出有貢獻(xiàn)。
圖1 LSTM網(wǎng)絡(luò)門控單元
在使用神經(jīng)網(wǎng)絡(luò)進(jìn)行評估前,通常使用歸一化方法將不同量綱、量級的數(shù)據(jù)統(tǒng)一化為同一個量級的無量綱數(shù)據(jù),以加速網(wǎng)絡(luò)的訓(xùn)練和推理速度。常用的歸一化方法包括z-score歸一化和minmax 歸一化方法。z-score 歸一化是基于原始數(shù)據(jù)的均值和標(biāo)準(zhǔn)差來進(jìn)行數(shù)據(jù)的標(biāo)準(zhǔn)化,處理后的數(shù)據(jù)滿足均值為0、方差為1 的正態(tài)分布:xnorm=(x-μ)/σ,其中x為原始數(shù)據(jù),μ為原始數(shù)據(jù)的平均值,σ為原始數(shù)據(jù)的標(biāo)準(zhǔn)差,xnorm為歸一化后的數(shù)據(jù)。min-max 歸一化也稱為離差標(biāo)準(zhǔn)化,是對原始數(shù)據(jù)的線性映射,使歸一化后的數(shù)據(jù)保持在[0,1]區(qū)間:xnorm=,其中xmin和xmax為原始數(shù)據(jù)的最小值和最大值。
1)遺忘門。遺忘門通常使用Sigmoid函數(shù)[20]來決定需要從LSTM 網(wǎng)絡(luò)中刪除哪些信息。遺忘門輸出ft的值介于0~1,當(dāng)ft趨近于0 表示傾向于遺忘該信息,當(dāng)ft趨近于1 表示傾向于保留該信息。遺忘門的輸出ft可以表示為:
2)輸入門。輸入門決定新信息添加到網(wǎng)絡(luò)內(nèi)存的程度。輸入門包括Sigmoid 和tanh 兩層網(wǎng)絡(luò)。Sigmoid 層決定需要更新值的向量it,tanh 層創(chuàng)建一個新的候選值向量,并將其添加到LSTM 網(wǎng)絡(luò)的內(nèi)存中。具體公式表達(dá)如下:
3)輸出門。輸出門首先使用一個Sigmoid層來決定網(wǎng)絡(luò)內(nèi)存的哪一部分用于輸出,執(zhí)行一個tanh 函數(shù)來映射-1~1 之間的值,將結(jié)果乘以一個Sigmoid層作為輸出。
式中:ot為輸出門的輸出;為權(quán)重矩陣;bo為偏置矩陣。
雙向LSTM 網(wǎng)絡(luò)是LSTM 網(wǎng)絡(luò)的變體,由兩個LSTM 網(wǎng)絡(luò)構(gòu)成,如圖2 所示。在第一輪中,輸入序列以前向傳播的方式輸入LSTM 網(wǎng)絡(luò)。在第二輪中,將輸入序列以反向傳播方式輸入到LSTM 網(wǎng)絡(luò)中。雙向LSTM 網(wǎng)絡(luò)將前向傳播與反向傳播相結(jié)合,使模型進(jìn)行雙向訓(xùn)練與評估,從而提高模型預(yù)測評估的準(zhǔn)確性。
圖2 雙向LSTM網(wǎng)絡(luò)結(jié)構(gòu)
本文采用某省電網(wǎng)100條輸電線路的14 300個樣本信息作為模型評估數(shù)據(jù)集,并依據(jù)所處區(qū)域差異構(gòu)造Ⅰ、Ⅱ、Ⅲ3個子數(shù)據(jù)集?;谏a(chǎn)管理系統(tǒng)的設(shè)備臺賬信息、故障和計劃停電文本數(shù)據(jù)、斷面和告警類結(jié)構(gòu)化信息和外部氣象條件數(shù)據(jù),建立輸電線路狀態(tài)評估樣本集。每個樣本包括共40 個維度的信息:基礎(chǔ)、金具、桿塔、絕緣子、導(dǎo)地線、緊縮銷、接續(xù)管等12 類內(nèi)部設(shè)施狀態(tài)數(shù)據(jù)(以桿塔為例,桿塔彎曲記為1,正常記為0);塔基滑坡、雷擊、覆冰、風(fēng)偏、污閃等8類公共安全類數(shù)據(jù)(以雷擊為例,發(fā)生雷擊記為1,不發(fā)生則為0);桿塔位置坐標(biāo)、標(biāo)識球坐標(biāo)等10類地理信息數(shù)據(jù);電纜生產(chǎn)日期、規(guī)格型號、家族缺陷等6類屬性信息;絕緣子泄漏電流、架空線溫度等4類檢測數(shù)據(jù)。每個維度的數(shù)據(jù)均使用z-score進(jìn)行歸一化處理,各樣本依據(jù)DL/T 1249—2013《架空輸電線路運行狀態(tài)評估技術(shù)導(dǎo)則》[21]要求標(biāo)注“正?!被颉爱惓!睒?biāo)簽。以隨機(jī)選取方式劃分?jǐn)?shù)據(jù)集,其中70%用于訓(xùn)練雙向LSTM 網(wǎng)絡(luò)模型,其余30%作為測試集。
網(wǎng)絡(luò)參數(shù)方面,本文使用Adam優(yōu)化器進(jìn)行優(yōu)化,學(xué)習(xí)率初始值設(shè)置為0.01,在前100輪訓(xùn)練過程中,每20 輪訓(xùn)練學(xué)習(xí)率減半,屬于模型粗調(diào)階段;在后150輪訓(xùn)練過程中,學(xué)習(xí)率保持不變,進(jìn)入模型微調(diào)階段。批量大小設(shè)置為12,共進(jìn)行250輪訓(xùn)練。每層網(wǎng)絡(luò)均使用Sigmoid激活函數(shù)以引入非線性成分,所有數(shù)據(jù)均進(jìn)行z-score歸一化。
本文所有算法均在配備Intel(R)Core(TM)i7-8750H(2.20 GHz)處理器和8 GB 內(nèi)存的Windows 10 計算機(jī)上進(jìn)行測試。采用評估準(zhǔn)確率A、F1值和偽正類率R作為評價模型性能的指標(biāo):評估準(zhǔn)確率A反映模型評估的總體性能;F1值可以看作精確率與召回率的加權(quán),F(xiàn)1值越大,模型性能越好;電網(wǎng)對輸電線路實際異常但被評估為正常現(xiàn)象的容忍度很低,因此引入偽正類率R來表征模型對這種情況的錯判率。表1為輸電線路狀態(tài)評估混淆矩陣,其中TP和FN分別為“正?!睒颖颈荒P驼_和錯誤評估的數(shù)量,TN和FP分別為“異?!睒颖颈荒P驼_和錯誤評估的數(shù)量。
表1 輸電線路狀態(tài)混淆矩陣
根據(jù)表1,評估準(zhǔn)確率A、F1值和偽正類率R的計算公式分別為:
2.2.1 狀態(tài)畫像
本文基于某省電網(wǎng)公司的輸電線路數(shù)據(jù)信息,利用自組織神經(jīng)網(wǎng)絡(luò),自適應(yīng)地提取并聚類出6類影響輸電線路狀態(tài)的外部因素(即風(fēng)偏、覆冰、雷害、污閃、外力和其他故障程度),以及8 類影響輸電線路狀態(tài)的內(nèi)部因素(即基礎(chǔ)、桿塔、導(dǎo)地線、絕緣子、金具、接地裝置、附屬設(shè)施和通道環(huán)境),構(gòu)成輸電線路的狀態(tài)畫像。使用K-means算法對輸電線路數(shù)據(jù)進(jìn)行聚類,與自組織神經(jīng)網(wǎng)絡(luò)作對比,如圖3所示,其中數(shù)字表示該狀態(tài)因素在總體的外部或內(nèi)部因素中的權(quán)重占比。由圖3可知,采用自組織神經(jīng)網(wǎng)絡(luò)得到的輸電線路畫像中:覆冰在外部因素中的權(quán)重占比為0.33,高于采用K-means 得到的結(jié)果(0.23);絕緣子在內(nèi)部因素中的權(quán)重占比為0.21,高于采用K-means 得到的結(jié)果(0.14)。
2.2.2 狀態(tài)評估
將聚類降維后的輸電線路數(shù)據(jù)作為雙向LSTM網(wǎng)絡(luò)的輸入,得到評估準(zhǔn)確率、F1值和偽正類率。將所提出的模型與目前用于輸電線路評估的主流模型(如人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、進(jìn)化計算、K 近鄰算法等機(jī)器學(xué)習(xí)模型,稀疏自動編碼機(jī)、卷積神經(jīng)網(wǎng)絡(luò)、傳統(tǒng)LSTM網(wǎng)絡(luò)等深度學(xué)習(xí)模型)進(jìn)行對比,結(jié)果如表2和表3所示。
表2 基于K-means聚類的不同算法評估效果比較
表3 基于自適應(yīng)自組織神經(jīng)網(wǎng)絡(luò)聚類的不同算法評估效果比較
采用自適應(yīng)自組織神經(jīng)網(wǎng)絡(luò)聚類時:在數(shù)據(jù)集Ⅰ上,本文提出的雙向LSTM 網(wǎng)絡(luò)的評估準(zhǔn)確率比次優(yōu)的進(jìn)化計算高0.6%,偽正類率低0.6%;在數(shù)據(jù)集Ⅱ上,本文算法的評估準(zhǔn)確率比傳統(tǒng)的LSTM網(wǎng)絡(luò)高1.2%;在數(shù)據(jù)集Ⅲ上,本文算法的偽正類率比支持向量機(jī)低2.4%。同時,本文算法的求解速度明顯高于卷積神經(jīng)網(wǎng)絡(luò)、進(jìn)化計算和LSTM網(wǎng)絡(luò)等算法。
采用K-means 聚類時:本文算法的評估準(zhǔn)確率在數(shù)據(jù)集Ⅰ、Ⅱ、Ⅲ上比次優(yōu)的LSTM 網(wǎng)絡(luò)分別高0.5%、1.2%、0.6%,且計算時間分別少28 s、36 s、35 s。
實驗結(jié)果表明,本文提出的算法可在更短時間內(nèi)獲得更好的輸電線路評估效果,有效地挖掘出海量輸電線路中的核心信息。
將模型所采用的z-score 歸一化方法分別替換成min-max 和無歸一化方法,得到迭代過程的評估準(zhǔn)確率如圖4 所示。在整個迭代過程中,采用z-score 歸一化方法的模型的評估準(zhǔn)確率要明顯高于其他兩種方法。
圖4 模型評估準(zhǔn)確率比較
不同歸一化處理下的模型評估效果如表4 所示。采用z-score歸一化模型的評估準(zhǔn)確率比采用min-max 歸一化模型高3.2%,比無歸一化模型高9.9%。采用z-score歸一化模型的偽正類率也遠(yuǎn)小于其他兩種模型??梢?,對于雙向LSTM 網(wǎng)絡(luò)模型而言,z-score 歸一化方法要優(yōu)于min-max 歸一化方法和不采用歸一化的方法。
表4 不同歸一化處理下的模型評估效果
本文提出一種基于深度學(xué)習(xí)的輸電線路狀態(tài)畫像與評估模型。具體而言,首先設(shè)計一種自組織神經(jīng)網(wǎng)絡(luò)對輸電線路數(shù)據(jù)進(jìn)行降維處理,提取出關(guān)鍵的幾類數(shù)據(jù),進(jìn)而構(gòu)建出輸電線路的畫像模型,為輸電線路狀態(tài)評估提供全方位、多層次和多角度的數(shù)據(jù)支持。該網(wǎng)絡(luò)可以自適應(yīng)地提取幾類關(guān)鍵信息,無需人為事先設(shè)定聚類數(shù)量。之后,針對線路的設(shè)備畫像數(shù)據(jù),提出基于雙向LSTM 網(wǎng)絡(luò)的輸電線路評估模型。雙向LSTM 網(wǎng)絡(luò)由兩個獨立的LSTM 網(wǎng)絡(luò)構(gòu)成,且參數(shù)彼此獨立。在訓(xùn)練過程中,模型將前向?qū)W習(xí)與反向?qū)W習(xí)相結(jié)合,建立了線路關(guān)鍵指標(biāo)與運行狀態(tài)的非線性映射關(guān)系,提高了電網(wǎng)場景下輸電線路狀態(tài)評估的準(zhǔn)確率。
基于某省電網(wǎng)100條實際輸電線路狀態(tài)數(shù)據(jù)的實驗結(jié)果表明,與常用的支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)、稀疏自動編碼機(jī)等方法相比,本文方法可以更好地對輸電線路進(jìn)行設(shè)備畫像和狀態(tài)評估。