鄭克剛,袁安榮,雷 乾,張?zhí)煨?,吳世強,馮小兵
(國網(wǎng)重慶市電力公司銅梁供電分公司,重慶 402560)
近些年,隨著互聯(lián)網(wǎng)和信息化的迅速發(fā)展,電力行業(yè)也逐漸推進智能化管理[1-2],各電力公司和供電企業(yè)不斷提升自身的客戶服務精益化管理水平。電能計量裝置作為關(guān)鍵性的電力企業(yè)和用戶結(jié)算的儀表工具,其運行狀態(tài)的正常與否會關(guān)系到計量結(jié)果的準確性和可靠性,并繼而影響到后續(xù)相關(guān)電力業(yè)務的開展。 在傳統(tǒng)的電能計量裝置的檢測工作中,主要是由人工巡檢完成,人工成本高且效率低;而隨著用電信息采集系統(tǒng)建設,當前系統(tǒng)內(nèi)已積累了海量計量裝置監(jiān)測數(shù)據(jù),且計量裝置異常樣本也達到了一定的體量,故可開展遠程線上異常識別[3],對計量裝置狀態(tài)進行識別。 從而可有效解決人工巡檢的不及時性和不準確性,節(jié)約時間和人工成本。
當前,部分研究機構(gòu)及專家已開展該方面的研究工作,如文獻[4]采用支持向量機構(gòu)建數(shù)據(jù)和任務并行化的故障診斷模型,實現(xiàn)對電能計量裝置運行異常特征、故障狀態(tài)的在線實時監(jiān)測。 文獻[5]基于電能表、電壓互感器和電流互感器的歷史故障、運行環(huán)境等數(shù)據(jù),組建不同的評價指標,將模糊分析法與層次分析法相結(jié)合、對計量裝置的運行狀態(tài)進行評估。 文獻[6]使用營銷系統(tǒng)數(shù)據(jù)和計量生產(chǎn)調(diào)度平臺數(shù)據(jù)等參數(shù),對電能表進行不同影響因素下的基礎(chǔ)測試,并以此建立評估模型對電能表進行狀態(tài)評估。 雖然上述方法均在一定程度上實現(xiàn)了計量裝置的遠程運行狀態(tài)監(jiān)測[7],但由于未結(jié)合時序數(shù)據(jù)加以分析,導致監(jiān)測效果并不理想。 針對上述問題,本文提出了基于樽海鞘群優(yōu)化調(diào)參的計量裝置狀態(tài)識別模型。
為了及時準確識別在電能計量裝置的運行狀態(tài),本文構(gòu)建了基于樽海鞘群優(yōu)化網(wǎng)絡模型的計量裝置狀態(tài)識別方法。 模型整體流程如圖1 所示。
圖1 系統(tǒng)結(jié)構(gòu)框圖Fig. 1 Structure diagram of the system
本文首先利用小波分解對樣本集的數(shù)據(jù)進行分解,然后對分解出的高低頻數(shù)據(jù)特征作為計量裝置狀態(tài)的關(guān)聯(lián)時序特征,分析其與運行年限、生產(chǎn)廠家、狀態(tài)數(shù)據(jù)、運行環(huán)境等影響因素間的相關(guān)性,構(gòu)建相應的運行年限、生產(chǎn)廠家和運行環(huán)境調(diào)整因子。將小波分解后的狀態(tài)關(guān)聯(lián)時序特征與調(diào)整因子作為長短期記憶網(wǎng)絡輸入,而后利用長短期記憶網(wǎng)絡(LSTM)進行計量裝置狀態(tài)分類,輸出分類結(jié)果,基于輸出結(jié)果與真實結(jié)果構(gòu)建交叉熵損失函數(shù),并根據(jù)損失函數(shù)進行反饋調(diào)參,再采用樽海鞘群算法優(yōu)化模型的調(diào)參過程,以提升調(diào)參速度與識別精準性。
本文針對電能計量裝置包含的電能表、電壓互感器、電流互感器進行遠程運行狀態(tài)監(jiān)測,異常狀態(tài)主要針對遠程數(shù)據(jù)可表征的電能表計量異常、電能表損壞、互感器損壞[8]。 通過用電信息采集系統(tǒng)的數(shù)據(jù)庫獲取涉及電能計量裝置狀態(tài)的樣本數(shù)據(jù),加以匯總整理后進行數(shù)據(jù)預處理,構(gòu)建計量裝置狀態(tài)樣本集,然后按照70%、20%和10%比例分為訓練樣本集、驗證樣本集和測試樣本集。 電能計量裝置狀態(tài)數(shù)據(jù)的主要特征包括電壓、電流、用電量、相位、開關(guān)量、運行時間、運行環(huán)境數(shù)據(jù)等。
針對上述樣本集數(shù)據(jù)的電壓、電流、用電量等曲線特征,采用小波分解[9]算法中的wavedec函數(shù)將特征數(shù)據(jù)進行D層小波分解,獲取小波分解系數(shù)矩陣C和矩陣內(nèi)系數(shù)的個數(shù)L:
其中,A為輸入的特征數(shù)據(jù);M為分解層數(shù);C為小波分解系數(shù);sym4 表示小波變換方式;L為小波分解系數(shù)的個數(shù),即矩陣內(nèi)系數(shù)的個數(shù)。 如經(jīng)過3層小波分解后,共包含4 個高低頻特征,分別是:1 個低頻近似特征值和3 個高頻細節(jié)特征值。
根據(jù)分解出的數(shù)據(jù)特征結(jié)合計量裝置樣本狀態(tài)、運行年限、生產(chǎn)廠家、狀態(tài)數(shù)據(jù)、運行環(huán)境等與計量裝置樣本狀態(tài)的相關(guān)性,構(gòu)建相應的運行年限、生產(chǎn)廠家和運行環(huán)境調(diào)整因子K。
本次電能計量裝置的運行狀態(tài)分為正常狀態(tài)、注意狀態(tài)和異常狀態(tài)。 采用LSTM 算法構(gòu)建計量裝置狀態(tài)識別模型,將小波分解后的狀態(tài)特征數(shù)據(jù)序列與調(diào)整因子K作為長短期記憶網(wǎng)絡的輸入,根據(jù)LSTM 算法中門控裝置的3 個控制門(輸入門、遺忘門和輸出門)來實現(xiàn)對輸入樣本集數(shù)據(jù)的識別和計量裝置狀態(tài)的判別。 3 個控制門控、記憶信息及輸出判別的數(shù)據(jù)處理過程可闡釋分述如下。
(1)更新忘記門輸出為:
更新輸入門2 部分輸出為:
(2)記憶信息狀態(tài)為:
(3)更新輸出門輸出為:
更新當前樣本的計量裝置狀態(tài)判別預測輸出為:
其中,Wf、Wi、Wa、Wo與Uf、Ui、Ua、Uo分別為輸入的隱藏層和輸入樣本的權(quán)重參數(shù);t -1 為上一神經(jīng)單元;t為當前LSTM 神經(jīng)單元;bf、bi、ba、bo為偏移量參數(shù)。
將Softmax函數(shù)作為LSTM 神經(jīng)單元網(wǎng)絡訓練的最后一層,在經(jīng)過門控裝置的訓練后會輸出樣本狀態(tài)類別預測概率值,再利用多分類交叉熵損失函數(shù)計算出樣本數(shù)據(jù)的期望輸出預測概率值和實際輸出概率的誤差、即損失,Softmax函數(shù)定義如下:
其中,yi為樣本計量裝置狀態(tài)判別的預測輸出值,C為分類的類別個數(shù)。
基于輸出結(jié)果與真實結(jié)果構(gòu)建交叉熵損失函數(shù),交叉熵損失函數(shù)定義如下:
其中,P為樣本的實際狀態(tài)類別;T為模型的判別輸出;C為分類的類別個數(shù),這里,T =[softmax(y1),softmax(y2),…,softmax(yi =n)]。
根據(jù)損失函數(shù)構(gòu)建梯度反饋函數(shù)進行調(diào)參,采用樽海鞘群算法[10]提升LSTM 網(wǎng)絡的調(diào)參速度與精準性。 樽海鞘群算法(salp swarm algorithm,SSA)對一個D 維空間進行尋優(yōu)搜索,樽海鞘種群的個體數(shù)為N,樽海鞘種群的位置向量可由矩陣X表示:
食物的位置是所有樽海鞘個體的目標位置,樽海鞘個體領(lǐng)導者的位置根據(jù)食物的位置進行更新,其位置更新公式為:
其中,l為當前迭代次數(shù),L為最大迭代次數(shù)。c1在搜索前期值較大,便于全局尋優(yōu),迅速確定全局最優(yōu)點;在搜索后期值變小,起到局部開發(fā)的作用。c1起到平衡全局探索和局部開發(fā)的作用,是樽海鞘群算法中最重要的參數(shù)。
樽海鞘種群追隨者的位置移動規(guī)律,在求解過程中的時間就是迭代過程,設每次迭代過程中的時間t =1,每次迭代的初速度v0=0,表示為:
式(12)和式(14)描述了整個樽海鞘群體內(nèi)部的移動機制。
利用樽海鞘群算法尋找計量裝置狀態(tài)識別模型的最優(yōu)參數(shù)的流程如下:
(1)初始化參數(shù)。 根據(jù)搜索空間每一維的上界與下界,初始化一個規(guī)模為D ×N的樽海鞘群,D表示參數(shù)個數(shù),d∈[1,2,…,D],在每一維空間中分別生成包含N個個體的隨機種群X,根據(jù)樽海鞘群算法,計算每個解xj(j =1,2,…,N) 的初始適應度,適應度為模型識別類別判別概率的提升,即參數(shù)θd為xi時,相比于當前θd值,其Softmax(yxj i) 概率值提升,則說明其適應度提升,二進制向量轉(zhuǎn)化為:
因此,只有對應于1 的xj被取出來表示適應度滿足條件,作為備選領(lǐng)導者的參數(shù)。
(2)選定目標位置。 由于實際調(diào)參過程中不知道目標參數(shù)的位置,因此,將樽海鞘群按照適應度值進行排序,排在首位的適應度最優(yōu)的樽海鞘的位置設為當前目標位置。
(3)選定領(lǐng)導者與追隨者。 選定目標位置后,群體中剩余N -1 個樽海鞘,按照樽海鞘群體的排序,將二進制向量為1 的樽海鞘視為領(lǐng)導者,其余樽海鞘視為追隨者。
(4)位置更新。 先根據(jù)式(12)更新領(lǐng)導者的位置,再根據(jù)式(14)更新追隨者的位置。
(6)重復步驟(3)~(5),直至達到一定迭代次數(shù)或適應度值達到終止門限、滿足終止條件后,輸出當前的解的位置作為目標的估計位置,即返回全局最優(yōu)解。
損失函數(shù)低于設定閾值后,固定參數(shù),輸出計量裝置狀態(tài)識別模型,采用驗證集對該模型進行驗證,驗證準確率與召回率達到設定閾值后,輸出模型,否則繼續(xù)進行反饋優(yōu)化。
實驗部分選取測試樣本集的數(shù)據(jù)對該模型的有效性進行測試。 在本文所提模型中輸入測試集中的樣本數(shù)據(jù),記錄其準確率和召回率,同時,將本文算法與SVM、邏輯回歸、貝葉斯和BP 神經(jīng)網(wǎng)絡四種算法進行識別性能的對比。 在測試中,主要采用準確率、精確率和召回率三個指標來衡量,各指標定義具體如下。
(1) 準確率ACC(accuracy),計算公式為:
(2)精確率P(precision)。 計算公式為:
(3)召回率R(recall)。 計算公式為:
其中,TP、TN、FP、FN表示的含義見表1。
表1 參數(shù)含義Tab. 1 Parameters meaning
本文所提方法與其他4 種算法的性能對比結(jié)果見表2。
表2 算法性能對比Tab. 2 Performance comparison of algorithm%
此實驗分別對比了各種算法識別的準確率和召回率,可以看到,其他4 類算法雖也表現(xiàn)出不錯的識別性能,但是本文所提方法的準確率和召回率具有明顯的優(yōu)勢。 實驗結(jié)果表明,本文采用長短期記憶網(wǎng)絡構(gòu)建計量裝置狀態(tài)識別模型,有效提升了狀態(tài)識別的準確率和召回率。
消融實驗分別對3 組測試數(shù)據(jù)進行測試,控制變量是采用樽海鞘群算法和不采用樽海鞘群算法,精確度實驗結(jié)果和時間對比實驗結(jié)果分別如圖2 和圖3 所示。 其中,時間對比實驗是基于當前訓練完成后的模型,以測試樣本集作為二次訓練樣本集,將其識別準確度作為目標函數(shù)進行二次調(diào)參,對比傳統(tǒng)反饋調(diào)參方式,本文所提的樽海鞘群調(diào)參可在更短的時間內(nèi)完成參數(shù)尋優(yōu)過程,且由精確度對比數(shù)據(jù)可看出,樽海鞘群調(diào)參可基于全局探索跳出一定的局部最優(yōu),從而有效提高了模型的識別性能。 從實驗結(jié)果圖可以看到,3 組數(shù)據(jù)都表現(xiàn)出了同一種趨勢,即采用樽海鞘群算法的模型具有更高的精確度和更快的調(diào)參速度,上述均表明本文所提計量裝置狀態(tài)識別模型具有良好的性能。
圖2 精度對比圖Fig. 2 Accuracy comparison chart
圖3 參數(shù)調(diào)整時間對比圖Fig. 3 Recognition time comparison chart
文中提出了一種基于樽海鞘群優(yōu)化網(wǎng)絡調(diào)參的計量裝置狀態(tài)識別模型,首先采用小波分解算法進行曲線特征分解,并構(gòu)建多因素的影響因子,隨后采用LSTM 算法構(gòu)建狀態(tài)識別模型,基于時序記憶的異常狀態(tài)識別提高了計量裝置狀態(tài)的識別準確率,并利用樽海鞘群算法提高了模型的調(diào)參速度,從而提升了整個異常識別方法的識別效率和準確率,模型具有極高的可用性和可靠性。 本文計量裝置狀態(tài)識別模型的提出,有效增強了供電公司客戶服務部門的數(shù)據(jù)分析能力,提升了客戶服務精益化管理水平。