国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

BiLSTM與TCN在戶變關(guān)系異常識別中的應(yīng)用

2022-06-05 06:27:08周亞同
關(guān)鍵詞:損率臺區(qū)卷積

楊 健,周亞同,劉 君

(1.河北工業(yè)大學(xué)電子信息工程學(xué)院,天津 300401;2.朗新科技集團(tuán)股份有限公司,天津 300041)

戶變關(guān)系是指用戶電表與變壓器(臺區(qū))的歸屬關(guān)系。低壓戶變關(guān)系識別是電力大數(shù)據(jù)處理領(lǐng)域里重要問題之一。準(zhǔn)確的低壓臺區(qū)戶變關(guān)系是線損得以精確分析調(diào)整的前提。有效計(jì)算低壓臺區(qū)線損并制定相應(yīng)的降損策略,對提高企業(yè)經(jīng)營效益,提升電網(wǎng)運(yùn)行效率具有重要價(jià)值[1]。截至2014年底,全國網(wǎng)已完成智能電表的大范圍普及,可實(shí)時采集用戶負(fù)荷、電壓、電量等信息,為準(zhǔn)確進(jìn)行戶變關(guān)系異常識別提供了精準(zhǔn)的電力大數(shù)據(jù)支持。

現(xiàn)實(shí)中,由于低壓臺區(qū)用戶數(shù)量眾多,網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,以及頻繁的施工改造(如遷建、擴(kuò)容、割接、布點(diǎn)等),使得營銷系統(tǒng)中用戶臺區(qū)歸屬沒有得到及時更新,造成部分終端用戶的真實(shí)戶變關(guān)系與臺區(qū)檔案記載不相符,而臺區(qū)戶變關(guān)系異常必然導(dǎo)致同期線損分析結(jié)果不準(zhǔn)確[2]。影響電網(wǎng)精益化管理。因此,戶變關(guān)系異常成為一個亟待解決的關(guān)鍵問題。

目前戶變關(guān)系識別方法主要有以下方式:

(1)臺區(qū)停電判別法。一線工作人員采用人工分臺區(qū)停電法,然后現(xiàn)場排查所有線路完成臺區(qū)用戶戶變關(guān)系的校驗(yàn)。該方法識別結(jié)果雖然準(zhǔn)確,但隨著用戶對供電要求的不斷提高,對臺區(qū)停電進(jìn)行低壓臺區(qū)戶變關(guān)系判定的方法已無法大范圍實(shí)施。

(2)高速電力線載波HPLC(high-speed power line carrier)通信技術(shù)判別法。通過變壓器側(cè)的載波通信終端和用戶側(cè)的接收端進(jìn)行載波通信,依據(jù)通信結(jié)果判定戶變關(guān)系異常。Xu等[3]提出了一種高速電力線載波辨識方法,變壓器端的拓?fù)鋯卧c用戶設(shè)備進(jìn)行信息交換并記錄,變壓器終端通過記錄匯總生成臺區(qū)拓?fù)鋵哟侮P(guān)系。采用載波通訊方式進(jìn)行戶變關(guān)系識別對采集器、集中器等硬件設(shè)備要求較高,且載波通信易受到噪聲干擾,若臺區(qū)用戶電壓波動較大,則識別準(zhǔn)確率較低。

(3)我國智能電表已實(shí)現(xiàn)大范圍普及,用電信息采集系統(tǒng)可以自動采集變壓器和臺區(qū)用戶用電數(shù)據(jù)。海量電力數(shù)據(jù)使得通過大數(shù)據(jù)分析判別低壓臺區(qū)用戶歸屬成為可能。利用采集到的96點(diǎn)/日采樣數(shù)據(jù)來實(shí)現(xiàn)拓?fù)渥R別則是一個最經(jīng)濟(jì)的方法。Tian等[4]針對徑向運(yùn)行的配電網(wǎng)絡(luò)提出了一種基于混合整數(shù)二次規(guī)劃MIQP(mixed integer quadratic programming)的拓?fù)渥R別模型;Babakemehr等[5]將壓縮感知和圖論相結(jié)合,提出了一種在線拓?fù)渥R別和監(jiān)控方案;Pappu[6]提出一種涉及主成分分析及圖論解釋的數(shù)據(jù)驅(qū)動方法來識別低壓配電網(wǎng)的網(wǎng)絡(luò)拓?fù)洹?/p>

電壓日凍結(jié)曲線數(shù)據(jù)是典型的時間序列數(shù)據(jù),當(dāng)用戶電壓采樣時間節(jié)點(diǎn)不一致或臺區(qū)負(fù)荷較輕導(dǎo)致電壓日凍結(jié)曲線波動性減小時,僅采用用戶一天的電壓日凍結(jié)曲線進(jìn)行戶變關(guān)系識別極易造成誤判。為提高臺區(qū)歸屬判別的準(zhǔn)確度,應(yīng)將用戶多日電壓數(shù)據(jù)拼接成長時間序列進(jìn)行戶變關(guān)系異常識別。

1 戶變關(guān)系識別原理

在低壓配電網(wǎng)中,電力用戶呈放射狀掛接在供電線路上。同一臺區(qū)內(nèi)的電表,由于掛接在同一變壓器下,電氣距離相對較近,電表采集的線路電壓波動趨勢與變壓器端大致相同[7],如圖1所示。圖中,3條曲線分別為同一臺區(qū)下用戶電壓日凍結(jié)曲線,智能電表每隔15 min采集一次用戶電壓數(shù)據(jù),其中橫坐標(biāo)為一天96個采樣點(diǎn),縱坐標(biāo)表示電壓。

圖1 同一臺區(qū)用戶電壓曲線Fig.1 User voltage curves in the same station area

當(dāng)電表處于不同的變壓器區(qū)域時,因?yàn)樽儔浩鞯慕K端輸出不同,電氣距離相對較長,電表采集的線路電壓波動趨勢各不相同。不同臺區(qū)下用戶電壓日凍結(jié)曲線如圖2所示。

圖2 不同臺區(qū)用戶電壓曲線Fig.2 User voltage curves in different station areas

由于用電負(fù)荷存在不確定性,變壓器與用戶側(cè)電壓經(jīng)常產(chǎn)生波動。由相同臺區(qū)及不同臺區(qū)下用戶電壓曲線波動性對比可知,通過分析用戶電壓曲線波動性可以進(jìn)行戶變關(guān)系識別。本文提出了一種基于臺區(qū)用戶用電負(fù)荷數(shù)據(jù)及電壓日凍結(jié)曲線數(shù)據(jù)的戶變關(guān)系異常識別方法,識別流程如圖3所示。

圖3 戶變關(guān)系異常識別流程Fig.3 Flow chart for anomaly recognition of users-transformer relationship

首先計(jì)算臺區(qū)線損率識別戶變關(guān)系異常臺區(qū)。然后確定異常臺區(qū)相鄰臺區(qū),將用戶一周的電壓曲線拼接成長時間序列識別異常用戶,并在相鄰臺區(qū)間進(jìn)行戶變關(guān)系調(diào)整。最后通過調(diào)整前后臺區(qū)線損率對比驗(yàn)證識別結(jié)果是否準(zhǔn)確。

2 戶變關(guān)系異常識別

2.1 異常臺區(qū)判定

據(jù)統(tǒng)計(jì),我國線損多是由于中低壓臺區(qū)存在戶變關(guān)系異常引起的。通常戶變關(guān)系異常發(fā)生在相鄰臺區(qū)間,僅分析同一臺區(qū)用戶電力數(shù)據(jù)難以定位異常用戶。本文在臺區(qū)異常用戶識別時,首先根據(jù)臺區(qū)線損波動情況和平均線損率,區(qū)分臺區(qū)異常類型,定位存在戶變關(guān)系異常臺區(qū)。

當(dāng)某臺區(qū)線損率出現(xiàn)異常時,首先考慮變壓器、集中器、互感器等臺區(qū)設(shè)備故障或線路狀況導(dǎo)致線損異常。經(jīng)排查,設(shè)備均正常運(yùn)行且線路狀況良好,供電半徑合格率指標(biāo)正常,初步排除設(shè)備故障或線路不合理因素。然后工作人員對該臺區(qū)下用戶進(jìn)行排查,無竊電行為發(fā)生。通過對臺區(qū)線損率波動異常及采集成功率異常情況分析,懷疑該臺區(qū)因戶變關(guān)系異常導(dǎo)致線損率不合格。通常情況下,正常臺區(qū)線損率處于正常范圍內(nèi)且波動較為平穩(wěn),存在用戶缺失的臺區(qū)線損率高且波動較大,包含多余用戶的臺區(qū)線損率低于正常值或?yàn)樨?fù)值[8]。

為真實(shí)反映某臺區(qū)線損波動情況,對臺區(qū)線損率數(shù)據(jù)進(jìn)行一階運(yùn)算。線損低于閾值的臺區(qū)內(nèi)通常存在較多其他臺區(qū)用戶,需要進(jìn)行優(yōu)先處理。線損率高于正常值且波動較大的臺區(qū)通常存在用戶缺失情況,應(yīng)在其他臺區(qū)識別異常用戶后再行處理[9]。

根據(jù)異常臺區(qū)及其相鄰臺區(qū)下所有用戶的用電數(shù)據(jù),計(jì)算所有待識別臺區(qū)多日的線損率及線損波動情況[10],計(jì)算公式為

式中:δ為臺區(qū)線損率波動;FM,i為第M個臺區(qū)在第i天的變壓器負(fù)荷;fM,i為M臺區(qū)下用戶第i天用電量總和;C為該臺區(qū)n天內(nèi)線損率波動大小;δM,q為M臺區(qū)戶變關(guān)系調(diào)整前臺區(qū)原線損率波動;δM,p為M臺區(qū)戶變關(guān)系調(diào)整后新線損率波動;δN,q和δN,p為戶變關(guān)系調(diào)整前后N臺區(qū)線損率波動。C表示用戶拓?fù)潢P(guān)系調(diào)整對線損率變化產(chǎn)生的影響。

計(jì)算各臺區(qū)線損率,確定可能存在戶變關(guān)系異常的臺區(qū)及其相鄰臺區(qū)。例如,某臺區(qū)2020年7月之前線損率一直保持正常,2020年7月臺區(qū)線損率突然增高,經(jīng)分析可能存在臺區(qū)用戶掛接錯誤,需要定位相鄰臺區(qū)判定異常用戶所屬臺區(qū)。該臺區(qū)線損率統(tǒng)計(jì)如表1所示。

表1 某臺區(qū)線損率統(tǒng)計(jì)結(jié)果Tab.1 Statistics results of line loss rate in one station area

2.2 相鄰臺區(qū)判定

戶變關(guān)系異常通常產(chǎn)生于相鄰臺區(qū)間,根據(jù)臺區(qū)距離遠(yuǎn)近可以確定相鄰臺區(qū)。低壓臺區(qū)線路對供電范圍有明確要求:通常Ⅰ類臺區(qū)服務(wù)半徑為150 m,Ⅱ類臺區(qū)服務(wù)半徑為250 m,Ⅲ類臺區(qū)服務(wù)半徑為400 m,Ⅳ類臺區(qū)服務(wù)半徑為500 m,相鄰臺區(qū)關(guān)系示意如圖4所示。

圖4 物理位置相鄰臺區(qū)示意Fig.4 Schematic of station areas at adjacent physical locations

2個臺區(qū)距離遠(yuǎn)近的計(jì)算公式為

式中:(jA,ωA),(jB,ωB)分別為變壓器A、B的經(jīng)緯度;R為地球半徑。

通過供電臺區(qū)地理位置坐標(biāo)找到異常臺區(qū)周邊至少5個相鄰臺區(qū),獲取異常臺區(qū)及相鄰臺區(qū)內(nèi)所有用戶電壓日凍結(jié)曲線數(shù)據(jù)組建本文算法數(shù)據(jù)集。僅在相鄰臺區(qū)間進(jìn)行戶變關(guān)系調(diào)整,可以節(jié)約大量人力物力,避免全供電區(qū)域內(nèi)調(diào)整產(chǎn)生異常結(jié)果。

2.3 現(xiàn)有研究方法分析

目前,國內(nèi)外采用電力數(shù)據(jù)研究臺區(qū)戶變關(guān)系通常采用以下3種方案。

(1)將電壓日凍結(jié)曲線數(shù)據(jù)進(jìn)行降維,然后采用邏輯回歸、SVM、K-means等傳統(tǒng)機(jī)器學(xué)習(xí)方法實(shí)現(xiàn)戶變關(guān)系識別。Liu Chen等[11]提出了一種改進(jìn)的K-means算法對用戶電壓數(shù)據(jù)聚類以識別用戶臺區(qū)歸屬;Zhao Guoai等[12]建立了多源數(shù)據(jù)挖掘的異常識別模型,應(yīng)用孤立森林、K-means、LSTM等算法并進(jìn)行特征融合識別拓?fù)洚惓S脩簦获T人海等[13]首先采用主成分分析法PCA(principal component analysis)對電力數(shù)據(jù)降維,然后將范數(shù)處理和凸松弛原理應(yīng)用于電力拓?fù)渥R別上,提高了識別準(zhǔn)確率。這類方法簡單易于實(shí)現(xiàn),但缺點(diǎn)是物理原理不夠清晰,將電壓數(shù)據(jù)降至低維會降低臺區(qū)識別的精度,若兩個用戶電壓曲線波動較為相似會導(dǎo)致誤判[14]。

(2)對用戶電壓曲線進(jìn)行動態(tài)時間規(guī)整DTW(dynamic time warping)度量,或計(jì)算電壓曲線間的歐式距離,皮爾遜相關(guān)系數(shù)進(jìn)行判別。皮爾遜相關(guān)系數(shù)定義為

(3)基于“同臺區(qū)用戶電壓波形相似”的方法進(jìn)行戶變關(guān)系識別。電壓日凍結(jié)曲線由于用電負(fù)荷的不確定性造成扭曲變形,將電壓曲線劃分成多個子片段,利用滑動時間窗口分析電壓曲線的極值點(diǎn)、曲線斜率、變化趨勢等信息,進(jìn)行戶變關(guān)系判別[16-17]。

采用傳統(tǒng)的機(jī)器學(xué)習(xí)方法如K近鄰算法KNN(K-nearest neighbor)、SVM、Logistic Regression等進(jìn)行分析需要大量的人工處理或者復(fù)雜的特征工程,在處理該任務(wù)時有一定的難度,而基于集成學(xué)習(xí)的方法由于計(jì)算復(fù)雜度極高并不適用[18]。

相比于一般的機(jī)器學(xué)習(xí)方法,深度學(xué)習(xí)在進(jìn)行時間序列分類時無需人工提取特征,且在面對大量數(shù)據(jù)樣本時,性能往往更優(yōu)越。Karim等[19]提出了用于時間序列分類的LSTM-FCN網(wǎng)絡(luò),無需進(jìn)行復(fù)雜數(shù)據(jù)預(yù)處理且分類準(zhǔn)確度較高。Liu Chien-Liang等[20]將時間序列數(shù)據(jù)轉(zhuǎn)化為張量表示,提出了一種多元卷積神經(jīng)網(wǎng)絡(luò)MVCNN(multivariate convolutional neural network)用于處理時間序列數(shù)據(jù)。

神經(jīng)網(wǎng)絡(luò)無需對數(shù)據(jù)集進(jìn)行繁雜的特征工程即可提取時間序列不同特征。本文提出一種基于雙向長短期記憶網(wǎng)絡(luò)和時間序列卷積BiLSTM-TCN(bidirectional long and short-term memory network and temporal convolutional network)的網(wǎng)絡(luò)模型解決單變量時間序列分類問題,相比于一般機(jī)器學(xué)習(xí)算法,識別準(zhǔn)確度進(jìn)一步提升。

2.4 供電臺區(qū)數(shù)據(jù)獲取

為檢驗(yàn)所提出的BiLSTM-TCN模型對時間序列分類的效果,采用天津市某電力公司提供的多個臺區(qū)下變壓器和用戶電壓日凍結(jié)曲線數(shù)據(jù)。供電臺區(qū)數(shù)據(jù)以臺區(qū)和用戶為核心,以鏈表形式存儲在Oracle數(shù)據(jù)庫中。本文所用數(shù)據(jù)如表2所示。

表2 戶變關(guān)系識別數(shù)據(jù)Tab.2 Data of recognition of users-transformer relationship

在選取臺區(qū)下用戶電壓數(shù)據(jù)時應(yīng)注意以下3點(diǎn)。

(1)選取相同時間段的電壓數(shù)據(jù)。在進(jìn)行戶變關(guān)系判別時,必須選取相同時間段的電力數(shù)據(jù)。隨著智能電表的普及,我國已基本實(shí)現(xiàn)電力數(shù)據(jù)的靜態(tài)采集,并針對電力數(shù)據(jù)中的漏點(diǎn)進(jìn)行補(bǔ)召。若補(bǔ)召后仍未采集到數(shù)據(jù),則用前一時刻的數(shù)值對漏點(diǎn)進(jìn)行補(bǔ)充,保證數(shù)據(jù)完整性。

(2)合適的電壓數(shù)據(jù)量。由于有些用戶電壓波動差異較小,僅選取一天的電壓曲線數(shù)據(jù)無法精確判斷用戶臺區(qū)歸屬。目前對于采用多日電壓值進(jìn)行戶變關(guān)系判別的研究仍是空白。但如果選取電力數(shù)據(jù)周期太長,雖然可以提高識別精度,但樣本過于復(fù)雜,對算法要求較高且運(yùn)算速度會很慢。為兼顧識別準(zhǔn)確性與運(yùn)算速度,本實(shí)驗(yàn)將用戶一周的電壓數(shù)據(jù)拼接成一個長時間序列,通過時間序列分類進(jìn)行用戶臺區(qū)歸屬判別。某用戶一周電壓波動曲線如圖5所示。

圖5 臺區(qū)用戶一周電壓曲線示意Fig.5 Schematic of one-week voltage curve for user in station area

(3)電力數(shù)據(jù)異常值處理。智能電表通過網(wǎng)絡(luò)時間協(xié)議NTP(network time protocol)定點(diǎn)向采集系統(tǒng)上傳該時刻的凍結(jié)數(shù)據(jù)。由于數(shù)據(jù)傳輸過程中會受到干擾產(chǎn)生錯誤數(shù)據(jù),這些錯誤數(shù)據(jù)會導(dǎo)致數(shù)據(jù)分析結(jié)果不準(zhǔn)確,因此需要對用戶用電數(shù)據(jù)進(jìn)行預(yù)處理,對于異常值進(jìn)行數(shù)據(jù)清洗[21]。電力大數(shù)據(jù)中數(shù)據(jù)錯誤一般分為重復(fù)數(shù)據(jù)和異常數(shù)據(jù)兩類。

由于電網(wǎng)狀態(tài)存在波動性,智能電表采集數(shù)據(jù)經(jīng)常產(chǎn)生重復(fù)記錄。針對數(shù)據(jù)中存在的重復(fù)數(shù)據(jù)需要進(jìn)行檢查處理并剔除。異常數(shù)據(jù)可分為無效數(shù)據(jù)和不符合業(yè)務(wù)邏輯的數(shù)據(jù),無效數(shù)據(jù)主要是指所有或大部分實(shí)例為null或缺省的數(shù)據(jù),不符合邏輯的數(shù)據(jù)主要是指數(shù)據(jù)中存在的違反規(guī)則的實(shí)例,或者不在指定集合范圍內(nèi)的實(shí)例。數(shù)據(jù)不完整主要是指缺少本該存在的信息[22]。

對于采集系統(tǒng)中的缺失值、異常值及不符合業(yè)務(wù)邏輯的數(shù)據(jù)進(jìn)行分析并剔除。例如對于線損異常的數(shù)據(jù),需要根據(jù)臺區(qū)下用戶容量等信息進(jìn)行數(shù)據(jù)篩選。對于小于200 V及大于250 V的電壓數(shù)據(jù)進(jìn)行剔除。由于同一變壓器區(qū)域內(nèi)電表的電壓曲線相似度高,在戶變關(guān)系判別中,電壓數(shù)據(jù)為無效數(shù)據(jù),電壓曲線數(shù)據(jù)為有效數(shù)據(jù)。將已明確臺區(qū)歸屬的所有用戶一周內(nèi)的電壓日凍結(jié)曲線數(shù)據(jù)及其戶變關(guān)系作為正樣本,將臺區(qū)歸屬存在異常的用戶作為負(fù)樣本。對用戶數(shù)量較少的臺區(qū),可以對數(shù)據(jù)進(jìn)行增強(qiáng)擴(kuò)充訓(xùn)練集樣本,提升神經(jīng)網(wǎng)絡(luò)識別精確度。

3 本文解決方案

3.1 實(shí)驗(yàn)原理分析

3.1.1 雙向長短期記憶網(wǎng)絡(luò)層

雙向長短期記憶網(wǎng)絡(luò)BiLSTM由正、反兩個傳播方向的LSTM結(jié)合而成。由于拼接后的電壓曲線數(shù)據(jù)為長時間序列,傳統(tǒng)遞歸神經(jīng)網(wǎng)絡(luò)RNN(recursive neural network)識別長時間序列會產(chǎn)生梯度消失和梯度爆炸,為了能夠有效利用前后時間序列信息,故采用BiLSTM結(jié)構(gòu)。

BiLSTM由正向和反向LSTM拼接而成,LSTM包含輸入門、輸出門和遺忘門三部分。遺忘門選用sigmoid函數(shù)對前面時刻的記憶信息和新輸入信息進(jìn)行選擇。遺忘門的出現(xiàn)使得LSTM很難出現(xiàn)梯度消失問題。LSTM各個計(jì)算細(xì)節(jié)如下。

式中,ft為通過的信息量。輸入門可以描述為

細(xì)胞狀態(tài)(信息傳導(dǎo))Ct的計(jì)算公式為

輸出門的計(jì)算公式為

Ct通過門限結(jié)構(gòu)控制記憶單元中的輸入信息是否被記憶或者遺忘,從而實(shí)現(xiàn)傳遞有用信息,丟棄無用信息,彌補(bǔ)了RNN難以獲取到長時間序列信息的不足。

為更好提取前后時間序列特征,本文引入BiLSTM網(wǎng)絡(luò)用于戶變關(guān)系異常識別,其網(wǎng)絡(luò)結(jié)構(gòu)如圖6所示。這類網(wǎng)絡(luò)在正向傳遞信息的同時還會進(jìn)行逆向傳遞,正向傳播層單元學(xué)習(xí)當(dāng)前時間序列之前的信息,反向傳播層學(xué)習(xí)當(dāng)前時間序列之后的信息,然后拼接兩個方向?qū)W習(xí)到的特征,進(jìn)而結(jié)合前后向時間序列信息。BiLSTM有效解決了LSTM只能保存前面信息這一問題,更有利于時間序列分類[23-24]。BiLSTM具有長距離捕獲能力,被應(yīng)用于各種文本及時間序列分類任務(wù)中。Sharfuddin等[23]將BiLSTM深度遞歸網(wǎng)絡(luò)用于情感分類,Zeng等[25]提出Densenet-BiLSTM網(wǎng)絡(luò)用于關(guān)鍵字定位,通過BiLSTM提取時間序列特征,減少人機(jī)交互中時間消耗,在指令識別任務(wù)中取得了較高的準(zhǔn)確率。

圖6 BiLSTM網(wǎng)絡(luò)結(jié)構(gòu)示意Fig.6 Schematic of BiLSTM network structure

3.1.2 時序卷積網(wǎng)絡(luò)

由于時間序列數(shù)據(jù)具有次序性,傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)由于卷積核的大小限制不能很好的抓取長時間序列的依賴特征,不適用于長時間序列分類。時序卷積網(wǎng)絡(luò)TCN引入因果卷積,使得上下層之間具有因果關(guān)系,并使用殘差連接和擴(kuò)張卷積避免梯度消失問題,更好地控制模型記憶長短,使其可以提取長時間序列特征,提升時間序列分類準(zhǔn)確度[26]。

相比于普通一維卷積網(wǎng)絡(luò),TCN主要有兩點(diǎn)改進(jìn):

(1)因果卷積(causal convolution)。因果卷積通過某個時刻之前的時間序列信息得到這一時刻的值,具有嚴(yán)格的時間限制,可以充分利用之前時刻的時間序列信息。因果卷積示意如圖7所示。

圖7 因果卷積示意Fig.7 Schematic of causal convolution

本文中電壓數(shù)據(jù)為長度672的長時間序列數(shù)據(jù)。為了擴(kuò)大卷積的感受野,更好地提取長時間序列特征,因果卷積必須增加網(wǎng)絡(luò)層數(shù)或選用更大的過濾器。但這會增加網(wǎng)絡(luò)模型復(fù)雜度,造成梯度消失、梯度爆炸、擬合效果差等問題。因此引入擴(kuò)張卷積。

(2)擴(kuò)張卷積(dilated convolution)。隨著卷積層數(shù)增加,擴(kuò)張卷積的擴(kuò)張系數(shù)成倍增加,通過在卷積窗口中引入更多的空洞,可以顯著增大感受野,降低計(jì)算量,簡化網(wǎng)絡(luò)結(jié)構(gòu)。擴(kuò)張卷積示意如圖8所示。

在圖8中,擴(kuò)張卷積感受野擴(kuò)大了1、2、4、8倍,可以在網(wǎng)絡(luò)層數(shù)相同的情況下使得感受野得到明顯提升,提取到更長時間序列特征。為避免神經(jīng)網(wǎng)絡(luò)層數(shù)增加產(chǎn)生梯度消失,TCN網(wǎng)絡(luò)使用殘差結(jié)構(gòu)將輸入與非線性輸出直接相連,提高了戶變關(guān)系識別的精度[27]。

圖8 擴(kuò)張卷積示意Fig.8 Schematic of dilated convolution

3.1.3 BiLSTM-TCN網(wǎng)絡(luò)模型

不同的神經(jīng)網(wǎng)絡(luò)可以提取時間序列不同特征??紤]到時間序列數(shù)據(jù)之間具有次序性,且單一的TCN對時間序列進(jìn)行建模存在無法編碼從后到前信息的問題[28],本文將雙向長短期記憶網(wǎng)絡(luò)與時序卷積網(wǎng)絡(luò)并行拼接,提出了BiLSTM-TCN并行神經(jīng)網(wǎng)絡(luò)用于戶變關(guān)系識別。

基于BiLSTM-TCN的電壓時間序列分類模型由時序卷積網(wǎng)絡(luò)模塊和BiLSTM模塊兩部分組成。由于提取時間序列特征的質(zhì)量直接影響到識別結(jié)果的準(zhǔn)確性,與傳統(tǒng)方法相比,該方法無需對時間序列數(shù)據(jù)進(jìn)行復(fù)雜的特征工程即可實(shí)現(xiàn)從原始輸入到輸出的端到端映射。在分類過程中不僅能夠保留數(shù)據(jù)原始樣本,還通過融合兩個網(wǎng)絡(luò)提取到的不同時間序列特征,提高了分類的準(zhǔn)確率。BiLSTMTCN并行神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)框架如圖9所示。

圖9 BiLSTM-TCN網(wǎng)絡(luò)結(jié)構(gòu)模型Fig.9 Structural model of BiLSTM-TCN network

將長時間序列分別輸入到BiLSTM模塊和TCN模塊,第1條支路中時間序列首先經(jīng)過維度混洗層,維度混洗層將時間序列維度轉(zhuǎn)換為具有單個時間步長的多變量時間序列,從而提高模型訓(xùn)練的速度。然后經(jīng)過BiLSTM模塊后送入Dropout層。

第2條支路中每個時序卷積模塊包含擴(kuò)張因果卷積、WN層、Relu激活函數(shù)和Dropout層。

首先采用因果擴(kuò)張卷積提取具有多個時間步長的單變量時間序列特征,然后將提取到的特征送入WN層進(jìn)行權(quán)值歸一化處理,最后通過Relu激活函數(shù)后送入Dropout層。由于卷積層數(shù)較多,在第2條支路中還引入殘差結(jié)構(gòu)避免梯度消失產(chǎn)生。2條支路將提取到的時間序列特征送入Concat模塊進(jìn)行特征融合。最后,經(jīng)過Dense層輸出分類結(jié)果。

3.2 實(shí)驗(yàn)仿真

3.2.1 可調(diào)參數(shù)設(shè)置

TCN卷積層中使用的過濾器數(shù)為64,卷積核大小設(shè)置為3;TCN網(wǎng)絡(luò)層中擴(kuò)張因果卷積層數(shù)設(shè)置為5,擴(kuò)張因子分別設(shè)置為1、2、4、8、16;激活函數(shù)選用Relu函數(shù),Resnet層數(shù)設(shè)置為1,配置訓(xùn)練方法使用Adam優(yōu)化器,學(xué)習(xí)率為0.01,使用均方誤差損失函數(shù)。

Keras的Bidirectional雙向?qū)觲rapper實(shí)質(zhì)上將具有前向處理能力和后向處理能力的并行LSTM進(jìn)行拼接。定義隱藏在一個Bidirectional層中的LSTM層,在正向LSTM隱藏層中使用128個存儲單元,平行于第1層的反向LSTM隱藏層也有128個存儲單元。

Concatenate層將兩個框架提取出的特征融合后,經(jīng)過一層Dense層輸出分類結(jié)果。由于需要將待識別用戶分成8類,所以全連接Dense設(shè)定為8。batch_size設(shè)置為64,在整個數(shù)據(jù)集上的迭代次數(shù)設(shè)定為15次。

3.2.2 對比實(shí)驗(yàn)

為驗(yàn)證BiLSTM-TCN算法在戶變關(guān)系異常識別中的有效性,本文引入6組對比實(shí)驗(yàn),實(shí)驗(yàn)數(shù)據(jù)為多個臺區(qū)下用戶一周電壓曲線組成的單變量長時間序列。使用識別準(zhǔn)確率,F(xiàn)1-score與損失函數(shù)作為評價(jià)標(biāo)準(zhǔn)。設(shè)置對比實(shí)驗(yàn)如下。

(1)LSTM:在一般RNN的基礎(chǔ)上添加了門限結(jié)構(gòu),選擇性提取信息。第1層LSTM神經(jīng)元個數(shù)設(shè)定為128,返回全部時刻輸出,Dropout層參數(shù)設(shè)定為0.2。第2層LSTM神經(jīng)元個數(shù)設(shè)定為128,僅返回最后時間步輸出,Dropout層參數(shù)設(shè)定為0.2,最后送入Dense層,輸出分類結(jié)果。

(2)BiLSTM:時間序列首先經(jīng)過embedding層進(jìn)行編碼,Bidirectional雙向?qū)訉⒄蚝头聪騆STM進(jìn)行堆疊,分別從正、反兩個方向?qū)r間序列特征進(jìn)行學(xué)習(xí),前向LSTM與后向LSTM均有128個神經(jīng)元,Dropout層參數(shù)設(shè)定為0.2,最后經(jīng)過Dense層輸出,進(jìn)行戶變關(guān)系識別。

(3)FCN將傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)CNN(convolutional neural network)網(wǎng)絡(luò)層中的全連接層替換為卷積層,在時間序列分類中取得了不錯的效果。本文中全卷積網(wǎng)絡(luò)由濾波器大小分別為128、256、128的3個全卷積塊堆疊而成,全卷積模塊選用Relu激活函數(shù),時間序列經(jīng)過一維卷積后送入BN層進(jìn)行批量歸一化,經(jīng)全局平均池化后送入Dense層輸出分類結(jié)果。

(4)LSTM-FCN:將LSTM網(wǎng)絡(luò)與FCN網(wǎng)絡(luò)經(jīng)Concat層進(jìn)行并聯(lián)。

(5)Dense-FCN:將全連接層與FCN網(wǎng)絡(luò)經(jīng)過Concat層進(jìn)行并聯(lián),Dense層選用sigmoid激活函數(shù),Dropout層參數(shù)設(shè)定為0.2。

(6)GRU-FCN:門控循環(huán)單元GRU(gated recurrent unit)將LSTM中的遺忘門和輸入門融合為更新門,實(shí)現(xiàn)對LSTM網(wǎng)絡(luò)的簡化。GRU參數(shù)與LSTM參數(shù)設(shè)置相同,將GRU網(wǎng)絡(luò)與FCN網(wǎng)絡(luò)經(jīng)Concat層進(jìn)行并聯(lián)。

(7)BiLSTM-TCN:本文提出模型,TCN可以提取長時間序列特征,同時增加BiLSTM網(wǎng)絡(luò)層補(bǔ)足單向TCN無法連結(jié)前后時間序列的缺陷。

3.2.3 實(shí)驗(yàn)環(huán)境設(shè)置

所有實(shí)驗(yàn)均在華為云ModelArts上運(yùn)行,開發(fā)框架使用Tensorflow2.1.0,操作系統(tǒng)為Linux運(yùn)行環(huán)境,使用python語言進(jìn)行編程,數(shù)據(jù)集為多個臺區(qū)下用戶一周的電壓曲線拼接成的長時間序列。具體實(shí)驗(yàn)運(yùn)算環(huán)境如表3所示。

表3 實(shí)驗(yàn)運(yùn)算環(huán)境Tab.3 Experimental computing environment

3.2.4 識別性能評價(jià)指標(biāo)

為對比各算法優(yōu)劣,本文引入了準(zhǔn)確率以及F1-score作為算法評價(jià)指標(biāo)。準(zhǔn)確率Racc、精準(zhǔn)率Rpre、召回率Rrec及F1-score計(jì)算公式為

式中:TP為實(shí)際為某臺區(qū)用戶且算法分類正確的樣本數(shù);FP為不屬于某臺區(qū)但被算法劃分為該臺區(qū)的樣本數(shù);FN為屬于該臺區(qū)但被算法劃分到其他臺區(qū)的樣本數(shù);TN為不屬于某臺區(qū)且算法未劃分到該臺區(qū)的樣本數(shù);Racc為準(zhǔn)確率,表示所有用戶中算法正確識別臺區(qū)歸屬用戶所占比例;Rpre為精準(zhǔn)率,表示算法識別為某臺區(qū)用戶數(shù)中實(shí)際屬于該臺區(qū)用戶數(shù)所占比例;Rrec為召回率,表示正確識別臺區(qū)用戶數(shù)占該臺區(qū)實(shí)際用戶總數(shù)的比例。交叉熵其損失函數(shù)公式為

式中:m為臺區(qū)類別數(shù)量,如果預(yù)測類別與實(shí)際類別相同則為1,不同則為0;pic為樣本i第c類的概率;yic為指示變量;H(p,q)為目標(biāo)分布與預(yù)測分布的交叉熵;L(H)為多分類交叉熵?fù)p失函數(shù)。

3.3 實(shí)驗(yàn)結(jié)果分析

本文在同一數(shù)據(jù)集上進(jìn)行了6組對比實(shí)驗(yàn),將準(zhǔn)確率、F1-score和交叉熵?fù)p失函數(shù)值作為評價(jià)標(biāo)準(zhǔn),對比本文提出的BiLSTM-TCN模型與其他網(wǎng)絡(luò)模型。各組模型識別準(zhǔn)確率如圖10所示。由各網(wǎng)絡(luò)模型準(zhǔn)確率對比圖可知,并行連接網(wǎng)絡(luò)對戶變關(guān)系識別準(zhǔn)確率顯著優(yōu)于單體神經(jīng)網(wǎng)絡(luò),識別精度均達(dá)到90%以上,說明采用兩種神經(jīng)網(wǎng)絡(luò)分別提取時間序列不同特征并進(jìn)行特征融合的方式能更好地提升戶變關(guān)系識別準(zhǔn)確率。其中BiLSTM-TCN與LSTM-FCN經(jīng)15輪迭代后識別準(zhǔn)確率均達(dá)到100%,GRU-FCN識別準(zhǔn)確率為95.74%,Dense-FCN識別準(zhǔn)確率為93.25%。

圖10 各組神經(jīng)網(wǎng)絡(luò)模型準(zhǔn)確度對比Fig.10 Comparison of accuracy among different neural network models

在單體神經(jīng)網(wǎng)絡(luò)中,F(xiàn)CN對于長時間序列識別精度弱于另外兩種循環(huán)神經(jīng)網(wǎng)絡(luò),經(jīng)過15輪迭代后識別精度為72.37%。LSTM經(jīng)過15輪迭代后識別精度為78.31%。BiLSTM神經(jīng)網(wǎng)絡(luò)將正反向LSTM網(wǎng)絡(luò)進(jìn)行堆疊,對于長時間序列建模能力明顯優(yōu)于單體LSTM網(wǎng)絡(luò),經(jīng)過15輪迭代后識別精度達(dá)到85.94%。各組神經(jīng)網(wǎng)絡(luò)模型交叉熵?fù)p失函數(shù)對比如圖11所示。

圖11 各組神經(jīng)網(wǎng)絡(luò)模型損失對比Fig.11 Comparison of loss among different neural network models

由實(shí)驗(yàn)結(jié)果可知,隨著訓(xùn)練輪次的增加,各組神經(jīng)網(wǎng)絡(luò)模型損失函數(shù)顯著下降。經(jīng)過15輪迭代后FCN損失函數(shù)最高,BiLSTM-TCN損失函數(shù)明顯低于其他神經(jīng)網(wǎng)絡(luò)模型。BiLSTM和LSTM網(wǎng)絡(luò)損失函數(shù)初始值較低,但趨于收斂速度較慢。FCN網(wǎng)絡(luò)與其他并行卷積網(wǎng)絡(luò)損失函數(shù)初始值較大,但下降到穩(wěn)定值的速度較快。

相比于單一LSTM,BiLSTM增加了反向傳播單元,能夠融合前后時間序列特征,效果更優(yōu)。TCN引入了擴(kuò)張卷積,可以在網(wǎng)絡(luò)層數(shù)相同的情況下提取到更多時間序列特征。將BiLSTM和TCN并行連接可獲得更優(yōu)的分類結(jié)果。各網(wǎng)絡(luò)模型準(zhǔn)確率、交叉熵?fù)p失值、F1-score、參數(shù)量的對比分析如表4所示。

表4 各網(wǎng)絡(luò)模型識別性能對比分析Tab.4 Comparative analysis for recognition performance of each network model

相比于其他神經(jīng)網(wǎng)絡(luò)模型,BiLSTM-TCN模型經(jīng)過較少的訓(xùn)練輪次就能達(dá)到較高的識別準(zhǔn)確率,在各臺區(qū)用戶電壓曲線數(shù)據(jù)集上的性能表現(xiàn)更優(yōu),具有較高實(shí)用價(jià)值。

3.4 戶變關(guān)系調(diào)整準(zhǔn)確性判別

模型輸出包括存在戶變關(guān)系異常的疑似用戶以及這些用戶應(yīng)屬臺區(qū)判定結(jié)果兩部分。為判定算法識別的準(zhǔn)確性,本文采用臺區(qū)線損率判定法進(jìn)行驗(yàn)證。通常10 kV電網(wǎng)線損率最高不超過6%。線損率超過9%的臺區(qū)劃為高損臺區(qū),會造成大量電能損失,這類臺區(qū)往往存在臺區(qū)用戶缺失,需要待其他臺區(qū)戶變關(guān)系調(diào)整后再行處理。而線損率太低甚至為負(fù)值的臺區(qū)往往存在較多其他臺區(qū)用戶,需要進(jìn)行優(yōu)先處理。將異常用戶加入到算法識別的臺區(qū)下,計(jì)算戶變關(guān)系調(diào)整前后各臺區(qū)線損波動情況。某臺區(qū)調(diào)整前后線損率波動如圖12所示。

圖12 某臺區(qū)戶變關(guān)系調(diào)整前后線損波動曲線示意Fig.12 Schematic of line loss fluctuation curve before and after the adjustment of users-transformer relationship in one station area

調(diào)整前該臺區(qū)線損率為10%左右且線損波動性較大,調(diào)整后臺區(qū)線損率達(dá)到正常范圍且線損率波動顯著下降。由前后線損率對比可知,該臺區(qū)戶變關(guān)系調(diào)整正確,將該用戶戶變關(guān)系劃歸到該臺區(qū)下,否則該用戶不屬于該臺區(qū)。

4 結(jié) 語

準(zhǔn)確的戶變關(guān)系是營配貫通深化應(yīng)用的前提,也是實(shí)現(xiàn)降損增效的根本途徑。頻繁的臺區(qū)改造使得大量用戶存在戶變關(guān)系異常,造成臺區(qū)線損計(jì)算出現(xiàn)較大偏差。本文首先根據(jù)各臺區(qū)變壓器及臺區(qū)下所有用戶不同時段的歷史負(fù)荷數(shù)據(jù),計(jì)算該臺區(qū)線損率及線損波動情況,從而確定異常臺區(qū)。由于戶變關(guān)系異常通常發(fā)生在相鄰臺區(qū)間,根據(jù)臺區(qū)位置及變壓器供電范圍確定鄰近臺區(qū)關(guān)系,避免全局性戶變關(guān)系調(diào)整,可顯著提高戶變關(guān)系識別效率。對于異常臺區(qū)下異常用戶識別,傳統(tǒng)戶變關(guān)系識別僅采用一天的電壓曲線數(shù)據(jù)進(jìn)行降維或計(jì)算皮爾遜相關(guān)系數(shù),若曲線波動性相似容易造成臺區(qū)歸屬誤判。本文根據(jù)同臺區(qū)下電壓曲線波動相似性原理,將臺區(qū)用戶一周的電壓曲線拼接成長時間序列,以提高識別準(zhǔn)確率。

傳統(tǒng)的機(jī)器學(xué)習(xí)方法處理長時間序列需要進(jìn)行特征工程,而神經(jīng)網(wǎng)絡(luò)可以避免復(fù)雜的數(shù)據(jù)處理。由于傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)不能很好提取長時間序列特征,因此本文提出基于BiLSTM-TCN的并行神經(jīng)網(wǎng)絡(luò)用于戶變關(guān)系識別。TCN通過引入擴(kuò)張卷積和殘差塊使得網(wǎng)絡(luò)層數(shù)相同時可以顯著增大感受野,從而提取更多時間序列特征。BiLSTM層由正向LSTM和反向LSTM拼接而成,從而結(jié)合提取到的前后向時間序列信息,具有對時間序列特征的長距離捕獲能力。通過與其他傳統(tǒng)神經(jīng)網(wǎng)絡(luò)對比,本文提出的BiLSTM-TCN模型對戶變關(guān)系識別準(zhǔn)確度最高,且在訓(xùn)練輪次最少的情況下能較快達(dá)到收斂,具有較高的應(yīng)用價(jià)值。

為驗(yàn)證戶變關(guān)系識別的準(zhǔn)確性,分別計(jì)算戶變關(guān)系調(diào)整前后臺區(qū)線損率波動性。若調(diào)整后異常臺區(qū)線損率達(dá)到正常閾值范圍內(nèi)則戶變關(guān)系判別正確,將該異常用戶加入該臺區(qū),否則戶變關(guān)系判別錯誤。

猜你喜歡
損率臺區(qū)卷積
我國水庫淤損情勢分析
基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
基于傅里葉域卷積表示的目標(biāo)跟蹤算法
降低臺區(qū)實(shí)時線損整治工作方法
電子制作(2017年2期)2017-05-17 03:55:22
無功補(bǔ)償極限線損率分析及降損措施探究
電子制作(2017年2期)2017-05-17 03:55:17
供電企業(yè)月度實(shí)際線損率定量計(jì)算方法
電子制作(2016年1期)2016-11-07 08:42:53
三合一集中器作為臺區(qū)線損考核表計(jì)的探討
多功能低壓臺區(qū)識別設(shè)備的研制
提升臺區(qū)線損正確可算率的措施與實(shí)踐
衡阳市| 乐业县| 黎城县| 景德镇市| 方城县| 南陵县| 海林市| 外汇| 兴宁市| 庄河市| 德江县| 文水县| 南昌县| 大邑县| 河北省| 邵阳县| 合山市| 左权县| 吉木萨尔县| 章丘市| 吉安县| 上杭县| 遂昌县| 宽城| 米易县| 淮滨县| 长丰县| 鄂尔多斯市| 绥宁县| 文水县| 祁连县| 社旗县| 东辽县| 阿克苏市| 沧源| 潮安县| 九龙城区| 通化市| 永丰县| 大冶市| 保靖县|