柳青,劉小平,陳浩,張振宇,朱彥卿,李勇
(1.國(guó)網(wǎng)湖南省電力有限公司供電服務(wù)中心,長(zhǎng)沙 410004; 2.湖南大學(xué) 電氣與信息工程學(xué)院,長(zhǎng)沙 410082)
非侵入式負(fù)荷監(jiān)測(cè)(Non-intrusive Load Monitoring,NILM)是指在用戶用電入口處安裝測(cè)量設(shè)備,采集電壓、電流、頻率、功率等電力數(shù)據(jù),并將其分解為獨(dú)立設(shè)備的用電狀態(tài)、用電電量等信息的方法[1]。根據(jù)負(fù)荷監(jiān)測(cè)得到的用戶用電行為信息,可為電網(wǎng)公司的調(diào)度,需求響應(yīng)等高級(jí)用電策略制定提供依據(jù),也可為用戶自我制定合理的用電規(guī)劃提供參考[2]。
自從文獻(xiàn)[3]在20世紀(jì)80年代提出非侵入式負(fù)荷監(jiān)測(cè)的基本思想后,國(guó)內(nèi)外學(xué)者已經(jīng)針對(duì)該問題進(jìn)行了大量的研究分析。對(duì)于這些研究,可以從使用的特征類型與算法類型兩個(gè)角度對(duì)其進(jìn)行分類。文中著重討論使用的特征對(duì)負(fù)荷辨識(shí)的影響。從特征角度,可以分為穩(wěn)態(tài)度量(電壓、電流、諧波等有效值數(shù)據(jù))、暫態(tài)度量(電壓、電流等暫態(tài)波形數(shù)據(jù))兩大類。在其中,最典型的穩(wěn)態(tài)度量是Hart提出的在有功功率與無功功率構(gòu)成的復(fù)功率平面上進(jìn)行聚類對(duì)設(shè)備分類的方法[3]。有功功率與無功功率可以說是最常見的特征,在文獻(xiàn)[4-12]中均有提及與分析。文獻(xiàn)[13]增廣了穩(wěn)態(tài)電流、暫態(tài)電流等典型負(fù)荷特征,進(jìn)行降維后形成了負(fù)荷空間,并在負(fù)荷空間中進(jìn)行設(shè)備的劃分。文獻(xiàn)[14-16]對(duì)設(shè)備特征進(jìn)行了分析,使用了諧波特征進(jìn)行負(fù)荷的分類,結(jié)果表明效果優(yōu)于僅使用有功功率與無功功率。然而,這些基于諧波的方法僅是對(duì)于部分設(shè)備可區(qū)分特征的經(jīng)驗(yàn)性總結(jié),缺乏可拓展性。
另一類基于暫態(tài)波形的負(fù)荷辨識(shí)方法,一般基于每周波高達(dá)幾十次至幾百次不等的高頻率采樣與存儲(chǔ),在這種高頻采樣的情況下,很容易分辨出不同設(shè)備的特定波形與振幅特點(diǎn)[17]。但是由于高頻采樣對(duì)通信,存儲(chǔ)與計(jì)算帶來的壓力,僅有少量的方法直接基于暫態(tài)波形進(jìn)行負(fù)荷辨識(shí)[18]。然而,基于高頻測(cè)量轉(zhuǎn)化后的新特征方法被得到了廣泛的應(yīng)用。包括基于傅立葉變換的特征表達(dá)[19-22],基于小波的特征表達(dá)[23-25],基于高斯濾波與工業(yè)檢測(cè)累加求和的邊緣檢測(cè)方法[26],以及基于V-I曲線的特征表達(dá)[27-31]。另外,這類方法通過對(duì)原始高頻采樣數(shù)據(jù)的加工,從中提取出可辨別性強(qiáng)的特征,并進(jìn)一步的加以處理。
對(duì)于復(fù)雜運(yùn)行狀態(tài)中的設(shè)備辨識(shí),常用于家庭環(huán)境下的聚類模型無法正常工作。來自中科院的結(jié)果表明,使用聚類的方法,無法從中得到具體設(shè)備的運(yùn)行信息,僅能獲得多設(shè)備整體的運(yùn)行行為分析[32]。伯明翰大學(xué)[33]與牛津大學(xué)[34],早稻田大學(xué)[35]等進(jìn)行的類似研究也表明,聚類等方法在較高的測(cè)量層級(jí)上能夠分析負(fù)荷的整體行為,但卻難以分離出具體到設(shè)備的行為。因此,較為合理的方法應(yīng)是在合理的特征層級(jí)上,使用具備強(qiáng)特征提取能力的方法進(jìn)行數(shù)據(jù)分析。
并且,在復(fù)雜設(shè)備環(huán)境下,由于多種變頻負(fù)荷同時(shí)運(yùn)行,會(huì)導(dǎo)致負(fù)荷的功率狀態(tài)在一個(gè)較大的范圍內(nèi)波動(dòng),并且,多設(shè)備間可能存在運(yùn)行狀態(tài)耦合,從而產(chǎn)生僅與該環(huán)境相關(guān),與具體設(shè)備無關(guān)的額外特征。對(duì)此,一種合理的解決方案是針對(duì)每一種設(shè)備進(jìn)行針對(duì)性的建模與辨識(shí),從而規(guī)避模型學(xué)習(xí)到多臺(tái)設(shè)備間運(yùn)行關(guān)聯(lián)造成的額外特性,影響模型的遷移能力。也即是說,所謂的“單輸入單輸出”模型,在針對(duì)復(fù)雜設(shè)備環(huán)境下的負(fù)荷辨識(shí),具備積極的意義。
雖然轉(zhuǎn)化后的特征對(duì)負(fù)荷的辨識(shí)具有積極的意義,但是對(duì)這些特征的轉(zhuǎn)化計(jì)算往往無法在測(cè)量同時(shí)完成,實(shí)質(zhì)上這無法規(guī)避高頻采樣帶來的巨大存儲(chǔ)與通信壓力。相對(duì)的,本文發(fā)現(xiàn)大多數(shù)較高等級(jí)的電能質(zhì)量分析設(shè)備具備符合IEC 61000-4-30標(biāo)準(zhǔn)的測(cè)量,其中包括高頻諧波的幅值,相角等高層次的信息,并且其相對(duì)的分析頻率比高頻測(cè)量要低得多?;贗EC 61000-4-30標(biāo)準(zhǔn)測(cè)量的負(fù)荷辨識(shí)算法有望成為一個(gè)合理的、介于高頻采樣與低頻采樣中的兼具高表達(dá)能力與低存儲(chǔ)壓力的合理表達(dá)方式。
基于IEC 61000-4-30的測(cè)量往往會(huì)帶來巨大的特征空間。以日置的某型號(hào)電能質(zhì)量分析儀為例,對(duì)三相電的測(cè)量而言,其可以每秒生成高達(dá)3 537種特征。極高的特征維度為下游的算法帶來了表征的困難,并且顯然會(huì)產(chǎn)生維度災(zāi)難,使得下游的算法面對(duì)的數(shù)據(jù)過于稀疏,降低算法的效率。
為了解決維度過高帶來的問題,文中提出了一種使用皮爾遜相關(guān)系數(shù)的特征提取方法,并且進(jìn)一步的,在提取的特征基礎(chǔ)上,使用深度卷積神經(jīng)網(wǎng)絡(luò)作為辨識(shí)方法,從而實(shí)現(xiàn)了對(duì)中壓配電網(wǎng)單設(shè)備運(yùn)行狀態(tài)的辨識(shí)。此外,為了表明提出算法的性能,將提出的方法與傳統(tǒng)的支持向量機(jī)(Support Vector Machine,SVM)、K近鄰分類(K-Nearest Neighbor,KNN)和決策樹(Decision Tree,DT)算法進(jìn)行了比較。
(1)
對(duì)典型的非侵入式負(fù)荷狀態(tài)辨識(shí)任務(wù)而言,測(cè)量點(diǎn)的位置在待辨識(shí)負(fù)荷的上游。測(cè)量點(diǎn)下游其他負(fù)荷產(chǎn)生的特征可以認(rèn)為是與不同特征相關(guān)的干擾噪聲,因此式(1)可以添加噪聲項(xiàng)后修正為:
(2)
該式可以表示負(fù)荷辨識(shí)問題的實(shí)質(zhì)。在給定時(shí)間,給定測(cè)量特征中通過映射,得到指定負(fù)荷狀態(tài)的問題可以定義為負(fù)荷狀態(tài)辨識(shí)問題。
皮爾遜相關(guān)系數(shù)(Pearson Correlation Coefficient)一般用來度量變量之間的線性相關(guān)程度。在文中,我們使用皮爾遜相關(guān)系數(shù)來度量特征時(shí)間序列Fi與狀態(tài)時(shí)間序列S的相關(guān)性,用以在含噪多維特征中篩選出與負(fù)荷狀態(tài)最相關(guān)的特征序列。
對(duì)于時(shí)長(zhǎng)為T的特定的特征序列Fi與狀態(tài)序列S,為求取兩者間的皮爾遜相關(guān)系數(shù),首先求取其均值:
(3)
(4)
以及二者的協(xié)方差Cov(Fi,S)和標(biāo)準(zhǔn)差σFi,σS:
(5)
(6)
(7)
最終可以求取得到兩者間的皮爾遜相關(guān)系數(shù):
(8)
皮爾遜相關(guān)系數(shù)的結(jié)果ρFi,S∈[-1,1],由于本文中的應(yīng)用不關(guān)心具體是正相關(guān)或負(fù)相關(guān),只關(guān)心兩者間是否有相關(guān)關(guān)系,因此本文將得到的皮爾遜相關(guān)系數(shù)取絕對(duì)值,使用|ρFi,S|表示二者間的相關(guān)程度,該數(shù)值越趨于1,則越表示該特征與負(fù)荷狀態(tài)之間的相關(guān)度越高。提取與負(fù)荷狀態(tài)相關(guān)性最高的特征序列,即可完成特征篩選工作。
由于卷積神經(jīng)網(wǎng)絡(luò)一般需要的輸入為二維多通道矩陣,與測(cè)量形成的一維時(shí)間序列不符,因此需要對(duì)原始測(cè)量數(shù)據(jù)特征重映射為二維多通道矩陣。
對(duì)于N維特征時(shí)間序列F={F1,F2,…,FN},目標(biāo)是將其重構(gòu)為形狀為n×lw的二維矩陣M,其中n為篩選出的特征數(shù)目,lw是選擇的時(shí)間窗長(zhǎng)度。令該二維矩陣表示的特征對(duì)應(yīng)的時(shí)間點(diǎn)為tp,則特征重映射過程可用下式表示:
(9)
為了提升特征的表達(dá)能力,也可以使用差分特征構(gòu)建矩陣M:
(10)
經(jīng)過特征篩選與特征重映射后,特征從多維時(shí)間序列變換成為了可供卷積神經(jīng)網(wǎng)絡(luò)處理的類圖像的矩陣特征。
深度卷積神經(jīng)網(wǎng)絡(luò)一般由卷積層,池化層,全連接層,輸出層以及對(duì)應(yīng)的激活函數(shù)組成[36]。對(duì)于分類任務(wù)來說,卷積神經(jīng)網(wǎng)絡(luò)輸入一般為二維多通道的矩陣,輸出為一維向量。
1.4.1 卷積層
使用N表示輸入的批量,Cin表示通道數(shù),H表示矩陣的行數(shù),W表示矩陣的列數(shù)。對(duì)于一個(gè)輸入維度為(N,Cin,H,W)的四維矩陣而言,卷積層可以精確的表達(dá)為:
input(Ni,k)
(11)
其中*表示2維滑動(dòng)點(diǎn)積操作符,i,j分別表示輸出在矩陣中的位置,weight表示權(quán)重。一次完整的卷積操作,需要對(duì)輸入的每個(gè)點(diǎn)周圍分別進(jìn)行式(11)中的運(yùn)算。
1.4.2 池化層
文中采用的是全局平均池化,該池化層對(duì)每個(gè)通道進(jìn)行計(jì)算,給定卷積核的尺寸(kH,kW)后,全局平均池化可以表示如下:
(12)
其中,sw,sh分別指池化層在長(zhǎng)與寬方向跨步的步長(zhǎng)。
1.4.3 全連接層
全連接層即為數(shù)據(jù)的線性關(guān)系。令輸入向量為x,輸出向量為y,偏置值為b,參數(shù)矩陣為A,則線性層可以表示為:
y=xAT+b
(13)
1.4.4 激活函數(shù)
本文中采用的激活函數(shù)主要為Relu函數(shù),變量含義同上,函數(shù)可以表示為:
y=max(0,x)
(14)
1.4.5 深度殘差網(wǎng)絡(luò)
深度殘差網(wǎng)絡(luò)(Residual Neural Network, ResNet)由何凱明在2015年提出,并在同年獲得了ImageNet大規(guī)模視覺識(shí)別賽(ImageNet Large Scale Visual Recognition Challenge, ILSVRC)中的圖像分類和物體識(shí)別的優(yōu)勝。該網(wǎng)絡(luò)由于采用了殘差結(jié)構(gòu),所以非常容易優(yōu)化。具體而言,以34層的深度殘差網(wǎng)絡(luò)為例,該網(wǎng)絡(luò)的結(jié)構(gòu)如圖1所示。
圖1 34層的深度殘差網(wǎng)絡(luò)結(jié)構(gòu)
深度殘差網(wǎng)絡(luò)具備卓越的信息提取能力,能夠在圖像中提取出原始數(shù)據(jù)的高效表征組合。在文中,使用深度殘差網(wǎng)絡(luò)來尋找隱含的模式,從而辨識(shí)出負(fù)荷對(duì)應(yīng)的狀態(tài)。并且,通過使用ImageNet預(yù)訓(xùn)練模型的方式,提升小樣本情況下的模型特征提取能力。
基于以上幾個(gè)部分,提出了一種基于深度學(xué)習(xí)與特征篩選的負(fù)荷狀態(tài)辨識(shí)方法,如圖2所示。首先針對(duì)原始數(shù)據(jù),選擇目標(biāo)測(cè)量中可以表征負(fù)荷狀態(tài)的特征,一般來講可以選擇電流特征。其次,對(duì)該負(fù)荷狀態(tài)表達(dá)特征與辨識(shí)測(cè)量點(diǎn)所產(chǎn)生的特征進(jìn)行差分,計(jì)算兩兩的皮爾遜相關(guān)系數(shù),選取相關(guān)系數(shù)最高的n條數(shù)據(jù)作為篩選后的特征。隨后,經(jīng)過特征重映射,將其轉(zhuǎn)化為深度殘差網(wǎng)絡(luò)可以處理的格式,然后進(jìn)行訓(xùn)練,最終得到預(yù)測(cè)模型。
圖2 所提方法的流程圖
在特征重映射與特征篩選過程中,可以通過差分的方式來增強(qiáng)特征的表達(dá)能力,從而避免持續(xù)的背景功率噪聲對(duì)負(fù)荷狀態(tài)辨識(shí)的影響。
值得注意的是,圖2中所述的負(fù)荷辨識(shí)訓(xùn)練方法是針對(duì)單種負(fù)荷而言,對(duì)于多測(cè)量裝置下接入的不同負(fù)荷,可以采取并行的方法進(jìn)行多設(shè)備識(shí)別的處理,具體的流程如圖3所示。左側(cè)部分是進(jìn)行訓(xùn)練的方法,具體而言應(yīng)將不同設(shè)備的運(yùn)行時(shí)在對(duì)應(yīng)的測(cè)量表中進(jìn)行標(biāo)注,隨后根據(jù)設(shè)備種類來保存設(shè)備的模型,并最終保存入多設(shè)備模型庫(kù)中。在推理階段,根據(jù)需求識(shí)別設(shè)備的不同,分別對(duì)多個(gè)表計(jì)采集的數(shù)據(jù)進(jìn)行推理,并最終合并結(jié)果獲取多設(shè)備的運(yùn)行狀態(tài)。
文中的數(shù)據(jù)集采集自某學(xué)校的教學(xué)樓,其配電間的連接關(guān)系圖如圖4所示。
測(cè)量點(diǎn)1為總測(cè)量,是該配電所的總進(jìn)線。測(cè)量點(diǎn)2與3測(cè)量的是電梯的負(fù)荷線。三臺(tái)設(shè)備之間時(shí)間同步,采樣頻率為1 Hz。采樣共進(jìn)行一周,從周五的17:12至下周五的17:01。在采樣期間,教學(xué)樓正常的進(jìn)行教學(xué)工作。文中將電梯電流大于1 A的狀態(tài)定義為運(yùn)行狀態(tài)。
計(jì)算使用的特征為所采集到的特征種類,包括:電壓、電流、有功功率、無功功率、各次電壓電流的諧波與半諧波的有效值與相角,三相不平衡度等參數(shù)的最大值、最小值、平均值。經(jīng)過統(tǒng)計(jì),每臺(tái)設(shè)備共產(chǎn)生3 537種有效測(cè)量特征。
其中,測(cè)量點(diǎn)1的數(shù)據(jù)用于算法訓(xùn)練的輸入數(shù)據(jù),測(cè)量點(diǎn)2與3僅用作算法訓(xùn)練的結(jié)果反饋,以及正確率計(jì)算的依據(jù)。訓(xùn)練中不采用所有數(shù)據(jù)進(jìn)行訓(xùn)練,僅采用一周中某幾個(gè)小時(shí)的數(shù)據(jù)。文中的訓(xùn)練僅取一個(gè)小時(shí)的測(cè)試數(shù)據(jù),也就是約占全部采集數(shù)據(jù)的0.59%的數(shù)據(jù)量測(cè)試其在極端小樣本條件下的算法性能。通過僅取白天的運(yùn)行數(shù)據(jù)作為訓(xùn)練,可以測(cè)試其在夜晚的泛化性能,進(jìn)而可以推斷在其他不同時(shí)間的推理性能。
對(duì)非侵入式負(fù)荷辨識(shí)算法,常用實(shí)際為正預(yù)測(cè)為正的真正例(True Positive, TP),實(shí)際為負(fù)預(yù)測(cè)為正的假正例(False Positive, FP),實(shí)際為正預(yù)測(cè)為負(fù)的假負(fù)例(False Negative, FN),實(shí)際為負(fù)預(yù)測(cè)為負(fù)的真負(fù)例(True Negative, TN)作為分類算法性能度量的標(biāo)準(zhǔn)[37]。使用以上四種定義,可以進(jìn)一步的定義精確率P(Precision)、召回率R(Recall)、準(zhǔn)確率A(Accuracy)以及F1-score[38]。
精確率指真正例與所有預(yù)測(cè)為正的案例的比值,用來表示算法抗誤檢的能力,定義為:
(15)
召回率為所有正測(cè)試案例中算法識(shí)別為正的比例,表示算法抗漏檢的能力,定義如:
(16)
準(zhǔn)確率表示測(cè)試中預(yù)測(cè)正確的案例占全部案例的比值,一般而言準(zhǔn)確率是算法優(yōu)化的第一目標(biāo):
(17)
F1-score為一個(gè)平衡了精確率與召回率的指標(biāo),可以較綜合的反應(yīng)不平衡數(shù)據(jù)條件下的算法性能:
(18)
電梯的負(fù)荷辨識(shí)屬于難以使用傳統(tǒng)策略的負(fù)荷辨識(shí)難題,主要原因在于其有功功率與無功功率的變化范圍十分廣泛,如圖5所示。不同于傳統(tǒng)的單狀態(tài)或多狀態(tài)負(fù)荷,電梯的功率狀態(tài)受承載人數(shù),上升或下降,樓層跨度等多種因素影響,呈現(xiàn)出復(fù)雜的負(fù)荷狀態(tài)。
圖5 電梯負(fù)荷的有功功率(P)與無功功率(Q)的聯(lián)合分布
盡管對(duì)電梯的高分辨率能耗進(jìn)行建模是復(fù)雜的[39],但是得益于數(shù)據(jù)驅(qū)動(dòng)的策略,可以略過建模分析而直接提取出對(duì)辨識(shí)具有作用的相關(guān)特征。本文設(shè)定兩種特征策略,一種是使用皮爾遜相關(guān)系數(shù)對(duì)差分的特征向量進(jìn)行計(jì)算,進(jìn)行特征提取,另一種是采用常規(guī)非侵入式負(fù)荷辨識(shí)算法中的低次電流諧波有效值及相角,兩種特征策略均選擇50種特征作為算法的輸入。通過皮爾遜相關(guān)系數(shù),可以提取出與負(fù)荷運(yùn)行狀態(tài)高度相關(guān)的特征,有助于增強(qiáng)特征的信息密度。
圖6展示了使用皮爾遜相關(guān)系數(shù)篩選出的相關(guān)性最高的9組特征,具備高相關(guān)性的數(shù)據(jù),其分布應(yīng)近乎在一條直線上。與圖7中的低次電流諧波特征相比,可以看出前者的變量間具有更高的線性相關(guān)度,二者的變化幾乎呈現(xiàn)線性關(guān)系。而常規(guī)特征中的一些特征與電梯的負(fù)荷并不具備十分強(qiáng)烈的相關(guān)關(guān)系,其實(shí)質(zhì)上輸入對(duì)電梯辨識(shí)無效的特征。綜合對(duì)比圖5與圖6,可以發(fā)現(xiàn)使用皮爾遜系數(shù)篩選出的特征具備更好的相關(guān)性。
圖6 皮爾遜系數(shù)法篩選出的特征與電梯電流的聯(lián)合分布圖
圖7 常規(guī)電流特征與電梯電流的聯(lián)合分布圖
在辨識(shí)算法上,對(duì)比了KNN、SVM、決策樹、Resnet以及預(yù)訓(xùn)練的Resnet共五種模型,運(yùn)行狀態(tài)辨識(shí)的準(zhǔn)確率結(jié)果見圖8,F1-score的結(jié)果見圖9。
圖8 0.59%數(shù)據(jù)量訓(xùn)練的準(zhǔn)確率結(jié)果
圖9 0.59%數(shù)據(jù)量訓(xùn)練的F1-score
算法辨識(shí)的目標(biāo)是通過總?cè)肟谔幍淖儔浩鞑杉臄?shù)據(jù),判斷電梯是否處于運(yùn)行狀態(tài)。圖9中,可以發(fā)現(xiàn)具有最高準(zhǔn)確率的模型是經(jīng)過了預(yù)訓(xùn)練的Resnet模型。除此以外,結(jié)果還表明:(1)預(yù)訓(xùn)練的Resnet模型在差分的特征輸入條件下具有較強(qiáng)的學(xué)習(xí)能力;(2)使用皮爾遜相關(guān)系數(shù)提取特征對(duì)算法水平的提升具有強(qiáng)烈的正效應(yīng);(3)即使在小樣本的條件下,通過合適的特征提取方法,也能使得機(jī)器學(xué)習(xí)算法正確的提取出關(guān)鍵的特征組合。這在圖8中展現(xiàn)的算法的F1-score比較中更為明顯。對(duì)結(jié)果的分析說明了結(jié)合特征篩選與深度神經(jīng)網(wǎng)絡(luò)的負(fù)荷狀態(tài)辨識(shí)方法的有效性。
本文提出了一種基于皮爾遜相關(guān)系數(shù)的特征篩選方法與深度神經(jīng)網(wǎng)絡(luò)的復(fù)雜設(shè)備環(huán)境中多狀態(tài)負(fù)荷狀態(tài)辨識(shí)方法。該方法能夠在僅提供少量訓(xùn)練樣本的情況下,取得較高的電梯負(fù)荷運(yùn)行狀態(tài)辨識(shí)成功率。實(shí)驗(yàn)的結(jié)果表明了提出方法的有效性,并且指出:(1)對(duì)特征進(jìn)行差分能夠更有效的幫助機(jī)器學(xué)習(xí)算法對(duì)負(fù)荷狀態(tài)的特征組合進(jìn)行學(xué)習(xí);(2)圖像識(shí)別的預(yù)訓(xùn)練對(duì)負(fù)荷狀態(tài)辨識(shí)存在積極的效果。在未來的研究中,可以進(jìn)一步地引入更大范圍的時(shí)間依賴關(guān)系,從而捕獲負(fù)荷的時(shí)間尺度上的行為與狀態(tài)的關(guān)系。