程志友, 程安然, 李 悅, 姜 帥
(1. 教育部電能質(zhì)量工程研究中心, 安徽大學(xué), 安徽 合肥 230601; 2. 安徽大學(xué)互聯(lián)網(wǎng)學(xué)院, 安徽 合肥 230039)
非侵入式負(fù)荷監(jiān)測(cè)(Non-Intrusive Load Monitoring, NILM)技術(shù)為居民提供負(fù)荷內(nèi)部各用電設(shè)備的耗能信息,通過(guò)耗能信息、電能質(zhì)量、分時(shí)電價(jià)、電能計(jì)量等綜合信息,電力用戶可以采取有效措施來(lái)減少耗能,同時(shí)非侵入式電表可以很容易地集成到現(xiàn)有建筑中,而不會(huì)給電力消費(fèi)者造成不便,近年來(lái)已成為國(guó)內(nèi)外學(xué)者的研究熱點(diǎn)[1]。NILM技術(shù)依賴于信號(hào)處理和機(jī)器學(xué)習(xí)方法,通過(guò)單個(gè)智能電表、電流電壓傳感器等點(diǎn)源監(jiān)測(cè)的聚合功率數(shù)據(jù)來(lái)推斷在建筑中運(yùn)行的終端設(shè)備,估計(jì)獨(dú)立負(fù)荷的功耗并進(jìn)行負(fù)荷狀態(tài)的有效識(shí)別[2]。
NILM的識(shí)別精度取決于負(fù)荷特征的差異性,因此特征提取對(duì)NILM至關(guān)重要。特征提取可以看作是從原始電壓信號(hào)和電流信號(hào)中獲取重要信息的信號(hào)處理過(guò)程,相關(guān)學(xué)者提出了多種方法獲得需要改進(jìn)的特征來(lái)提高NILM性能。Hart首先提出使用功率的變化作為負(fù)荷特征,精度可達(dá)到80%,但對(duì)于功耗相近的設(shè)備,識(shí)別精度則大大降低[3]。高采樣頻率提供如諧波、V-I軌跡等高頻特征,劉恒勇等人通過(guò)提取用電器穩(wěn)態(tài)電流信號(hào),經(jīng)過(guò)傅里葉變換提取諧波分量作為負(fù)荷特征,并將該負(fù)荷特征作為循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)模型的輸入,實(shí)驗(yàn)表明所提取的特征值能將用電器成功識(shí)別[4]。然而該負(fù)荷特征提取需要較高的采樣頻率和較大的數(shù)據(jù)存儲(chǔ)容量,增加了硬件設(shè)備的成本。凌家源等人通過(guò)應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)模型進(jìn)行負(fù)荷識(shí)別,利用CNN可以自動(dòng)提取特征的特點(diǎn),使用特征豐富的高頻電流數(shù)據(jù)作為輸入,取得了較好的識(shí)別效果[5]。文獻(xiàn)[6-10]表明,將V-I軌跡轉(zhuǎn)化為圖像表示,并將其作為機(jī)器學(xué)習(xí)分類器的輸入,可以提高分類性能。然而文獻(xiàn)中提出的方法均使用單標(biāo)簽學(xué)習(xí),忽略了多個(gè)設(shè)備可以同時(shí)運(yùn)行的事實(shí),以及設(shè)備使用之間的依賴關(guān)系。實(shí)際應(yīng)用場(chǎng)景中,家用電器種類繁多且多種負(fù)荷同時(shí)運(yùn)行的情況比較常見,因此多標(biāo)簽學(xué)習(xí)是傳統(tǒng)NILM方法的一種可行的替代方法[11-15]。文獻(xiàn)[14]中對(duì)低采樣功率測(cè)量的多標(biāo)簽分類和多標(biāo)簽元分類框架進(jìn)行了廣泛的調(diào)查。文獻(xiàn)[16]提出利用各用電設(shè)備的穩(wěn)態(tài)電流諧波特性,建立用電設(shè)備特征標(biāo)簽,然后采用彈性后向反饋(Resilient back PROPagation, RPROP)神經(jīng)網(wǎng)絡(luò),訓(xùn)練多種設(shè)備組合,進(jìn)行多標(biāo)簽負(fù)荷辨識(shí)。文獻(xiàn)[17]提出改進(jìn)雞群算法作為負(fù)荷識(shí)別算法,以家用電器穩(wěn)態(tài)電流基波和諧波作為負(fù)荷特征參數(shù)進(jìn)行多標(biāo)簽識(shí)別。但文獻(xiàn)[16,17]均需人為選取特征進(jìn)行識(shí)別,且選取特征參數(shù)有限。
針對(duì)以上多標(biāo)簽負(fù)荷識(shí)別方法依賴于特征量的選取,本文提出了一種基于集合經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition, EEMD)結(jié)合CNN模型的負(fù)荷識(shí)別方法,首先從檢測(cè)到事件的聚合測(cè)量數(shù)據(jù)中提取單周期穩(wěn)態(tài)電流特征,隨后應(yīng)用EEMD將該電流特征分解為兩種目標(biāo)模態(tài)分量,接著應(yīng)用歐氏距離相似度函數(shù)將分解后的模態(tài)轉(zhuǎn)化為二維矩陣表示,通過(guò)CNN多標(biāo)簽分類器自動(dòng)提取矩陣的有效特征。最后在PLAID(即插即用設(shè)備標(biāo)識(shí))數(shù)據(jù)集上對(duì)所提出的方法進(jìn)行了實(shí)驗(yàn)驗(yàn)證,結(jié)果表明,基于EEMD與CNN模型的負(fù)荷識(shí)別準(zhǔn)確率較高,能夠有效地實(shí)現(xiàn)多標(biāo)簽負(fù)荷識(shí)別[18]。
由于提取到的電流信號(hào)具有非平穩(wěn)和非周期性,傳統(tǒng)的傅里葉變換不能描述信號(hào)某一頻率的出現(xiàn)時(shí)刻,因此有學(xué)者提出了多種時(shí)頻分析方法,如短時(shí)傅里葉變換和小波變換等,但其基本思想都是根據(jù)傅里葉分析理論,對(duì)非線性非平穩(wěn)信號(hào)的分析能力不足,受限于Heisenberg不確定原理。經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition, EMD)是由Huang等人于1998年提出的一種新型自適應(yīng)信號(hào)時(shí)頻處理方法,適用于非線性非平穩(wěn)信號(hào)的分析處理[19]。然而EMD的分解過(guò)程中易發(fā)生模態(tài)混疊問(wèn)題,模態(tài)混疊問(wèn)題使得特征提取、模型訓(xùn)練、模式識(shí)別變得困難,本征模態(tài)函數(shù)(Intrinsic Mode Function, IMF)失去了單一特征尺度的特征。為解決模態(tài)混疊問(wèn)題,Huang等人在2009年提出通過(guò)加噪聲輔助分析的集合經(jīng)驗(yàn)?zāi)B(tài)分解理論,其本質(zhì)是對(duì)信號(hào)進(jìn)行平穩(wěn)化處理,不需要人為選擇基函數(shù)和分解層數(shù),利用其分解結(jié)果可以準(zhǔn)確有效地把握原數(shù)據(jù)的特征信息,不僅能有效抑制經(jīng)驗(yàn)?zāi)B(tài)分解中出現(xiàn)的模態(tài)混疊現(xiàn)象,得到更有意義的IMF分量,而且能將原一維觀測(cè)信號(hào)分解成多維,為實(shí)現(xiàn)信號(hào)的盲源分離創(chuàng)造條件[20]。
EEMD算法步驟如下:
步驟1:在采集到的目標(biāo)信號(hào)x(t)中添加均值為零、標(biāo)準(zhǔn)差為常數(shù)的隨機(jī)白噪聲gi(t),得到含噪信號(hào)為:
xi(t)=x(t)+gi(t)
(1)
式中,gi(t)為第i次加入高斯白噪聲的信號(hào),加入的高斯白噪聲大小會(huì)直接影響信號(hào)EEMD分解效果,一般取gi(t)的標(biāo)準(zhǔn)差為采集信號(hào)標(biāo)準(zhǔn)差的0.1~0.4。
步驟2:對(duì)xi(t)分別進(jìn)行EMD處理,得到的IMF分量記為dij(t)和余項(xiàng)ri(t)。
步驟3:重復(fù)步驟1和步驟2,N次后,利用不相關(guān)隨機(jī)序列統(tǒng)計(jì)均值為0的原理,將步驟2對(duì)應(yīng)的IMF分量進(jìn)行總體平均運(yùn)算,從而消除多次加入高斯白噪聲對(duì)真實(shí)IMF分量的影響,最后得到EEMD分解后的IMF分量。
(2)
式中,dj(t)為目標(biāo)信號(hào)x(t)進(jìn)行EEMD處理后得到的第j個(gè)IMF分量。當(dāng)N越大,對(duì)應(yīng)的白噪聲IMF分量的和將趨于0,此時(shí)EEMD分解的結(jié)果為:
(3)
式中,r(t)為最終的殘余分量,代表信號(hào)的平均趨勢(shì)。通過(guò)EEMD理論可以把任意一個(gè)目標(biāo)信號(hào)x(t)分解為若干個(gè)IMF分量dj(t)和一個(gè)殘余分量r(t),本文中噪聲信號(hào)標(biāo)準(zhǔn)差取0.3,N取300。
(4)
本文研究對(duì)象為家用電器負(fù)荷,其狀態(tài)改變對(duì)系統(tǒng)沖擊很小,因此設(shè)備狀態(tài)切換30周期后可認(rèn)定處于穩(wěn)定狀態(tài)[21]。圖1為根據(jù)標(biāo)簽數(shù)據(jù)得到的風(fēng)扇與吸塵器在不同時(shí)刻開啟同時(shí)運(yùn)行以及最后分別關(guān)閉的實(shí)例樣本。
圖1 不同事件的聚合電流信號(hào)Fig.1 Aggregate current signals of different events
為獲得家用電器穩(wěn)態(tài)運(yùn)行數(shù)據(jù),對(duì)選取的設(shè)備根據(jù)事件標(biāo)簽中的時(shí)間戳,在短時(shí)間窗口測(cè)量到的高頻聚合電壓和電流數(shù)據(jù)中找到事件發(fā)生的時(shí)間點(diǎn),從樣本標(biāo)簽中最后一臺(tái)設(shè)備開啟后30周期開始測(cè)量Nc個(gè)完整穩(wěn)態(tài)周期電壓和電流數(shù)據(jù)(這些周期均在電壓過(guò)零點(diǎn)處對(duì)齊),其中數(shù)據(jù)集采樣頻率fs=30 kHz,電表采集頻率f=60 Hz,一個(gè)周期內(nèi)的采樣點(diǎn)數(shù)T=fs/f=500,接著將這些周期內(nèi)相應(yīng)索引點(diǎn)的值累加取平均,從而獲取到一個(gè)周期內(nèi)的穩(wěn)態(tài)電流特征。計(jì)算公式如下:
(5)
(6)
圖2為不同設(shè)備穩(wěn)態(tài)運(yùn)行對(duì)應(yīng)的電流特征。
圖2 不同穩(wěn)態(tài)電流特征Fig.2 Different steady-state current features
對(duì)提取到的電流特征進(jìn)行EEMD,由于分解后的模態(tài)數(shù)量不一致,大部分樣本的電流波形在分解到第5個(gè)模態(tài)后無(wú)法進(jìn)行分解,且前3種模態(tài)頻率過(guò)高,含有用信息量較少,為了盡可能在保留原始波形特征的條件下捕捉到其高頻細(xì)節(jié),實(shí)驗(yàn)?zāi)繕?biāo)選取包含工頻的第4、第5模態(tài)分量(對(duì)應(yīng)圖3的i(t)m1,i(t)m2)。通過(guò)對(duì)空調(diào)、緊湊型熒光燈、咖啡機(jī)等12種類型設(shè)備的電流信號(hào)進(jìn)行EEMD處理并歸一化,得到如圖3所示的結(jié)果。
圖3 歸一化電流及其相應(yīng)的第4、第5模態(tài)電流Fig.3 Normalized current and its corresponding fourth and fifth mode currents
從圖3可以觀察到,即使對(duì)于緊湊型熒光燈和筆記本充電器等非周期負(fù)載電流設(shè)備,其電流特征對(duì)應(yīng)的第4模態(tài)分量也接近純正弦波,通過(guò)EEMD后的兩種模態(tài)電流特征的結(jié)合使得每種類型設(shè)備通常表現(xiàn)出一致又獨(dú)特的特點(diǎn),為后續(xù)進(jìn)行多標(biāo)簽負(fù)荷識(shí)別的實(shí)驗(yàn)提供條件。
圖4 ω取不同值時(shí)的識(shí)別性能和訓(xùn)練時(shí)間Fig.4 Recognition performance and training time with ω taking different values
為進(jìn)一步提高不同類型設(shè)備對(duì)應(yīng)模態(tài)電流特征的唯一性,將歐式距離相似度函數(shù)du,v=‖i(t)u-i(t)v‖2應(yīng)用于EEMD后的模態(tài)分量,該函數(shù)通常用來(lái)測(cè)量?jī)蓚€(gè)數(shù)據(jù)點(diǎn)間的相似性或相關(guān)性,且歐式距離相似性函數(shù)被廣泛用作機(jī)器學(xué)習(xí)算法的預(yù)處理步驟[22],距離相似度矩陣Dω,ω表示歐幾里得空間中一組ω點(diǎn)的間距。
(7)
圖5為緊湊型熒光燈和筆記本充電器同時(shí)運(yùn)行時(shí)提取到的電流特征以及該電流特征經(jīng)EEMD后的兩種目標(biāo)模態(tài)。
圖5 緊湊型熒光燈與筆記本充電器運(yùn)行時(shí)的電流及EEMD后的兩種模態(tài)電流Fig.5 Compact fluorescent lamp and notebook charger operating current and two modes of current after EEMD
圖6展示了圖5中的電流特征通過(guò)歐式距離相似度函數(shù)轉(zhuǎn)化成的2維矩陣圖像表示,其中H,ω為維度,通過(guò)圖6可以觀察到,兩種模態(tài)電流對(duì)應(yīng)的距離矩陣比原始電流對(duì)應(yīng)的距離矩陣所含信息量更豐富,有利于后續(xù)CNN模型的學(xué)習(xí)。
圖6 圖5電流對(duì)應(yīng)的距離矩陣Fig.6 Distance matrix of current showing in figure 5
圖7 CNN多標(biāo)簽分類器結(jié)構(gòu)Fig.7 Structure of CNN multi-label classifier
為學(xué)習(xí)該模型參數(shù),使用標(biāo)準(zhǔn)反向傳播來(lái)優(yōu)化預(yù)測(cè)的Softmax分布和基于每個(gè)輸入特征的多標(biāo)簽?zāi)繕?biāo)之間的交叉熵,聯(lián)合交叉熵?fù)p失隱式地捕捉了標(biāo)簽之間的關(guān)系:
(8)
實(shí)驗(yàn)采用了多標(biāo)簽分層10折交叉驗(yàn)證方法,這種評(píng)價(jià)方法提供了多標(biāo)簽的分層隨機(jī)折疊,保存了標(biāo)簽在每次折疊中的百分比,同時(shí)通過(guò)多次劃分樣本中訓(xùn)練集和測(cè)試集的大小來(lái)訓(xùn)練該多標(biāo)簽分類器,每運(yùn)行一次,取總樣本的p份進(jìn)行100次迭代訓(xùn)練,并在該樣本剩下的1-p份中進(jìn)行測(cè)試,其中p∈[0.1,0.9]。本文所提方法流程框圖如圖8所示。
圖8 方法流程框圖Fig.8 Flow diagram of method
本文利用來(lái)自美國(guó)加州55個(gè)家庭中12種不同類型的設(shè)備負(fù)載電流與電壓測(cè)試值的PLAID數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)驗(yàn)證,數(shù)據(jù)集主要包含了兩部分內(nèi)容,第一部分是高頻采集的電壓及電流數(shù)據(jù),采樣頻率為30 kHz,第二部分標(biāo)記了電器種類,電器切換時(shí)刻以及采樣時(shí)長(zhǎng)等標(biāo)簽數(shù)據(jù),共1 478個(gè)實(shí)例樣本,其中單一負(fù)荷樣本采樣時(shí)長(zhǎng)在4~6 s,含多個(gè)負(fù)荷開啟樣本采樣時(shí)長(zhǎng)在10~20 s。首先選取該數(shù)據(jù)集中含1~3個(gè)設(shè)備狀態(tài)轉(zhuǎn)換的電流和標(biāo)簽樣本,隨后根據(jù)3.1節(jié)所述特征提取方法,得到最終用于訓(xùn)練及測(cè)試的1 154個(gè)樣本,其中每個(gè)樣本的采樣時(shí)長(zhǎng)為(1/60)×20 s=(1/3)s。
通過(guò)圖9可以看出,電烙鐵的樣本最多,冰箱除霜機(jī)的樣本最少,其余10種負(fù)荷的樣本居中;圖10可以觀察到,單一設(shè)備的樣本占總樣本比例最大,達(dá)到674例,含多個(gè)設(shè)備運(yùn)行的樣本數(shù)量較少,分別只有413例和67例。
圖9 設(shè)備類型分布Fig.9 Distribution of device type
圖10 設(shè)備數(shù)量分布Fig.10 Distribution of device’s number
實(shí)驗(yàn)采用基于標(biāo)簽和基于實(shí)例的度量標(biāo)準(zhǔn)來(lái)定量評(píng)估分類性能,即基于實(shí)例的F1度量(F1-eb)和宏觀-平均的F1度量(F1-marco)。
F1-eb用來(lái)度量正確預(yù)測(cè)標(biāo)簽與真實(shí)和預(yù)測(cè)標(biāo)簽總和的比例:
(9)
F1-marco源自F1-score,度量所有標(biāo)簽上基于每類標(biāo)簽的F1-score平均值,該指標(biāo)被廣泛應(yīng)用于多分類任務(wù)中,定義如下:
(10)
式中,F(xiàn)Pi為第i類負(fù)荷被分類為運(yùn)行狀態(tài)而實(shí)際為關(guān)閉狀態(tài)的數(shù)量。
為驗(yàn)證本文所提方法在單一負(fù)荷識(shí)別上具有較好的識(shí)別效果,實(shí)驗(yàn)首先針對(duì)單一負(fù)荷的樣本進(jìn)行設(shè)備識(shí)別,同時(shí)提取了另外4種用于負(fù)荷識(shí)別的特征進(jìn)行對(duì)比分析,依次是V-I二進(jìn)制圖像(如文獻(xiàn)[8]所述,首先獲取一個(gè)穩(wěn)態(tài)周期下的電壓、電流波形,構(gòu)建T×T維矩陣并將生成的圖片劃分到ω維度的網(wǎng)格柵欄,將含有像素的網(wǎng)格柵欄指定為1,反之指定為0,最終得到ω×ω維包含0與1的2維矩陣)、單周期穩(wěn)態(tài)電流波形、電流經(jīng)EEMD后的目標(biāo)模態(tài)分量(以下簡(jiǎn)稱EEMD電流)、電流對(duì)應(yīng)的歐式距離矩陣(以下簡(jiǎn)稱距離矩陣)。表1為本文所提方法與上述4種特征結(jié)合CNN模型進(jìn)行單一負(fù)荷識(shí)別的F1-eb度量結(jié)果。
表1 各負(fù)荷的F1-eb度量Tab.1 F1-eb measurement of each load
從表1可以看出,針對(duì)大多數(shù)類型設(shè)備,將提取到的電流通過(guò)EEMD后再輸入到CNN模型中進(jìn)行單一負(fù)荷識(shí)別,都不同程度地提高了負(fù)荷識(shí)別率,可以看出EEMD在特征預(yù)處理環(huán)節(jié)的重要性,而顯而易見的是,本文所提特征在此基礎(chǔ)上更進(jìn)一步提高了單一負(fù)荷的識(shí)別率,在咖啡機(jī)和冰箱除霜機(jī)上的F1-eb度量均為1;除緊湊型熒光燈、空調(diào)、筆記本充電器、吸塵器4種家電負(fù)荷外,本文所提方法在識(shí)別其余9種負(fù)荷上的F1-eb值最高,均優(yōu)于其他4種方法。
同時(shí),表2還對(duì)比分析了上述5種特征在進(jìn)行單一負(fù)荷識(shí)別上的F1-marco值。
表2 基于5種特征提取方法的F1-marco度量Tab.2 F1-marco metrics based on five kinds of feature extraction method
從表2中可以看出,V-I二進(jìn)制圖像結(jié)合CNN模型識(shí)別的F1-marco度量只有0.826,本文所提方法的F1-marco度量達(dá)到0.951,值得注意的是,距離矩陣特征進(jìn)行單一負(fù)荷識(shí)別的F1-marco值達(dá)到0.938,僅次于本文方法,由此可見距離矩陣特征較電流特征更有助于CNN模型進(jìn)行單一負(fù)荷識(shí)別的學(xué)習(xí)。
本文主要探究的是所提方法識(shí)別多臺(tái)設(shè)備的性能,因此針對(duì)圖10中的樣本分布進(jìn)行多標(biāo)簽負(fù)荷識(shí)別,得到的實(shí)驗(yàn)結(jié)果見表3。
表3 識(shí)別多個(gè)設(shè)備的準(zhǔn)確率Tab.3 Accuracy of identifying multiple devices
可以看出,基于V-I二進(jìn)制圖像特征的負(fù)荷識(shí)別方法在識(shí)別單一負(fù)荷時(shí)的準(zhǔn)確率最低,為90.5%,而本文所提方法的準(zhǔn)確率高達(dá)98.5%;采用電流特征進(jìn)行識(shí)別多個(gè)設(shè)備的準(zhǔn)確率最低,僅為34.6%和6%,基于EEMD電流特征的識(shí)別準(zhǔn)確率為53.8%、23.9%,有較大幅度提升,由此可見,EEMD在多標(biāo)簽負(fù)荷識(shí)別率方面,具有良好的改善作用,而本文所提方法的準(zhǔn)確率分別為78.9%、40.3%,較電流特征提高了4.3%和3.4%,均優(yōu)于其余4種負(fù)荷特征,有力地驗(yàn)證了本文所提方法在多標(biāo)簽負(fù)荷識(shí)別上具有良好的識(shí)別效果。
表4進(jìn)一步對(duì)比了本文方法與近幾年的NILM相關(guān)文獻(xiàn)所提方法進(jìn)行負(fù)荷識(shí)別所獲得的F1-marco度量,盡管有些方法所用數(shù)據(jù)集和模型學(xué)習(xí)特點(diǎn)不盡相同,但與表4中各項(xiàng)實(shí)驗(yàn)條件相同的第2種方法所獲得的F1-marco得分對(duì)比,本文所提方法的F1-marco值較之提高了1.1%。
表4 不同方法性能對(duì)比Tab.4 F1-marco metrics based on different methods
本文提出了一種基于EEMD與CNN模型的多標(biāo)簽負(fù)荷識(shí)別方法,實(shí)現(xiàn)了對(duì)用戶負(fù)荷有效的非侵入式監(jiān)測(cè),首先從高頻電壓和電流聚合測(cè)量數(shù)據(jù)中提取單周期穩(wěn)態(tài)電流信號(hào),隨后應(yīng)用EEMD理論,該方法將電流特征分解為多個(gè)模態(tài)分量,從中選取2種目標(biāo)模態(tài)分量,隨后應(yīng)用歐氏距離相似度函數(shù)將分解后的電流信號(hào)轉(zhuǎn)換為2維矩陣表示,作為CNN多標(biāo)簽分類器的輸入。通過(guò)PLAID聚合數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果表明,本文所提出的方法能較準(zhǔn)確地從聚合測(cè)量數(shù)據(jù)中識(shí)別多臺(tái)設(shè)備,具有較高的家電負(fù)荷識(shí)別準(zhǔn)確率。