周勇軍,吳元香,董智華,胡譽(yù)蓉,肖先勇,張 姝
(1. 國網(wǎng)西藏電力有限公司拉薩供電公司,西藏拉薩 850010;2. 四川大學(xué)電氣工程學(xué)院,四川成都 610065;3. 國網(wǎng)西藏電力有限公司,西藏拉薩 850000)
在用戶與電網(wǎng)的雙向互動(dòng)服務(wù)模式[1]中,對(duì)用戶側(cè)設(shè)備用電情況的分類計(jì)量是一項(xiàng)基礎(chǔ)工作[2],其中非侵入式負(fù)荷監(jiān)測NILM(Non-Intrusive Load Monitoring)是所采用的一種典型方法,該方法是指利用用戶供電總線處的數(shù)據(jù)分析出詳細(xì)的設(shè)備使用狀態(tài)等信息。這些信息可以幫助用戶通過更換節(jié)能電器、調(diào)整電器參數(shù)、錯(cuò)峰用電等方式來減少電費(fèi)。用戶也可將這些信息共享給電力企業(yè),以獲取更多的增值服務(wù)。通過NILM 方法,電力企業(yè)能更加詳細(xì)地掌握用戶的用能信息,科學(xué)地制定區(qū)域電力系統(tǒng)的發(fā)展規(guī)劃與供電計(jì)劃[3]。
現(xiàn)有關(guān)于NILM 方法的研究,大多需依靠對(duì)單臺(tái)設(shè)備的單獨(dú)測量來建立負(fù)荷特征庫進(jìn)行模式識(shí)別,但特征庫是侵入式收集的,會(huì)影響用戶正常的生產(chǎn)生活,因此需要一種可以非侵入式收集、提取和存檔任意用戶每臺(tái)設(shè)備唯一特征向量的收集方法[4]。隨著用戶設(shè)備類型與數(shù)量的增加,具有相近運(yùn)行特征的設(shè)備也逐漸增多,當(dāng)這類設(shè)備交叉投切時(shí),準(zhǔn)確分析設(shè)備運(yùn)行時(shí)間極為困難。文獻(xiàn)[5]通過大量的算例驗(yàn)證了基于設(shè)備運(yùn)行窗的NILM 方法準(zhǔn)確率更高,但其沒有對(duì)設(shè)備窗的選定進(jìn)行說明。文獻(xiàn)[4]根據(jù)歷史標(biāo)記事件數(shù)據(jù)、相位、設(shè)備可能的運(yùn)行時(shí)間段等信息以及聚類算法確定設(shè)備的運(yùn)行窗,在一定程度上提升了分析精度,但輔助信息過多且實(shí)時(shí)性不足。文獻(xiàn)[6-7]分別通過二分圖模型與迭代運(yùn)算進(jìn)行事件匹配,但均未考慮多狀態(tài)和相近功率的設(shè)備。
負(fù)荷特征量是用來區(qū)分設(shè)備類型或運(yùn)行狀態(tài)的重要標(biāo)簽,主要包括設(shè)備運(yùn)行時(shí)的穩(wěn)態(tài)特征和狀態(tài)轉(zhuǎn)換時(shí)的暫態(tài)特征。其中,穩(wěn)態(tài)特征包括功率需求、諧波特性、電壓-電流軌跡、電壓和電流的波形參數(shù)等。暫態(tài)特征包括瞬態(tài)功率、諧波和電壓波形參數(shù)等[8]。但波形參數(shù)與諧波分析都需要較高的采樣頻率,對(duì)配置的測量設(shè)備要求較高,這也會(huì)導(dǎo)致存儲(chǔ)與分析成本的增加,因此,有必要提取分析更為實(shí)用的負(fù)荷特征量,以滿足NILM方法推廣應(yīng)用的需求。
最經(jīng)典的負(fù)荷識(shí)別方法是以單臺(tái)設(shè)備的特征向量為對(duì)象進(jìn)行模板匹配[9],并根據(jù)與期望值的偏差情況進(jìn)行判定。隨著對(duì)準(zhǔn)確度需求的提升,基于判別函數(shù)的分類法被用于負(fù)荷識(shí)別中,包括基于線性函數(shù)的支持向量機(jī)[10]、基于非線性函數(shù)的神經(jīng)網(wǎng)絡(luò)[11]以及基于概率函數(shù)的貝葉斯[12]分類法。但這些監(jiān)督類方法對(duì)標(biāo)記樣本的數(shù)量需求較高,使得相應(yīng)的NILM 方法在應(yīng)用中面臨成本高昂、實(shí)施繁瑣以及居民舒適度低等問題[13]。如何降低該過程的工作量,是NILM 方法廣泛應(yīng)用面臨的關(guān)鍵難題。近年來,模糊聚類[14]與隱馬爾可夫模型[15]等不對(duì)樣本進(jìn)行標(biāo)記的無監(jiān)督類方法也被應(yīng)用到NILM 方法領(lǐng)域,但這類方法存在分類準(zhǔn)確度較低且分析結(jié)果需要人工標(biāo)識(shí)等新問題。
為此,本文從NILM 方法的實(shí)用性角度出發(fā),提出一種基于模體挖掘與調(diào)和函數(shù)半監(jiān)督學(xué)習(xí)的NILM 方法。首先,基于1 Hz 低頻采樣的功率數(shù)據(jù),利用設(shè)備運(yùn)行的基本約束與事件發(fā)生的先后邏輯,確定唯一匹配的設(shè)備運(yùn)行窗并建立設(shè)備特征庫,對(duì)不能唯一確定的匹配事件,以模體挖掘法分析所有的可能性;然后,根據(jù)不同類型設(shè)備開啟與穩(wěn)定運(yùn)行時(shí)的差異,進(jìn)一步提取設(shè)備運(yùn)行窗中的特征向量,并利用對(duì)標(biāo)記樣本需求少的基于調(diào)和函數(shù)的半監(jiān)督學(xué)習(xí)算法對(duì)設(shè)備類型和運(yùn)行狀態(tài)進(jìn)行識(shí)別;最后,基于參考能量分解數(shù)據(jù)集REDD(Reference Energy Disaggregation Data set),分別從事件匹配和設(shè)備識(shí)別的角度與其他NILM 方法進(jìn)行對(duì)比,驗(yàn)證本文所提方法的優(yōu)越性。
本文所提基于模體挖掘與調(diào)和函數(shù)半監(jiān)督學(xué)習(xí)的NILM 方法是根據(jù)設(shè)備投切時(shí)在用戶總功率曲線上產(chǎn)生的階躍量,利用完整的設(shè)備運(yùn)行基本約束、事件發(fā)生的先后邏輯與模體挖掘,對(duì)所有可能的確定設(shè)備的運(yùn)行過程進(jìn)行劃分,并在設(shè)備運(yùn)行窗中利用不同類型的設(shè)備在開啟瞬態(tài)與穩(wěn)定運(yùn)行時(shí)的波動(dòng)差異等特征量對(duì)各類型設(shè)備進(jìn)行識(shí)別的方法。該方法的具體實(shí)現(xiàn)流程如圖1 所示。其中,基于滑動(dòng)窗的雙邊累積和事件檢測方法[16]檢測設(shè)備投切與狀態(tài)變化的時(shí)刻ti與對(duì)應(yīng)的功率階躍量ΔPi,判斷功率階躍量的閾值η=40 W。
圖1 本文所提方法基本流程Fig.1 Basic process of proposed method
從功率曲線的角度,用戶設(shè)備主要有3 種典型運(yùn)行過程:單狀態(tài)設(shè)備在開關(guān)時(shí)具有相近的功率階躍量;多狀態(tài)設(shè)備在運(yùn)行過程中會(huì)出現(xiàn)多次不同狀態(tài)間功率的需求變換,如洗衣機(jī)、烤箱等;通常狀態(tài)變化的設(shè)備在開關(guān)時(shí)的功率變化量不同,在運(yùn)行過程中設(shè)備的功率需求不斷變化,如變頻空調(diào)。
設(shè)備運(yùn)行窗是指設(shè)備從不工作的初始狀態(tài)到被開啟運(yùn)行,再到最后被關(guān)閉重新回到初始狀態(tài)的數(shù)據(jù)段。根據(jù)定義可知設(shè)備運(yùn)行的基本約束為:設(shè)備運(yùn)行窗的有功功率變化量總和為0;設(shè)備在任何狀態(tài)都不可能以負(fù)有功功率需求運(yùn)行;設(shè)備在關(guān)閉前一定被打開,這被稱為事件發(fā)生的時(shí)間邏輯,即當(dāng)檢測到一個(gè)(ΔPi<0,ti)的事件時(shí),一定有某一功率階躍量ΔPx>0且ΔPx≈|ΔPi|(單狀態(tài)設(shè)備)或ΔPx>0(多狀態(tài)設(shè)備)發(fā)生在ti時(shí)刻之前?;炯s束對(duì)應(yīng)的單狀態(tài)和多狀態(tài)設(shè)備的匹配條件分別如式(1)和式(2)所示。
式中:ε為判斷匹配的閾值,其值約為10 W。
設(shè)備運(yùn)行窗的確定步驟如下。
1)當(dāng)檢測出用戶總功率曲線上的所有階躍量后,在時(shí)間軸上形成一系列以階躍量ΔPi為符號(hào)的事件。
2)讀取起始有功功率P0,將未匹配的功率階躍事件暫時(shí)記錄于式(3)所示待匹配狀態(tài)Pw中,待匹配狀態(tài)功率總和始終大于0,且分析數(shù)據(jù)段的第一個(gè)階躍量應(yīng)為正,若為負(fù),則說明某設(shè)備的開啟事件不在分析數(shù)據(jù)段內(nèi),不能進(jìn)行運(yùn)行窗匹配。
3)當(dāng)檢測到ΔPi<0 時(shí),設(shè)置匹配標(biāo)識(shí)n=0,依次假設(shè)設(shè)備類型為單狀態(tài)、兩狀態(tài)、三狀態(tài)等,將ΔPi如圖2 所示向前匹配,判斷是否滿足基本約束式(1)或式(2)。每匹配到1 次,n值加1。當(dāng)ΔPi與此前的階躍量全部匹配后,若n=1,對(duì)于單狀態(tài)設(shè)備,則說明在此期間沒有發(fā)生功率需求相近的設(shè)備同時(shí)投入運(yùn)行的情況,轉(zhuǎn)至步驟6),而對(duì)于多狀態(tài)設(shè)備,則需要進(jìn)一步分析,轉(zhuǎn)至步驟4);若n≠1,則發(fā)生了功率需求相近設(shè)備相繼開啟或者已經(jīng)開啟的某單狀態(tài)設(shè)備與某多狀態(tài)設(shè)備的狀態(tài)改變量相近的情況,需等待下一個(gè)ΔPi<0的事件,轉(zhuǎn)至步驟3)。
圖2 各狀態(tài)設(shè)備匹配Fig.2 Matching of each state device
4)當(dāng)功率匹配滿足多狀態(tài)設(shè)備約束式(2)時(shí),有可能出現(xiàn)如圖3所示的3種情況,圖中數(shù)據(jù)單位均為W。情況1 下不同狀態(tài)對(duì)應(yīng)的階躍量絕對(duì)值不同,在當(dāng)前階段可以唯一確定單個(gè)多狀態(tài)設(shè)備類型,轉(zhuǎn)至步驟6)。而情況2 和3 下除了滿足式(2)外,還存在多個(gè)單狀態(tài)設(shè)備以及某多狀態(tài)設(shè)備與某狀態(tài)變化量相近的單狀態(tài)設(shè)備重疊的可能性,設(shè)備所屬類型不能唯一確定,需進(jìn)行進(jìn)一步分析,因此將情況2 和3暫時(shí)記錄于待匹配事件序列式(3)中。
圖3 累加和為0的狀態(tài)窗情況Fig.3 Condition of state window when cumulative sum is zero
5)檢測Pw是否小于0:若是,則說明發(fā)生了某長時(shí)間運(yùn)行設(shè)備關(guān)閉的事件,且該設(shè)備開啟事件發(fā)生的時(shí)間早于分析數(shù)據(jù)段對(duì)應(yīng)的時(shí)間,此時(shí)應(yīng)調(diào)整式(3)中P0與階躍量的關(guān)系;否則,返回步驟3)。
6)根據(jù)2.3節(jié)步驟輸出匹配的設(shè)備運(yùn)行窗。
根據(jù)上述步驟可以唯一確定一部分設(shè)備運(yùn)行窗,然后將已確定的設(shè)備運(yùn)行窗從總線數(shù)據(jù)上移除,以便于分析其他設(shè)備運(yùn)行窗。
模體挖掘[17]是根據(jù)數(shù)據(jù)挖掘的思想,在時(shí)間序列中尋找重復(fù)出現(xiàn)的相似片段。數(shù)據(jù)挖掘以序列符號(hào)化的形式進(jìn)行,即在分析運(yùn)行窗前將監(jiān)測數(shù)據(jù)處理為不同時(shí)刻下的功率階躍量信息。一組能夠滿足設(shè)備運(yùn)行窗基本約束的功率階躍量為一個(gè)模體,模體挖掘即是在一組符號(hào)化信息中挖掘出重復(fù)出現(xiàn)的相似片段模體,因此,確定每類設(shè)備的第1 個(gè)模體是很關(guān)鍵的。
1)在所研究的待匹配事件序列式(3)中,按照時(shí)間順序?qū)Ζi>0的事件依次以單狀態(tài)設(shè)備或多狀態(tài)設(shè)備為假設(shè),以設(shè)備運(yùn)行窗基本約束為判定依據(jù),確定第1個(gè)模體。
2)每個(gè)模體一一向后對(duì)應(yīng),挖掘監(jiān)測數(shù)據(jù)中所有可能的設(shè)備運(yùn)行窗。
3)執(zhí)行上述步驟,直到分析數(shù)據(jù)的最后一個(gè)階躍量。
基于上述分析,監(jiān)測到的所有設(shè)備狀態(tài)都被劃分,一部分是確定的設(shè)備運(yùn)行窗,另一部分是可能的設(shè)備運(yùn)行窗。 確定的設(shè)備運(yùn)行窗將作為已標(biāo)記樣本,用于辨識(shí)可能的設(shè)備運(yùn)行窗是否屬于某類設(shè)備,因此需要從分析結(jié)果中進(jìn)一步提取運(yùn)行窗數(shù)據(jù)。
以單狀態(tài)設(shè)備為例,當(dāng)事件匹配后,設(shè)備運(yùn)行窗中的數(shù)據(jù)提取過程如下。
1)檢查在時(shí)間軸上ΔPi與ΔPx事件之間是否有其他設(shè)備事件,若沒有,則認(rèn)為該設(shè)備在運(yùn)行時(shí)無其他設(shè)備交叉重疊開啟,該設(shè)備運(yùn)行窗的數(shù)據(jù)窗口?。╰x,ti)之間的數(shù)據(jù)與tx前一段平穩(wěn)區(qū)段平均值Pav的差值,如圖4 所示,圖中,Aon和Aoff分別為設(shè)備A 開和關(guān)的標(biāo)識(shí)。
圖4 情況1下數(shù)據(jù)窗處理示意圖Fig.4 Schematic diagram of data window processing under Case 1
2)若在時(shí)間軸上ΔPx與ΔPi事件之間有其他設(shè)備事件,則除了取差值,還需要將其他設(shè)備事件從該數(shù)據(jù)窗口中移除。考慮到設(shè)備重疊運(yùn)行時(shí)大幅度波動(dòng)的設(shè)備會(huì)覆蓋小幅度波動(dòng)的設(shè)備,影響本文所提的設(shè)備運(yùn)行時(shí)穩(wěn)定波動(dòng)幅度特征值,因此在數(shù)據(jù)移除時(shí),若ΔPx與ΔPi之間是ΔPy>0 的事件,則將ΔPy到ΔPi之間的數(shù)據(jù)替換為ΔPx到ΔPy之間的數(shù)據(jù),反之,則將ΔPx到ΔPy之間的數(shù)據(jù)替換為ΔPy到ΔPi之間的數(shù)據(jù),如圖5 所示,圖中,Bon和Boff分別為設(shè)備B開和關(guān)的標(biāo)識(shí)。
圖5 情況2下數(shù)據(jù)窗處理示意圖Fig.5 Schematic diagram of data window processing under Case 2
設(shè)備在運(yùn)行過程中受到主要元器件、設(shè)備功能以及人為因素等多方面的影響,將會(huì)產(chǎn)生不同的運(yùn)行特征。在對(duì)1 Hz 頻率采樣的功率數(shù)據(jù)進(jìn)行分析時(shí),不同類型設(shè)備的表現(xiàn)特征如表1 所示。為表征不同類型設(shè)備在開啟和運(yùn)行狀態(tài)下瞬態(tài)和波動(dòng)情況的差異,本文提出2 個(gè)新的負(fù)荷特征量進(jìn)行負(fù)荷識(shí)別。
表1 不同類型設(shè)備的表現(xiàn)特征Table 1 Performance of different types of equipments
圖6給出了2種典型的設(shè)備開啟、穩(wěn)定運(yùn)行直到設(shè)備關(guān)閉的功率曲線,設(shè)備1 為電阻類或受人為活動(dòng)影響類設(shè)備,設(shè)備2 為電機(jī)驅(qū)動(dòng)類或電子饋電類設(shè)備。圖中:Pmax為設(shè)備開啟時(shí)的有功功率最大值;Ps為特征量,表示設(shè)備開啟到開始穩(wěn)定運(yùn)行點(diǎn)的斜率,該變量是考慮不同類型設(shè)備在開啟時(shí)的有功功率需求最大值、穩(wěn)定運(yùn)行值與在過渡時(shí)間段不同而設(shè)定的;Pst為設(shè)備開始穩(wěn)定運(yùn)行點(diǎn)的功率;Pe為設(shè)備最終穩(wěn)定運(yùn)行點(diǎn)的功率。
圖6 2種典型的設(shè)備運(yùn)行窗Fig.6 Two typical equipment operation windows
為計(jì)算Ps,對(duì)圖6(b)運(yùn)行窗中的數(shù)據(jù)進(jìn)行Δt=1 s的功率變化量分析,如圖7所示,圖中最大的功率變化量ΔPmax可直接定位,ΔPmax后第1個(gè)為負(fù)值的變化量對(duì)應(yīng)的有功功率值為Pmax,而最小的功率變化量ΔPmin向前對(duì)應(yīng)的功率值為Pe。
圖7 有功功率變化量示意圖Fig.7 Schematic diagram of active power variation
由圖6(b)可以看出,Pmax到Pst并不是連續(xù)下滑的過程,而是存在間歇性的功率值回升現(xiàn)象,因此根據(jù)累加和的思想判斷Pst的位置。具體計(jì)算步驟如下。
1)設(shè)置閾值β=3,讀取Pmax后的階躍量,置i=1。
2)判斷ΔPi是否為正:若是,則轉(zhuǎn)至步驟3);否則,令i=i+1,繼續(xù)向前判斷ΔPi的正負(fù)。
3)判斷ΔPi+ΔPi+1+ΔPi+2是否大于β:若是,則認(rèn)為已經(jīng)進(jìn)入穩(wěn)定運(yùn)行區(qū)段,輸出Pst對(duì)應(yīng)的時(shí)刻點(diǎn);否則,認(rèn)為仍處于過渡過程,令i=i+1,返回步驟2)。
圖6(b)的設(shè)備運(yùn)行窗連續(xù)3個(gè)變化量相加的結(jié)果如附錄A 圖A1 所示。當(dāng)分別確定Pmax和Pst對(duì)應(yīng)的時(shí)刻點(diǎn)t1、t2后,根據(jù)式(4)計(jì)算Ps。
不同類型的設(shè)備在Pst到Pe的功率變化量如附錄A 圖A2所示。由圖可以看出,不同設(shè)備在穩(wěn)態(tài)運(yùn)行時(shí)波動(dòng)幅度不同。設(shè)備穩(wěn)定運(yùn)行時(shí)功率變化量(取自設(shè)備樣本a—d)的頻數(shù)分布直方圖如圖8所示,可以看出,數(shù)據(jù)近似服從正態(tài)分布,因此取90%的置信水平將每個(gè)運(yùn)行窗穩(wěn)態(tài)運(yùn)行時(shí)的波動(dòng)上下限Pf作為設(shè)備的特征量。
圖8 不同設(shè)備功率變化量的頻數(shù)分布直方圖Fig.8 Frequency distribution histogram of power variation of different equipments
每臺(tái)設(shè)備運(yùn)行窗對(duì)應(yīng)一個(gè)特征向量T=[PmaxPsPfPd],其中,Pd為Pst到Pe之間設(shè)備穩(wěn)定運(yùn)行時(shí)的功率需求。
本文以基于調(diào)和函數(shù)的半監(jiān)督學(xué)習(xí)算法進(jìn)行運(yùn)行窗所屬設(shè)備類型的辨識(shí)。該算法的主要思想是在學(xué)習(xí)訓(xùn)練過程中綜合利用已標(biāo)記和未標(biāo)記樣本,從未標(biāo)記樣本中提取有效的信息來提高學(xué)習(xí)的性能[18]。該算法在所構(gòu)建的樣本圖G上建立連續(xù)預(yù)測函數(shù)的分布模型,充分考慮樣例的分類概率,解決了傳統(tǒng)離散預(yù)測的圖割法對(duì)相鄰類樣本誤判的問題[19]。此外,該算法的基本思想在后續(xù)流形正則化方法的開發(fā)中被沿用,是準(zhǔn)確性與實(shí)用性兼?zhèn)涞囊活惏氡O(jiān)督學(xué)習(xí)算法。
將全部樣本集X(包括已標(biāo)記樣本集XV和未標(biāo)記樣本集XU)構(gòu)建在包含N個(gè)點(diǎn)和E條邊的無向圖G=(N,E)中,圖G中每個(gè)點(diǎn)表示一個(gè)樣本。X共包含N個(gè)樣本,其中XV的樣本數(shù)為l,XU的樣本數(shù)為u,且N=l+u。X中樣本xi的特征向量為T,當(dāng)xi為已標(biāo)記樣本時(shí),其標(biāo)記值為yi,所有已標(biāo)記樣本的標(biāo)記值構(gòu)成集合Y。圖G中每條邊的權(quán)重為wij,表示樣本xi和xj之間的相似程度,所有權(quán)重構(gòu)成矩陣W。相似程度一般是通過距離進(jìn)行判定的,本文用帶寬為σ的高斯核函數(shù)表示樣本特征量間的距離。
對(duì)于已標(biāo)記樣本,調(diào)和函數(shù)值與標(biāo)記值對(duì)應(yīng);對(duì)于未標(biāo)記樣本,調(diào)和函數(shù)值滿足權(quán)重平均原則。設(shè)調(diào)和函數(shù)為f(x),則:
設(shè)計(jì)使目標(biāo)函數(shù)值最小的標(biāo)記預(yù)測函數(shù)f(x),對(duì)于調(diào)和函數(shù)而言,它是優(yōu)化問題式(8)的解。
式中:f(x)∈R 表示調(diào)和函數(shù)值屬于實(shí)數(shù)域,具有閉合解。式(8)中第1 項(xiàng)為帶無窮大加權(quán)的損失函數(shù),用于保證已標(biāo)記樣本的值在計(jì)算過程中保持不變,第2 項(xiàng)為正則項(xiàng)Ω(f),用于保證預(yù)測函數(shù)對(duì)樣本數(shù)據(jù)點(diǎn)標(biāo)記值的平滑性,使得鄰近樣本的預(yù)測標(biāo)記相似。
設(shè)對(duì)角矩陣D=(Dij)N×N,其中,i≠j時(shí),Dij=0,i=j時(shí),Dij=∑wij。對(duì)應(yīng)圖G的拉普拉斯矩陣L=D-W,令f=[f(x1)f(x2) …f(xl+u)]T。在圖G中,數(shù)據(jù)點(diǎn)被劃分為2 個(gè)獨(dú)立的分別標(biāo)記為正和負(fù)的數(shù)據(jù)組,而分割這2 個(gè)獨(dú)立數(shù)據(jù)組的邊可以表示為正則化函數(shù)Ω(f)=fTL f。
拉普拉斯矩陣L可以劃分為4個(gè)部分:
式中:L為(l+u)×(l+u)階矩陣;LV、LUV、LVU、LU為拉普拉斯矩陣L的4 個(gè)部分,LV為l×l階矩陣,與已標(biāo)記樣本部分對(duì)應(yīng),LU為u×u階矩陣,與未標(biāo)記樣本部分對(duì)應(yīng),LUV為u×l階矩陣,LVU為l×u階矩陣,且=LVU。
類似地,f也可按照已標(biāo)記和未標(biāo)記樣本分為2個(gè)部分:
式中:fV為l維列向量,與已標(biāo)記樣本部分對(duì)應(yīng);fU為u維列向量,與未標(biāo)記樣本部分對(duì)應(yīng)。
正則化函數(shù)存在式(11)對(duì)應(yīng)的關(guān)系。
由于正則化函數(shù)主要是針對(duì)標(biāo)簽中的fU進(jìn)行求解,對(duì)于式(8)中的優(yōu)化問題也是求極值解,因此將式(11)對(duì)fU求偏導(dǎo)并令結(jié)果為0,可得:
綜上,基于調(diào)和函數(shù)半監(jiān)督學(xué)習(xí)的設(shè)備識(shí)別步驟為:
1)所有樣本的特征向量形成鄰接矩陣W;
2)定義已標(biāo)記樣本的調(diào)和函數(shù)值;
3)計(jì)算拉普拉斯矩陣L,根據(jù)式(12)計(jì)算未標(biāo)記樣本的調(diào)和函數(shù)值,以此區(qū)分設(shè)備類型。
本節(jié)使用麻省理工學(xué)院(MIT)發(fā)布的從真實(shí)家庭中收集的數(shù)據(jù)集REDD[20],驗(yàn)證工作主要從REDD_house1 和REDD_house3 數(shù)據(jù)展開,其中有功功率的采樣頻率為1 Hz。為了測試模體挖掘和基于調(diào)和函數(shù)的半監(jiān)督學(xué)習(xí)算法的性能,從2 個(gè)方面進(jìn)行驗(yàn)證:保持所提方法中其他部分不變,將所提方法中模體挖掘分別替換為文獻(xiàn)[6-7]中事件匹配法進(jìn)行對(duì)比;保持所提方法中其他部分不變,將所提方法中基于調(diào)和函數(shù)的半監(jiān)督學(xué)習(xí)算法分別替換為監(jiān)督類和無監(jiān)督類算法進(jìn)行對(duì)比。
負(fù)荷識(shí)別過程中,樣本處理過程為:
1)對(duì)每臺(tái)設(shè)備均以5%的已標(biāo)記樣本作為間隔進(jìn)行7 組測試,其中,每組中正負(fù)樣本比例和已標(biāo)記樣本比例均相同;
2)為了保證測試結(jié)果的準(zhǔn)確性,每組測試反復(fù)隨機(jī)選擇已標(biāo)記樣本計(jì)算10次;
3)將10次測試結(jié)果的平均值作為最終的結(jié)果。
本節(jié)利用式(13)中綜合評(píng)價(jià)指標(biāo)識(shí)別準(zhǔn)確度F1對(duì)分類精確度進(jìn)行評(píng)價(jià)。F1的值越高,說明分析越準(zhǔn)確。
式中:p為預(yù)測為本類的樣本中正確的比例;r為本類樣本中預(yù)測正確的比例;Tp為樣本類別預(yù)測正確的個(gè)數(shù);Fp為將其他類樣本預(yù)測為本類樣本的個(gè)數(shù);Tn為將本類的樣本預(yù)測為其他類樣本的個(gè)數(shù)。
實(shí)驗(yàn)結(jié)果如圖9 以及附錄A 圖A3、圖A4 所示。在圖9 的REDD_house1 中,烤箱、微波爐、熱水器和熨斗運(yùn)行時(shí)的功率需求非常接近,文獻(xiàn)[6]方法對(duì)這些設(shè)備僅進(jìn)行隨機(jī)匹配,非常容易出現(xiàn)錯(cuò)誤,文獻(xiàn)[7]方法在時(shí)間上進(jìn)行就近匹配,僅部分情況能夠匹配正確,而本文模體挖掘在匹配時(shí)考慮了所有的可能性,采用本文所提方法得到的結(jié)果遠(yuǎn)大于其他方法。在圖A3 的REDD_house1 中,臺(tái)燈是多狀態(tài)設(shè)備,在重疊設(shè)備序列中難以進(jìn)行匹配,并且所有的特征樣本在訓(xùn)練時(shí)集中在同一個(gè)圖中,采用文獻(xiàn)[6-7]方法時(shí)無效特征向量太多,會(huì)進(jìn)一步增大識(shí)別難度,導(dǎo)致其他類別設(shè)備的識(shí)別準(zhǔn)確度也略低于本文所提方法。同樣地,在圖A4 的REDD_house3 中,電視機(jī)與冰箱以及微波爐與熱水器運(yùn)行時(shí)的功率需求非常接近,且臥室燈和廚房燈是多狀態(tài)設(shè)備,因此文獻(xiàn)[6-7]方法對(duì)這幾類設(shè)備的識(shí)別準(zhǔn)確度也遠(yuǎn)低于本文所提方法。
圖9 在REDD_house1中3種方法的對(duì)比結(jié)果Fig.9 Comparison results of three methods in REDD_house1
本節(jié)將負(fù)荷識(shí)別的基于調(diào)和函數(shù)的半監(jiān)督學(xué)習(xí)算法分別與監(jiān)督類算法中的反向傳播BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)和k最鄰近kNN(k-Nearest Neighbor)法[15]以及無監(jiān)督類算法中的基于信息熵的模糊聚類算法[14]進(jìn)行對(duì)比。
1)與監(jiān)督類算法的對(duì)比。
監(jiān)督類算法與半監(jiān)督類算法均需要部分已標(biāo)記樣本,樣本處理及實(shí)驗(yàn)過程與5.1節(jié)相同。對(duì)比結(jié)果如圖10和附錄A 圖A5、圖A6所示。可以看出:隨著標(biāo)記率的提高,3 種算法的識(shí)別準(zhǔn)確度均逐漸升高;在樣本比例較低時(shí),基于調(diào)和函數(shù)的半監(jiān)督學(xué)習(xí)算法的識(shí)別準(zhǔn)確度最高,BP 神經(jīng)網(wǎng)絡(luò)和kNN 的識(shí)別準(zhǔn)確度較低;在標(biāo)記率為35%及以上時(shí),3種算法對(duì)部分設(shè)備的識(shí)別準(zhǔn)確度較接近;在標(biāo)記率為40%及以下時(shí),基于調(diào)和函數(shù)的半監(jiān)督學(xué)習(xí)算法對(duì)部分設(shè)備的識(shí)別準(zhǔn)確度始終高于另外2 種算法,這說明本文所提方法的準(zhǔn)確度與可推廣度更高。
圖10 在REDD_house1中3種算法的對(duì)比結(jié)果Fig.10 Comparison results of three algorithms in REDD_house1
2)與無監(jiān)督類算法的對(duì)比。
無監(jiān)督類算法理論上不依賴于已標(biāo)記樣本,但是在負(fù)荷分類結(jié)束后仍需要利用部分信息判斷所劃分的負(fù)荷屬于哪一類,因此本節(jié)將少量的已標(biāo)記樣本用于識(shí)別,并與同樣數(shù)量樣本識(shí)別的半監(jiān)督類算法進(jìn)行對(duì)比。圖11 和附錄A 圖A7 給出了在10%的已標(biāo)記樣本下2 種算法的對(duì)比結(jié)果,圖中設(shè)備編號(hào)與名稱的對(duì)應(yīng)關(guān)系見附錄A 表A1??梢钥闯觯瑢?duì)大部分設(shè)備而言,基于調(diào)和函數(shù)的半監(jiān)督學(xué)習(xí)算法在較少已標(biāo)記樣本的情況下比基于信息熵的模糊聚類算法的準(zhǔn)確度高。
圖11 在REDD_house1中2種算法的對(duì)比結(jié)果Fig.11 Comparison results of two algorithms in REDD_house1
減少對(duì)人工成本的依賴,是NILM 方法推廣應(yīng)用的關(guān)鍵。本文從實(shí)用性角度出發(fā),基于低頻采樣數(shù)據(jù),提出一種基于模體挖掘與調(diào)和函數(shù)半監(jiān)督學(xué)習(xí)的NILM 方法。利用設(shè)備運(yùn)行的基本約束與事件發(fā)生的時(shí)間邏輯,確定唯一匹配的設(shè)備運(yùn)行窗并建立設(shè)備特征庫,對(duì)不能唯一確定的匹配事件,以模體挖掘法分析所有的可能性。根據(jù)不同類型設(shè)備開啟過程與穩(wěn)定運(yùn)行時(shí)的差異,采用累積和頻數(shù)分布等統(tǒng)計(jì)方法提取出能反映設(shè)備特性的特征量,并通過構(gòu)建設(shè)備運(yùn)行窗的特征向量,利用基于調(diào)和函數(shù)的半監(jiān)督學(xué)習(xí)算法對(duì)設(shè)備類型進(jìn)行識(shí)別。從事件匹配和設(shè)備識(shí)別的角度,將本文所提方法與其他NILM方法進(jìn)行對(duì)比,算例分析結(jié)果表明:相比于事件匹配法,本文模體挖掘能夠?qū)β氏嘟脑O(shè)備和多狀態(tài)設(shè)備進(jìn)行準(zhǔn)確識(shí)別;在負(fù)荷識(shí)別方面,在準(zhǔn)確度需求相同時(shí),基于調(diào)和函數(shù)的半監(jiān)督學(xué)習(xí)算法比有監(jiān)督類算法所需樣本標(biāo)記率低,在低標(biāo)記率時(shí)比無監(jiān)督和有監(jiān)督類算法的準(zhǔn)確度高。因此,算例測試證明了本文所提方法具有更高的準(zhǔn)確度和可推廣度。
附錄見本刊網(wǎng)絡(luò)版(http://www.epae.cn)。