基于模體挖掘與調(diào)和函數(shù)半監(jiān)督學(xué)習(xí)的非侵入式負(fù)荷監(jiān)測

2022-07-20 01:44周勇軍吳元香董智華胡譽(yù)蓉肖先勇

電力自動(dòng)化設(shè)備 2022年7期

周勇軍，吳元香，董智華，胡譽(yù)蓉，肖先勇，張姝

（1. 國網(wǎng)西藏電力有限公司拉薩供電公司，西藏拉薩 850010；2. 四川大學(xué)電氣工程學(xué)院，四川成都 610065；3. 國網(wǎng)西藏電力有限公司，西藏拉薩 850000）

0 引言

在用戶與電網(wǎng)的雙向互動(dòng)服務(wù)模式［1］中，對(duì)用戶側(cè)設(shè)備用電情況的分類計(jì)量是一項(xiàng)基礎(chǔ)工作［2］，其中非侵入式負(fù)荷監(jiān)測NILM（Non-Intrusive Load Monitoring）是所采用的一種典型方法，該方法是指利用用戶供電總線處的數(shù)據(jù)分析出詳細(xì)的設(shè)備使用狀態(tài)等信息。這些信息可以幫助用戶通過更換節(jié)能電器、調(diào)整電器參數(shù)、錯(cuò)峰用電等方式來減少電費(fèi)。用戶也可將這些信息共享給電力企業(yè)，以獲取更多的增值服務(wù)。通過NILM 方法，電力企業(yè)能更加詳細(xì)地掌握用戶的用能信息，科學(xué)地制定區(qū)域電力系統(tǒng)的發(fā)展規(guī)劃與供電計(jì)劃［3］。

現(xiàn)有關(guān)于NILM 方法的研究，大多需依靠對(duì)單臺(tái)設(shè)備的單獨(dú)測量來建立負(fù)荷特征庫進(jìn)行模式識(shí)別，但特征庫是侵入式收集的，會(huì)影響用戶正常的生產(chǎn)生活，因此需要一種可以非侵入式收集、提取和存檔任意用戶每臺(tái)設(shè)備唯一特征向量的收集方法［4］。隨著用戶設(shè)備類型與數(shù)量的增加，具有相近運(yùn)行特征的設(shè)備也逐漸增多，當(dāng)這類設(shè)備交叉投切時(shí)，準(zhǔn)確分析設(shè)備運(yùn)行時(shí)間極為困難。文獻(xiàn)［5］通過大量的算例驗(yàn)證了基于設(shè)備運(yùn)行窗的NILM 方法準(zhǔn)確率更高，但其沒有對(duì)設(shè)備窗的選定進(jìn)行說明。文獻(xiàn)［4］根據(jù)歷史標(biāo)記事件數(shù)據(jù)、相位、設(shè)備可能的運(yùn)行時(shí)間段等信息以及聚類算法確定設(shè)備的運(yùn)行窗，在一定程度上提升了分析精度，但輔助信息過多且實(shí)時(shí)性不足。文獻(xiàn)［6-7］分別通過二分圖模型與迭代運(yùn)算進(jìn)行事件匹配，但均未考慮多狀態(tài)和相近功率的設(shè)備。

負(fù)荷特征量是用來區(qū)分設(shè)備類型或運(yùn)行狀態(tài)的重要標(biāo)簽，主要包括設(shè)備運(yùn)行時(shí)的穩(wěn)態(tài)特征和狀態(tài)轉(zhuǎn)換時(shí)的暫態(tài)特征。其中，穩(wěn)態(tài)特征包括功率需求、諧波特性、電壓-電流軌跡、電壓和電流的波形參數(shù)等。暫態(tài)特征包括瞬態(tài)功率、諧波和電壓波形參數(shù)等［8］。但波形參數(shù)與諧波分析都需要較高的采樣頻率，對(duì)配置的測量設(shè)備要求較高，這也會(huì)導(dǎo)致存儲(chǔ)與分析成本的增加，因此，有必要提取分析更為實(shí)用的負(fù)荷特征量，以滿足NILM方法推廣應(yīng)用的需求。

最經(jīng)典的負(fù)荷識(shí)別方法是以單臺(tái)設(shè)備的特征向量為對(duì)象進(jìn)行模板匹配［9］，并根據(jù)與期望值的偏差情況進(jìn)行判定。隨著對(duì)準(zhǔn)確度需求的提升，基于判別函數(shù)的分類法被用于負(fù)荷識(shí)別中，包括基于線性函數(shù)的支持向量機(jī)［10］、基于非線性函數(shù)的神經(jīng)網(wǎng)絡(luò)［11］以及基于概率函數(shù)的貝葉斯［12］分類法。但這些監(jiān)督類方法對(duì)標(biāo)記樣本的數(shù)量需求較高，使得相應(yīng)的NILM 方法在應(yīng)用中面臨成本高昂、實(shí)施繁瑣以及居民舒適度低等問題［13］。如何降低該過程的工作量，是NILM 方法廣泛應(yīng)用面臨的關(guān)鍵難題。近年來，模糊聚類［14］與隱馬爾可夫模型［15］等不對(duì)樣本進(jìn)行標(biāo)記的無監(jiān)督類方法也被應(yīng)用到NILM 方法領(lǐng)域，但這類方法存在分類準(zhǔn)確度較低且分析結(jié)果需要人工標(biāo)識(shí)等新問題。

為此，本文從NILM 方法的實(shí)用性角度出發(fā)，提出一種基于模體挖掘與調(diào)和函數(shù)半監(jiān)督學(xué)習(xí)的NILM 方法。首先，基于1 Hz 低頻采樣的功率數(shù)據(jù)，利用設(shè)備運(yùn)行的基本約束與事件發(fā)生的先后邏輯，確定唯一匹配的設(shè)備運(yùn)行窗并建立設(shè)備特征庫，對(duì)不能唯一確定的匹配事件，以模體挖掘法分析所有的可能性；然后，根據(jù)不同類型設(shè)備開啟與穩(wěn)定運(yùn)行時(shí)的差異，進(jìn)一步提取設(shè)備運(yùn)行窗中的特征向量，并利用對(duì)標(biāo)記樣本需求少的基于調(diào)和函數(shù)的半監(jiān)督學(xué)習(xí)算法對(duì)設(shè)備類型和運(yùn)行狀態(tài)進(jìn)行識(shí)別；最后，基于參考能量分解數(shù)據(jù)集REDD（Reference Energy Disaggregation Data set），分別從事件匹配和設(shè)備識(shí)別的角度與其他NILM 方法進(jìn)行對(duì)比，驗(yàn)證本文所提方法的優(yōu)越性。

1 基于模體挖掘與調(diào)和函數(shù)半監(jiān)督學(xué)習(xí)的NILM方法架構(gòu)

本文所提基于模體挖掘與調(diào)和函數(shù)半監(jiān)督學(xué)習(xí)的NILM 方法是根據(jù)設(shè)備投切時(shí)在用戶總功率曲線上產(chǎn)生的階躍量，利用完整的設(shè)備運(yùn)行基本約束、事件發(fā)生的先后邏輯與模體挖掘，對(duì)所有可能的確定設(shè)備的運(yùn)行過程進(jìn)行劃分，并在設(shè)備運(yùn)行窗中利用不同類型的設(shè)備在開啟瞬態(tài)與穩(wěn)定運(yùn)行時(shí)的波動(dòng)差異等特征量對(duì)各類型設(shè)備進(jìn)行識(shí)別的方法。該方法的具體實(shí)現(xiàn)流程如圖1 所示。其中，基于滑動(dòng)窗的雙邊累積和事件檢測方法［16］檢測設(shè)備投切與狀態(tài)變化的時(shí)刻ti與對(duì)應(yīng)的功率階躍量ΔPi，判斷功率階躍量的閾值η=40 W。

圖1 本文所提方法基本流程Fig.1 Basic process of proposed method

2 基于時(shí)間序列與模體挖掘的設(shè)備運(yùn)行窗劃分

從功率曲線的角度，用戶設(shè)備主要有3 種典型運(yùn)行過程：單狀態(tài)設(shè)備在開關(guān)時(shí)具有相近的功率階躍量；多狀態(tài)設(shè)備在運(yùn)行過程中會(huì)出現(xiàn)多次不同狀態(tài)間功率的需求變換，如洗衣機(jī)、烤箱等；通常狀態(tài)變化的設(shè)備在開關(guān)時(shí)的功率變化量不同，在運(yùn)行過程中設(shè)備的功率需求不斷變化，如變頻空調(diào)。

2.1 基于時(shí)間序列的設(shè)備運(yùn)行窗識(shí)別

設(shè)備運(yùn)行窗是指設(shè)備從不工作的初始狀態(tài)到被開啟運(yùn)行，再到最后被關(guān)閉重新回到初始狀態(tài)的數(shù)據(jù)段。根據(jù)定義可知設(shè)備運(yùn)行的基本約束為：設(shè)備運(yùn)行窗的有功功率變化量總和為0；設(shè)備在任何狀態(tài)都不可能以負(fù)有功功率需求運(yùn)行；設(shè)備在關(guān)閉前一定被打開，這被稱為事件發(fā)生的時(shí)間邏輯，即當(dāng)檢測到一個(gè)(ΔPi＜0，ti)的事件時(shí)，一定有某一功率階躍量ΔPx＞0且ΔPx≈|ΔPi|（單狀態(tài)設(shè)備）或ΔPx＞0（多狀態(tài)設(shè)備）發(fā)生在ti時(shí)刻之前?；炯s束對(duì)應(yīng)的單狀態(tài)和多狀態(tài)設(shè)備的匹配條件分別如式（1）和式（2）所示。

式中：ε為判斷匹配的閾值，其值約為10 W。

設(shè)備運(yùn)行窗的確定步驟如下。

1）當(dāng)檢測出用戶總功率曲線上的所有階躍量后，在時(shí)間軸上形成一系列以階躍量ΔPi為符號(hào)的事件。

2）讀取起始有功功率P0，將未匹配的功率階躍事件暫時(shí)記錄于式（3）所示待匹配狀態(tài)Pw中，待匹配狀態(tài)功率總和始終大于0，且分析數(shù)據(jù)段的第一個(gè)階躍量應(yīng)為正，若為負(fù)，則說明某設(shè)備的開啟事件不在分析數(shù)據(jù)段內(nèi)，不能進(jìn)行運(yùn)行窗匹配。

3）當(dāng)檢測到ΔPi＜0 時(shí)，設(shè)置匹配標(biāo)識(shí)n=0，依次假設(shè)設(shè)備類型為單狀態(tài)、兩狀態(tài)、三狀態(tài)等，將ΔPi如圖2 所示向前匹配，判斷是否滿足基本約束式（1）或式（2）。每匹配到1 次，n值加1。當(dāng)ΔPi與此前的階躍量全部匹配后，若n=1，對(duì)于單狀態(tài)設(shè)備，則說明在此期間沒有發(fā)生功率需求相近的設(shè)備同時(shí)投入運(yùn)行的情況，轉(zhuǎn)至步驟6），而對(duì)于多狀態(tài)設(shè)備，則需要進(jìn)一步分析，轉(zhuǎn)至步驟4）；若n≠1，則發(fā)生了功率需求相近設(shè)備相繼開啟或者已經(jīng)開啟的某單狀態(tài)設(shè)備與某多狀態(tài)設(shè)備的狀態(tài)改變量相近的情況，需等待下一個(gè)ΔPi＜0的事件，轉(zhuǎn)至步驟3）。

圖2 各狀態(tài)設(shè)備匹配Fig.2 Matching of each state device

4）當(dāng)功率匹配滿足多狀態(tài)設(shè)備約束式（2）時(shí)，有可能出現(xiàn)如圖3所示的3種情況，圖中數(shù)據(jù)單位均為W。情況1 下不同狀態(tài)對(duì)應(yīng)的階躍量絕對(duì)值不同，在當(dāng)前階段可以唯一確定單個(gè)多狀態(tài)設(shè)備類型，轉(zhuǎn)至步驟6）。而情況2 和3 下除了滿足式（2）外，還存在多個(gè)單狀態(tài)設(shè)備以及某多狀態(tài)設(shè)備與某狀態(tài)變化量相近的單狀態(tài)設(shè)備重疊的可能性，設(shè)備所屬類型不能唯一確定，需進(jìn)行進(jìn)一步分析，因此將情況2 和3暫時(shí)記錄于待匹配事件序列式（3）中。

圖3 累加和為0的狀態(tài)窗情況Fig.3 Condition of state window when cumulative sum is zero

5）檢測Pw是否小于0：若是，則說明發(fā)生了某長時(shí)間運(yùn)行設(shè)備關(guān)閉的事件，且該設(shè)備開啟事件發(fā)生的時(shí)間早于分析數(shù)據(jù)段對(duì)應(yīng)的時(shí)間，此時(shí)應(yīng)調(diào)整式（3）中P0與階躍量的關(guān)系；否則，返回步驟3）。

6）根據(jù)2.3節(jié)步驟輸出匹配的設(shè)備運(yùn)行窗。

根據(jù)上述步驟可以唯一確定一部分設(shè)備運(yùn)行窗，然后將已確定的設(shè)備運(yùn)行窗從總線數(shù)據(jù)上移除，以便于分析其他設(shè)備運(yùn)行窗。

2.2 基于模體挖掘的設(shè)備運(yùn)行窗劃分

模體挖掘［17］是根據(jù)數(shù)據(jù)挖掘的思想，在時(shí)間序列中尋找重復(fù)出現(xiàn)的相似片段。數(shù)據(jù)挖掘以序列符號(hào)化的形式進(jìn)行，即在分析運(yùn)行窗前將監(jiān)測數(shù)據(jù)處理為不同時(shí)刻下的功率階躍量信息。一組能夠滿足設(shè)備運(yùn)行窗基本約束的功率階躍量為一個(gè)模體，模體挖掘即是在一組符號(hào)化信息中挖掘出重復(fù)出現(xiàn)的相似片段模體，因此，確定每類設(shè)備的第1 個(gè)模體是很關(guān)鍵的。

1）在所研究的待匹配事件序列式（3）中，按照時(shí)間順序?qū)Ζi＞0的事件依次以單狀態(tài)設(shè)備或多狀態(tài)設(shè)備為假設(shè)，以設(shè)備運(yùn)行窗基本約束為判定依據(jù)，確定第1個(gè)模體。

2）每個(gè)模體一一向后對(duì)應(yīng)，挖掘監(jiān)測數(shù)據(jù)中所有可能的設(shè)備運(yùn)行窗。

3）執(zhí)行上述步驟，直到分析數(shù)據(jù)的最后一個(gè)階躍量。

2.3 運(yùn)行窗數(shù)據(jù)提取

基于上述分析，監(jiān)測到的所有設(shè)備狀態(tài)都被劃分，一部分是確定的設(shè)備運(yùn)行窗，另一部分是可能的設(shè)備運(yùn)行窗。確定的設(shè)備運(yùn)行窗將作為已標(biāo)記樣本，用于辨識(shí)可能的設(shè)備運(yùn)行窗是否屬于某類設(shè)備，因此需要從分析結(jié)果中進(jìn)一步提取運(yùn)行窗數(shù)據(jù)。

以單狀態(tài)設(shè)備為例，當(dāng)事件匹配后，設(shè)備運(yùn)行窗中的數(shù)據(jù)提取過程如下。

1）檢查在時(shí)間軸上ΔPi與ΔPx事件之間是否有其他設(shè)備事件，若沒有，則認(rèn)為該設(shè)備在運(yùn)行時(shí)無其他設(shè)備交叉重疊開啟，該設(shè)備運(yùn)行窗的數(shù)據(jù)窗口?。╰x，ti）之間的數(shù)據(jù)與tx前一段平穩(wěn)區(qū)段平均值Pav的差值，如圖4 所示，圖中，Aon和Aoff分別為設(shè)備A 開和關(guān)的標(biāo)識(shí)。

圖4 情況1下數(shù)據(jù)窗處理示意圖Fig.4 Schematic diagram of data window processing under Case 1

2）若在時(shí)間軸上ΔPx與ΔPi事件之間有其他設(shè)備事件，則除了取差值，還需要將其他設(shè)備事件從該數(shù)據(jù)窗口中移除。考慮到設(shè)備重疊運(yùn)行時(shí)大幅度波動(dòng)的設(shè)備會(huì)覆蓋小幅度波動(dòng)的設(shè)備，影響本文所提的設(shè)備運(yùn)行時(shí)穩(wěn)定波動(dòng)幅度特征值，因此在數(shù)據(jù)移除時(shí)，若ΔPx與ΔPi之間是ΔPy＞0 的事件，則將ΔPy到ΔPi之間的數(shù)據(jù)替換為ΔPx到ΔPy之間的數(shù)據(jù)，反之，則將ΔPx到ΔPy之間的數(shù)據(jù)替換為ΔPy到ΔPi之間的數(shù)據(jù)，如圖5 所示，圖中，Bon和Boff分別為設(shè)備B開和關(guān)的標(biāo)識(shí)。

圖5 情況2下數(shù)據(jù)窗處理示意圖Fig.5 Schematic diagram of data window processing under Case 2

3 負(fù)荷特征量的分析與選取

設(shè)備在運(yùn)行過程中受到主要元器件、設(shè)備功能以及人為因素等多方面的影響，將會(huì)產(chǎn)生不同的運(yùn)行特征。在對(duì)1 Hz 頻率采樣的功率數(shù)據(jù)進(jìn)行分析時(shí)，不同類型設(shè)備的表現(xiàn)特征如表1 所示。為表征不同類型設(shè)備在開啟和運(yùn)行狀態(tài)下瞬態(tài)和波動(dòng)情況的差異，本文提出2 個(gè)新的負(fù)荷特征量進(jìn)行負(fù)荷識(shí)別。

表1 不同類型設(shè)備的表現(xiàn)特征Table 1 Performance of different types of equipments

3.1 設(shè)備開啟最大值到穩(wěn)定運(yùn)行點(diǎn)的斜率

圖6給出了2種典型的設(shè)備開啟、穩(wěn)定運(yùn)行直到設(shè)備關(guān)閉的功率曲線，設(shè)備1 為電阻類或受人為活動(dòng)影響類設(shè)備，設(shè)備2 為電機(jī)驅(qū)動(dòng)類或電子饋電類設(shè)備。圖中：Pmax為設(shè)備開啟時(shí)的有功功率最大值；Ps為特征量，表示設(shè)備開啟到開始穩(wěn)定運(yùn)行點(diǎn)的斜率，該變量是考慮不同類型設(shè)備在開啟時(shí)的有功功率需求最大值、穩(wěn)定運(yùn)行值與在過渡時(shí)間段不同而設(shè)定的；Pst為設(shè)備開始穩(wěn)定運(yùn)行點(diǎn)的功率；Pe為設(shè)備最終穩(wěn)定運(yùn)行點(diǎn)的功率。

圖6 2種典型的設(shè)備運(yùn)行窗Fig.6 Two typical equipment operation windows

為計(jì)算Ps，對(duì)圖6（b）運(yùn)行窗中的數(shù)據(jù)進(jìn)行Δt=1 s的功率變化量分析，如圖7所示，圖中最大的功率變化量ΔPmax可直接定位，ΔPmax后第1個(gè)為負(fù)值的變化量對(duì)應(yīng)的有功功率值為Pmax，而最小的功率變化量ΔPmin向前對(duì)應(yīng)的功率值為Pe。

圖7 有功功率變化量示意圖Fig.7 Schematic diagram of active power variation

由圖6（b）可以看出，Pmax到Pst并不是連續(xù)下滑的過程，而是存在間歇性的功率值回升現(xiàn)象，因此根據(jù)累加和的思想判斷Pst的位置。具體計(jì)算步驟如下。

1）設(shè)置閾值β=3，讀取Pmax后的階躍量，置i=1。

2）判斷ΔPi是否為正：若是，則轉(zhuǎn)至步驟3）；否則，令i=i+1，繼續(xù)向前判斷ΔPi的正負(fù)。

3）判斷ΔPi+ΔPi+1+ΔPi+2是否大于β：若是，則認(rèn)為已經(jīng)進(jìn)入穩(wěn)定運(yùn)行區(qū)段，輸出Pst對(duì)應(yīng)的時(shí)刻點(diǎn)；否則，認(rèn)為仍處于過渡過程，令i=i+1，返回步驟2）。

圖6（b）的設(shè)備運(yùn)行窗連續(xù)3個(gè)變化量相加的結(jié)果如附錄A 圖A1 所示。當(dāng)分別確定Pmax和Pst對(duì)應(yīng)的時(shí)刻點(diǎn)t1、t2后，根據(jù)式（4）計(jì)算Ps。

3.2 設(shè)備穩(wěn)定運(yùn)行時(shí)的波動(dòng)幅度

不同類型的設(shè)備在Pst到Pe的功率變化量如附錄A 圖A2所示。由圖可以看出，不同設(shè)備在穩(wěn)態(tài)運(yùn)行時(shí)波動(dòng)幅度不同。設(shè)備穩(wěn)定運(yùn)行時(shí)功率變化量（取自設(shè)備樣本a—d）的頻數(shù)分布直方圖如圖8所示，可以看出，數(shù)據(jù)近似服從正態(tài)分布，因此取90%的置信水平將每個(gè)運(yùn)行窗穩(wěn)態(tài)運(yùn)行時(shí)的波動(dòng)上下限Pf作為設(shè)備的特征量。

圖8 不同設(shè)備功率變化量的頻數(shù)分布直方圖Fig.8 Frequency distribution histogram of power variation of different equipments

3.3 特征向量的構(gòu)建

每臺(tái)設(shè)備運(yùn)行窗對(duì)應(yīng)一個(gè)特征向量T=［PmaxPsPfPd］，其中，Pd為Pst到Pe之間設(shè)備穩(wěn)定運(yùn)行時(shí)的功率需求。

4 基于調(diào)和函數(shù)半監(jiān)督學(xué)習(xí)的設(shè)備類型識(shí)別

本文以基于調(diào)和函數(shù)的半監(jiān)督學(xué)習(xí)算法進(jìn)行運(yùn)行窗所屬設(shè)備類型的辨識(shí)。該算法的主要思想是在學(xué)習(xí)訓(xùn)練過程中綜合利用已標(biāo)記和未標(biāo)記樣本，從未標(biāo)記樣本中提取有效的信息來提高學(xué)習(xí)的性能［18］。該算法在所構(gòu)建的樣本圖G上建立連續(xù)預(yù)測函數(shù)的分布模型，充分考慮樣例的分類概率，解決了傳統(tǒng)離散預(yù)測的圖割法對(duì)相鄰類樣本誤判的問題［19］。此外，該算法的基本思想在后續(xù)流形正則化方法的開發(fā)中被沿用，是準(zhǔn)確性與實(shí)用性兼?zhèn)涞囊活惏氡O(jiān)督學(xué)習(xí)算法。

將全部樣本集X（包括已標(biāo)記樣本集XV和未標(biāo)記樣本集XU）構(gòu)建在包含N個(gè)點(diǎn)和E條邊的無向圖G=（N，E）中，圖G中每個(gè)點(diǎn)表示一個(gè)樣本。X共包含N個(gè)樣本，其中XV的樣本數(shù)為l，XU的樣本數(shù)為u，且N=l+u。X中樣本xi的特征向量為T，當(dāng)xi為已標(biāo)記樣本時(shí)，其標(biāo)記值為yi，所有已標(biāo)記樣本的標(biāo)記值構(gòu)成集合Y。圖G中每條邊的權(quán)重為wij，表示樣本xi和xj之間的相似程度，所有權(quán)重構(gòu)成矩陣W。相似程度一般是通過距離進(jìn)行判定的，本文用帶寬為σ的高斯核函數(shù)表示樣本特征量間的距離。

對(duì)于已標(biāo)記樣本，調(diào)和函數(shù)值與標(biāo)記值對(duì)應(yīng)；對(duì)于未標(biāo)記樣本，調(diào)和函數(shù)值滿足權(quán)重平均原則。設(shè)調(diào)和函數(shù)為f(x)，則：

設(shè)計(jì)使目標(biāo)函數(shù)值最小的標(biāo)記預(yù)測函數(shù)f(x)，對(duì)于調(diào)和函數(shù)而言，它是優(yōu)化問題式（8）的解。

式中：f(x)∈R 表示調(diào)和函數(shù)值屬于實(shí)數(shù)域，具有閉合解。式（8）中第1 項(xiàng)為帶無窮大加權(quán)的損失函數(shù)，用于保證已標(biāo)記樣本的值在計(jì)算過程中保持不變，第2 項(xiàng)為正則項(xiàng)Ω(f)，用于保證預(yù)測函數(shù)對(duì)樣本數(shù)據(jù)點(diǎn)標(biāo)記值的平滑性，使得鄰近樣本的預(yù)測標(biāo)記相似。

設(shè)對(duì)角矩陣D=(Dij)N×N，其中，i≠j時(shí)，Dij=0，i=j時(shí)，Dij=∑wij。對(duì)應(yīng)圖G的拉普拉斯矩陣L=D-W，令f=[f(x1)f(x2) …f(xl+u)]T。在圖G中，數(shù)據(jù)點(diǎn)被劃分為2 個(gè)獨(dú)立的分別標(biāo)記為正和負(fù)的數(shù)據(jù)組，而分割這2 個(gè)獨(dú)立數(shù)據(jù)組的邊可以表示為正則化函數(shù)Ω(f)=fTL f。

拉普拉斯矩陣L可以劃分為4個(gè)部分：

式中：L為（l+u）×（l+u）階矩陣；LV、LUV、LVU、LU為拉普拉斯矩陣L的4 個(gè)部分，LV為l×l階矩陣，與已標(biāo)記樣本部分對(duì)應(yīng)，LU為u×u階矩陣，與未標(biāo)記樣本部分對(duì)應(yīng)，LUV為u×l階矩陣，LVU為l×u階矩陣，且=LVU。

類似地，f也可按照已標(biāo)記和未標(biāo)記樣本分為2個(gè)部分：

式中：fV為l維列向量，與已標(biāo)記樣本部分對(duì)應(yīng)；fU為u維列向量，與未標(biāo)記樣本部分對(duì)應(yīng)。

正則化函數(shù)存在式（11）對(duì)應(yīng)的關(guān)系。

由于正則化函數(shù)主要是針對(duì)標(biāo)簽中的fU進(jìn)行求解，對(duì)于式（8）中的優(yōu)化問題也是求極值解，因此將式（11）對(duì)fU求偏導(dǎo)并令結(jié)果為0，可得：

綜上，基于調(diào)和函數(shù)半監(jiān)督學(xué)習(xí)的設(shè)備識(shí)別步驟為：

1）所有樣本的特征向量形成鄰接矩陣W；

2）定義已標(biāo)記樣本的調(diào)和函數(shù)值；

3）計(jì)算拉普拉斯矩陣L，根據(jù)式（12）計(jì)算未標(biāo)記樣本的調(diào)和函數(shù)值，以此區(qū)分設(shè)備類型。

5 算例驗(yàn)證

本節(jié)使用麻省理工學(xué)院（MIT）發(fā)布的從真實(shí)家庭中收集的數(shù)據(jù)集REDD［20］，驗(yàn)證工作主要從REDD_house1 和REDD_house3 數(shù)據(jù)展開，其中有功功率的采樣頻率為1 Hz。為了測試模體挖掘和基于調(diào)和函數(shù)的半監(jiān)督學(xué)習(xí)算法的性能，從2 個(gè)方面進(jìn)行驗(yàn)證：保持所提方法中其他部分不變，將所提方法中模體挖掘分別替換為文獻(xiàn)［6-7］中事件匹配法進(jìn)行對(duì)比；保持所提方法中其他部分不變，將所提方法中基于調(diào)和函數(shù)的半監(jiān)督學(xué)習(xí)算法分別替換為監(jiān)督類和無監(jiān)督類算法進(jìn)行對(duì)比。

5.1 模體挖掘驗(yàn)證

負(fù)荷識(shí)別過程中，樣本處理過程為：

1）對(duì)每臺(tái)設(shè)備均以5%的已標(biāo)記樣本作為間隔進(jìn)行7 組測試，其中，每組中正負(fù)樣本比例和已標(biāo)記樣本比例均相同；

2）為了保證測試結(jié)果的準(zhǔn)確性，每組測試反復(fù)隨機(jī)選擇已標(biāo)記樣本計(jì)算10次；

3）將10次測試結(jié)果的平均值作為最終的結(jié)果。

本節(jié)利用式（13）中綜合評(píng)價(jià)指標(biāo)識(shí)別準(zhǔn)確度F1對(duì)分類精確度進(jìn)行評(píng)價(jià)。F1的值越高，說明分析越準(zhǔn)確。

式中：p為預(yù)測為本類的樣本中正確的比例；r為本類樣本中預(yù)測正確的比例；Tp為樣本類別預(yù)測正確的個(gè)數(shù)；Fp為將其他類樣本預(yù)測為本類樣本的個(gè)數(shù)；Tn為將本類的樣本預(yù)測為其他類樣本的個(gè)數(shù)。

實(shí)驗(yàn)結(jié)果如圖9 以及附錄A 圖A3、圖A4 所示。在圖9 的REDD_house1 中，烤箱、微波爐、熱水器和熨斗運(yùn)行時(shí)的功率需求非常接近，文獻(xiàn)［6］方法對(duì)這些設(shè)備僅進(jìn)行隨機(jī)匹配，非常容易出現(xiàn)錯(cuò)誤，文獻(xiàn)［7］方法在時(shí)間上進(jìn)行就近匹配，僅部分情況能夠匹配正確，而本文模體挖掘在匹配時(shí)考慮了所有的可能性，采用本文所提方法得到的結(jié)果遠(yuǎn)大于其他方法。在圖A3 的REDD_house1 中，臺(tái)燈是多狀態(tài)設(shè)備，在重疊設(shè)備序列中難以進(jìn)行匹配，并且所有的特征樣本在訓(xùn)練時(shí)集中在同一個(gè)圖中，采用文獻(xiàn)［6-7］方法時(shí)無效特征向量太多，會(huì)進(jìn)一步增大識(shí)別難度，導(dǎo)致其他類別設(shè)備的識(shí)別準(zhǔn)確度也略低于本文所提方法。同樣地，在圖A4 的REDD_house3 中，電視機(jī)與冰箱以及微波爐與熱水器運(yùn)行時(shí)的功率需求非常接近，且臥室燈和廚房燈是多狀態(tài)設(shè)備，因此文獻(xiàn)［6-7］方法對(duì)這幾類設(shè)備的識(shí)別準(zhǔn)確度也遠(yuǎn)低于本文所提方法。

圖9 在REDD_house1中3種方法的對(duì)比結(jié)果Fig.9 Comparison results of three methods in REDD_house1

5.2 基于調(diào)和函數(shù)的半監(jiān)督學(xué)習(xí)算法驗(yàn)證

本節(jié)將負(fù)荷識(shí)別的基于調(diào)和函數(shù)的半監(jiān)督學(xué)習(xí)算法分別與監(jiān)督類算法中的反向傳播BP（Back Propagation）神經(jīng)網(wǎng)絡(luò)和k最鄰近kNN（k-Nearest Neighbor）法［15］以及無監(jiān)督類算法中的基于信息熵的模糊聚類算法［14］進(jìn)行對(duì)比。

1）與監(jiān)督類算法的對(duì)比。

監(jiān)督類算法與半監(jiān)督類算法均需要部分已標(biāo)記樣本，樣本處理及實(shí)驗(yàn)過程與5.1節(jié)相同。對(duì)比結(jié)果如圖10和附錄A 圖A5、圖A6所示。可以看出：隨著標(biāo)記率的提高，3 種算法的識(shí)別準(zhǔn)確度均逐漸升高；在樣本比例較低時(shí)，基于調(diào)和函數(shù)的半監(jiān)督學(xué)習(xí)算法的識(shí)別準(zhǔn)確度最高，BP 神經(jīng)網(wǎng)絡(luò)和kNN 的識(shí)別準(zhǔn)確度較低；在標(biāo)記率為35%及以上時(shí)，3種算法對(duì)部分設(shè)備的識(shí)別準(zhǔn)確度較接近；在標(biāo)記率為40%及以下時(shí)，基于調(diào)和函數(shù)的半監(jiān)督學(xué)習(xí)算法對(duì)部分設(shè)備的識(shí)別準(zhǔn)確度始終高于另外2 種算法，這說明本文所提方法的準(zhǔn)確度與可推廣度更高。

圖10 在REDD_house1中3種算法的對(duì)比結(jié)果Fig.10 Comparison results of three algorithms in REDD_house1

2）與無監(jiān)督類算法的對(duì)比。

無監(jiān)督類算法理論上不依賴于已標(biāo)記樣本，但是在負(fù)荷分類結(jié)束后仍需要利用部分信息判斷所劃分的負(fù)荷屬于哪一類，因此本節(jié)將少量的已標(biāo)記樣本用于識(shí)別，并與同樣數(shù)量樣本識(shí)別的半監(jiān)督類算法進(jìn)行對(duì)比。圖11 和附錄A 圖A7 給出了在10%的已標(biāo)記樣本下2 種算法的對(duì)比結(jié)果，圖中設(shè)備編號(hào)與名稱的對(duì)應(yīng)關(guān)系見附錄A 表A1?？梢钥闯觯瑢?duì)大部分設(shè)備而言，基于調(diào)和函數(shù)的半監(jiān)督學(xué)習(xí)算法在較少已標(biāo)記樣本的情況下比基于信息熵的模糊聚類算法的準(zhǔn)確度高。

圖11 在REDD_house1中2種算法的對(duì)比結(jié)果Fig.11 Comparison results of two algorithms in REDD_house1

6 結(jié)論

減少對(duì)人工成本的依賴，是NILM 方法推廣應(yīng)用的關(guān)鍵。本文從實(shí)用性角度出發(fā)，基于低頻采樣數(shù)據(jù)，提出一種基于模體挖掘與調(diào)和函數(shù)半監(jiān)督學(xué)習(xí)的NILM 方法。利用設(shè)備運(yùn)行的基本約束與事件發(fā)生的時(shí)間邏輯，確定唯一匹配的設(shè)備運(yùn)行窗并建立設(shè)備特征庫，對(duì)不能唯一確定的匹配事件，以模體挖掘法分析所有的可能性。根據(jù)不同類型設(shè)備開啟過程與穩(wěn)定運(yùn)行時(shí)的差異，采用累積和頻數(shù)分布等統(tǒng)計(jì)方法提取出能反映設(shè)備特性的特征量，并通過構(gòu)建設(shè)備運(yùn)行窗的特征向量，利用基于調(diào)和函數(shù)的半監(jiān)督學(xué)習(xí)算法對(duì)設(shè)備類型進(jìn)行識(shí)別。從事件匹配和設(shè)備識(shí)別的角度，將本文所提方法與其他NILM方法進(jìn)行對(duì)比，算例分析結(jié)果表明：相比于事件匹配法，本文模體挖掘能夠?qū)β氏嘟脑O(shè)備和多狀態(tài)設(shè)備進(jìn)行準(zhǔn)確識(shí)別；在負(fù)荷識(shí)別方面，在準(zhǔn)確度需求相同時(shí)，基于調(diào)和函數(shù)的半監(jiān)督學(xué)習(xí)算法比有監(jiān)督類算法所需樣本標(biāo)記率低，在低標(biāo)記率時(shí)比無監(jiān)督和有監(jiān)督類算法的準(zhǔn)確度高。因此，算例測試證明了本文所提方法具有更高的準(zhǔn)確度和可推廣度。

附錄見本刊網(wǎng)絡(luò)版（http：//www.epae.cn）。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡