涂 京,周 明,宋旭帆,周光東,李庚銀
(華北電力大學(xué) 新能源電力系統(tǒng)國家重點(diǎn)實(shí)驗(yàn)室,北京 102206)
智能電網(wǎng)發(fā)展帶來的優(yōu)勢之一是電力用戶與電網(wǎng)的友好互動(dòng)[1],即用戶在價(jià)格或激勵(lì)機(jī)制下主動(dòng)調(diào)整自身用電行為,實(shí)現(xiàn)削峰填谷、節(jié)能降耗,同時(shí)降低用戶用電開支。用戶負(fù)荷監(jiān)測是了解用戶用電特性的主要方法,為分析用戶用電行為、調(diào)整用電方式提供依據(jù)和指導(dǎo),是用戶參與電網(wǎng)雙向互動(dòng)的支撐技術(shù)。因此,研究有效的負(fù)荷監(jiān)測方法對了解用戶用電特性、開展智能用電、制定價(jià)格或激勵(lì)政策具有重要的指導(dǎo)意義。
Hart教授于1982年提出了非侵入式負(fù)荷監(jiān)測NILM(Non-Intrusive Load Monitoring)方法[2],通過監(jiān)測用戶端口處的電氣信息,采用數(shù)學(xué)算法根據(jù)用戶總體用電功率分解得到各個(gè)用電設(shè)備的工作狀態(tài),進(jìn)而分析各個(gè)設(shè)備的用電情況。相比于侵入式監(jiān)測,NILM的成本低、安裝維護(hù)簡單,同時(shí)具有較高的準(zhǔn)確度,實(shí)用性強(qiáng),適用于家庭負(fù)荷監(jiān)測等低成本監(jiān)測場景[3],具有廣泛的應(yīng)用前景。
家庭智能電表的普及使得NILM成為國內(nèi)外智能用電研究的熱點(diǎn)之一??傮w而言,NILM算法可以歸納為監(jiān)督學(xué)習(xí)算法和無監(jiān)督學(xué)習(xí)算法。監(jiān)督學(xué)習(xí)算法的識別準(zhǔn)確度較高,應(yīng)用較廣,但用于模型訓(xùn)練的數(shù)據(jù)集需要人工預(yù)先標(biāo)記。無監(jiān)督學(xué)習(xí)算法可以使用無標(biāo)記數(shù)據(jù),但識別準(zhǔn)確度較低,目前在事件檢測和特征提取階段有較多應(yīng)用。在監(jiān)督學(xué)習(xí)算法的研究方面,文獻(xiàn)[4]應(yīng)用了動(dòng)態(tài)模糊C均值聚類和k-近鄰k-NN(k-Nearest Neighbor)識別算法對家庭負(fù)荷進(jìn)行識別,能夠?qū)Φ凸β试O(shè)備實(shí)現(xiàn)90%的識別準(zhǔn)確率,效果較好;文獻(xiàn)[5]采用主成分分析法和Fisher有監(jiān)督判別算法實(shí)現(xiàn)負(fù)荷識別,對運(yùn)行機(jī)理不同的負(fù)荷分類效果較好,對運(yùn)行機(jī)理相同的負(fù)荷進(jìn)行區(qū)分則需要進(jìn)一步探討;文獻(xiàn)[6]采用粒子群優(yōu)化算法優(yōu)化人工神經(jīng)網(wǎng)絡(luò)的訓(xùn)練參數(shù),將構(gòu)建的神經(jīng)網(wǎng)絡(luò)應(yīng)用于家庭負(fù)荷識別,測試結(jié)果表明該方法顯著提高了識別準(zhǔn)確性和計(jì)算效率;文獻(xiàn)[7]利用彈性反向傳播算法訓(xùn)練多層神經(jīng)網(wǎng)絡(luò),通過訓(xùn)練所有可能的設(shè)備組合實(shí)現(xiàn)負(fù)荷分解,但隨著設(shè)備種類增加,輸出神經(jīng)元和訓(xùn)練樣本將呈指數(shù)增長;文獻(xiàn)[8]采用支持向量機(jī)(SVM)對1 Hz的采樣信號進(jìn)行負(fù)荷識別,識別了95%的電熱負(fù)荷,但對小功率電器的識別效果不佳;文獻(xiàn)[9]增加3次諧波作為負(fù)荷特征,采用遺傳算法求解多特征目標(biāo)函數(shù),分解精度較高,但是遺傳算法的求解速度較慢,難以適用于在線分析監(jiān)測;文獻(xiàn)[10]則提出一種基于改進(jìn)雞群算法的負(fù)荷監(jiān)測方法,同樣存在計(jì)算速度較慢的不足。以上文獻(xiàn)基于監(jiān)督學(xué)習(xí)算法實(shí)現(xiàn)了NILM,識別準(zhǔn)確度較高,但需要預(yù)先獲取負(fù)荷樣本以訓(xùn)練模型。在無監(jiān)督學(xué)習(xí)算法的研究方面,文獻(xiàn)[11]提出了基于滑動(dòng)窗雙邊累積和的無監(jiān)督負(fù)荷投切事件檢測算法,采用IEEE 30節(jié)點(diǎn)系統(tǒng)進(jìn)行了仿真測試,表明所提算法能有效檢測負(fù)荷投切事件,但并未對家庭負(fù)荷的投切進(jìn)行單獨(dú)測試;文獻(xiàn)[12]利用均值漂移聚類算法和權(quán)重聚類算法實(shí)現(xiàn)了負(fù)荷特征提取,可用于建立NILM負(fù)荷特征數(shù)據(jù)庫或負(fù)荷狀態(tài)監(jiān)測??傮w而言,無監(jiān)督學(xué)習(xí)算法因使用無標(biāo)記數(shù)據(jù)存在識別精度不高的問題,因此通常應(yīng)用于負(fù)荷投切事件檢測、負(fù)荷特征提取等環(huán)節(jié)。本文著重對基于監(jiān)督學(xué)習(xí)的NILM算法進(jìn)行對比研究。
雖然目前各文獻(xiàn)提出了多種家庭NILM的監(jiān)督學(xué)習(xí)算法,但所提出的算法通常基于不同的實(shí)驗(yàn)環(huán)境,且部分文獻(xiàn)僅僅分析了算法的準(zhǔn)確性,對算法的快速性缺乏研究,彼此之間難以進(jìn)行橫向?qū)Ρ取a槍Υ瞬蛔?,本文建立?種具有代表性的監(jiān)督學(xué)習(xí)分類算法,并對它們進(jìn)行對比研究。首先,在負(fù)荷特征選取上,選用容易獲取的智能電表提供的穩(wěn)態(tài)電流作為特征提取源,采用離散傅里葉變換DFT(Discrete Fourier Transform)對家庭負(fù)荷穩(wěn)態(tài)電流進(jìn)行諧波分解,提取電流的奇次諧波作為負(fù)荷特征;其次,分別建立了多層感知器MLP(Multi-Layer Perce-ptions)神經(jīng)網(wǎng)絡(luò)、k-NN、邏輯回歸LR(Logistic Regression)、SVM這4種分類模型;然后,利用卡內(nèi)基梅隆大學(xué)提供的BLUED數(shù)據(jù)庫[13]對4種分類器進(jìn)行了訓(xùn)練和測試,對比分析了它們在識別精度、訓(xùn)練時(shí)間、識別速度、抗噪性能等方面的表現(xiàn),并對其在NILM中的應(yīng)用效果進(jìn)行了總結(jié)。
負(fù)荷特征作為負(fù)荷識別的主要依據(jù),其對不同類別的設(shè)備應(yīng)具有足夠的區(qū)分能力。早期麻省理工學(xué)院利用設(shè)備投切前/后的有功變化量ΔP、無功變化量ΔQ作為負(fù)荷特征[14],具有獲取簡單、設(shè)備投資小的優(yōu)點(diǎn),但對功率相近的設(shè)備則會發(fā)生誤判。為了提高識別準(zhǔn)確率,在增大采樣頻率的基礎(chǔ)上,電流諧波可作為負(fù)荷分類的有效特征:通常采用傅里葉變換提取諧波系數(shù)。由于諧波特征能夠反映設(shè)備的運(yùn)行特性,而且維數(shù)較高,因此具有較好的負(fù)荷區(qū)分能力。電流諧波特征還可利用其暫態(tài)過程諧波分析提取特征。另外,基于電壓-電流軌跡圖或電壓噪聲的特征提取方法亦有少量應(yīng)用,但電壓噪聲特征由于需要極高的采樣頻率而難以推廣。
本文采用易獲取的負(fù)荷電流作為特征提取源,利用傅里葉變換進(jìn)行負(fù)荷電流諧波分解,取諧波幅值較大的諧波次數(shù)作為負(fù)荷特征,以便獲取較好的區(qū)分能力。對離散采樣的負(fù)荷電流樣本應(yīng)用DFT獲取負(fù)荷特征的方法如式(1)所示。
(1)
其中,i(n)為家用電器周期電流采樣點(diǎn),每周期采樣Nf次,從0標(biāo)記到Nf-1;f為諧波次數(shù),f=0,1,…,Nf-1;X(f)為復(fù)數(shù)形式的DFT的諧波系數(shù)。
將X(f)前乘以歸一化系數(shù)1/Nf以符合傅里葉級數(shù)分析的習(xí)慣,利用歐拉公式將其整理為實(shí)數(shù)計(jì)算表達(dá)式:
(2)
(3)
(4)
其中,af為X′(f)的實(shí)部,bf為X′(f)的虛部,兩者共同作為f次諧波的參數(shù)。
對于DFT而言,電流諧波的幅值隨著諧波次數(shù)的增大而減小。因此,為了減少噪聲對分類的影響,應(yīng)選擇幅值較大的低次諧波作為主要分類特征;另外,可以證明,如果電流波形滿足式(5),即電壓正半周下電流波形與電壓負(fù)半周下電流波形關(guān)于電流軸y=0對稱,則偶次諧波(包含直流分量)為0。
(5)
通常家用電器的電流波形均近似滿足上述要求。以電冰箱為例,圖1和圖2分別為電冰箱在某工作狀態(tài)下的周期電流波形及其直流分量、基波和2~13次諧波的幅值。
圖1 電冰箱在某工作狀態(tài)下的周期電流波形Fig.1 Periodic current waveform of a refrigerator under some working condition
圖2 電流諧波幅值Fig.2 Amplitude of current harmonic
從圖2可以看出,偶次諧波幅值明顯小于奇次諧波幅值,且13次諧波的幅值已經(jīng)很小,更高次諧波的幅值更小且易受噪聲干擾。因此,本文選擇基波和3、5、7、9、11、13次諧波作為負(fù)荷分類的特征。
MLP神經(jīng)網(wǎng)絡(luò)是將單一感知器模型進(jìn)行多層疊加形成的通用神經(jīng)網(wǎng)絡(luò)模型[15],由一個(gè)輸入層、若干隱含層和一個(gè)輸出層組成。MLP神經(jīng)網(wǎng)絡(luò)被證明具有任意逼近連續(xù)函數(shù)的性能[16],作為分類算法可以劃分復(fù)雜的非線性決策邊界。
利用MLP神經(jīng)網(wǎng)絡(luò)進(jìn)行負(fù)荷識別,其輸入節(jié)點(diǎn)數(shù)目與樣本負(fù)荷特征維數(shù)一致,其輸出節(jié)點(diǎn)數(shù)目與所需分類類別數(shù)目一致,所需分類類別由標(biāo)記類別的訓(xùn)練樣本預(yù)先確定。網(wǎng)絡(luò)隱含層層數(shù)及其所含神經(jīng)元的數(shù)目則由網(wǎng)絡(luò)功能的復(fù)雜程度確定,用于負(fù)荷識別的神經(jīng)網(wǎng)絡(luò)通常采用單隱層結(jié)構(gòu),包含4~60個(gè)神經(jīng)元。網(wǎng)絡(luò)的激勵(lì)函數(shù)采用Sigmoid函數(shù),代價(jià)函數(shù)采用正則化的交叉熵代價(jià)函數(shù),訓(xùn)練算法采用反向傳播法計(jì)算網(wǎng)絡(luò)參數(shù)梯度,具體實(shí)現(xiàn)過程見附錄A1。
k-NN算法是一種用于分類的非參數(shù)統(tǒng)計(jì)方法,通過計(jì)算分類對象與其他訓(xùn)練樣本的距離,選出最近的k個(gè)訓(xùn)練樣本,其中樣本數(shù)量最多的類別則作為該分類對象的類別,即分類對象的類別由其最近的k個(gè)鄰居中大多數(shù)鄰居的類別所決定。
k-NN算法的邏輯簡單、清晰,能夠形成復(fù)雜的分類邊界,但對局部訓(xùn)練樣本的構(gòu)成非常敏感,且參數(shù)k需要預(yù)先選定,k的大小在一定程度上影響分類算法的效果。另外,k-NN算法的“多數(shù)表決”機(jī)制會在訓(xùn)練樣本類別分布偏斜時(shí)出現(xiàn)缺陷,樣本數(shù)量較多的類別將大幅影響分類結(jié)果,通常利用距離1/d(d為待識別對象到鄰居的距離)進(jìn)行加權(quán),賦予近處的鄰居較大的權(quán)重以處理樣本分布偏斜。本文采用1/d加權(quán)的k-NN算法作為家用電器負(fù)荷識別的分類模型,并利用遍歷法進(jìn)行樣本識別,具體的計(jì)算實(shí)現(xiàn)過程見附錄A2。
LR作為一種經(jīng)典分類算法被廣泛應(yīng)用于各類分類問題,其采用Sigmoid函數(shù)嵌套線性回歸的形式處理二分類問題。LR在特征空間中應(yīng)用線性超平面將樣本劃分為正類和負(fù)類,并使得樣本分類錯(cuò)誤盡可能小。
LR為二分類的分類器,利用“一對多”[17]策略將其擴(kuò)展為多類別分類器?!耙粚Χ唷辈呗詫γ總€(gè)負(fù)荷類別單獨(dú)建立一個(gè)分類器,該分類器以某一負(fù)荷類別為正類、其他負(fù)荷類別為負(fù)類進(jìn)行訓(xùn)練,對于K個(gè)負(fù)荷類別則訓(xùn)練K個(gè)分類器。對于某個(gè)待分類的負(fù)荷樣本,將其同時(shí)輸入所有分類器進(jìn)行計(jì)算,選擇輸出最大的分類器的負(fù)荷類別作為該樣本的類別。另外,采用正則化的對數(shù)似然函數(shù)作為分類器的代價(jià)函數(shù),訓(xùn)練算法采用共軛梯度法。正則化的對數(shù)似然函數(shù)如式(6)所示。
(6)
SVM是一種基于監(jiān)督學(xué)習(xí)的大間距分類器,其核心理念為在特征空間中尋找盡可能大的分類間隔以有效分隔正類和負(fù)類。分類間隔通常由正、負(fù)類邊界若干向量支撐形成,因而稱之為SVM。
SVM作為二分類的分類器,其對于多分類問題同樣采用“一對多”策略,對每個(gè)負(fù)荷類別單獨(dú)訓(xùn)練分類器。SVM應(yīng)用核函數(shù)可以適用于非線性分類問題,本文采用可生成非線性分類邊界的高斯核函數(shù)SVM分類器,其代價(jià)函數(shù)為軟間隔最大化代價(jià)函數(shù),具體實(shí)現(xiàn)過程參見附錄A4。
4種監(jiān)督學(xué)習(xí)算法中,MLP神經(jīng)網(wǎng)絡(luò)、k-NN算法和基于核函數(shù)的SVM是非線性負(fù)荷分類器,能夠根據(jù)負(fù)荷特征進(jìn)行復(fù)雜的分類邊界劃分,理論上具有較高的識別準(zhǔn)確率;而LR為線性分類器,僅能在高維負(fù)荷特征空間中使用線性超平面進(jìn)行負(fù)荷分類,對非線性的特征邊界則易出現(xiàn)錯(cuò)誤??紤]到不同類別負(fù)荷亦可能具有相近的負(fù)荷特征,因此,理論上具有非線性分類能力的MLP神經(jīng)網(wǎng)絡(luò)、k-NN算法和SVM應(yīng)當(dāng)具有更好的負(fù)荷識別準(zhǔn)確率。
從模型建立復(fù)雜度的角度來看,MLP神經(jīng)網(wǎng)絡(luò)的模型結(jié)構(gòu)最為復(fù)雜,參數(shù)數(shù)量最多,因此訓(xùn)練模型所需計(jì)算時(shí)間最長,收斂速度較慢,其訓(xùn)練時(shí)間視規(guī)模不同需要數(shù)分鐘至數(shù)小時(shí)不等。相較而言,LR和SVM由于結(jié)構(gòu)簡單、參數(shù)數(shù)量較少、訓(xùn)練速度較快,通常在秒級時(shí)間即可完成訓(xùn)練。k-NN算法作為一種基于實(shí)例的監(jiān)督學(xué)習(xí)算法,無需事先建立模型,沒有訓(xùn)練過程。
從模型應(yīng)用的角度來看,k-NN算法需要將待識別的負(fù)荷樣本與所有已知的負(fù)荷樣本進(jìn)行對比,然后才能完成負(fù)荷類型識別,因而k-NN算法雖然沒有模型訓(xùn)練過程,但是在NILM的負(fù)荷識別階段卻需要大量的計(jì)算,且計(jì)算時(shí)間隨負(fù)荷樣本的增加而增加。相對而言,MLP神經(jīng)網(wǎng)絡(luò)、LR和SVM都是將待識別的負(fù)荷樣本輸入訓(xùn)練好的模型,進(jìn)行固定的數(shù)學(xué)計(jì)算繼而完成負(fù)荷類型識別,因此負(fù)荷識別速度較快。理論上,MLP神經(jīng)網(wǎng)絡(luò)、LR和SVM在NILM的應(yīng)用中應(yīng)當(dāng)具有較好的實(shí)時(shí)性,而利用k-NN算法進(jìn)行負(fù)荷識別時(shí)需要適當(dāng)?shù)卮_定負(fù)荷樣本的規(guī)模以確保負(fù)荷識別的實(shí)時(shí)性。
本文從識別精度、訓(xùn)練時(shí)間、識別速度和抗噪能力方面對MLP神經(jīng)網(wǎng)絡(luò)、k-NN算法、LR和SVM這4種NILM分類算法進(jìn)行對比分析。首先對4種分類器進(jìn)行訓(xùn)練和測試,對比其在不同電器設(shè)備上的識別準(zhǔn)確率;然后對4種分類器的收斂狀況、訓(xùn)練時(shí)間、識別速度等特性進(jìn)行對比,分析各分類器的訓(xùn)練特點(diǎn);最后對訓(xùn)練樣本和測試樣本添加電流噪聲,對比分析4種分類器在不同噪聲水平下的識別效果。
本文采用卡內(nèi)基梅隆大學(xué)公開的BLUED數(shù)據(jù)庫進(jìn)行仿真測試,該數(shù)據(jù)庫使用12 kHz的采樣頻率,在1個(gè)美國家庭的電力端口處連續(xù)采集了一周的電壓、電流數(shù)據(jù),并標(biāo)記了各個(gè)電器設(shè)備的投切時(shí)刻。以每次投切事件前、后端口處的穩(wěn)態(tài)電流之差作為投切負(fù)荷電流樣本,每次投切事件均提取100個(gè)負(fù)荷電流樣本,并根據(jù)電壓校正電流波形相位。訓(xùn)練數(shù)據(jù)采用580次負(fù)荷投切事件,共計(jì)58 000個(gè)負(fù)荷電流樣本作為訓(xùn)練集,包含了8個(gè)設(shè)備類別(7種常用設(shè)備和1種其他設(shè)備);測試數(shù)據(jù)采用數(shù)據(jù)庫中具有相同設(shè)備類別的另外248次負(fù)荷投切事件,共計(jì)24 800個(gè)負(fù)荷電流樣本作為測試集。
仿真測試軟件平臺使用MATLAB R2010a,硬件平臺使用Intel i5-2410M 2.3 GHz,4 GB RAM電腦,4種分類算法均在該平臺上編程實(shí)現(xiàn),并使用相同的數(shù)據(jù)集進(jìn)行測試,利用相同的計(jì)算環(huán)境從而保證算法性能分析的有效性。
對4種分類器使用相同的訓(xùn)練集和測試集,根據(jù)分類器在測試集中的識別效果對比分析不同分類器的分類精度。表1為MLP神經(jīng)網(wǎng)絡(luò)、k-NN算法、LR和SVM在測試集上的識別準(zhǔn)確率。表中,總體準(zhǔn)確率為測試集中準(zhǔn)確識別的樣本占測試集總樣本的比例。從表1中可以看出,MLP神經(jīng)網(wǎng)絡(luò)、k-NN算法、SVM幾乎能夠?qū)Ω黝愲娖髟O(shè)備進(jìn)行準(zhǔn)確分類,而LR在冰箱、浴室頂燈和未知設(shè)備的識別上出現(xiàn)了較多錯(cuò)誤。這是因?yàn)镸LP神經(jīng)網(wǎng)絡(luò)、k-NN算法、基于高斯核的SVM均是非線性分類器,能夠形成不規(guī)則的負(fù)荷分類邊界,而LR僅能進(jìn)行負(fù)荷的線性分類,對于非線性分類邊界負(fù)荷會出現(xiàn)明顯的分類錯(cuò)誤。因此,從識別精度來看,MLP神經(jīng)網(wǎng)絡(luò)、k-NN算法、SVM明顯優(yōu)于LR,更適用于NILM。
表1 4種分類器的識別準(zhǔn)確率Table 1 Recognition accuracy of four classifiers
采用3.1節(jié)所述訓(xùn)練集對MLP神經(jīng)網(wǎng)絡(luò)和LR進(jìn)行訓(xùn)練,然后進(jìn)行負(fù)荷識別準(zhǔn)確率測試,它們在訓(xùn)練和測試中的識別準(zhǔn)確率與迭代訓(xùn)練次數(shù)的關(guān)系如圖3所示。
圖3 MLP神經(jīng)網(wǎng)絡(luò)和LR的訓(xùn)練和測試過程Fig.3 Training and testing process of MLP neural network and LR
由圖3可見,相比于LR,MLP神經(jīng)網(wǎng)絡(luò)的收斂速度較為緩慢,但最終能獲得較好的識別準(zhǔn)確率;LR能較快收斂于全局最優(yōu)解,但通常其識別準(zhǔn)確率較低。對于k-NN和SVM分類器而言,k-NN分類器是基于實(shí)例的學(xué)習(xí)算法,其對于每個(gè)測試樣本可直接計(jì)算識別樣本所屬類別,不存在訓(xùn)練過程,且識別準(zhǔn)確率較高;SVM分類器的參數(shù)優(yōu)化問題可轉(zhuǎn)化為一個(gè)凸二次規(guī)劃[18],收斂速度較快,其識別準(zhǔn)確率與k-NN分類器相當(dāng)。
表2為4種分類器訓(xùn)練至收斂后的測試情況,可以看出k-NN算法由于其基于實(shí)例學(xué)習(xí)的特殊性,無訓(xùn)練時(shí)間,而SVM和LR的訓(xùn)練速度相對較快,時(shí)間大約在10 s級,MLP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時(shí)間則達(dá)到了分鐘級,訓(xùn)練速度較慢。因而,MLP神經(jīng)網(wǎng)絡(luò)雖然具有較好的識別準(zhǔn)確率,但是其收斂速度慢,訓(xùn)練時(shí)間長,在NILM應(yīng)用中其只能采用離線訓(xùn)練方式,而其他算法可以在NILM裝置中進(jìn)行模型訓(xùn)練,靈活性較好。
表2 4種分類器訓(xùn)練、測試結(jié)果Table 2 Training and testing results of four classifiers
從分類器的識別速度來看,各分類器表現(xiàn)了與訓(xùn)練時(shí)間近乎相反的特性。LR和MLP神經(jīng)網(wǎng)絡(luò)在微秒級時(shí)間即能夠?qū)崿F(xiàn)負(fù)荷識別,SVM則需243.6 μs,而k-NN算法則需要1.89 ms才能識別1個(gè)負(fù)荷電流樣本,識別時(shí)間約為SVM的7.8倍??紤]到工程中NILM裝置的CPU較慢且存在人機(jī)交互、遠(yuǎn)程通信等其他工作模塊,具有較快識別速度的LR和MLP神經(jīng)網(wǎng)絡(luò)將更適用于NILM裝置的在線識別。
另外,分類器由于其訓(xùn)練方式不同,在不同規(guī)模的訓(xùn)練集下其訓(xùn)練時(shí)間差異較大,同時(shí)也會影響分類器對新樣本的識別速度。圖4為4種分類器在5%~100%的訓(xùn)練集樣本(即每次投切事件分別取5~100個(gè)電流樣本)下,各個(gè)分類器訓(xùn)練時(shí)間與訓(xùn)練樣本規(guī)模的關(guān)系。
圖5 分類器單個(gè)負(fù)荷樣本識別時(shí)間與訓(xùn)練樣本規(guī)模的關(guān)系Fig.5 Relationship between recognition time of single load sample and training sample size
圖5為在5%~100%的訓(xùn)練集樣本下,各分類器單個(gè)負(fù)荷樣本識別時(shí)間與訓(xùn)練樣本規(guī)模的關(guān)系。由圖5可以看出,k-NN算法單個(gè)負(fù)荷樣本的識別時(shí)間和訓(xùn)練樣本數(shù)量呈線性關(guān)系,MLP神經(jīng)網(wǎng)絡(luò)和LR單個(gè)負(fù)荷樣本的識別時(shí)間穩(wěn)定不變,與訓(xùn)練樣本數(shù)量無關(guān),SVM單個(gè)負(fù)荷樣本的識別時(shí)間則表現(xiàn)為訓(xùn)練樣本數(shù)量的對數(shù)函數(shù)。一般而言,負(fù)荷訓(xùn)練樣本的數(shù)量越大,模型越精確,負(fù)荷識別效果越好;但隨著訓(xùn)練樣本增加,k-NN算法單個(gè)負(fù)荷樣本的識別時(shí)間線性增大,影響了NILM識別的實(shí)時(shí)性;而MLP神經(jīng)網(wǎng)絡(luò)、LR和SVM單個(gè)負(fù)荷樣本的識別時(shí)間較為穩(wěn)定,且識別速度快,適用于NILM在線負(fù)荷識別。
本節(jié)先在3.1節(jié)所述的訓(xùn)練集和測試集電流樣本信號加入高斯白噪聲,再對4種分類器進(jìn)行訓(xùn)練和測試,以對比分析不同方法的抗噪能力。噪聲強(qiáng)度采用信噪比SNR(Signal-to-Noise Ratio)進(jìn)行衡量,SNR越小,則噪聲相對越強(qiáng)。各個(gè)分類器的識別準(zhǔn)確率與負(fù)荷電流SNR的關(guān)系如圖6所示。
圖6 4種分類器的識別準(zhǔn)確率與SNR的關(guān)系Fig.6 Relationship between recognition accuracy of four classifiers and SNR
由圖6可以看出,隨著SNR逐漸下降、噪聲強(qiáng)度逐漸增大,各分類器的識別準(zhǔn)確率均出現(xiàn)了不同程度的下降。MLP神經(jīng)網(wǎng)絡(luò)、k-NN算法、SVM的識別準(zhǔn)確率從SNR為19 dB時(shí)開始下降,下降過程中MLP神經(jīng)網(wǎng)絡(luò)的識別準(zhǔn)確率略高于k-NN算法和SVM;隨著噪聲強(qiáng)度的增大,LR的識別準(zhǔn)確率也不斷下降,降幅相對較小。在有噪聲的情況下,MLP神經(jīng)網(wǎng)絡(luò)、k-NN算法、 SVM這3種分類器的識別準(zhǔn)確率仍然顯著優(yōu)于LR。
圖7 SVM訓(xùn)練時(shí)間、識別時(shí)間與SNR的關(guān)系Fig.7 Relationship between training time and recognition time of SVM and SNR
從抗噪能力角度分析,SVM在NILM中僅能用于負(fù)荷電流噪聲較低的場合,在高噪聲環(huán)境下SVM的實(shí)時(shí)性將大幅度降低;而MLP神經(jīng)網(wǎng)絡(luò)、LR和k-NN 算法在不同電流噪聲水平下的識別時(shí)間比較穩(wěn)定,且MLP神經(jīng)網(wǎng)絡(luò)的識別準(zhǔn)確率最優(yōu)。
表3為4種分類器的性能綜合對比。由表3可知,LR的計(jì)算速度和穩(wěn)定性最優(yōu),但其識別精度低,提升有限且非常困難;k-NN算法簡單、可靠,能夠劃分高度復(fù)雜的分類邊界,但是其識別需要大量計(jì)算時(shí)間和內(nèi)存容量,應(yīng)用于NILM在線識別受限;SVM能夠最小化結(jié)構(gòu)風(fēng)險(xiǎn),負(fù)荷識別準(zhǔn)確率較好,但其訓(xùn)練、識別時(shí)間對噪聲較為敏感,適用于低噪聲環(huán)境下的NILM場合;相對而言,MLP神經(jīng)網(wǎng)絡(luò)雖然訓(xùn)練較慢,但其判斷準(zhǔn)確、識別快速、穩(wěn)定性好,對于通常采用的離線訓(xùn)練、在線負(fù)荷識別的家庭NILM最為適用。
表3 4種分類器的性能對比Table 3 Performance comparison among four classifiers
NILM能夠根據(jù)家庭電力入口處的整體電氣信息分析用戶內(nèi)部各個(gè)設(shè)備的工作狀態(tài),為家庭負(fù)荷監(jiān)測和智能用電提供決策指導(dǎo)。本文選取家庭用電設(shè)備穩(wěn)態(tài)電流的奇次諧波作為負(fù)荷特征,建立了4種具有代表性的監(jiān)督學(xué)習(xí)分類算法——MLP神經(jīng)網(wǎng)絡(luò)、k-NN算法、LR和SVM,對比了它們在NILM中的應(yīng)用效果,并比較分析了4種算法在識別精度、訓(xùn)練時(shí)間、識別速度和抗噪性能方面的表現(xiàn),指出了各自的特點(diǎn)。分析結(jié)果表明:在4種分類器中,MLP神經(jīng)網(wǎng)絡(luò)最適用于家庭NILM。
附錄見本刊網(wǎng)絡(luò)版(http:∥www.epae.cn)。