王雅倩,周東國(guó),胡文山
(武漢大學(xué) 電氣與自動(dòng)化學(xué)院, 武漢 430072)
非侵入式電力負(fù)荷監(jiān)測(cè)(Non-intrusive Load Monitoring)技術(shù)的核心是辨識(shí)算法,主要包括優(yōu)化方法[1]、監(jiān)督學(xué)習(xí)方法[2-4]、非監(jiān)督學(xué)習(xí)方法[5-6]三類。優(yōu)化方法以整數(shù)規(guī)劃為依據(jù),建立負(fù)荷辨識(shí)模型;而監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)以模式識(shí)別為理論支撐,其性能在一定程度上各具優(yōu)勢(shì),成為目前研究的熱點(diǎn)。隨著國(guó)家電網(wǎng)、南方電網(wǎng)等電力單位的大力推進(jìn),如何開(kāi)發(fā)和利用現(xiàn)有算法成為關(guān)注的焦點(diǎn)。為此,研究人員提出了各種性能評(píng)價(jià)測(cè)度來(lái)評(píng)估分解方法的性能。文獻(xiàn)[7]提出將準(zhǔn)確識(shí)別電器負(fù)荷、開(kāi)關(guān)事件的比例作為性能評(píng)價(jià)測(cè)度。文獻(xiàn)[8]根據(jù)精確度和召回率提出了F1度量的評(píng)價(jià)測(cè)度,精度是分解后的相關(guān)設(shè)備的功率值與分解后設(shè)備總的功率值的比率,召回率是分解后的相關(guān)設(shè)備的功率值與實(shí)際中設(shè)備的相關(guān)功率值的比率。文獻(xiàn)[9]用ROC曲線對(duì)非侵入式電力負(fù)荷分解算法進(jìn)行性能評(píng)估。文獻(xiàn)[10]對(duì)該問(wèn)題進(jìn)行了較為系統(tǒng)的研究,建議分別考慮檢測(cè)準(zhǔn)確度和分類準(zhǔn)確度,提出了總體和個(gè)體負(fù)荷的誤檢率和漏檢率兩個(gè)測(cè)度,并給出了相應(yīng)的檢測(cè)準(zhǔn)確度、分解準(zhǔn)確度和總體檢測(cè)度的計(jì)算公式。近年來(lái),文獻(xiàn)[11]在2014年建立了ECO負(fù)荷數(shù)據(jù)庫(kù),其采用召回率、準(zhǔn)確率、精確率、總能耗相對(duì)誤差、均方絕對(duì)誤差等五項(xiàng)評(píng)價(jià)指標(biāo)對(duì)各個(gè)非侵入式負(fù)荷算法模型在同一負(fù)荷數(shù)據(jù)集中進(jìn)行評(píng)價(jià)。文獻(xiàn)[12]介紹了包括召回率、準(zhǔn)確率、精確率、F1分?jǐn)?shù)、NDE(Normalized Disaggregation Error)分?jǐn)?shù)以及實(shí)時(shí)噪音等在內(nèi)的多種評(píng)價(jià)指標(biāo),并簡(jiǎn)單闡述了各指標(biāo)優(yōu)缺點(diǎn)和應(yīng)用。
目前,準(zhǔn)確率等直觀的單一效益性指標(biāo)仍是衡量和驗(yàn)證算法可行性和可靠性的主流方案,但是非侵入式負(fù)荷辨識(shí)易受訓(xùn)練數(shù)據(jù)等因素的影響,單一的準(zhǔn)確率等指標(biāo)并不足以說(shuō)明問(wèn)題,甚至出現(xiàn)識(shí)別準(zhǔn)確率畸高而實(shí)際辨識(shí)效果很差的情況。此時(shí)利用單一的準(zhǔn)確率指標(biāo)會(huì)出現(xiàn)決策失誤,不足以反映識(shí)別效果。此外,在實(shí)際應(yīng)用中往往需要同時(shí)兼顧算法的多種性能,而同一算法在不同指標(biāo)下的性能表現(xiàn)并不相同,因此,如何針對(duì)實(shí)際情況和側(cè)重需求建立綜合的評(píng)價(jià)體系也成為待解決的問(wèn)題之一。
為此,文章提出一種基于融合決策的TOPSIS[13](Technique for Order Preference by Similarity to an Ideal Solution)模型評(píng)價(jià)非侵入式算法。它在傳統(tǒng)的TOPSIS模型上利用組合賦權(quán)法集AHP主觀賦權(quán)和變異系數(shù)法客觀賦權(quán)的優(yōu)點(diǎn)于一體,兼顧專家經(jīng)驗(yàn)、工程實(shí)際以及客觀指標(biāo)數(shù)據(jù)價(jià)值,避免了傳統(tǒng)TOPSIS模型中存在的權(quán)重確定單一易造成評(píng)價(jià)失真等問(wèn)題。該模型基于TOPSIS方法集成其他方法的強(qiáng)大能力[15-17],采用融合權(quán)重為各指標(biāo)賦權(quán)再通過(guò)TOPSIS法對(duì)有限負(fù)荷辨識(shí)算法進(jìn)行決策排序,擇優(yōu)選擇,并將該方法應(yīng)用于實(shí)際工程,為負(fù)荷辨識(shí)算法的綜合評(píng)價(jià)提供一種新的解決方案。
TOPSIS法[13-14]最初是由Hwang和Yoon在1981年提出,全稱為逼近于理想解的排序方法,其主要思想是通過(guò)計(jì)算評(píng)價(jià)對(duì)象與理想化目標(biāo)和負(fù)理想化目標(biāo)的接近程度對(duì)評(píng)價(jià)對(duì)象進(jìn)行排序以確定其相對(duì)優(yōu)劣程度,從而選擇最佳方案。具體步驟如下:
(1)設(shè)某決策問(wèn)題有M個(gè)評(píng)價(jià)對(duì)象構(gòu)成決策方案集{X1,X2,…,Xm};衡量方案屬性優(yōu)劣的n個(gè)評(píng)價(jià)指標(biāo),則M個(gè)評(píng)價(jià)對(duì)象的n個(gè)原始評(píng)價(jià)指標(biāo)數(shù)據(jù)構(gòu)成矩陣X。
(1)
(2)將原始指標(biāo)進(jìn)行規(guī)范化處理得到規(guī)范化矩陣F。設(shè)xij為X矩陣中i個(gè)方案中第j個(gè)指標(biāo)的值,其規(guī)范化后的值記為fij。
(3)
(3)構(gòu)造加權(quán)規(guī)范化矩陣。設(shè)由決策者給定的權(quán)重向量ω=[ω1,ω2,…,ωn]T,利用各指標(biāo)權(quán)值和規(guī)范化矩陣F構(gòu)造加權(quán)規(guī)范化矩陣R。其中,rij為加權(quán)規(guī)范矩陣R中第i個(gè)方案中第j個(gè)指標(biāo)的值。
rij=ωjfij(i=1,2,…,m;j=1,2,…,n)
(4)
(4)確定正、負(fù)理想解的集合R+、R-。指標(biāo)中越大越好的為效益型指標(biāo),越小越好的為成本型指標(biāo)。以效益型指標(biāo)的最大值和成本性指標(biāo)的最小值構(gòu)造R+、R-。
(5)
(5)計(jì)算各個(gè)方案分別與正、負(fù)理想解的距離D+、D-。
(6)
(6)計(jì)算各個(gè)方案與理想解的貼近度Wi,Wi值越大,該方案評(píng)價(jià)越優(yōu),反之越劣。
(7)
非侵入式算法評(píng)價(jià)過(guò)程實(shí)質(zhì)也是一個(gè)多指標(biāo)綜合決策問(wèn)題,TOPSIS方法對(duì)數(shù)據(jù)分布及樣本量、指標(biāo)數(shù)無(wú)嚴(yán)格限制,原始數(shù)據(jù)的利用較充分,信息損失少且計(jì)算適中,是多目標(biāo)決策分析中一種科學(xué)、常用的有效方法。TOPSIS法的重點(diǎn)是用于衡量方案的指標(biāo)屬性權(quán)值的分配?,F(xiàn)有的權(quán)值確定方案有很多,主要包括兩類:主觀賦權(quán)法和客觀賦權(quán)法,但是單一權(quán)重都會(huì)造成評(píng)價(jià)結(jié)果失真。文獻(xiàn)[17]研究對(duì)比了TOPSIS與不同的權(quán)重確定方法進(jìn)行集成組合后的優(yōu)劣性和原始數(shù)據(jù)的影響,建議集成TOPSIS與AHP兩種方法。AHP法允許人為決策,充分吸收專家經(jīng)驗(yàn),但主觀因素過(guò)強(qiáng),很難直接應(yīng)用于非侵入式算法評(píng)價(jià)。因此,為了保留評(píng)價(jià)指標(biāo)的客觀信息,同時(shí)減低客觀賦權(quán)法對(duì)樣本數(shù)據(jù)的強(qiáng)依賴性,文章提出一種基于AHP和變異系數(shù)法的融合權(quán)重。
為了保留評(píng)價(jià)指標(biāo)的客觀信息,同時(shí)減低客觀賦權(quán)法對(duì)樣本數(shù)據(jù)的強(qiáng)依賴性,文中提出一種基于AHP和變異系數(shù)法的融合權(quán)重。
(1)AHP
層次分析法[18-19](Analytic Hierarchy Process,簡(jiǎn)稱AHP)由美國(guó)運(yùn)籌學(xué)家T. L. Saaty教授于20世紀(jì)70年代初期提出。主要通過(guò)構(gòu)建遞階層次模型明確多指標(biāo)之間的隸屬度關(guān)系,保證不同層元素的類別相似性和指標(biāo)體系的排序合理性,非常適用于分析包含主觀信息的不確定性問(wèn)題,是一種比較科學(xué)的確定權(quán)重的方法。其核心步驟為:
第一步:構(gòu)建遞階層次模型,劃分不同指標(biāo)層次,確定隸屬關(guān)系;
第二步:明確下層元素對(duì)上層元素的相對(duì)重要性,利用二元對(duì)比法確定同層元素的比較矩陣;
第三步:通過(guò)歸一化確定下層指標(biāo)對(duì)其上層指標(biāo)的相對(duì)權(quán)重,逐層關(guān)聯(lián)遞進(jìn)得到層次總權(quán)重。
設(shè)下層n個(gè)元素C1,C2,…,Cn對(duì)于上層某一元素的判斷矩陣為A:
(8)
式中cij表示元素i與元素j相對(duì)于上一層次因素重要性的比例標(biāo)度值。采用二元對(duì)比法對(duì)同層指標(biāo)兩兩比較,賦值依據(jù)為文獻(xiàn)[21]中T.L.Saaty提出的比例標(biāo)度表,如表1所示。
表1 重要性比例標(biāo)度表Tab.1 Scale of importance ratio
由矩陣A的數(shù)學(xué)性質(zhì)可知其為正定互反矩陣,存在最大特征根且唯一,因此,采用特征根法計(jì)算同層元素的相對(duì)權(quán)重。
AW=λmaxW
(9)
式中λmax是A的最大特征根;W是對(duì)應(yīng)的特征向量,對(duì)W進(jìn)行歸一化后即可作為權(quán)重向量ωA。
標(biāo)準(zhǔn)值2、4、6、8分別表示1、3、5、7、9之間的重要度賦值;且Wij=1/Wji,若矩陣A滿足:
cij×cjk=cik,i,j=1,2,…,n
(10)
稱矩陣A為一致陣。在判斷矩陣的構(gòu)造中,由于客觀事物的復(fù)雜性和主觀認(rèn)識(shí)的多樣性,式(10)并不要求一定嚴(yán)格成立,但為了避免出現(xiàn)“元素甲比元素乙極端重要,元素乙比元素丙極端重要,而元素丙又比元素甲極端重要”的錯(cuò)誤決策,對(duì)判斷矩陣進(jìn)行一致性檢驗(yàn),計(jì)算一致性比率C.R.為:
(11)
式中R.I.表示平均隨機(jī)一致性指標(biāo),表2列出了1~14階矩陣計(jì)算1 000次得到的平均隨機(jī)一致性指標(biāo)值;C.I.為一致性指標(biāo):C.I.=(λmax-n)/(n-1),n為矩陣A的階數(shù)。
表2 平均隨機(jī)一致性指標(biāo)R.I.Tab.2 Average random consistency indicator R.I.
當(dāng)C.R.小于閾值0.1[18,20]時(shí),認(rèn)為該判斷矩陣具有整體滿意的一致性,否則,需對(duì)判斷矩陣做出修正,如式(10)所示。
(2)變異系數(shù)法
變異系數(shù)法作為一種客觀賦權(quán)法主要通過(guò)評(píng)價(jià)指標(biāo)的對(duì)比強(qiáng)度和變化幅度來(lái)衡量權(quán)值。在多指標(biāo)決策過(guò)程中,若某一指標(biāo)的值在不同待評(píng)價(jià)對(duì)象之間差異較大,說(shuō)明該指標(biāo)對(duì)待評(píng)價(jià)對(duì)象排序的貢獻(xiàn)較大,應(yīng)當(dāng)賦予相對(duì)更高的權(quán)值。
(12)
式中xij表示第j個(gè)評(píng)價(jià)對(duì)象的第i評(píng)價(jià)指標(biāo)值。則指標(biāo)變異系數(shù)Gi為:
(13)
歸一化后即可求得指標(biāo)客觀賦權(quán):
(14)
采用基于理想點(diǎn)法的組合賦權(quán)法融合主觀權(quán)值ωA客觀權(quán)值ωB,使得指標(biāo)賦權(quán)既能反應(yīng)指標(biāo)客觀規(guī)律,又能兼顧決策者的主觀需求和實(shí)際工程經(jīng)驗(yàn)。
(15)
(16)
(17)
則融合權(quán)重:
(18)
由以上步驟得到非侵入式算法評(píng)價(jià)模型如圖1所示。
圖1 非侵入式算法評(píng)價(jià)模型Fig.1 Evaluation model of non-intrusive algorithm
針對(duì)現(xiàn)有單一準(zhǔn)確率指標(biāo),精確度(pc)和召回率(rc)在樣本分布不均時(shí)可以提供補(bǔ)充的識(shí)別性能分析依據(jù);F1得分是pc和rc的調(diào)和均值,當(dāng)兩者差距過(guò)大無(wú)法比較時(shí),F(xiàn)1量度可以提供判斷依據(jù);此外,常用的能耗估值相對(duì)誤差等三個(gè)度量均是對(duì)功耗估值的誤差量度,都較為直觀。
在非侵入式負(fù)荷辨識(shí)算法中,效益型指標(biāo)更為人們所關(guān)注。因此,結(jié)合實(shí)際工程應(yīng)用的側(cè)重點(diǎn),文章從負(fù)荷辨識(shí)結(jié)果和能耗分配過(guò)程兩個(gè)方面選擇六個(gè)效益型評(píng)價(jià)指標(biāo)構(gòu)建評(píng)價(jià)模型,如表3所示。
表3 非侵入式算法評(píng)價(jià)指標(biāo)Tab.3 Non-intrusive algorithm evaluation index
為了驗(yàn)證文章方法的有效性,實(shí)驗(yàn)一測(cè)試了DAE算法、RNN算法和DAE-RNN優(yōu)化算法在UK-DALE[22]公共數(shù)據(jù)集上對(duì)洗衣機(jī)、洗碗機(jī)、水壺、微波爐、冰箱共5種常用的電器設(shè)備的辨識(shí),且只考慮單一狀態(tài)識(shí)別。表4列出了三種辨識(shí)方法對(duì)單一狀態(tài)設(shè)備的辨識(shí)分析結(jié)果[23-25],可以發(fā)現(xiàn),三種算法在不同的單一評(píng)價(jià)指標(biāo)下排序差異較大,為了避免單一評(píng)價(jià)值的誤差干擾,綜合考慮多方評(píng)價(jià)因素,采用基于融合權(quán)重的TOPSIS法對(duì)算法進(jìn)行優(yōu)劣排序。
表4 算法辨識(shí)結(jié)果Tab.4 Algorithm identification result
(1)AHP法:根據(jù)專家經(jīng)驗(yàn)和實(shí)際側(cè)重,由表4得到判斷矩陣A,C1,C2,…,C6依次表示表4中的六種指標(biāo)。由式(9)~式(11)計(jì)算得到一致性比率C.R.為0.004 6,經(jīng)驗(yàn)證C.R.<0.1,通過(guò)一致性檢驗(yàn),求得主觀權(quán)重如表5所示。
(19)
(2)由式(12)~式(14)求得客觀權(quán)重ωB,由式(15)~式(18)組合賦權(quán)求得融合權(quán)重ω,如表5所示。
表5 融合權(quán)重Tab.5 Fusion weight
W3>W1>W2,即單狀態(tài)設(shè)備辨識(shí)中,DAE-RNN算法最優(yōu),DAE算法次之,RNN算法性能最差。根據(jù)訓(xùn)練期間電器可見(jiàn)的數(shù)據(jù)和使用訓(xùn)練期電器不可見(jiàn)的數(shù)據(jù)訓(xùn)練優(yōu)化網(wǎng)絡(luò)的識(shí)別結(jié)果。DAE神經(jīng)網(wǎng)絡(luò)對(duì)單狀態(tài)負(fù)荷辨識(shí)性能優(yōu)于RNN網(wǎng)絡(luò),在保持準(zhǔn)確率和精確度優(yōu)勢(shì)上,能耗分配準(zhǔn)確率也相對(duì)較高。DAE-RNN優(yōu)化結(jié)構(gòu)總體應(yīng)用性能都在其他兩者之上,在保留了DAE網(wǎng)絡(luò)單狀態(tài)電器識(shí)別準(zhǔn)確率優(yōu)勢(shì)的基礎(chǔ)上提高了F1得分,保證算法能更好地處理數(shù)據(jù)分布不均的情況,是辨識(shí)算法更加穩(wěn)定可靠,證明了基于融合權(quán)重的改進(jìn)TOPSIS模型評(píng)價(jià)結(jié)果與實(shí)際工程性能相符,證明文章方法實(shí)際有效可行。
3.1.1 指標(biāo)賦權(quán)對(duì)比分析
對(duì)比分析由主觀賦權(quán)AHP法、客觀賦權(quán)變異系數(shù)法、組合優(yōu)化賦權(quán)法所得的指標(biāo)權(quán)重結(jié)果,如圖2所示。采用AHP賦權(quán)時(shí)能耗估值正確率和總功率正確分配率重要性相近,但原始數(shù)據(jù)中三種算法的能耗估值正確率差異較大;而單獨(dú)采用客觀賦權(quán)時(shí)會(huì)過(guò)分夸大數(shù)據(jù)波動(dòng)性,對(duì)樣本數(shù)據(jù)依賴性較大,容易忽略實(shí)際工程需求,不能體現(xiàn)評(píng)估指標(biāo)自身價(jià)值的重要性?;谧顑?yōu)組合賦權(quán)的融合權(quán)重可以對(duì)兩者進(jìn)行適當(dāng)調(diào)節(jié),實(shí)現(xiàn)優(yōu)勢(shì)互補(bǔ),得到更為合理科學(xué)的評(píng)價(jià)結(jié)果。
3.1.2 指標(biāo)個(gè)數(shù)及選擇對(duì)評(píng)價(jià)結(jié)果的影響
考慮到多指標(biāo)決策過(guò)程中指標(biāo)個(gè)數(shù)及選取對(duì)評(píng)價(jià)結(jié)果的影響,實(shí)驗(yàn)測(cè)試了四個(gè)指標(biāo)、五個(gè)指標(biāo)共21種組合方式下上述三種算法的評(píng)價(jià)結(jié)果,所有實(shí)驗(yàn)數(shù)據(jù)均相同,實(shí)驗(yàn)結(jié)果如表6所示,其中F1,F(xiàn)2,F(xiàn)3依次從左至右表示表4中三種算法,C1、C2、C3、C4、C5、C6依次從上至下表示表4中6種評(píng)價(jià)指標(biāo)。分析測(cè)試結(jié)果得到如下結(jié)論:
表6 指標(biāo)組合與評(píng)價(jià)結(jié)果Tab.6 Indicator combination and evaluation results
(1)四個(gè)指標(biāo)組合中排序正確率為2/3;五個(gè)指標(biāo)組合中排序正確率為5/6,由于篇幅限制和文章旨在多指標(biāo)評(píng)價(jià),因此一、二、三個(gè)指標(biāo)組合排序?qū)嶒?yàn)并未在此列出。隨著指標(biāo)的增加,排序正確率逐漸增大且趨近于正確排序;
(2)通過(guò)分析,主觀賦權(quán)權(quán)重最大的指標(biāo)和不同方案間實(shí)際數(shù)據(jù)差異最大的指標(biāo)會(huì)對(duì)評(píng)價(jià)結(jié)果產(chǎn)生一定影響;
(3)實(shí)際應(yīng)用中可以通過(guò)統(tǒng)計(jì)學(xué)方法測(cè)試不同指標(biāo)組合的評(píng)價(jià)結(jié)果確定適合的指標(biāo)個(gè)數(shù)并判斷最終正確排序。
實(shí)驗(yàn)二在某家庭用戶場(chǎng)景下測(cè)試了關(guān)聯(lián)RNN算法、LSTM以及Bi-LSTM(雙向長(zhǎng)短期記憶網(wǎng)絡(luò))算法對(duì)電采暖1,2,3檔、電燉鍋、泡腳桶、電吹風(fēng)冷風(fēng)、熱風(fēng)檔、電磁爐、高壓鍋、打印機(jī)、電飯鍋、豆?jié){機(jī)、電視共13種用電狀態(tài)的辨識(shí)結(jié)果,如表7所示。按照案例一的評(píng)價(jià)步驟對(duì)三種算法進(jìn)行排序,結(jié)果如表8所示。
表7 算法辨識(shí)結(jié)果Tab.7 Algorithm identification result
表8 融合權(quán)重Tab.8 Fusion weight
為了綜合評(píng)估電力負(fù)荷辨識(shí)算法的可靠性和可行性,避免單一評(píng)價(jià)指標(biāo)造成辨識(shí)失誤等問(wèn)題,選取六種互補(bǔ)的效益型評(píng)價(jià)指標(biāo),采用基于AHP和變異系數(shù)法融合賦權(quán)的TOPSIS模型,兼顧客觀數(shù)據(jù)信息和專家經(jīng)驗(yàn)主觀決策,利用逼近于理想解的排序方法計(jì)算評(píng)價(jià)對(duì)象與正負(fù)理想解的接近程度,實(shí)現(xiàn)對(duì)非侵入式算法的評(píng)價(jià)。最后通過(guò)實(shí)際案例驗(yàn)證文中方法有效性和可行性,為研究非侵入式電力負(fù)荷辨識(shí)領(lǐng)域算法的分類、評(píng)價(jià)及選取提供一種新的解決方案。