朱 啟 成
(安徽工貿(mào)職業(yè)技術(shù)學院 計算機信息工程系,安徽 淮南 232007)
本文針對非入侵式挖掘方法進行研究,尤其是針對電力負荷辨識這一環(huán)節(jié),相關(guān)專家提出了很多方法進行解決,如諧波分析、傅里葉變換(FT)、小波分析(WT)等[2-3]。這些方法雖然都能在一定程度上辨別出不同電器用電情況,但是一旦面對電器過多、負荷數(shù)據(jù)較為混亂,就會出現(xiàn)識別不準確或識別不出來的現(xiàn)象,導(dǎo)致無法實現(xiàn)數(shù)據(jù)挖掘的目的。為此,本文針對電力負荷辨識這一環(huán)節(jié),提出一種基于神經(jīng)網(wǎng)絡(luò)的開放性云平臺非侵入式負載數(shù)據(jù)協(xié)同挖掘方法。該方法分為4步:首先,進行非入侵式數(shù)據(jù)采集,包括負荷獨立運行數(shù)據(jù)和負荷混合運行數(shù)據(jù);然后,對采集的兩種數(shù)據(jù)進行處理;再提取負荷獨立運行數(shù)據(jù)特征;最后,利用神經(jīng)網(wǎng)絡(luò)算法,結(jié)合獨立負荷特征,實現(xiàn)特征匹配,完成負荷組成成分和電器用電狀態(tài)的識別[4]。
1.1.1 模擬實驗平臺
模擬實驗平臺主要由電源負荷插線板(27W MAX,公牛集團股份有限公司)、電壓電流傳感器(NB-AV1C1-G4MB,寧波億思達傳感器有限公司)、NI數(shù)據(jù)采集卡(PCI8620,北京阿爾泰科技發(fā)展有限公司)、開關(guān)電源、導(dǎo)線以及計算機(天逸510Pro,聯(lián)想集團)等多個部分組成(圖1)。
圖1 模擬實驗平臺
1.1.2 實驗所需用電設(shè)備及數(shù)據(jù)
本仿真實驗所需數(shù)據(jù)來自16種電氣設(shè)備一個月的用電數(shù)據(jù)情況,采集的用電參數(shù)見表1。
表1 16種電氣設(shè)備及用電參數(shù)
1.2.1 非侵入式負載數(shù)據(jù)協(xié)同挖掘方法
活性炭纖維具有大比表面積(1000~3000m2/g)和豐富的微孔,微孔體積占總孔體積的90%以上,其在空氣中對有機氣體的吸附能力比顆?;钚蕴扛邘妆吨翈资?,吸附速率快100~1000倍,同時耐酸、堿,耐高溫,可再生循環(huán)使用,是近年來應(yīng)用較多的一種吸附劑。
數(shù)據(jù)挖掘是指從大量的數(shù)據(jù)中自動搜索隱藏于其中的特殊的關(guān)系性,其任務(wù)有關(guān)聯(lián)分析、聚類分析、分類分析、異常分析、特異群組分析和演變分析等。在現(xiàn)代科技社會,人們生產(chǎn)、生活中離不開各種帶能電氣設(shè)備的應(yīng)用,而這些設(shè)備每天都會產(chǎn)生大量的負載數(shù)據(jù)。本文對這些數(shù)據(jù)進行挖掘,有利于幫助用戶了解電氣設(shè)備的具體使用情況,從而增強用戶節(jié)電意識,幫助用戶合理用電,也可以幫助電力企業(yè)準確預(yù)測短期電力負荷,從而科學制定電網(wǎng)調(diào)度方案[5]。
負載數(shù)據(jù)挖掘有兩種方式:入侵式挖掘和非入侵式挖掘。兩者的特點對比見表2。
表2 入侵式挖掘和非入侵式挖掘特點對比
與侵入式負載數(shù)據(jù)挖掘相比,非侵入式負載數(shù)據(jù)挖掘集更為常用,優(yōu)點更為明顯,因此本文針對非侵入式負載數(shù)據(jù)挖掘進行研究,過程包括負載數(shù)據(jù)采集、負載數(shù)據(jù)處理、負載數(shù)據(jù)特征提取以及負載組成成分辨別等步驟,完成數(shù)據(jù)協(xié)同挖掘[6]。
1.2.2 負載數(shù)據(jù)采集
負載數(shù)據(jù)采集是負載數(shù)據(jù)挖掘的前提基礎(chǔ),在本小節(jié)需要采集的數(shù)據(jù)有兩種:負荷獨立運行數(shù)據(jù)和負荷混合運行數(shù)據(jù)。前者是作為對比項,為了提取每種電氣設(shè)備的運行特征準備的,而后者主要是為了完成最后的數(shù)據(jù)挖掘準備的,前者數(shù)據(jù)是為后者數(shù)據(jù)分析服務(wù)的[7]。因此在這里需要一種侵入式和非侵入式兩種裝置來采集數(shù)據(jù),其結(jié)構(gòu)如圖2~3所示。
圖2 侵入式采集裝置 圖3 非侵入式采集裝置
特別注意的是,若在電力數(shù)據(jù)處理中心數(shù)據(jù)庫中存有每種電氣設(shè)備負荷獨立運行數(shù)據(jù),就不必再進行侵入式負載數(shù)據(jù)采集,只需要進行非侵入式混合負載數(shù)據(jù)采集即可。
1.2.3 負載數(shù)據(jù)處理
負載數(shù)據(jù)在采集和傳輸過程中,受到外界因素和自身因素的影響,會被一些噪聲干擾,導(dǎo)致數(shù)據(jù)質(zhì)量下降,不利于后期數(shù)據(jù)挖掘,因此需要去除數(shù)據(jù)中的噪聲[8]。目前,數(shù)據(jù)去噪方法有3種:濾波器、傅里葉變換去噪和小波分析去噪,其性能比較見表3。
表3 數(shù)據(jù)去噪方法對比
與濾波器和傅里葉變換去噪相比,小波分析去噪是在前兩者基礎(chǔ)上發(fā)展而來的,因此去噪能力更強,能同時滿足時域和頻域分辨率的雙重要求。因此,本小節(jié)采用小波分析法進行去噪,具體過程如下:
步驟1 設(shè)定參數(shù),即選取合適的小波基函數(shù)(包括Daubechies小波、Symlets小波、Coiflets小波和Biorthogonal小波等)和分解層數(shù)(一般選為3或4層)。
步驟2 對采集到的數(shù)據(jù)進行小波分解,得到小波系數(shù)。
步驟3 選取合適的閾值。目前閾值主要有硬閾值和軟閾值兩種,其中后者比前者更加平滑,因此選擇軟閾值,閾值λ的選取直接影響到去噪的效果,小波變換閾值去噪法的閾值的選取形式有4種:通用閾值規(guī)則、最小極大方差閾值、無偏似然估計(SURE)規(guī)則、啟發(fā)式閾值規(guī)則[9]。
步驟4 利用選取合適的閾值對小波系數(shù)上一步驟得到的結(jié)果進行閾值處理。
步驟5 通過小波逆變換對數(shù)據(jù)進行重構(gòu)。
在數(shù)據(jù)處理中,除了去噪之外,還需要進行離散化處理。采集到的負載數(shù)據(jù)是一個連續(xù)變量,但在后續(xù)數(shù)據(jù)挖掘中卻不能直接使用連續(xù)變量,因此需要進行離散化。在這里采用基于卡方的一種連續(xù)變量離散化方法,基本原理如下:首先將數(shù)據(jù)取值范圍內(nèi)的所有數(shù)據(jù)值列為一個單獨的區(qū)間,再遞歸地找出鄰近可合并的區(qū)間,然后合并它們,進而形成較大的區(qū)間[10]。
1.2.4 負載數(shù)據(jù)特征提取
負載數(shù)據(jù)特征提取是從采集到的每種電氣設(shè)備負荷運行數(shù)據(jù)中提取到獨立特征,為后續(xù)特征匹配做準備。每種電氣設(shè)備從開啟到關(guān)閉這一過程中產(chǎn)生的負荷數(shù)據(jù)都會有自己本身獨特的特征,一般分為穩(wěn)態(tài)特征、暫態(tài)特征和時間特征等辨識特征量[11]。這些辨識特征量都是后續(xù)能夠從非入侵負載數(shù)據(jù)中辨別電氣設(shè)備種類和工作狀態(tài)的關(guān)鍵證據(jù)。在本文當中選擇前2個辨識特征量:穩(wěn)態(tài)和暫態(tài)特征作為負載數(shù)據(jù)特征。穩(wěn)態(tài)特征是指電氣設(shè)備在正常工作狀態(tài)下表現(xiàn)出來的特征參數(shù);暫態(tài)特征是指與穩(wěn)態(tài)特征相反的一種較為奇異的特征,這種特征一般存在時間很短,但包含的內(nèi)容非常豐富,是一個更能表現(xiàn)電氣設(shè)備不同點的特征參數(shù),比穩(wěn)態(tài)特征更為重要。負載數(shù)據(jù)特征及提取方法見表4。
表4 負載數(shù)據(jù)特征及提取方法
1.2.5 非侵入式負載數(shù)據(jù)挖掘?qū)崿F(xiàn)
非侵入式負載數(shù)據(jù)挖掘任務(wù)是結(jié)合一種識別模型,從采集的數(shù)據(jù)中辨別出各類電氣設(shè)備種類和工作狀態(tài)。在這里識別模型的構(gòu)建至關(guān)重要,本文采用一種BP神經(jīng)網(wǎng)絡(luò)算法構(gòu)建非侵入式負載數(shù)據(jù)挖掘模型。BP神經(jīng)網(wǎng)絡(luò)是由若干個神經(jīng)元相互連接而成,通過模擬人類大腦神經(jīng)元處理過程來進行數(shù)據(jù)處理[12]。BP神經(jīng)網(wǎng)絡(luò)典型結(jié)構(gòu)如圖4所示。
圖4 BP神經(jīng)網(wǎng)絡(luò)典型結(jié)構(gòu)
基于神經(jīng)網(wǎng)絡(luò)的非侵入式負載數(shù)據(jù)挖掘基本流程如下圖5所示。
圖5 基于神經(jīng)網(wǎng)絡(luò)的非侵入式負載數(shù)據(jù)挖掘基本流程
(1)
(2)
其中
(3)
圖6 實驗流程
利用本文方法和3種傳統(tǒng)基于諧波分析、傅里葉變換(FT)、小波分析(WT)的數(shù)據(jù)挖掘方法進行電氣設(shè)備種類和工作狀態(tài)辨識,挖掘準確性見表5。
表5 挖掘準確性 單位:%
從表5中可以看出,本文所提方法應(yīng)用中,非侵入式負載數(shù)據(jù)挖掘準確率為95.68%,而三種傳統(tǒng)挖掘方法,挖掘準確率分別為90.66%、92.21%和92.35%。以上4種結(jié)果對比可知,本文方法的準確率更高,為數(shù)據(jù)應(yīng)用奠定了可靠的基礎(chǔ)。
本文研究一種開放性云平臺非侵入式負載數(shù)據(jù)協(xié)同挖掘方法。該方法結(jié)合神經(jīng)網(wǎng)絡(luò)算法,對采集到的非侵入式負載數(shù)據(jù)進行挖掘,得出電氣設(shè)備種類和工作狀態(tài)信息。最后經(jīng)測試,本方法的準確性要高于其他3種方法,為電力企業(yè)和用戶提供了可靠的數(shù)據(jù)參考。綜上所述,隨著人們生產(chǎn)、生活中電氣設(shè)備的廣泛應(yīng)用,在方便人們的同時,產(chǎn)生的電力消耗在劇烈增加,因此,為方便電力用戶隨時掌握用電信息以及方便電力企業(yè)進行電力負荷預(yù)測和電力調(diào)度,進行電力負載數(shù)據(jù)挖掘具有重要的現(xiàn)實意義。