楊立波,馬 斌,王亞軍,孫廣輝,李一鵬
(國網(wǎng)河北省電力有限公司,石家莊 050021)
近年來,傳統(tǒng)化石能源消耗量不斷增加,能源匱乏和環(huán)境污染成為當(dāng)今時代熱點(diǎn)問題,世界各國均在努力尋找更低碳、環(huán)保的發(fā)展道路,不斷探索可再生能源發(fā)電技術(shù),而新能源發(fā)電系統(tǒng)又具有運(yùn)行期間無環(huán)境污染、安裝方便、維護(hù)成本低,以及資源可再生[1]等理想特性。因此風(fēng)力、光伏等新能源發(fā)電的應(yīng)用備受關(guān)注,全球的新能源發(fā)電裝機(jī)容量也在不斷增加,相關(guān)系統(tǒng)和采集數(shù)據(jù)日趨豐富。
在新能源場站的系統(tǒng)中,作為發(fā)電機(jī)組的光伏陣列或風(fēng)電機(jī)組均安裝在惡劣的室外環(huán)境,這種戶外環(huán)境會使光伏陣列或風(fēng)電機(jī)組發(fā)生故障且不易被察覺,導(dǎo)致發(fā)電效率達(dá)不到理想效果。因此,需要工作人員及時發(fā)現(xiàn)并維修,但人工巡檢不僅費(fèi)力、影響發(fā)電效率,還存在危險性。通過對新能源發(fā)電所產(chǎn)生的基礎(chǔ)數(shù)據(jù)進(jìn)行數(shù)據(jù)特征分類和核查[2],進(jìn)而獲取新能源的故障辨識,是一種有效的解決方法。然而在實(shí)際中新能源發(fā)電系統(tǒng)的特征數(shù)據(jù)復(fù)雜且不易獲取,需建立適當(dāng)模型,通過數(shù)據(jù)稽查校驗實(shí)現(xiàn)。為解決上述問題,文獻(xiàn)[3]提出一種新能源發(fā)電的故障檢測系統(tǒng),該系統(tǒng)是基于測量光伏發(fā)電數(shù)據(jù)與其對應(yīng)的預(yù)測量之間的差值,如果差值大于給定的閾值,則認(rèn)為發(fā)生了故障,否則認(rèn)為未發(fā)生故障。文獻(xiàn)[4]提出一種基于限定記憶遞推最小二乘算法的計量裝置誤差診斷方法,進(jìn)行數(shù)據(jù)驅(qū)動誤差分析。文獻(xiàn)[5]基于概率神經(jīng)網(wǎng)絡(luò),利用故障樣本和正常樣本的歷史數(shù)據(jù)來建立故障診斷模型。上述技術(shù)大多依賴于人工特征提取,需要診斷專家和強(qiáng)大的信號處理知識,這種特征提取方法要求信號處理的熟練程度高,此外,整個數(shù)據(jù)校驗過程耗時多,效率低下且核查準(zhǔn)確性需要驗證。
針對上述技術(shù)存在的問題,本文提出一種適用于新能源發(fā)電數(shù)據(jù)核查的方法,并將該方法應(yīng)用于數(shù)據(jù)核查服務(wù)平臺,數(shù)據(jù)核查服務(wù)平臺系統(tǒng)架構(gòu)如圖1所示。由圖1可知,新能源發(fā)電基礎(chǔ)數(shù)據(jù)主要是通過電網(wǎng)調(diào)度系統(tǒng)及場站管控系統(tǒng)獲取,該系統(tǒng)為更加合理地存儲不同結(jié)構(gòu)的新能源發(fā)電基礎(chǔ)數(shù)據(jù),提供了充足的模型特征提取樣本。平臺通過大數(shù)據(jù)統(tǒng)計分析技術(shù)進(jìn)行數(shù)據(jù)分析,上層管理中心收到分析結(jié)果后,用戶管理人員根據(jù)數(shù)據(jù)核查的相關(guān)算法,并通過可視化分析技術(shù)挖掘新能源發(fā)電基礎(chǔ)數(shù)據(jù)隱藏的信息,并展示多維度數(shù)據(jù),以實(shí)現(xiàn)對新能源發(fā)電系統(tǒng)的故障檢測[6]。
圖1 數(shù)據(jù)核查服務(wù)平臺架構(gòu)Fig.1 Architecture of data verification service platform
數(shù)據(jù)核查服務(wù)方法主要包括5個步驟,分別為獲取數(shù)據(jù)、數(shù)據(jù)特征提取、數(shù)據(jù)分析、數(shù)據(jù)核查和可視化實(shí)現(xiàn)。其中,在獲取數(shù)據(jù)時應(yīng)保證數(shù)據(jù)的質(zhì)量,并對數(shù)據(jù)進(jìn)行審查和評價,然后整理出與分析任務(wù)相關(guān)的數(shù)據(jù),將數(shù)據(jù)統(tǒng)一或變換成適合分析的形式,以減小數(shù)據(jù)規(guī)模。數(shù)據(jù)特征提取后的數(shù)據(jù)由4種分析技術(shù)構(gòu)成,分別為關(guān)聯(lián)性分析、聚類分析、分類方法及特征量分析,將分析結(jié)果用于數(shù)據(jù)核查,以完成數(shù)據(jù)核查相關(guān)的內(nèi)容。
針對新能源發(fā)電基礎(chǔ)數(shù)據(jù)進(jìn)行特征提取與數(shù)據(jù)核查,分別闡述該過程中所采用的關(guān)鍵技術(shù)。
由于新能源發(fā)電基礎(chǔ)數(shù)據(jù)類型結(jié)構(gòu)多種多樣,本文基于深度學(xué)習(xí)構(gòu)建出一種數(shù)據(jù)特征提取模型,如圖2所示。該模型通過構(gòu)建特征模板,建立模糊粗糙集,以及應(yīng)用條件隨機(jī)場CRF(conditional ran?dom field)算法,最終提取到新能源發(fā)電基礎(chǔ)數(shù)據(jù)的特征向量。
圖2 數(shù)據(jù)特征提取模型Fig.2 Data feature extraction model
1)構(gòu)建特征模板
由圖2可知,提取新能源發(fā)電基礎(chǔ)數(shù)據(jù)特征向量需要構(gòu)建特征模板,即通過提取數(shù)據(jù)特征并建立特定的模板,使用該模板可以優(yōu)化之后識別數(shù)據(jù)的特征提取。“模板窗口”是特征模板建立的決定性因素,當(dāng)窗口長度過大時會出現(xiàn)過擬合情況;當(dāng)窗口過小則會使能夠提取的特征不足,造成新能源發(fā)電基礎(chǔ)數(shù)據(jù)的識別效率較低,因此構(gòu)建恰當(dāng)?shù)拇翱谑直匾猍7]。
設(shè)置新能源發(fā)電基礎(chǔ)數(shù)據(jù)特征為w(i,j),其中,w為新能源發(fā)電基礎(chǔ)數(shù)據(jù)信息字符,i、j分別為相對w的位置和特征序[8]。設(shè)y為基礎(chǔ)數(shù)據(jù)的安全檢測數(shù)據(jù)段,可定義發(fā)電信息中第k個特征函數(shù)fk(y,w)為
式中:t為所需要進(jìn)行檢測的字段位置;Tfield為字段數(shù);yt、yt-1分別為新能源發(fā)電基礎(chǔ)數(shù)據(jù)在階段t和前一階段的檢測數(shù)據(jù)段;x為新能源發(fā)電基礎(chǔ)數(shù)據(jù)自變量;特征函數(shù)fk(y,w)為各個字段的特征函數(shù)總和。
將新能源發(fā)電所有的基礎(chǔ)數(shù)據(jù)特征函數(shù)fk(y,w)轉(zhuǎn)換為對應(yīng)的特征向量,可得到全部特征向量的總序列F(y,w),即
式中,F(xiàn)(y,w)為全部特征向量的總序列。
2)建立模糊粗糙集
由于新能源發(fā)電基礎(chǔ)數(shù)據(jù)種類太多,在特征選擇過程中會產(chǎn)生不完全特征信息,因此,本文使用模糊粗糙集依賴的屬性約簡算法進(jìn)行決策。
假設(shè)Z=(U,A?Q)是一個新能源發(fā)電基礎(chǔ)數(shù)據(jù)處理程序,U為一個非空的有限對象集,A為條件屬性的非空有限集,Q為一個非空的有限決策屬性集,屬性集P?A對應(yīng)于一個不可區(qū)分的等價關(guān)系。
同粗糙集依賴相似,由式(6)可以得出只采用P中的數(shù)據(jù)時,可分辨對象在對應(yīng)數(shù)據(jù)集中的比例。Q依賴于P的程度確定了在比例Kr中的值,即P決定新能源發(fā)電基礎(chǔ)數(shù)據(jù)特征選擇效果。當(dāng)Kr值越大時,則表示基于模糊粗糙集新能源發(fā)電基礎(chǔ)數(shù)據(jù)特征選擇效果越好。
為了便于理解,采用新能源發(fā)電基礎(chǔ)數(shù)據(jù)原始決策作為實(shí)例來解釋模糊依賴的計算,假設(shè)新能源發(fā)電基礎(chǔ)數(shù)據(jù)原始決策如表1所示。
表1 具有連續(xù)屬性值的決策Tab.1 Decision table with continuous attribute values
表1中,a1、a2和a3為新能源發(fā)電基礎(chǔ)數(shù)據(jù)條件屬性;Q為新能源發(fā)電基礎(chǔ)數(shù)據(jù)決策屬性。在進(jìn)行模糊依賴的計算時,首先計算a1、a2、a3的模糊近似值,然后進(jìn)一步計算各屬性的依賴程度Kr。對應(yīng)每個新能源發(fā)電基礎(chǔ)數(shù)據(jù)模糊屬性的模糊等價類,等價類的隸屬函數(shù)一般包括梯形函數(shù)、三角函數(shù)和正態(tài)分布函數(shù)[10]。由于新能源發(fā)電基礎(chǔ)數(shù)據(jù)屬性值是連續(xù)的,在模糊相似關(guān)系下,需要劃分連續(xù)屬性區(qū)間,對表1決策進(jìn)行處理后,得到區(qū)間劃分結(jié)果為
結(jié)果表明,由式(7)確定的每個二維笛卡爾子區(qū)間中,目標(biāo)的決策值相等。因此,將每個條件屬性分為2個模糊等價類,由三角函數(shù)和梯形函數(shù)確定條件屬性的每個模糊等價類對應(yīng)隸屬函數(shù)如圖3所示。
圖3 條件屬性對應(yīng)模糊集的隸屬函數(shù)Fig.3 Membership function of fuzzy set with the corresponding conditional attribute
綜上所述,基于模糊粗糙集依賴的屬性約簡算法包括3個步驟:①確定候選屬性集;②確定候選屬性集中是否存在冗余屬性,③確定每個新能源發(fā)電基礎(chǔ)數(shù)據(jù)模糊屬性的模糊等價類,根據(jù)依賴程度K確定新能源發(fā)電基礎(chǔ)數(shù)據(jù)的特征選擇[11]。
3)應(yīng)用CRF算法提取特征向量
傳統(tǒng)的遞歸神經(jīng)網(wǎng)絡(luò)模型存在梯度消失情況,限制了遞歸神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)長期時間依賴關(guān)系的能力,本文提出長短期記憶LSTM(long-and short-term memory)神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu),以解決遞歸神經(jīng)網(wǎng)絡(luò)模型所面臨的梯度消失問題。圖4為某單個LSTM塊結(jié)構(gòu)。于正則化,避免了方差問題。
圖4 LSTM塊體系結(jié)構(gòu)Fig.4 Architecture of LSTM block
Softmax回歸分類器對新能源發(fā)電基礎(chǔ)數(shù)據(jù)測試樣本的分類規(guī)則可表示為
綜上所述,Softmax回歸分類器通過式(16)的分類規(guī)則能夠提高數(shù)據(jù)核查效率。
為驗證所獲取發(fā)電數(shù)據(jù)是否存在數(shù)據(jù)造假或錯誤信息,選取河北省某光伏場站發(fā)電功率、電壓、電流等基礎(chǔ)數(shù)據(jù)和測量值作為研究對象進(jìn)行正確性核查,得到檢驗結(jié)果如表2所示。
表2 新能源主要基礎(chǔ)數(shù)據(jù)正確性核查結(jié)果Tab.2 Correctness verification result of main basic data of new energy
由表2可知,對不同節(jié)點(diǎn)有功、無功功率、電壓和電流進(jìn)行分類,其中有功功率基于模糊聚類的樣本數(shù)量高達(dá)33種,表明數(shù)據(jù)復(fù)雜度高。由各分類數(shù)據(jù)的過檢與漏檢差異數(shù)可以看出,有功功率的要求最為嚴(yán)格,過檢數(shù)為3,而漏檢只存在于無功功率數(shù)據(jù)中。在相關(guān)性檢測中,有功功率的p值為0.067,大于規(guī)程設(shè)定值0.05,則不能執(zhí)行否決零假設(shè),認(rèn)為基礎(chǔ)數(shù)據(jù)與檢測數(shù)據(jù)之間不存在明顯差異;電壓基礎(chǔ)數(shù)據(jù)的p值為0.018,小于設(shè)定值0.05,則執(zhí)行否決零假設(shè),認(rèn)為這兩組數(shù)據(jù)存在明顯差異。
在執(zhí)行效果方面,分別采用文獻(xiàn)[5]中的PNN模型與本文方法進(jìn)行對比實(shí)驗,根據(jù)兩種方法統(tǒng)計在0~2 GB不同發(fā)電基礎(chǔ)數(shù)據(jù)量環(huán)境下,數(shù)據(jù)核查所需要的計算時間對比如圖5所示。由圖5可知,本文研究所開發(fā)的數(shù)據(jù)核查服務(wù)平臺對新能源發(fā)電基礎(chǔ)數(shù)據(jù)進(jìn)行數(shù)據(jù)核查耗時更短,處理效率更高,表現(xiàn)出適用性與可靠性,在核查2 GB數(shù)據(jù)量情況下,所耗時間只有84 s。
圖5 兩種方案所需時間對比Fig.5 Comparison of required time between two schemes
本文提出一種基于數(shù)據(jù)特征提取的新能源發(fā)電數(shù)據(jù)核查方法,經(jīng)過研究和應(yīng)用分析,得到結(jié)論如下。
(1)基于模糊依賴的兩步屬性約簡特征選擇算法,根據(jù)冗余屬性集的定義,以候選屬性集為出發(fā)點(diǎn),能夠依次消除不重要的屬性,從而選擇相同種類結(jié)構(gòu)的新能源發(fā)電基礎(chǔ)數(shù)據(jù)特征向量集。
(2)利用LSTM網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)核查,通過單元的存儲器狀態(tài)進(jìn)行寫入、擦除和讀取操作,可以避免深度學(xué)習(xí)過程中所面臨的梯度消失問題,將特征輸入Softmax回歸分類,有助于提高數(shù)據(jù)核查效率。