李 明,袁逸萍,賈依達爾,趙 琴
(新疆大學(xué)機械工程學(xué)院,新疆 烏魯木齊 830047)
由于風(fēng)力資源的波動性和間歇性特點,并網(wǎng)風(fēng)力發(fā)電在給人類提供清潔能源的同時,也給電力系統(tǒng)的安全、穩(wěn)定運行帶來了嚴(yán)峻挑戰(zhàn)[1]。精確的風(fēng)電功率短期預(yù)測有助于緩解電力系統(tǒng)調(diào)峰、調(diào)頻壓力,對于風(fēng)電并網(wǎng)具有重大意義[2-3]。同時,對于發(fā)電設(shè)備的利用率和經(jīng)濟調(diào)度的有效性也起著重要作用[4]。SCADA數(shù)據(jù)采集與監(jiān)控系統(tǒng)集成在風(fēng)電機組中,用于完整記錄機組各個子系統(tǒng)和關(guān)鍵部件的運行狀態(tài)[5]。該系統(tǒng)監(jiān)測參數(shù)眾多:既包括電機保護、偏航動作開關(guān)等離散參量,又包括溫度、風(fēng)速、振動、電壓、電流等連續(xù)參量[6]。然而通常無法通過龐大的SCADA數(shù)據(jù)提取反應(yīng)系統(tǒng)運行狀態(tài)的特征向量,從而挖掘風(fēng)電機組各運行系統(tǒng)之間的潛在關(guān)聯(lián)性,提取特征向量精確預(yù)測風(fēng)電功率是一大挑戰(zhàn)。
國內(nèi)外學(xué)者結(jié)合SCADA 數(shù)據(jù)針對風(fēng)電機組相關(guān)參數(shù)的預(yù)測及故障認定做了大量研究。文獻[7]分析了風(fēng)電機組溫度、功率等SCADA數(shù)據(jù),震動信號的頻率作為輔助因素,利用神經(jīng)網(wǎng)絡(luò)實現(xiàn)了風(fēng)機軸承是否故障,故障等級所屬,以及具體故障類型的三級故障預(yù)測;文獻[7]中運用風(fēng)機SCADA數(shù)據(jù)中的轉(zhuǎn)速、功率為參數(shù),建立了Boosting tree 和神經(jīng)網(wǎng)絡(luò)兩種模型預(yù)測故障發(fā)生;文獻[8]采用最小量化誤差的神經(jīng)網(wǎng)絡(luò),對某海上風(fēng)機的故障進行了預(yù)測,效果較好;文獻[9]將SCADA數(shù)據(jù)中實時功率、不可控風(fēng)速、空氣溫度、主軸轉(zhuǎn)速作為神經(jīng)網(wǎng)絡(luò)的輸入,通過實際軸承溫度與預(yù)測軸承溫度的殘差預(yù)測故障。文獻[10]利用線性回歸分析對齒輪箱軸承溫度進行了預(yù)測;文獻[12]利用SPC及SVM算法建立了軸承溫度預(yù)測模型;文獻[13]等利用非線性自回歸神經(jīng)網(wǎng)絡(luò)對齒輪箱油溫及相關(guān)變量集進行了建模采用考慮殘差分布規(guī)律的SPC方法控制模型在線學(xué)習(xí)行為。
在以上預(yù)測研究基礎(chǔ)上,選擇能夠充分挖掘時間維度上的信息的LSTM網(wǎng)絡(luò),利用PCA降維原始變量集降低冗余,最終實現(xiàn)風(fēng)電機組短期輸出功率的準(zhǔn)確穩(wěn)定預(yù)測,為緩解電力系統(tǒng)調(diào)峰、調(diào)頻壓力,發(fā)電設(shè)備的利用率和經(jīng)濟調(diào)度的有效性提供基礎(chǔ)性支持。
模型輸入的數(shù)據(jù)均來自新疆地區(qū)某風(fēng)場2017 年12 月的SCADA數(shù)據(jù),模型可由式(1)進行描述。
輸入量包括:變流器扭矩反饋、變流器功率反饋、變流器機側(cè)電壓、風(fēng)速(機械)、視在功率、發(fā)電機轉(zhuǎn)速(接近開關(guān))、gh輸出變流器扭矩給定值等一些列與風(fēng)電機組輸出功率存在較大影響因子的相關(guān)變量。
減少變量集Xt中反映同一特性的冗余變量,有益于減小模型計算量,提升精度。通過特征方程求得R矩陣的特征值λ(λ1、λ2、…、λn,λ1≥λ2≥…≥λn),再根據(jù)各個主成分累計貢獻率Qs(m)選取k個主成分。數(shù)學(xué)表達式,如式(2)所示。
一般累計貢獻率Q(m)≥85%即可包含原問題的絕大部分信息,能夠較準(zhǔn)確描述原問題的發(fā)展方向。
由于RNN存在梯度消失的問題,所以Hochreiter和Schmid?huber引入記憶單元提出了LSTM,LSTM是一種時間遞歸型網(wǎng)絡(luò),主要應(yīng)用于時間序列預(yù)測問題中。LSTM由輸入層、隱含層和輸出層組成,同時LSTM 通過輸入門、遺忘門和輸出門三個結(jié)構(gòu)進行信息的保護和控制。在給出圖1的LSTM 結(jié)構(gòu)中組成輸入單元,ht為狀態(tài)輸出單元,Ct-1,Ct表示細胞狀態(tài),it、ft、ot分別為輸入、遺忘和輸出門限,各單元的狀態(tài)可由式(3)~式(8)表示。
圖1 LSTM結(jié)構(gòu)圖Fig.1 LSTM Structure Diagram
遺忘門:
輸入門:
輸出門:
式中:σ—sigmoid函數(shù)。
4.1.1 平臺設(shè)置
硬件平臺為工作站。處理器為i5-8250U,內(nèi)存為8GB,固態(tài)硬盤容量為265GB。軟件框架結(jié)構(gòu)為基于Anaconda深度學(xué)習(xí)工具的Tensorflow框架。
4.1.2 數(shù)據(jù)構(gòu)造與評價指標(biāo)說明
將2017年12月1日至12月31日期間的新疆某風(fēng)場直驅(qū)永磁式2MW 機型12 號機SCADA 實際工況運維數(shù)據(jù)進行模型驗證,SCADA系統(tǒng)每300s記錄一次機組運行參數(shù)。
變量間存在強相關(guān)性是進行PCA分析的前提必備條件。變量間的相關(guān)性可由KMO(Kaisar-Meyer-Olkin)和Bartlett檢驗獲得,檢驗結(jié)果,如表1所示。
表1 相關(guān)性檢驗表Tab.1 Correlation Checklist
KMO 檢驗主要是用于說明主成分提取的數(shù)據(jù)情況。根據(jù)表1,KMO 檢驗系數(shù)值0.857>0.8,巴特利檢驗系數(shù)值P=0.000<0.001,該研究數(shù)據(jù)結(jié)構(gòu)良好,存在較強相關(guān)關(guān)系,具有很好的實用性,研究數(shù)據(jù)可以進行主成分分析。
對于以上數(shù)據(jù)進行數(shù)據(jù)預(yù)處理步驟如下:
(1)根據(jù)式(9)對所有數(shù)據(jù)進行歸一化處理。
(2)零值及數(shù)據(jù)缺失處,直接采用將整條數(shù)據(jù)進行刪除操作即可,由于總的數(shù)據(jù)量足夠完成仿真,同時僅存在少量的零值及缺失,故此操作不影響總的預(yù)測效果。
(3)進行數(shù)據(jù)高斯平滑處理。
(4)據(jù)式(10)計算每個變量對于風(fēng)電機組有功功率的Pear?son相關(guān)系數(shù),保留系數(shù)值>0.8的變量。
根據(jù)PCA計算原則,計算所屬特征值對于輸出功率提供的單個貢獻了和累計貢獻率,根據(jù)下表,Qj(g)≥85%的主成分包含4個,Qj(g)=89.17%,故g=4。
表2 相關(guān)參數(shù)表Tab.2 Related Parameter Table
表3 總方差解釋表Tab.3 Total Variance Interpretation Table
進而得到成分系數(shù)矩陣,如表4所示。
表4 成分系數(shù)表Tab.4 Composition Coefficient Table
取得以上參數(shù)樣本總數(shù)為11949,將最后的500組數(shù)據(jù)作為測試集,余留數(shù)據(jù)按照4:1的比例設(shè)定訓(xùn)練集和驗證集。選取預(yù)測步長為6步,即1h的預(yù)測間隔;與具有代表性的時間序列預(yù)測算法Arima、SVM在同一數(shù)據(jù)集對比預(yù)測效果。各模型預(yù)測性能依據(jù)以下統(tǒng)計誤差分析參數(shù)進行衡量:
式中:pi—模型預(yù)測值;ri—功率實際值;n—樣本總數(shù);式(11)~式(13)式表征誤差情況,計算結(jié)果越小表明預(yù)測值與實際值越接近,證明模型性能越好,特征表達能力越強。
在LSTM算法中,將輸入層設(shè)定為21,數(shù)據(jù)經(jīng)過輸出維度為50的LSTM單元,并取其隱含層輸出形成(50×21)的數(shù)據(jù)矩陣hl。預(yù)測結(jié)果,如圖2所示。
圖2 預(yù)測結(jié)果圖Fig.2 Forecast Result Graph
比較圖2中的結(jié)果可以發(fā)現(xiàn),由于步長較長,三種模型在一定程度上均偏離了原始數(shù)據(jù)集的發(fā)展方向,其中表征Arima模型預(yù)測結(jié)果的黃色線條偏離程度最大,表征SVM及LSTM預(yù)測結(jié)果的綠色及紅色線條偏離程度多少并不能通過整個表現(xiàn)出來,如圖2所示。于是將圖2[100,200]區(qū)間內(nèi)的點集分布進行放大形成圖,如圖3所示。在圖3的結(jié)果中可以知道,LSTM模型預(yù)測結(jié)果始終保持與原始數(shù)據(jù)集變化趨勢的緊密貼合,雖然SVM預(yù)測結(jié)果在大體上也能夠跟隨實際值的變化趨勢,但預(yù)測圖中可以發(fā)現(xiàn)兩種現(xiàn)象,第一是預(yù)測結(jié)果變化的幅度總是小于原始數(shù)據(jù)集變化的幅度,呈現(xiàn)一種‘平穩(wěn)過度’的現(xiàn)象;第二在圖2中明顯可發(fā)現(xiàn),在每一段原始數(shù)據(jù)發(fā)生較大的突然下降時,表征SVM預(yù)測結(jié)果的綠色線條存在延后下降的趨勢,導(dǎo)致嚴(yán)重失準(zhǔn)。同時,表5中的誤差統(tǒng)計結(jié)果表明,LSTM模型各項指標(biāo)均優(yōu)于Arima與SVM,結(jié)合各項指標(biāo),LSTM 較Arima 誤差平均降低61.10%,較SVM 誤差平均降低了27.85%。
圖3 預(yù)測結(jié)果圖Fig.3 Forecast Result Graph
表5 誤差對比結(jié)果表Tab.5 Error Comparison Result Table
長短期記憶神經(jīng)網(wǎng)絡(luò)在時間序列上的預(yù)測具有優(yōu)勢,能夠充分挖掘時間維度上的信息,從而更準(zhǔn)確的反應(yīng)短時期內(nèi)的負荷變化,提升預(yù)測結(jié)果的可靠性。
然而,面對非線性數(shù)據(jù)大量長期數(shù)據(jù)預(yù)測問題時,由于記憶細胞中存儲的原始記憶作用,在一定程度上中和了突變數(shù)據(jù)帶來的影響,因而可能會使預(yù)測結(jié)果呈現(xiàn)較為平穩(wěn)的變化趨勢。這就在一定程度上會造成預(yù)測相應(yīng)功率數(shù)值時有延遲現(xiàn)象,將直接導(dǎo)致預(yù)測精度的下降,故針對于長期非線性的數(shù)據(jù)預(yù)測應(yīng)適當(dāng)考慮空間信息的結(jié)合,對于高維多源異構(gòu)數(shù)據(jù)空間上的特征和LSTM記憶細胞輸出的時序特征向量的結(jié)合,在不同的點具有相對應(yīng)的側(cè)重點,更好的緩沖數(shù)據(jù)突變帶來的數(shù)據(jù)預(yù)測不穩(wěn)定性將是有待繼續(xù)深入研究的一個方向。
相對于傳統(tǒng)的預(yù)測方法提出的模型挖掘的信息更為充分,實現(xiàn)了數(shù)據(jù)特征的提取,預(yù)測效果也較傳統(tǒng)預(yù)測方法有較好的精度,在預(yù)測結(jié)果上更接近實際值的非線性變化趨勢,提高了短期功率預(yù)測的穩(wěn)定性。