程斌斌,陳德彬,李德鑫,李宙宇,趙天野
(華能吉林發(fā)電有限公司新能源分公司,長春 130000)
在習近平總書記“2030年碳達峰,2060年碳中和”的重要指示下,綠色與高效發(fā)展成為我國能源體系建設的發(fā)展方向。風力發(fā)電作為一種可再生能源,發(fā)展迅速,在我國綠色低碳轉(zhuǎn)型、能源結(jié)構(gòu)調(diào)整等方面發(fā)揮著舉足輕重的作用。風電機組所處環(huán)境復雜,面臨高溫、高濕、鹽霧腐蝕、沙塵、臺風、雷暴等惡劣氣候條件,且隨著風電機組服役年限增長,風機故障率不斷上升,這給機組的運行安全帶來挑戰(zhàn)[1]。目前大型風電機組普遍配置了數(shù)據(jù)采集與監(jiān)視控制(Supervisory Control And Data Acquisition,SCADA)系統(tǒng),對風力機及其核心部件的性能參數(shù)、溫度和風速等環(huán)境參數(shù)、電網(wǎng)電壓和頻率等電氣參數(shù)、風力機故障停機及維修等運行參數(shù)進行實時遠程監(jiān)測與記錄。當SCADA系統(tǒng)監(jiān)測的參數(shù)超出設定的閾值,就會觸發(fā)警報。但是SCADA系統(tǒng)是基于設計時的固定閾值來報告機組的運行狀態(tài)的,是一種固定的越線報警模式,未能兼顧環(huán)境變化和機組在運行過程中的老化,當機組發(fā)生故障,觸發(fā)警報時,機組的故障已然惡化,故障的早期預警無法實現(xiàn)。因此,采用大數(shù)據(jù)分析方法,利用風電機組SCADA系統(tǒng)大量運行數(shù)據(jù)及狀態(tài)信息,開展風電機組性能評估、異常工況預警及早期故障檢測[2-3],成為當前的研究熱點。
基于SCADA系統(tǒng)的參數(shù)預警的基本原理是從 SCADA 系統(tǒng)中抽取機組正常運行數(shù)據(jù),建立預測模型,對當前工況的應達值進行估計,并與實際運行參數(shù)對比,通過殘差的大小來評判機組的運行狀況。睦浩淼[4]在風電機組運行狀態(tài)異常檢測方面提出了一種基于回歸算法支持向量機的方法。陳自強等[5]提出了一種基于深度置信網(wǎng)絡的風電機組變槳系統(tǒng)的故障診斷方法,用于診斷系統(tǒng)的早期故障,取得了較好的效果。Zhang等[6]分析了長短時記憶網(wǎng)絡在風力機參數(shù)預警中的不確定性。崔愷等[7]建立了基于廣義回歸神經(jīng)網(wǎng)絡的風電機組性能預測模型和故障預警模型,并用某實際風電機組若干歷史故障發(fā)生前后的真實 SCADA 數(shù)據(jù)驗證了模型的有效性。
上述方法在風電機組早期參數(shù)異常預警方面取得了較好的效果,但對風電機組實際運行的狀態(tài)考慮不夠全面。其中數(shù)據(jù)清洗規(guī)則不適用于不規(guī)則和多密度數(shù)據(jù)集,對于限負荷數(shù)據(jù)的清洗過程較為繁瑣,且其建模方法也存在適應性不足的缺點。基于此,本文依據(jù)風力發(fā)電機的工作原理,將風電機組劃分為風速功率系統(tǒng)、機艙溫度系統(tǒng)、變槳系統(tǒng)、齒輪箱系統(tǒng)、發(fā)電機系統(tǒng)等子系統(tǒng),基于降噪自編碼(Denoising Auto-Encoders,DAE)深度神經(jīng)網(wǎng)絡,建立了風力發(fā)電機組各子系統(tǒng)的參數(shù)異常預警模型。在此基礎上,依據(jù)SCADA系統(tǒng)實際運行數(shù)據(jù),從空值、異常值、非正常狀態(tài)數(shù)據(jù)以及歸一化等4個方面提出了一整套數(shù)據(jù)預處理方法,最終提出了一種基于降噪自編碼的風電機組參數(shù)預警方法。
風電機組傳感器數(shù)據(jù)容易出現(xiàn)測量誤差,這通常是惡劣的自然環(huán)境、強電磁干擾和信道噪聲造成的,由于傳感器失靈、通信錯誤或極端天氣等原因會產(chǎn)生不良數(shù)據(jù)。機組實際輸出功率為零的情況通常由測量終端通信設備故障、非計劃停運等原因?qū)е隆S捎陔娋W(wǎng)負荷端接納能力不足,風電機組可能會出現(xiàn)被迫降功率運行或停機的情況,導致發(fā)生限功率運行。以上種種原因可能會導致SCADA中的數(shù)據(jù)不能用于模型訓練。上述問題一般可以歸納為空值、異常值、非正常工況三種情況,此外在模型訓練中數(shù)據(jù)還存在歸一化的問題。
風力機組長時間在惡劣工況下運行會導致其狀態(tài)不穩(wěn)定,出現(xiàn)間歇性的啟停機或者通信中斷情況,這種情況會導致傳達到SCADA數(shù)據(jù)庫的數(shù)據(jù)為空值。如果SCADA系統(tǒng)中的數(shù)據(jù)在較長時間范圍內(nèi)都為空值,可以采用直接去除的方式對空值數(shù)據(jù)進行預處理。
SCADA數(shù)據(jù)中的異常值主要指傳感器的測量值超出其物理上下限,或者其測量結(jié)果超出當前可能的正常范圍,如風速、環(huán)境溫度等超出正常范圍。對于傳感器測量值超出物理上下限的數(shù)據(jù)可以直接采用刪除的方式進行處理。對于采用極值判斷后測量結(jié)果出現(xiàn)明顯異常的情況,比如風速值、轉(zhuǎn)速值小于0或者絕對值特別大等情況,應該將其歷史記錄的保存數(shù)據(jù)刪除。對于其他可能存在的不正常情況和數(shù)據(jù)值,應通過對風電機組歷史值的統(tǒng)計分析,采用箱型圖方法進行預處理,以刪除明顯偏離正常值的數(shù)據(jù)點。
箱形圖可以用來描述數(shù)據(jù)分布的整體情況,通過計算中位數(shù)、下四分位數(shù)、上四分位數(shù)、上邊界、下邊界等統(tǒng)計量來生成一個箱體圖,來描述數(shù)據(jù)的整體分布情況。箱體內(nèi)是正常數(shù)據(jù),超出了上下邊界的數(shù)據(jù)可以判定為異常。箱型圖剔除數(shù)據(jù)中的異常數(shù)據(jù)的原理如圖1所示。
圖1 箱型圖剔除異常數(shù)據(jù)
上下邊界計算公式如下:
(1)
式中:Q1表示數(shù)據(jù)的下四分位數(shù);Q3表示數(shù)據(jù)的上四分位數(shù);Xll表示數(shù)據(jù)集的下限;Xul表示數(shù)據(jù)集的上限。
非正常工況數(shù)據(jù)主要指設備未運行時產(chǎn)生的數(shù)據(jù)和設備發(fā)生故障時的運行數(shù)據(jù),以及發(fā)生棄風限電或出現(xiàn)多參數(shù)間有邏輯矛盾的情況下的數(shù)據(jù),如風速低于切入風速,但機組卻仍然并網(wǎng)發(fā)電等。對于該類數(shù)據(jù),可以通過邏輯值加聚類方式對其數(shù)據(jù)范圍進行判斷,然后將數(shù)據(jù)記錄刪除。
SCADA數(shù)據(jù)中存儲的監(jiān)測數(shù)據(jù)種類眾多,不同類型數(shù)據(jù)單位不同,物理意義不同。不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到數(shù)據(jù)分析的結(jié)果。為了消除指標之間的量綱影響,需將數(shù)據(jù)進行歸一化處理。歸一化計算公式如下:
(2)
自編碼器(Auto-Encoder,AE)[8]是一種用于學習輸入數(shù)據(jù)非線性特征并將其進行重構(gòu)的神經(jīng)網(wǎng)絡,通過無監(jiān)督方式學習輸入數(shù)據(jù)的表達特征,網(wǎng)絡結(jié)構(gòu)包括輸入層、隱含層和輸出層。通常AE的輸出層與輸入層的神經(jīng)元數(shù)量相同,其訓練目標是讓輸出盡可能還原輸入信號。AE包括從輸入層到隱藏層的編碼過程和隱藏層到輸出層的解碼過程,其邏輯結(jié)構(gòu)如圖2所示。
圖2 自編碼神經(jīng)網(wǎng)絡結(jié)構(gòu)示意圖
為了解決經(jīng)典AE容易產(chǎn)生的過擬合的問題,Vincent等[9]提出了DAE方法,在傳統(tǒng)AE的輸入層加入隨機噪聲來增強模型的魯棒性。分別用函數(shù)表示添加噪聲、編碼器、解碼器和損失函數(shù)如下:
(3)
(4)
(5)
(6)
風電機組是由風輪、偏航、變槳、傳動鏈、發(fā)電機、機艙、塔架以及控制系統(tǒng)等共同構(gòu)成的發(fā)電運行系統(tǒng)。若將整個風電機組建立成一個DAE深度網(wǎng)絡模型,則會存在輸入?yún)?shù)過多,且多個參數(shù)之間相關性不強的問題,這會導致模型的訓練樣本超大,訓練和預測速度降低,精度較低。因此本文依據(jù)風電機組的工作原理,將其劃分為風速功率子系統(tǒng)、機艙溫度子系統(tǒng)、變槳子系統(tǒng)、偏航子系統(tǒng)、齒輪箱子系統(tǒng)、發(fā)電機子系統(tǒng)等等,對每個子系統(tǒng)分別建模,并選取相應的輸入輸出參數(shù)。需要注意的是,不同廠家不同型號的機組,由于傳感器的布置存在一定的差異,其子系統(tǒng)的輸入輸出參數(shù)會根據(jù)傳感器的實際布置情況進行修正。以金風GW82/1500型機組為例,其發(fā)電機子系統(tǒng)的模型輸入輸出參數(shù)如表1所示,而華銳SL1500/77型機組的發(fā)電機子系統(tǒng)的模型輸入輸出參數(shù)如表2所示,可以看出其有較大的差異。
表1 金風GW82/1500機組發(fā)電機模型的輸入輸出參數(shù)
表2 華銳SL1500/77機組發(fā)電機模型的輸入輸出參數(shù)
下面以金風GW82/1500型機組發(fā)電機子系統(tǒng)的模型為例,根據(jù)3.1節(jié)所建立的各子模型分別進行訓練。該DAE模型設置3個隱含層,對每個隱含層的單元個數(shù)、學習率以及噪聲損壞程度進行網(wǎng)格搜索尋優(yōu),最終確定單元數(shù)分別是8和4,損壞程度為0.4,優(yōu)化器為Adam,訓練損失函數(shù)為MSE。模型的W,b等參數(shù)在訓練開始時進行服從均勻分布的隨機初始化。模型建立完成后進行訓練。本文選取前一年的正常工況作為總樣本,將總樣本按季節(jié)進行劃分,從各個季節(jié)中隨機選擇80%的數(shù)據(jù)作為訓練樣本,其余20%數(shù)據(jù)作為測試樣本。圖3為模型訓練過程中訓練樣本與測試樣本損失函數(shù)變化趨勢,隨著訓練深度的增加,損失函數(shù)逐漸降低直至趨于穩(wěn)定。
圖3 模型訓練損失函數(shù)變化過程
根據(jù)前述研究結(jié)果,采用JAVA軟件開發(fā)系統(tǒng)界面,采用PYTHON建立風電機組各子系統(tǒng)的預警模型,并將所開發(fā)的預警軟件布置在某風電公司的A風電場、B風電場和C風電場上,2021年8月份運行1個多月的預警事件統(tǒng)計表明,正確預警為180條,錯誤預警為27條,運行1個月來的預警準確率為86.9%。下面以C風電場運達F28風電機組變槳系統(tǒng)為例,詳細說明其預警結(jié)果。
2021年8月31日 04:59:44 該風電機組槳葉2電機溫度殘差超限,發(fā)出預警,同一時刻的槳葉1號電機溫度、槳葉3號電機溫度未發(fā)出預警信息,預測界面如圖4至圖6所示。
圖4 槳葉1號電機溫度預測結(jié)果圖
圖5 槳葉2號電機溫度預測結(jié)果圖
圖6 槳葉3號電機溫度預測結(jié)果圖
從圖4至圖6可以看出,槳葉1號、3號電機溫度預測值與實際值之間均擬合得較好,殘差處于很低的水平。經(jīng)分析實際值可知,此時槳葉2號電機溫度長時間在48 ℃上下波動,與1號、3號電機溫度實際值差距較大,懷疑溫度傳感器損壞。經(jīng)維修人員現(xiàn)場檢查后,確定了該故障。
基于風電機組SCADA系統(tǒng)歷史運行數(shù)據(jù),從空值、異常值、非正常狀態(tài)數(shù)據(jù)以及歸一化等4個方面提出了一整套數(shù)據(jù)預處理方法,對原始數(shù)據(jù)進行了清洗,剔除異常和故障數(shù)據(jù),然后依據(jù)風力發(fā)電機的工作原理,將風電機組劃分為風速功率系統(tǒng)、機艙溫度系統(tǒng)、變槳系統(tǒng)、齒輪箱系統(tǒng)、發(fā)電機系統(tǒng)等子系統(tǒng),進而采用DAE建立了風電機組正常參數(shù)預測模型,并對模型進行了驗證。結(jié)果表明,該方法能夠?qū)︼L電機組異常狀態(tài)進行提前預警,準確率能夠滿足風電場實際需求。研究成果對于機組的安全運行和維護決策具有重要意義。