周建華,呂鵬遠,王 春
(1.中國水利水電科學研究院 北京中水科工程總公司,北京 100048;2.響水長江風力發(fā)電有限公司,湖北 鹽城 224600)
一種適用于海上風機監(jiān)測數(shù)據(jù)實時處理的方法研究
周建華1,呂鵬遠2,王 春1
(1.中國水利水電科學研究院 北京中水科工程總公司,北京 100048;2.響水長江風力發(fā)電有限公司,湖北 鹽城 224600)
海上風機監(jiān)測異常數(shù)據(jù)實時處理,對于風機結(jié)構(gòu)體系功能與安全狀態(tài)的分析評價,具有十分重要的意義。但現(xiàn)階段對于異常數(shù)據(jù)實時處理方法的研究還有待完善。本文結(jié)合風機實時監(jiān)測數(shù)據(jù)特點,采用具有自動調(diào)整參數(shù)功能的AR(n)模型預(yù)測算法進行異常數(shù)據(jù)實時處理,對處理機制進行了分析。應(yīng)用該方法對某海上風機實時采集風速及多種傳感器監(jiān)測數(shù)據(jù)進行了處理,討論了該方法的精度及處理效率,驗證了該方法對于處理風機異常監(jiān)測數(shù)據(jù)的有效性和適用性。
異常數(shù)據(jù);實時處理;處理機制;AR(n)自動調(diào)參預(yù)測模型
近年來,對海上MW級風機安全運行狀況進行實時監(jiān)測成為研究熱點。現(xiàn)有海上監(jiān)測技術(shù)主要針對海上風機所受荷載及相應(yīng)的響應(yīng)進行監(jiān)測,原始數(shù)據(jù)經(jīng)過數(shù)據(jù)存儲、分析及處理,得到基礎(chǔ)的安全運行狀況和維修決策等結(jié)論。由于基礎(chǔ)結(jié)構(gòu)損壞、監(jiān)測對象固有變化異常、測量儀器故障、數(shù)據(jù)傳輸錯誤或者噪音信號摻雜等原因,常常引發(fā)傳感器監(jiān)測數(shù)據(jù)的異常。如果不能實時有效地對監(jiān)測數(shù)據(jù)流中的異常數(shù)據(jù)進行處理,異常信息不能有效辨識,缺失信息不能有效修復(fù),會給后續(xù)數(shù)據(jù)處理與分析帶來很大的誤差,低精度和異常的監(jiān)測數(shù)據(jù)會嚴重影響對基礎(chǔ)結(jié)構(gòu)體系功能與特性的分析評價,威脅風機基礎(chǔ)安全運行。
通過對于海上風機監(jiān)測數(shù)據(jù)的分析研究及相關(guān)研究成果的歸納總結(jié),得到海上風機監(jiān)測數(shù)據(jù)的以下特點[1-3]:無固定的分布模型,隨季節(jié)變化而變化,隨時間變化非線性強,數(shù)據(jù)具有較高不確定性,無法提供大量可信的訓練數(shù)據(jù),監(jiān)測數(shù)據(jù)流每天波動范圍相對小,變化趨勢相近;監(jiān)測數(shù)據(jù)種類多,格式復(fù)雜、信息量大,每天數(shù)據(jù)量甚至能達到十幾GB。
針對風機實時監(jiān)測數(shù)據(jù)特點,國內(nèi)學者已經(jīng)研究了很多處理辦法,如小波分析、數(shù)據(jù)挖掘和數(shù)據(jù)流理論等,然而,常用方法包含大量參數(shù)、算法比較復(fù)雜,占用較大的存儲空間、計算效率較低,且具有代表性的樣本數(shù)據(jù)的選取也是亟需解決的問題[4],因此主要適用于處理離線異常數(shù)據(jù),對于海量實時異常數(shù)據(jù)處理還存在一定的困難。對于風機實時異常數(shù)據(jù),處理方法既要充分體現(xiàn)數(shù)據(jù)分布的特點,且要滿足處理效率要求,又不能依賴大量可信的訓練數(shù)據(jù)。
本文利用監(jiān)測對象本身的一組觀測數(shù)據(jù)之間的關(guān)系來描述監(jiān)測數(shù)據(jù)隨機變動的規(guī)律,即建立AR(n)線性自回歸預(yù)測模型。給出監(jiān)測數(shù)據(jù)的預(yù)測模型參數(shù)及其機制,以預(yù)測未來時刻的值,用預(yù)測值和監(jiān)測值比較的方法確定異常值。
AR(n)預(yù)測模型的建立不需要預(yù)先設(shè)定參數(shù)值,只需少量近期正常監(jiān)測數(shù)據(jù)和簡單計算就可以估計模型的參數(shù)并能實時給出預(yù)測值,比較適用于監(jiān)測數(shù)據(jù)種類多、格式復(fù)雜、信息量大的海上風機異常監(jiān)測數(shù)據(jù)的實時處理。
結(jié)合相關(guān)研究文獻,為了降低預(yù)測誤差,本文采用預(yù)測模型參數(shù)自動調(diào)整策略,以便在預(yù)測誤差超過預(yù)先設(shè)定的閾值時,通過相應(yīng)計算就可以估計模型的參數(shù)并能實時給出預(yù)測值并實時自動調(diào)整預(yù)測模型。
2.1 AR(n)模型異常數(shù)據(jù)處理機制N個樣本點與xt的線性關(guān)系為:是不可觀測的隨機變量。即:
式中:βi為自回歸參數(shù);為 εt的方差[5]。
將{xt}序列直接代入式(1),可以得到線性方程組,用矩陣形式表示為:
根據(jù)多元回歸理論,參數(shù)矩陣β的最小二乘估計為:
對AR(n)模型,擬合的方法有很多,根據(jù)相關(guān)研究成果,其中Box擬合方法簡單,且具有較快的擬合速度,尤其適用于對模型階次毫無任何驗前信息的情況[5-7]。該擬合方法在做最小二乘估計時,從n=1開始對{xt}開始擬合AR(n)模型,檢查最后一個自回歸系數(shù)βn,如果βn≈0,則確定適用模型為AR(n-1)。
根據(jù)AR(n)模型的性質(zhì)知[8],其模型的誤差值,即滿足標準正態(tài)分布。為使 εt盡可能為0,在預(yù)測過程中AR(n)模型應(yīng)自動調(diào)整相關(guān)參數(shù)。當εt=0出現(xiàn)的概率小于一個閾值時,模型就需要調(diào)整。設(shè)當前時刻的預(yù)測誤差為εt,預(yù)測誤差期望值為E(εt),設(shè)調(diào)整后的誤差為ε′t,要使ε′t盡可能為0,可將 εt-E(εt)的值近似為ε′t,即ε′t=εt-E(εt)。
用 βi代替,用ε′t代替εt-E( ) εt,則原模型可改寫為如下形式:
即為調(diào)整后的預(yù)測模型。綜合相應(yīng)的研究成果[9-10],給出如下調(diào)整方案:針對每次的誤差值εt,計算 P(εt=0),即計算εt=0出現(xiàn)的概率;如果P(εt=0)<δ,δ為設(shè)定的閾值,則計算;計算;得到相應(yīng)參數(shù),結(jié)合式(4),重新構(gòu)建預(yù)測模型。
對于實際監(jiān)測數(shù)據(jù),xt可能是一個不符合普遍分布規(guī)律的數(shù)據(jù),即異常數(shù)據(jù)。此時,如果用xt去預(yù)測 xt+1,xt+2,…,則會出現(xiàn)預(yù)測失真,為減小預(yù)測誤差,采用預(yù)測值代替 xt來進行預(yù)測。雖然仍然會出現(xiàn)失真,但誤差就會小很多。
2.2 異常數(shù)據(jù)處理方法算法編程由式(1)得且,設(shè)W為一步后移算子,即xt-1=Wxt,則可得下式:
定義:
式中:N為樣本容量;ω2表示時間序列中當前時刻向前N步時刻(N為整數(shù),且N≥1)相應(yīng)預(yù)測誤差εt平方和的平均值;λ表示當前誤差值 εt+1的平方與ω2的比值,λ即為檢測xt+1是否異常的統(tǒng)計量;U為預(yù)先設(shè)定的大于零的常數(shù),當λ>U,xt+1為異常監(jiān)測數(shù)據(jù)。
在實際應(yīng)用中,可根據(jù)相關(guān)傳感器監(jiān)測數(shù)據(jù)分布特點及實際要求而設(shè)定,假設(shè)U為0.3,則表示如果當前誤差的平方和是平均誤差平方和的零點三倍時,認為是異常數(shù)據(jù)。U值越大,表示監(jiān)測數(shù)據(jù)中包含的異常數(shù)據(jù)的越少。一般來說,對λ>U的情形,意味著異常值比正常值大,統(tǒng)計量λ的大小標志著異常點偏離正常的大小。
利用Matlab軟件與Java語言按照上文所述步驟編寫相應(yīng)程序,實現(xiàn)該異常數(shù)據(jù)處理算法,具體程序框架如下圖1所示。
圖1 異常數(shù)據(jù)實時處理程序框架圖
利用上述方法對海上風機風速及各種傳感器實測數(shù)據(jù)進行處理,驗證該異常數(shù)據(jù)處理方法的有效性及適用性。由于風機塔筒無法安裝風速傳感器,采用風機臨近的測風塔上的風速儀監(jiān)測值進行分析,風速傳感器安裝高度為10m,采樣周期為5 s,其他類型傳感器包括鋼筋計、傾角計、土壓力計及錨索計,安裝在風機基礎(chǔ)不同位置處,采樣周期均為6m in。
3.1 異常風速監(jiān)測數(shù)據(jù)處理對于AR(n)模型,選擇合適的樣本容量和模型階數(shù)n是至關(guān)重要的。樣本容量和階數(shù)太大,將產(chǎn)生大的計算量,不適合用于實時檢測;但如果采用過小的容量和階數(shù),又不能精確的擬合監(jiān)測數(shù)據(jù)。結(jié)合AR(n)模型相關(guān)研究成果[6,11],綜合考慮處理效率和可靠度,確定樣本容量為160,模型階數(shù)n為4,在此基礎(chǔ)上,針對某時段內(nèi)連續(xù)風速實測值進行分析,討論該異常數(shù)據(jù)處理方法的適用性和有效性問題。
(1)具有自調(diào)整機制的AR(n)預(yù)測模型的有效性。對于正常風速監(jiān)測數(shù)據(jù),運用自調(diào)整系數(shù)的AR(n)預(yù)測模型,給出對應(yīng)時刻預(yù)測值。預(yù)測值與實測值之間的對比結(jié)果如圖2所示。
圖2 無異常監(jiān)測數(shù)據(jù)實測值與其預(yù)測值
圖3 含有異常的監(jiān)測數(shù)據(jù)實測值與預(yù)測值對比
由相關(guān)研究成果可知[10-11],預(yù)測結(jié)果可由最終預(yù)測誤差(FPL)定量評價,經(jīng)過程序計算,該模型最終預(yù)測誤差。一般認為,當FPE<0.0015時,預(yù)測模型較好,預(yù)測結(jié)果比較符合實際,且預(yù)測值與實測值之間的最大誤差為2.68%,大部分數(shù)據(jù)誤差在1%以內(nèi)。故該模型對于正常監(jiān)測數(shù)據(jù)流,具有較好的精度,適用性較好。故可以用預(yù)測值代替對應(yīng)時刻的實測值,不會產(chǎn)生較大誤差。
為了驗證模型對含有異常數(shù)據(jù)序列的適用與否,針對上述時間段實測風速值,人為的加入一些單個及連續(xù)的異常數(shù)據(jù)作為傳感器監(jiān)測值,考慮模型階數(shù)、監(jiān)測數(shù)據(jù)容量,以及傳感器監(jiān)測數(shù)據(jù)的實際需求,連續(xù)異常即異常事件包含數(shù)據(jù)點的個數(shù)最大為5個,因為通常情況下,連續(xù)5個數(shù)據(jù)異常時,則認為傳感器自身存在問題。再次利用本文預(yù)測算法對新產(chǎn)生的異常數(shù)據(jù)集進行分析,結(jié)果如圖3所示。
分析圖3可知,預(yù)測模型能夠準確對監(jiān)測數(shù)據(jù)中的異常值進行處理,并及時的用預(yù)測值代替異常值進行修正,修正后的數(shù)據(jù)符合正常監(jiān)測數(shù)據(jù)分布特點。
通過本文預(yù)測模型,可以得到包含異常值與不包含異常值的監(jiān)測數(shù)據(jù)對應(yīng)時刻的預(yù)測值,兩組預(yù)測值對應(yīng)時刻的差值,與正常監(jiān)測數(shù)據(jù)的比值,即為預(yù)測結(jié)果差值百分比,可用PRD表示,如圖4所示。
由圖4可知,無論監(jiān)測數(shù)據(jù)中是否包含異常數(shù)據(jù),預(yù)測結(jié)果相差較小,對應(yīng)時刻預(yù)測值最大差百分比值為4.13%,這是由于在預(yù)測過程中,異常數(shù)據(jù)被及時的用其預(yù)測值代替,所以預(yù)測結(jié)果不太會受相應(yīng)異常數(shù)據(jù)的影響。
(2)預(yù)測數(shù)據(jù)個數(shù)對異常數(shù)據(jù)處理效率及有效性的影響。通過當前N個時刻的監(jiān)測值,結(jié)合預(yù)測模型,可得到未來m(m=1,2,…)步時刻的數(shù)據(jù)值,m為預(yù)測數(shù)據(jù)個數(shù),當出現(xiàn)連續(xù)的異常數(shù)據(jù)即異常事件時,后續(xù)異常數(shù)據(jù)預(yù)測值以前面時刻預(yù)測值為基礎(chǔ),預(yù)測數(shù)據(jù)個數(shù)會對異常數(shù)據(jù)處理精度產(chǎn)生較大影響。
由圖5可知,當預(yù)測數(shù)據(jù)個數(shù)小于3時,處理誤差λ逐步降低,當?shù)扔?時,誤差達到最低,λ= 0.023,而以后隨著預(yù)測數(shù)據(jù)個數(shù)增加,誤差也隨著增大,預(yù)測數(shù)據(jù)個數(shù)越多,處理誤差增加越多,當處理數(shù)據(jù)個數(shù)為8時,λ=0.051。原因可能是當預(yù)測數(shù)據(jù)個數(shù)小于3時,預(yù)測數(shù)據(jù)越多,更能屏蔽只有一個時刻出現(xiàn)的異常監(jiān)測數(shù)據(jù),而隨著預(yù)測個數(shù)的增加,算法會自動用預(yù)測出來的數(shù)據(jù)代替監(jiān)測值,再去預(yù)測更遠時刻的數(shù)據(jù),經(jīng)過多步預(yù)測后累積誤差將會增多。
圖4 有無異常數(shù)據(jù)預(yù)測值差值
圖5 處理數(shù)據(jù)個數(shù)與處理誤差λ關(guān)系
由圖6可知,當預(yù)測數(shù)據(jù)在3個以內(nèi)時,數(shù)據(jù)處理效率基本一致,效率降低不明顯,當預(yù)測數(shù)據(jù)超過4個時,數(shù)據(jù)每增加一個,數(shù)據(jù)處理效率明顯降低,預(yù)測8個數(shù)據(jù)的程序耗時是3個數(shù)據(jù)的將近6.5倍。要適應(yīng)異常數(shù)據(jù)實時處理的要求,每次處理異常數(shù)據(jù)不能太多。
綜合以上分析可知,自調(diào)整系數(shù)AR(n)預(yù)測模型對風速監(jiān)測數(shù)據(jù)異常實時處理最終預(yù)測誤差(PFE)為0.0006,預(yù)測值差值精度(PRD)在5%以內(nèi),運算效率也比較高;該模型能夠處理的最合理的連續(xù)異常數(shù)據(jù)的個數(shù)為3個,誤差最小,處理效率適中,對于正常使用情況,如果出現(xiàn)連續(xù)3個異常數(shù)據(jù),則要考慮傳感器自身問題或外界荷載突變引發(fā),必須重點加以分析,數(shù)據(jù)直接進入異常數(shù)據(jù)庫。即AR(n)模型對于處理時間序列的實時監(jiān)測數(shù)據(jù)異常問題是有效的,其處理精度和效率相對比較高。
圖6 處理數(shù)據(jù)個數(shù)與處理效率關(guān)系
表1 傳感器異常數(shù)據(jù)處理特征值
3.2 各類傳感器異常數(shù)據(jù)處理方法按照上文所述方法,對鋼筋計、傾角計、土壓力計與錨索計實際監(jiān)測數(shù)據(jù)進行處理,得到相應(yīng)預(yù)測值,模型最終預(yù)測誤差(FPE)等特征值。用Zmax、Zmin表示正常監(jiān)測數(shù)據(jù)預(yù)測值與實測值最大、最小差值百分比,用PRDmax、PRDmin表示含異常數(shù)據(jù)序列預(yù)測值與正常預(yù)測值最大、最小差值百分比。則AR(n)預(yù)測模型對應(yīng)于各類傳感器實時數(shù)據(jù)處理的特征值如表1所示。
分析上表可知,自調(diào)整系數(shù)AR(n)預(yù)測模型處理各類傳感器實時監(jiān)測數(shù)據(jù)具有相同的分布規(guī)律,如下所示:(1)模型最終預(yù)測誤差(FPL)均小于0.0015,即模型對各類數(shù)據(jù)處理適用性較好;(2)利用正常監(jiān)測數(shù)據(jù)得到的預(yù)測值與實測值之間的差值,能夠控制在8%以內(nèi),考慮到實際工程中應(yīng)用的精度問題,8%偏差在實際工程中是可以接受的,且與其他異常處理方法相比,AR(n)預(yù)測模型精度比較高;(3)含有異常值的預(yù)測值與正常數(shù)據(jù)的預(yù)測值之間的差值百分比在6%以下,即異常值預(yù)測值與該值處的正常值比較接近,可以對異常值進行替換,以保證監(jiān)測數(shù)據(jù)的完整性;(4)自調(diào)整系數(shù)AR(n)對于風速監(jiān)測數(shù)據(jù),合適的數(shù)據(jù)處理個數(shù)為3,則對其他類傳感器合適的數(shù)據(jù)處理個數(shù)也應(yīng)為3個。
風速、應(yīng)力應(yīng)變、傾角、土壓力及錨索等監(jiān)測數(shù)據(jù)具有明顯的時間連續(xù)性,監(jiān)測頻率固定,通過上文分析可知,對于該類監(jiān)測數(shù)據(jù)序列中的異常數(shù)據(jù),自調(diào)整系數(shù)AR(n)模型具有一定的適用性和有效性。
本文結(jié)合海上風機實時監(jiān)測數(shù)據(jù)無固定分布模型、隨季節(jié)與時間變化非線性強、短時間分布及變化趨勢相對穩(wěn)定、數(shù)據(jù)種類多,格式復(fù)雜、信息量大等特點,建立了具有自動調(diào)整參數(shù)功能的AR(n)模型對監(jiān)測數(shù)據(jù)流進行處理,該模型的實時自動調(diào)整參數(shù)機制較好契合監(jiān)測數(shù)據(jù)流的特征。應(yīng)用該方法對某海上風機實時采集風速及其他傳感器監(jiān)測數(shù)據(jù)進行了處理,結(jié)果表明,當異常數(shù)據(jù)在3個或以內(nèi)時,該方法預(yù)測偏差在6%以內(nèi),最終預(yù)測誤差小于0.001 5,具有較好的精度及效率,對于具有時間序列的風機異常監(jiān)測數(shù)據(jù)實時處理具有一定的有效性和適用性,可以為類似工程中異常數(shù)據(jù)實時處理提供一定的參考。
[1] 楊錦園.橋梁健康監(jiān)測系統(tǒng)數(shù)據(jù)處理分析的研究[J].微計算機信息,2008,24(1):87-91.
[2] 劉芳,毛志忠.基于小波隱馬爾可夫模型的控制過程異常數(shù)據(jù)檢測方法[J].控制與決策,2011,26(8):1187-1911.
[3] 鄭濱,任蕾.一種融合了異常數(shù)據(jù)識別的CMN改進算法[J].計算機工程與應(yīng)用,2013,49(8):120-129.
[4] 梁宗保,胡怡然,張凱 .橋梁健康監(jiān)測信息的數(shù)據(jù)驅(qū)動處理方法研究[J].計算機技術(shù)與發(fā)展,2013,10(20):63-69.
[5] 譚義紅,林亞平,董婷,等 .傳感器網(wǎng)絡(luò)中異常數(shù)據(jù)實時檢測算法[J].系統(tǒng)仿真學報,2007,19(18):4335-4338.
[6] Da Silva S,Dias JNior M,Lopes Junior V.Damage detection in a benchmark structure using AR-ARX models and statistical pattern recognition[J].J.Braz.Soc.Mech.Sci.Eng.,2007,29(2):174-84.
[7] Peter JBrockwell,Richard A.Davis.時間序列的理論與方法[M].第2版.田錚,譯.北京:高等教育出版社,施普林格出版社,2001.
[8] 王國新,閻艷,寧汝新,等.數(shù)據(jù)驅(qū)動與模塊化控制模型相結(jié)合的生產(chǎn)系統(tǒng)快速建模方法[J].系統(tǒng)仿真學報,2009,24(14):4224-4230.
[9] 王家偉,汪仁紅,羅憲,等 .基于數(shù)據(jù)流的橋梁健康監(jiān)測海量數(shù)據(jù)處理[J].計算機系統(tǒng)應(yīng)用,2011,20(12):158-161.
[10] Datar M,Gionis A,Indyk P,et al.Maintaining stream statistics over sliding windows[J].SIAM Journal on Co?puting,2001,31:1791-1813.
[11] 王永利,徐宏炳,董逸生,等 .數(shù)據(jù)流上異常數(shù)據(jù)的在線檢測與修正[J].應(yīng)用科學學報,2006,24(3):256-261.
Study on the approach to dealing with the abnormal data in real-time monitoring of the offshore wind turbine
ZHOU Jianhua1,LüPengyuan2,WANG Chun1
(1.Beijing IWHRCorp.,IWHR,Beijing 100048,China;
2.XiangshuiYangtzeWind Power Generation Co.,Ltd.,Yancheng 224600,China)
s:It has very important significance for the fan structure function analysis and evaluation of the se?curity state to disposes the monitoring data of the offshore wind turbine in real-time.At the present stage,the methods for processing abnormal data in real-time should be improved.In this paper,the general rules of the monitoring data and the corresponding characteristics of abnormal data are obtained by analyzing the characteristics of monitoring data of the fan in real-time.The abnormal data is processed through the AR(n)prediction model,and the processing mechanism of this model is analyzed.Through appling this meth?od to process the monitoring data of the wind speed and a variety of sensors,it has been proved that the method is effective and applicable for dealing with the anomaly monitoring data.
the abnormal data;deal with in time;processing mechanism;AR(n)prediction model with automatic parameter ad justment
文獻標識碼:Adoi:10.13244/j.cnki.jiwhr.2015.04.011
1672-3031(2015)04-0306-06
(責任編輯:王冰偉)
2015-01-21
周建華(1985-),男,山東濟寧人,碩士,助理工程師,主要從事海上基礎(chǔ)研究。E-mail:future521@163.com