王夢(mèng)柯 何利力
摘 要:由于制造業(yè)生產(chǎn)數(shù)據(jù)具有較強(qiáng)時(shí)段性,相關(guān)工藝蒸汽流量預(yù)測(cè)方法精確度不高,無(wú)法有效節(jié)能降耗。針對(duì)該問(wèn)題,提出基于時(shí)間集分割的蒸汽流量預(yù)測(cè)模型?;诠に嚿a(chǎn)情況及原始數(shù)據(jù)的時(shí)段性,將日生產(chǎn)工藝流量時(shí)間集劃分為工單穩(wěn)定生產(chǎn)時(shí)段、工單啟動(dòng)后/結(jié)束前時(shí)段、非工單時(shí)段,采用逐點(diǎn)回歸模型預(yù)測(cè)工單穩(wěn)定生產(chǎn)時(shí)段,利用曲線補(bǔ)全模型預(yù)測(cè)工單啟動(dòng)后/結(jié)束前時(shí)段。非工單時(shí)段無(wú)生產(chǎn),因此無(wú)需進(jìn)行預(yù)測(cè)。綜合逐點(diǎn)回歸—曲線補(bǔ)全預(yù)測(cè)結(jié)果,得出日工藝用蒸汽流量。實(shí)例研究表明,相較于傳統(tǒng)未分割時(shí)間集的單一預(yù)測(cè)模型,基于時(shí)間集分割的逐點(diǎn)回歸—曲線補(bǔ)全組合預(yù)測(cè)方法精確度達(dá)94%以上。基于時(shí)間集分割的組合模型不僅預(yù)測(cè)精度高且較穩(wěn)定,可為蒸汽生產(chǎn)與實(shí)時(shí)調(diào)度提供決策依據(jù)。
關(guān)鍵詞:時(shí)段性;時(shí)間集劃分;逐點(diǎn)回歸;曲線補(bǔ)全
DOI:10. 11907/rjdk. 191885 開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
中圖分類(lèi)號(hào):TP306文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2020)005-0088-06
0 引言
一個(gè)精確的工藝用流量預(yù)測(cè)模型對(duì)于蒸汽供應(yīng)設(shè)備的調(diào)度優(yōu)化與企業(yè)穩(wěn)定生產(chǎn)具有重大意義。國(guó)內(nèi)外現(xiàn)有流量預(yù)測(cè)方法可分為3類(lèi)。
(1)基于數(shù)學(xué)分析的模型。如鄒伯賢等[1]將自回歸滑動(dòng)平均模型(Autoregressive?Moving?Average Model,ARMA模型)應(yīng)用到網(wǎng)絡(luò)流量預(yù)測(cè)中,取得了較好的預(yù)測(cè)結(jié)果,使網(wǎng)絡(luò)過(guò)載預(yù)警成為可能;劉艷麗等[2]提出一種改進(jìn)的ARIMA預(yù)測(cè)模型,通過(guò)優(yōu)化模型識(shí)別與參數(shù)調(diào)整提高了交通流量預(yù)測(cè)精度。
(2)人工智能模型。如吳海姬等[3]采用BP神經(jīng)網(wǎng)絡(luò)建立主蒸汽流量預(yù)測(cè)模型,但神經(jīng)網(wǎng)絡(luò)存在易陷入局部極小點(diǎn)、預(yù)測(cè)精度差等缺點(diǎn);王雷等[4]針對(duì)實(shí)際生產(chǎn)過(guò)程中主蒸汽流量預(yù)測(cè),提出一種基于支持向量機(jī)(Support Vector Machine,SVM)的主蒸汽流量回歸預(yù)測(cè)方法,然而該方法計(jì)算模型比較復(fù)雜,當(dāng)數(shù)據(jù)規(guī)模較大時(shí),耗時(shí)較長(zhǎng);Fu等[5]基于平均影響值和支持向量回歸,提出了一種新的主蒸汽流量預(yù)測(cè)模型,該方法可有效減少模型維數(shù),提高預(yù)測(cè)精度。
(3)組合模型。如張維平等[6]提出一種基于粗糙集理論與最小二乘支持向量回歸算法相結(jié)合的主蒸汽流量預(yù)測(cè)方法,避免了常規(guī)最小二乘支持向量回歸算法根據(jù)經(jīng)驗(yàn)選取輸入?yún)?shù)的盲目性;Gao等[7]采用小波分析與人工神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法建立小波神經(jīng)網(wǎng)絡(luò)短期交通流預(yù)測(cè)模型,取得了更好的預(yù)測(cè)精度與更快的收斂速度;Mouatadid等[8]首次提出復(fù)發(fā)長(zhǎng)短記憶網(wǎng)絡(luò)與最大重疊離散小波變換及自舉技術(shù)相結(jié)合,并應(yīng)用于農(nóng)業(yè)灌溉流量預(yù)測(cè),取得了準(zhǔn)確的預(yù)測(cè)結(jié)果。
現(xiàn)有方法雖然在一定程度上提高了預(yù)測(cè)性能,但大多數(shù)方法不適用于預(yù)測(cè)制造企業(yè)生產(chǎn)工藝蒸汽流量,因?yàn)閷?shí)際生產(chǎn)工藝流量數(shù)據(jù)具有較強(qiáng)時(shí)段性,若直接采取某種方法進(jìn)行預(yù)測(cè),結(jié)果往往不夠精準(zhǔn)。因此本文提出一種逐點(diǎn)回歸——曲線補(bǔ)全的組合預(yù)測(cè)方法,根據(jù)不同時(shí)段數(shù)據(jù)特性和影響因素,先對(duì)時(shí)間集進(jìn)行分割,再針對(duì)不同時(shí)段采用不同的預(yù)測(cè)方法,以提高預(yù)測(cè)性能,達(dá)到企業(yè)節(jié)能降耗的目的。
1 問(wèn)題與數(shù)據(jù)描述
本文研究對(duì)象為某大型企業(yè)制絲線蒸汽流量預(yù)測(cè)及供能應(yīng)用。根據(jù)次日計(jì)劃工單集合預(yù)測(cè)工藝用蒸汽流量,預(yù)測(cè)頻度為5分鐘/次。通過(guò)深入剖析工藝蒸汽歷史流量數(shù)據(jù),充分考慮產(chǎn)品、工藝線、時(shí)間段等因素對(duì)流量的影響,利用最佳數(shù)學(xué)方法表示蒸汽變化規(guī)律,最后基于規(guī)律對(duì)次日工藝蒸汽流量進(jìn)行預(yù)測(cè)。
該廠蒸汽由4臺(tái)蒸汽流量輸送大小不同的鍋爐進(jìn)行供應(yīng),關(guān)于制絲生產(chǎn)工藝蒸汽流量的采集點(diǎn)位有100余個(gè),數(shù)據(jù)采集頻率2次/分。工單數(shù)據(jù)集合[Wm,na][{order_id,t_s,t_e,b,d,a}],其中order_id表示工單編號(hào)且唯一,m表示第幾天,na表示工單生產(chǎn)次序,t_s表示工單生產(chǎn)開(kāi)始時(shí)間、t_e表示工單生產(chǎn)結(jié)束時(shí)間、b表示生產(chǎn)產(chǎn)品、d表示生產(chǎn)工藝段、a表示生產(chǎn)工藝線。工單數(shù)據(jù)和流量數(shù)據(jù)融合后數(shù)據(jù)集合[o_m={(order_id,t_j,v_j,b,d,a)|][j=1,2,?2880}],其中o_m表示第幾天數(shù)據(jù)集,t_j表示采集時(shí)間點(diǎn),v_j表示流量值。
本文從工藝蒸汽流量數(shù)據(jù)集中選取2018年1月8日至1月12日制絲A線烘絲段蒸汽流量數(shù)據(jù)進(jìn)行可視化處理,繪制5日內(nèi)蒸汽流量時(shí)間曲線圖。
由圖1可以看出,原始日蒸汽流量變化具有顯著的時(shí)段性,基本分為3類(lèi)時(shí)段。結(jié)合業(yè)務(wù)調(diào)研及數(shù)據(jù)探索可知,流量處于平穩(wěn)波動(dòng)狀態(tài)的時(shí)段為工單穩(wěn)定生產(chǎn)時(shí)刻,工單啟動(dòng)/結(jié)束時(shí)段為穩(wěn)定生產(chǎn)開(kāi)始前一段時(shí)間段與穩(wěn)定生產(chǎn)結(jié)束后一段時(shí)間段,非工單時(shí)間段即非生產(chǎn)時(shí)間段。
2 模型與方法
2.1 基本思路
實(shí)驗(yàn)采用2017年6月1日到2018年12月31日蒸汽工單流量融合數(shù)據(jù)作為預(yù)測(cè)模型的訓(xùn)練數(shù)據(jù)集,采用2019年1月7日到1月11日數(shù)據(jù)作為預(yù)測(cè)的校驗(yàn)數(shù)據(jù)集,根據(jù)工廠日歷通過(guò)數(shù)據(jù)處理將非工作日剔除。
根據(jù)卷煙廠實(shí)際調(diào)研情況及大量數(shù)據(jù)可視化分析可知,工單正常生產(chǎn)時(shí)間段是蒸汽流量曲線波動(dòng)較為穩(wěn)定的時(shí)間段。在工單穩(wěn)定生產(chǎn)前的一段時(shí)間,曲線波動(dòng)主要處于管道預(yù)熱階段,預(yù)熱時(shí)間長(zhǎng)度受生產(chǎn)產(chǎn)品、工藝線、工單次序影響,此外預(yù)熱階段蒸汽曲線還可能受人為操作影響;而工單穩(wěn)定生產(chǎn)結(jié)束后的一段時(shí)間內(nèi),流量逐漸減少,最后趨于某一個(gè)值,為后續(xù)工單生產(chǎn)作準(zhǔn)備。
為提高預(yù)測(cè)精確度,分析基于分割后的時(shí)間集數(shù)據(jù)特點(diǎn),采用相應(yīng)建模方式進(jìn)行預(yù)測(cè),即工單穩(wěn)定生產(chǎn)時(shí)段采用逐點(diǎn)回歸模型,工單啟動(dòng)/結(jié)束時(shí)段采用曲線補(bǔ)全模型,非工單時(shí)段分為工單間非生產(chǎn)時(shí)段和非工單間非生產(chǎn)時(shí)段,其中工單間時(shí)段流量用前一個(gè)工單末尾流量值填充,非工單非生產(chǎn)時(shí)段流量用0填充,故無(wú)需預(yù)測(cè)。綜上所述,預(yù)測(cè)天m時(shí)間點(diǎn)t處于的時(shí)間集不同,預(yù)測(cè)工藝蒸汽流量[x(m,t)]采用的預(yù)測(cè)方法也不同。主要包括工單穩(wěn)定生產(chǎn)時(shí)刻蒸汽流量預(yù)測(cè)逐點(diǎn)回歸方法與工單啟動(dòng)/結(jié)束蒸汽流量曲線補(bǔ)全方法,則蒸汽流量預(yù)測(cè)表達(dá)式為:
2.2 數(shù)據(jù)預(yù)處理
由于數(shù)據(jù)采集環(huán)節(jié)較多,實(shí)際收集的數(shù)據(jù)存在多種不連續(xù)、毛刺等問(wèn)題,在建立預(yù)測(cè)模型之前需進(jìn)行相應(yīng)數(shù)據(jù)處理,還原數(shù)據(jù)連續(xù)性和真實(shí)性。
壞數(shù)據(jù)出現(xiàn)的位置和時(shí)間是未知的,具有很強(qiáng)的隨機(jī)性。其表現(xiàn)形式有多種,大致可劃分為3類(lèi):①單點(diǎn)空流量,該類(lèi)壞數(shù)據(jù)主要是因?yàn)閭鞲衅鞒霈F(xiàn)故障,沒(méi)有采集到數(shù)據(jù)或數(shù)據(jù)丟失;②單點(diǎn)毛刺流量,該種壞數(shù)據(jù)在整體數(shù)據(jù)中表現(xiàn)為急劇增大或急劇減小,與相鄰流量有明顯區(qū)分;③局部數(shù)據(jù)連續(xù)出現(xiàn)空流量,其表現(xiàn)為某個(gè)時(shí)間段內(nèi)整體流量連續(xù)出現(xiàn)空值,與前后時(shí)間段內(nèi)的流量曲線走勢(shì)明顯不同。
針對(duì)以上不同情況,采用不同處理方法處理數(shù)據(jù)。
(1)插值法。本文根據(jù)具體數(shù)據(jù)情況,采用插值法對(duì)缺失值進(jìn)行補(bǔ)全?;舅悸窞椋褐饤l檢查融合集合o_i中每個(gè)工單即order_id采集的流量值,如果是空值,則獲取其索引號(hào)[hi]及其前一個(gè)記錄的索引號(hào)[hi-1]和值[ri-1],然后繼續(xù)向后遍歷并保存每個(gè)遍歷值索引號(hào),直到獲取后面一個(gè)非0的值[rn]及其索引號(hào)[hn],計(jì)算兩個(gè)非0數(shù)據(jù)之間的距離[hn]-[hi],用插值法將缺失的數(shù)據(jù)計(jì)算出來(lái)。
(2) 閾值法。通過(guò)對(duì)原始數(shù)據(jù)的可視化分析,可知毛刺數(shù)據(jù)均為單點(diǎn)毛刺且其值與前后點(diǎn)絕對(duì)差值均大于0.3t/h。故采用設(shè)置閾值法確定毛刺數(shù)據(jù)出現(xiàn)的位置,然后用插值法進(jìn)行替換。
2.3 基于工作狀態(tài)的時(shí)間集劃分
通過(guò)實(shí)際業(yè)務(wù)調(diào)研及影響因子相關(guān)研究可知,時(shí)間點(diǎn)劃分受產(chǎn)品、工藝線、工單次序、工藝段影響。結(jié)合蒸汽數(shù)據(jù)特點(diǎn),故提出基于特征點(diǎn)對(duì)訓(xùn)練數(shù)據(jù)集中工藝日用蒸汽流量時(shí)間序列進(jìn)行時(shí)間集分割,通過(guò)對(duì)大量訓(xùn)練數(shù)據(jù)集中流量曲線特征點(diǎn)進(jìn)行分類(lèi)、分析,可標(biāo)準(zhǔn)化預(yù)測(cè)工單穩(wěn)定時(shí)段、工單啟動(dòng)/結(jié)束時(shí)段、非工單時(shí)段范圍[9]。特征點(diǎn)指日蒸汽時(shí)間序列中對(duì)其形態(tài)及整體趨勢(shì)變化影響較大的數(shù)據(jù)點(diǎn)。原始數(shù)據(jù)時(shí)間序列采集頻率2次/分,故日蒸汽時(shí)間序列[Y{yt1,yt2,?yti|i=1,2,?2 880}]的特征點(diǎn)獲取原則如下:
(1)根據(jù)生產(chǎn)計(jì)劃表剔除非工單時(shí)間段,假設(shè)取生產(chǎn)啟動(dòng)時(shí)間為[t1],生產(chǎn)結(jié)束時(shí)間為[tm],故生產(chǎn)時(shí)間序列起始點(diǎn)和終止點(diǎn)為n=1或n=m。
具體流程包括:首先,由訓(xùn)練數(shù)據(jù)集中工單蒸汽流量數(shù)據(jù)分析,可知特征點(diǎn)條件變量[R1]為1.2、[R2]為0.05;然后,遍歷訓(xùn)練數(shù)據(jù)集,按照同工藝段、工藝線、產(chǎn)品、工單次序進(jìn)行分類(lèi)形成新的類(lèi)別數(shù)據(jù)集[Fwm,na];第三,分別遍歷每一個(gè)[Fwm,na](其中[wm,na]表示m這天第na個(gè)工單)中的[wm,na],并根據(jù)設(shè)定特征點(diǎn)條件對(duì)其[ΔT1]和[ΔT2]進(jìn)行統(tǒng)計(jì)并獲取特征點(diǎn)出現(xiàn)時(shí)對(duì)應(yīng)的時(shí)間點(diǎn),由統(tǒng)計(jì)結(jié)果分析可知同一個(gè)數(shù)據(jù)集[Fwm,na]中[ΔT1]和[ΔT2]的值基本穩(wěn)定,故可通過(guò)統(tǒng)計(jì)結(jié)果標(biāo)準(zhǔn)化同工藝段、工藝線、產(chǎn)品、工單次序的工單啟動(dòng)后時(shí)間段[ΔT1]與工單結(jié)束前時(shí)間段[ΔT2];最終把原訓(xùn)練數(shù)據(jù)集按同產(chǎn)品、工藝段、工藝線、工單次序劃分為穩(wěn)定生產(chǎn)時(shí)間段訓(xùn)練數(shù)據(jù)集[Pwm,na(m,na=1,2?)]、工單啟動(dòng)后訓(xùn)練數(shù)據(jù)集[Swm,na(m,na=1,2?)]、工單結(jié)束前訓(xùn)練數(shù)據(jù)集[Ewm,na(m,na=1,2?)]。以制絲A線烘絲段生產(chǎn)利群(新版)數(shù)據(jù)集[Fwm,1]部分統(tǒng)計(jì)結(jié)果為例進(jìn)行統(tǒng)計(jì)說(shuō)明,如表1所示。
2.4 基于穩(wěn)定生產(chǎn)時(shí)段的逐點(diǎn)回歸
逐點(diǎn)回歸基本思路為:首先,依據(jù)已劃分的時(shí)間點(diǎn)可獲取每個(gè)預(yù)測(cè)工單用于逐點(diǎn)回歸預(yù)測(cè)的時(shí)間段I,并保存其預(yù)測(cè)點(diǎn)數(shù)量d,其中I可表示為[I(t0,t1,?td)];再者,從統(tǒng)計(jì)[Pwm,na]表中可以獲取每個(gè)訓(xùn)練工單的穩(wěn)定生產(chǎn)時(shí)間段J,根據(jù)每個(gè)預(yù)測(cè)工單預(yù)測(cè)點(diǎn)數(shù)量將其對(duì)應(yīng)的訓(xùn)練數(shù)據(jù)[Pwm,na]中所有訓(xùn)練工單的穩(wěn)定生產(chǎn)時(shí)間段J進(jìn)行相同數(shù)量點(diǎn)d的的時(shí)間片切割,并獲得對(duì)應(yīng)的蒸汽流量值。至此每個(gè)預(yù)測(cè)工單與其對(duì)應(yīng)的訓(xùn)練數(shù)據(jù)集中的工單有一致的相對(duì)時(shí)間點(diǎn);最后,通過(guò)對(duì)歷史點(diǎn)位數(shù)據(jù)分析采用適當(dāng)?shù)念A(yù)測(cè)方法,逐點(diǎn)建立回歸模型進(jìn)行預(yù)測(cè)。本文分別采用均值擬合與時(shí)間序列的方法逐點(diǎn)建立工藝用蒸汽流量的預(yù)測(cè)模型。
時(shí)間點(diǎn)切割思路為:因?yàn)槊總€(gè)工單開(kāi)始穩(wěn)定生產(chǎn)時(shí)間和結(jié)束穩(wěn)定生產(chǎn)時(shí)間及生產(chǎn)時(shí)長(zhǎng)存在差異,所以需對(duì)工單進(jìn)行相對(duì)時(shí)間切割,讓每個(gè)工單的點(diǎn)均基于工單穩(wěn)定開(kāi)始時(shí)間的相對(duì)點(diǎn)位,以此消除時(shí)間漂移問(wèn)題。
2.4.1 均值擬合模型
分別對(duì)預(yù)測(cè)時(shí)間段I中每一個(gè)點(diǎn)位對(duì)應(yīng)的歷史流量數(shù)據(jù)進(jìn)行可視化分析。以2019年1月7日第一個(gè)工單預(yù)測(cè)時(shí)間段I中第一個(gè)相對(duì)時(shí)間點(diǎn)位[t0]對(duì)應(yīng)的訓(xùn)練數(shù)據(jù)集中相對(duì)時(shí)間點(diǎn)[t0]的流量值為例,進(jìn)行可視化分析,時(shí)間點(diǎn)[t0]蒸汽流量密度—直方如圖3所示。
2.4.2 時(shí)間序列模型
時(shí)間序列分析是從一段時(shí)間上的一組屬性值數(shù)據(jù)中發(fā)現(xiàn)模式并預(yù)測(cè)未來(lái)值的過(guò)程。ARMA模型(自回歸滑動(dòng)平均模型)是最常見(jiàn)用于擬合平穩(wěn)序列的模型,本文某一時(shí)刻點(diǎn)對(duì)應(yīng)的歷史蒸汽流量數(shù)據(jù)是一組平穩(wěn)的時(shí)間序列,故可用ARMA模型逐點(diǎn)進(jìn)行建模預(yù)測(cè)[11]。ARMA模型主要有3種基本形式:自回歸模型(AR)、移動(dòng)平均模型(MA)與混合模型(ARMA)[12]。
對(duì)于任一零均值平穩(wěn)時(shí)間序列[{x(m,t)}],若[x(m,t)]的取值不僅與其前p步的各個(gè)取值[x(m-1,t)],…,[x(m-p,t)]有關(guān),還與前m步的隨機(jī)干擾[ε(m-1,t)],…,[ε(m-q,t)](p,q=1,2,…)有關(guān),則可用p階自回歸—p階滑動(dòng)平均混合時(shí)序模型描述該系統(tǒng),記為ARMA(p,q),即參數(shù)p、q的ARMA模型預(yù)測(cè)方程[13]為:
利用平均絕對(duì)誤差度量模型預(yù)測(cè)誤差,通過(guò)計(jì)算得到平均絕對(duì)誤差為0.014 59。綜上,通過(guò)對(duì)兩種用于工單穩(wěn)定時(shí)段的模型誤差對(duì)比分析,可知時(shí)間序列模型擬合效果優(yōu)于均值擬合模型,故優(yōu)先采用時(shí)間序列模型對(duì)工單穩(wěn)定時(shí)間段進(jìn)行逐點(diǎn)預(yù)測(cè)。
2.5 基于不穩(wěn)定生產(chǎn)時(shí)段的曲線補(bǔ)全
工單啟動(dòng)后/結(jié)束前時(shí)間段由于易受外界人為因素影響,致使生產(chǎn)工藝蒸汽流量時(shí)間序列形態(tài)較為復(fù)雜,故通過(guò)一種基于DTW相似度的AP聚類(lèi)算法獲取預(yù)測(cè)時(shí)間段影響,用典型曲線補(bǔ)全該時(shí)間段流量曲線[15-17]。
由劃分時(shí)間點(diǎn)階段可獲得融合后的啟動(dòng)后訓(xùn)練數(shù)據(jù)集[Swm,na(m,na=1,2,?)]和結(jié)束前訓(xùn)練數(shù)據(jù)集[Ewm,na(m,][na=1,2?)]。曲線補(bǔ)全基本思想包括:首先,依據(jù)預(yù)測(cè)工單信息獲取對(duì)應(yīng)的訓(xùn)練數(shù)據(jù)集;然后,通過(guò)計(jì)算得到訓(xùn)練樣本兩兩之間的DTW矩陣,將該距離矩陣負(fù)值作為相似度矩陣并輸入到AP聚類(lèi),得到聚類(lèi)結(jié)果;最后從樣本數(shù)量最多的類(lèi)別中選擇時(shí)間點(diǎn)與預(yù)測(cè)曲線時(shí)間點(diǎn)基本吻合的曲線作為典型曲線進(jìn)行補(bǔ)全[18-19]。
2.6 基于生產(chǎn)計(jì)劃的滾動(dòng)預(yù)測(cè)
滾動(dòng)預(yù)測(cè)機(jī)制的主要思想是保持?jǐn)?shù)據(jù)長(zhǎng)度不變,滾動(dòng)地補(bǔ)充新數(shù)據(jù),剔除舊數(shù)據(jù),建立這樣的序列更能反映預(yù)測(cè)方法有效性[20]。為得到預(yù)測(cè)日工藝用流量曲線,當(dāng)滾動(dòng)輸入預(yù)測(cè)日工單信息時(shí),需對(duì)相應(yīng)的分割數(shù)據(jù)集進(jìn)行不同新數(shù)據(jù)添加和舊數(shù)據(jù)剔除。
穩(wěn)定時(shí)間段滾動(dòng)預(yù)測(cè):若當(dāng)前預(yù)測(cè)點(diǎn)從[x(m,t)]變?yōu)閇x(m+1,t)],訓(xùn)練樣本序列則由原來(lái)的[X(x(m-1,t),][x(m-2,t),?x(m-i+1),x(m-i,t))]變成[X(x(m,t),][x(m-1,t),?x(m-i+2),x(m-i+1,t))],相比原來(lái)序列增加了[x(m,t)],去掉了[x(m-i+1,t)],進(jìn)行逐點(diǎn)回歸得到預(yù)測(cè)值。由此體現(xiàn)出訓(xùn)練樣本集[Pwm,na(m,na=1,2,?)]、預(yù)測(cè)樣本與預(yù)測(cè)結(jié)果的動(dòng)態(tài)變化,從而實(shí)現(xiàn)穩(wěn)定時(shí)間集流量滾動(dòng)預(yù)測(cè)。
工單啟動(dòng)/結(jié)束時(shí)間段:向相應(yīng)數(shù)據(jù)集中添加新數(shù)據(jù)集,同時(shí)將聚類(lèi)結(jié)果中樣本數(shù)量最少的類(lèi)別中某個(gè)時(shí)間序列剔除,從而提高聚類(lèi)速度,更快獲取對(duì)應(yīng)的典型曲線。
3 結(jié)果分析
基于式(3)對(duì)上述各分割時(shí)間集預(yù)測(cè)結(jié)果進(jìn)行拼接,最終獲取預(yù)測(cè)日完整工藝用流量預(yù)測(cè)曲線,預(yù)測(cè)結(jié)果如圖4、圖5所示。
4 結(jié)語(yǔ)
本文針對(duì)日工藝用蒸汽流量預(yù)測(cè)問(wèn)題,提出了一種基于時(shí)間集分割的逐點(diǎn)回歸—曲線補(bǔ)全的組合預(yù)測(cè)方法,先利用特征點(diǎn)對(duì)時(shí)間集進(jìn)行分割,再根據(jù)各時(shí)段影響因素采用不同方法進(jìn)行預(yù)測(cè),降低了數(shù)據(jù)時(shí)段性對(duì)預(yù)測(cè)結(jié)果的影響。采用基于時(shí)間集分割的預(yù)測(cè)方法可較精準(zhǔn)地預(yù)測(cè)企業(yè)工藝用蒸汽流量,為企業(yè)蒸汽智能供應(yīng)策略?xún)?yōu)化提供一定理論依據(jù)。
參考文獻(xiàn):
[1] 鄒伯賢, 劉強(qiáng). ?基于ARMA模型的網(wǎng)絡(luò)流量預(yù)測(cè)[J]. ?計(jì)算機(jī)研究與發(fā)展, 2002, 39(12): 1645-1652.
[2] 劉艷麗,趙卓峰,丁維龍,等. 基于高速收費(fèi)大數(shù)據(jù)的短時(shí)交通流量預(yù)測(cè)方法[J]. 計(jì)算機(jī)與數(shù)字工程,2019,47(5):1164-1169+1188.
[3] 吳海姬,王雷,司風(fēng)琪,等. 基于BP神經(jīng)網(wǎng)絡(luò)的主蒸汽流量計(jì)算模型[J]. 汽輪機(jī)技術(shù),2007(4):269-271+304.
[4] 王雷,張瑞青,肖增弘,等. ?基于SVM的主蒸汽流量回歸估計(jì)[J]. 華東電力,2008,36(12):89-92.
[5] FU Z G, MIN F F, YUAN J. Regression forecast of main steam flow based on mean impact value and support vector regression[C]. 2012 Asia-Pacific Power and Energy Engineering Conference,2012: 1-5.
[6] 張維平,趙文蕾,李國(guó)強(qiáng),等. ?基于粗糙集與最小二乘支持向量回歸的汽輪機(jī)主蒸汽流量預(yù)測(cè)[J]. 計(jì)量學(xué)報(bào),2015,36(1):43-47.
[7] GAO J W, LENG Z W, QIN Y,et al. Short-term traffic flow forecasting model based on wavelet neural network[C]. ?2013 25th Chinese Control and Decision Conference (CCDC), 2013:5081-5084.
[8] MOUTADID S, ADAMOWSKI J F, TIWARI M K,et al. Coupling the maximum overlap discrete wavelet transform and long short-term memory networks for irrigation flow forecasting[J]. Agricultural Water Management, 2019, 219(219):72-85.
[9] 楊艷林,葉楓,呂鑫,等. ?一種基于DTW聚類(lèi)的水文時(shí)間序列相似性挖掘方法[J]. 計(jì)算機(jī)科學(xué),2016,43(2):245-249.
[10] 崔智泉. 淺談高斯分布的原理和應(yīng)用[J]. 中國(guó)校外教育,2018(16):63-64.
[11] 李靜,黃玲花. 《時(shí)間序列分析》課程教學(xué)改革探索[J]. 廣西師范學(xué)院學(xué)報(bào)(自然科學(xué)版), 2017,34(4):147-150.
[12] 黃榮庚,龍靜,潘志剛,等. 基于ARMA模型的地鐵站環(huán)控系統(tǒng)能耗預(yù)測(cè)[J]. 制冷學(xué)報(bào),2019,40(1):88-93.
[13] 謝華為. 基于ARMA平穩(wěn)時(shí)間序列的道路交通事故預(yù)測(cè)[J]. 寧德師范學(xué)院學(xué)報(bào)(自然科學(xué)版),2018,30(3):268-272.
[14] 蘇維均,楊飛,崔世杰,等. ?造紙企業(yè)工藝過(guò)程能源消耗預(yù)測(cè)仿真[J]. 計(jì)算機(jī)仿真,2016,33(8):438-442+447.
[15] 喬美英,劉宇翔,陶慧. 一種基于信息熵和DTW的多維時(shí)間序列相似性度量算法[J]. 中山大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,58(2):1-8.
[16] GAO Y Y,JIANG B,ZHU Z W,et al. A fault diagnosis method based on DTW[C]. 2006 Chinese Control Conference,2006:1281-1284.
[17] 郭秀娟,陳瑩. AP聚類(lèi)算法的分析與應(yīng)用[J]. 吉林建筑大學(xué)學(xué)報(bào),2013,30(4):58-61.
[18] YIN H, YANG S Q, SHAO D M et al. A novel parallel scheme for fast similarity search in large time series[J]. in?China Communications, 2015,12(2):129-140.
[19] 朱紅,丁世飛,許新征. 基于改進(jìn)屬性約簡(jiǎn)的細(xì)粒度并行AP聚類(lèi)算法[J]. 計(jì)算機(jī)研究與發(fā)展,2012,49(12):2638-2644.
[20] KUSAKCI A O, AYVAZ B. Electrical energy consumption forecasting for Turkey using grey forecasting technics with rolling mechanism[C]. ?2015 2nd International Conference on Knowledge-Based Engineering and Innovation, 2015:8-13.
(責(zé)任編輯:江 艷)