張朝輝,梁家豪,梁秉崗,秦冠軍,尹毅然,丁 笠,周 宇
1(中國南方電網(wǎng)有限責(zé)任公司超高壓輸電公司 廣州局,廣州 510663)
2(南京南瑞繼保電氣有限公司,南京 211106)
3(南京航空航天大學(xué),南京 210016)
目前,國內(nèi)用電需求隨著社會(huì)的發(fā)展而不斷增長.直流輸電技術(shù)[1,2]正在朝著高電壓大容量的技術(shù)方向發(fā)展,由于國土遼闊,對其在長距離輸電、跨區(qū)域聯(lián)網(wǎng)及調(diào)度靈活等方面有著現(xiàn)實(shí)需求.電網(wǎng)在運(yùn)行過程中,保證換流閥等關(guān)鍵設(shè)備穩(wěn)定運(yùn)行就顯得至關(guān)重要.換流閥等關(guān)鍵設(shè)備在電網(wǎng)運(yùn)行過程中會(huì)不斷產(chǎn)生熱量,當(dāng)設(shè)備的熱量不斷聚集,溫度就會(huì)不斷上升時(shí)則會(huì)影響電網(wǎng)的正常運(yùn)行.電網(wǎng)中的換流閥等關(guān)鍵設(shè)備出現(xiàn)的故障對電力系統(tǒng)造成的影響也越來越大[3].因此,需要對電網(wǎng)中關(guān)鍵設(shè)備檢測數(shù)據(jù)進(jìn)行預(yù)測,提高工作人員對設(shè)備的感知能力,能對關(guān)鍵設(shè)備未來出現(xiàn)的變化趨勢做相應(yīng)的準(zhǔn)備.這對電網(wǎng)的正常運(yùn)行和提供可靠的供電具有實(shí)際意義.
由于人工在處理電網(wǎng)設(shè)備時(shí)會(huì)存在經(jīng)驗(yàn)不足和誤操作等客觀因素,因此對電的安全性,穩(wěn)定性和智能化的要求越來越高.閥冷系統(tǒng)作為電網(wǎng)中冷卻系統(tǒng)的關(guān)鍵設(shè)備,以水為傳導(dǎo)介質(zhì),水有較高的熱導(dǎo)性,作為“載熱體”存在,將設(shè)備的熱量傳遞到水介質(zhì)并將熱能帶出,達(dá)到物理降低設(shè)備溫度的目的.閥冷系統(tǒng)對高壓直流系統(tǒng)的安全運(yùn)行起著至關(guān)重要作用[4].閥冷系統(tǒng)分為內(nèi)冷水系統(tǒng)和外冷水系統(tǒng)兩個(gè)部分.內(nèi)冷水系統(tǒng)是密閉式循環(huán)具有水循環(huán)、內(nèi)冷水處理等功能[5].內(nèi)冷水系統(tǒng)在換流閥運(yùn)行時(shí)負(fù)責(zé)可靠高效通過水帶走設(shè)備運(yùn)行產(chǎn)生的熱量,送到外冷水系統(tǒng)中.外冷水系統(tǒng)是開放式循環(huán),具有水質(zhì)軟化凈化、補(bǔ)水等功能[6].冷卻塔會(huì)對內(nèi)冷水管道噴淋散熱,并通過風(fēng)扇對外、內(nèi)冷水交換將閥內(nèi)冷水系統(tǒng)的熱量排至大氣環(huán)境中,兩者共同合作完成對換流閥的持續(xù)冷卻,可以達(dá)到對閥廳整個(gè)設(shè)備進(jìn)行散熱的目的.
閥冷系統(tǒng)在降低設(shè)備溫度的過程中,其涉及的參數(shù)為出閥溫度,進(jìn)閥溫度,出閥壓力,內(nèi)冷水導(dǎo)電率.所有參數(shù)中最核心和最關(guān)鍵的參數(shù)是溫度,包括了出閥溫度和進(jìn)閥溫度.閥冷系統(tǒng)中換流閥的進(jìn)出閥溫度在運(yùn)行過程中只要維持在合理范圍內(nèi),就能夠保證換流閥設(shè)備的穩(wěn)定運(yùn)行從而保證閥冷系統(tǒng)的穩(wěn)定運(yùn)行.由于換流閥的出閥溫度和進(jìn)閥溫度具有很強(qiáng)的相關(guān)性,所以我們選取其中進(jìn)閥溫度作為整個(gè)設(shè)備運(yùn)行狀態(tài)的評價(jià)指標(biāo).如果設(shè)備熱量過度聚集導(dǎo)致?lián)Q流閥的進(jìn)閥溫度過高,可能會(huì)損壞相應(yīng)設(shè)備.如果這個(gè)問題長時(shí)間不能夠妥善解決,就會(huì)產(chǎn)生嚴(yán)重的安全隱患,造成難以估計(jì)的后果.進(jìn)閥溫度參數(shù)短期內(nèi)有波動(dòng),但從長期來看,具有一定的變化趨勢,可以利用時(shí)序分析如ARIMA、SVM、GRU 以及ARIMA-SVM 混合等方法對進(jìn)閥溫度進(jìn)行預(yù)測,使運(yùn)行工作人員提前預(yù)知進(jìn)閥溫度變化趨勢.
時(shí)序數(shù)據(jù)本質(zhì)上是反應(yīng)某個(gè)或者某些隨機(jī)變量隨時(shí)間不斷變化的趨勢,分析時(shí)序數(shù)據(jù)的核心是從這些數(shù)據(jù)里挖掘出某種規(guī)律,并利用規(guī)律對未來進(jìn)行預(yù)估[7].時(shí)序數(shù)據(jù)分析方法從最早提出到現(xiàn)在經(jīng)過漫長的發(fā)展,國內(nèi)外研究學(xué)者提出了許多基于時(shí)序數(shù)據(jù)分析方法[8–11].時(shí)序分析方法主要有3 類方法,從最開始提出的傳統(tǒng)的時(shí)間序列預(yù)測方法,到將機(jī)器學(xué)習(xí)和時(shí)間序列預(yù)測結(jié)合的方法,以及要提高預(yù)測效率的基于參數(shù)模型的在線時(shí)間序列預(yù)測方法.無論是傳統(tǒng)的時(shí)間序列預(yù)測方法中還是應(yīng)用到時(shí)序領(lǐng)域的機(jī)器學(xué)習(xí)方法以及基于參數(shù)模型的在線時(shí)間序列預(yù)測方法,目前,沒有一種單一模型能夠統(tǒng)一地對特定的時(shí)間序列數(shù)據(jù)做出最好的預(yù)測.因此混合模型應(yīng)運(yùn)而生,混合模型受益于各個(gè)模型的多樣性,減少單一模型使用風(fēng)險(xiǎn),很好彌補(bǔ)單個(gè)模型的缺陷,可以提升時(shí)間序列預(yù)測精度.
經(jīng)典的時(shí)間序列模型包括移動(dòng)平均模型(Move-Average,MA)、自回歸模型(Auto-Regressive,AR)、自回歸移動(dòng)平均模型(Auto Regressive Moving Average,ARMA),還有其對應(yīng)的各種衍生出來的模型,如動(dòng)態(tài)自回歸模型和向量化的自回歸模型[12].而Box和Jenkins[13]提出的“Box-Jenkins 方法”非常流行.該方法有3 步,第1 步對給定時(shí)間序列,確定參數(shù)模型中適當(dāng)?shù)膒,q,d值,第2 步通過最有效的方法估計(jì)出參數(shù)模型的具體值,第3 步檢測模型的有效性并做出相應(yīng)調(diào)整.
時(shí)間序列預(yù)測方法歸根到底在本質(zhì)上與基于機(jī)器學(xué)習(xí)分類中的回歸分析有著許多相似之處.機(jī)器學(xué)習(xí)中許多方法都可以應(yīng)用在時(shí)間序列預(yù)測方面,并且取得了不錯(cuò)的效果,例如經(jīng)典的支持向量機(jī)SVM,貝葉斯網(wǎng)絡(luò)BN,GRU 神經(jīng)網(wǎng)絡(luò).隨著人工神經(jīng)網(wǎng)絡(luò)的不斷發(fā)展,以及神經(jīng)網(wǎng)絡(luò)在時(shí)間序列中趨勢性分析有著獨(dú)特的特性,所以有人將神經(jīng)網(wǎng)絡(luò)應(yīng)用在時(shí)間序列預(yù)測上,取得很好的效果.進(jìn)一步深度學(xué)習(xí)也被看作是實(shí)現(xiàn)時(shí)間序列預(yù)測的有效工具.Kim[14]直接用支持向量機(jī)來預(yù)測股票價(jià)格,并通過對比試驗(yàn)來驗(yàn)證該方法的可行性,Gestel 等提出把貝葉斯證據(jù)框架[15,16]應(yīng)用到最小二乘支持向量機(jī)[17,18]應(yīng)用到金融領(lǐng)域進(jìn)行時(shí)間序列預(yù)測.Das和Ghosh 將貝葉斯網(wǎng)絡(luò)(BN)應(yīng)用到氣象時(shí)間序列預(yù)測,并在后續(xù)時(shí)間做了大量的工作.在2017年,提出基于語義貝葉斯網(wǎng)絡(luò)的多元?dú)庀髸r(shí)間序列預(yù)測網(wǎng)絡(luò)semBnet[19].隨著深度學(xué)習(xí)的流行,也被看作實(shí)現(xiàn)時(shí)間序列預(yù)測的有效工具.機(jī)器學(xué)習(xí)本質(zhì)上是多層神經(jīng)網(wǎng)絡(luò),主要包括卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)[20],其中RNN 能夠解決時(shí)間序列的延續(xù)性問題.RNN 可以處理整個(gè)時(shí)間序列所包含的信息,但存在長期依賴問題,即對長序列進(jìn)行學(xué)習(xí)時(shí),RNN 會(huì)出現(xiàn)梯度消失和梯度爆炸問題,無法學(xué)習(xí)到長時(shí)間跨度的關(guān)系.為了解決這個(gè)問題,Schmidhuber 教授在1997年提出長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)能夠很好的解決這個(gè)問題,默認(rèn)就可以記住長期的信息,實(shí)現(xiàn)長程記憶.
隨著計(jì)算機(jī)技術(shù)的發(fā)展和互聯(lián)網(wǎng)的普及,以及數(shù)據(jù)的急速增長給傳統(tǒng)時(shí)間序列預(yù)測方法和批處理機(jī)器學(xué)習(xí)預(yù)測方法帶來了極大的挑戰(zhàn).在面對大數(shù)據(jù)的時(shí)候,傳統(tǒng)的方法的效率低下,因此利用在線學(xué)習(xí)方法來對時(shí)間序列數(shù)據(jù)預(yù)測成為新的趨勢,而且取得了不錯(cuò)的效果.和傳統(tǒng)批處理學(xué)習(xí)方法相比,在線學(xué)習(xí)方法不需要處理整個(gè)數(shù)據(jù)集,只需要處理這個(gè)新的樣本,大大節(jié)約了時(shí)間提高效率.Anava 等[21]提出了基于參數(shù)模型的在線時(shí)間序列預(yù)測算法ARMA-ONS,能夠?qū)鹘y(tǒng)的時(shí)間序列模型和在線學(xué)習(xí)有效結(jié)合起來.
此章節(jié)主要針對閥冷系統(tǒng)的監(jiān)測數(shù)據(jù)進(jìn)行篩選和提取,并在此基礎(chǔ)上對閥冷數(shù)據(jù)進(jìn)行簡單時(shí)序分析.
本文工作的數(shù)據(jù)來源于中國南方電網(wǎng)從2017年到2019年收集的將近兩年的真實(shí)數(shù)據(jù),包括PWR,出閥溫度,進(jìn)閥溫度,進(jìn)閥壓力,冷卻水流量,冷卻水導(dǎo)電率等相關(guān)記錄.進(jìn)一步篩選和內(nèi)冷水系統(tǒng)有關(guān)的數(shù)據(jù),篩選和提取出進(jìn)閥溫度,出閥溫度,進(jìn)閥壓力,冷卻水導(dǎo)電率相關(guān)數(shù)據(jù).因此針對這個(gè)4個(gè)指標(biāo),從MySQL數(shù)據(jù)庫混亂的原始數(shù)據(jù)里提取出來,這就需要一些數(shù)據(jù)預(yù)處理步驟,最后可以構(gòu)建出一個(gè)適合進(jìn)行時(shí)間序列分析工作的數(shù)據(jù)集.
中國南方電網(wǎng)的設(shè)備眾多,每個(gè)閥冷設(shè)備都有相應(yīng)的監(jiān)測數(shù)據(jù),就需要對每個(gè)閥冷設(shè)備的監(jiān)測數(shù)據(jù)進(jìn)行分析.因此需要把數(shù)據(jù)按照各個(gè)設(shè)備進(jìn)行劃分,并按照日期時(shí)間排列,以保證每個(gè)設(shè)備對應(yīng)數(shù)據(jù)的完整性和時(shí)序性,最終構(gòu)建出一個(gè)包含4個(gè)監(jiān)測指標(biāo)的數(shù)據(jù)表.
經(jīng)過上面的數(shù)據(jù)預(yù)處理之后,獲得了可以進(jìn)行下一步時(shí)序分析的數(shù)據(jù)集.
由于整個(gè)數(shù)據(jù)的采集頻率為每半個(gè)小時(shí)采集一次而且時(shí)間跨度長達(dá)兩年,導(dǎo)致了整個(gè)數(shù)據(jù)集比較大,對整個(gè)數(shù)據(jù)進(jìn)行趨勢分析只能從宏觀上觀察數(shù)據(jù)變化趨勢,我們對4個(gè)指標(biāo)的數(shù)據(jù)分別按周、月對數(shù)據(jù)進(jìn)行采樣,分析其內(nèi)在的規(guī)律性和數(shù)據(jù)的趨勢變化.對預(yù)處理的后數(shù)據(jù)集采用隨機(jī)抽樣,隨機(jī)選取一周的數(shù)據(jù)進(jìn)行分析,其數(shù)據(jù)隨時(shí)間變化如圖1所示.
圖1包含了4個(gè)子圖,分別描繪了進(jìn)閥溫度,出閥溫度,進(jìn)閥壓力,冷卻水導(dǎo)電率的變化趨勢.進(jìn)閥溫度在32℃到40℃之間變化,相差8℃,而出閥溫度在38℃到49℃之間變化,溫度提升6℃到9℃.進(jìn)閥壓力和冷卻水導(dǎo)電率,會(huì)隨機(jī)波動(dòng),值的波動(dòng)幅度并不是很大,且進(jìn)閥壓力和冷卻水導(dǎo)電率均在正常值范圍之內(nèi)變化.進(jìn)閥溫度,出閥溫度,進(jìn)閥壓力和冷卻水導(dǎo)電率都在某個(gè)均值附近波動(dòng),可以初步判斷各個(gè)時(shí)間序列數(shù)據(jù)是平穩(wěn)的,可以通過計(jì)算迪基-福勒檢驗(yàn)進(jìn)行單位根校驗(yàn),計(jì)算出相對應(yīng)的p值為遠(yuǎn)小于0.01,可以認(rèn)為閥冷數(shù)據(jù)是時(shí)間平穩(wěn)序列.
為了進(jìn)一步發(fā)現(xiàn)閥冷變化趨勢以及數(shù)據(jù)的平穩(wěn)性,我們對一個(gè)月的閥冷數(shù)據(jù)進(jìn)行分析.從圖2可以看出,進(jìn)閥溫度和出閥溫度的變化趨勢很相似,但總體的變化范圍有些不同,進(jìn)閥溫度的變化范圍在22℃到36℃,而出閥溫度則在24℃到42℃之間波動(dòng).相差了2℃到6℃.
圖1 閥冷4個(gè)參數(shù)的周變化趨勢
圖2 閥冷4個(gè)參數(shù)的月變化趨勢
從圖1和圖2可以發(fā)現(xiàn)進(jìn)閥溫度在22℃到36℃的范圍內(nèi)變化,出閥溫度都在24℃到42℃范圍內(nèi)變化并且在各自對應(yīng)的范圍內(nèi)變化趨勢很是接近.通過相關(guān)性分析得到兩者關(guān)系是正相關(guān),相關(guān)性系數(shù)接近于1.出閥溫度和進(jìn)閥溫度的數(shù)據(jù)波動(dòng)都在正常范圍之內(nèi),但是觀察數(shù)據(jù)出閥溫度略高一些,原因在于閥冷系統(tǒng)的循環(huán)水將帶走其產(chǎn)生的熱量.通過初步判斷各個(gè)時(shí)間序列數(shù)據(jù)是平穩(wěn)的,再進(jìn)一步通過計(jì)算迪基-福勒檢驗(yàn)進(jìn)行單位根校驗(yàn),計(jì)算出p值為遠(yuǎn)小于0.01,最終判斷閥冷數(shù)據(jù)是時(shí)間平穩(wěn)序列.
閥冷系統(tǒng)檢測到的數(shù)據(jù),其具有多維度、實(shí)時(shí)性、線性和非線性并存等一些特點(diǎn).以往傳統(tǒng)的時(shí)序分析方法是根據(jù)所研究時(shí)間序列的基本規(guī)律和自身特點(diǎn),選取適當(dāng)?shù)臅r(shí)序模型并先確定時(shí)間序列模型的參數(shù),在此基礎(chǔ)上,利用已求解出參數(shù)的模型對未來的時(shí)間序列進(jìn)行預(yù)測.傳統(tǒng)時(shí)序模型在線性預(yù)測方面取得了很好的成果,但在面對處理復(fù)雜數(shù)據(jù)的時(shí)候,往往顯得力不從心,因此需要和基于機(jī)器學(xué)習(xí)的時(shí)間序列預(yù)測方法相結(jié)合.與神經(jīng)網(wǎng)絡(luò)相比,SVM 具有豐富的理論基礎(chǔ),并且神經(jīng)網(wǎng)絡(luò)非常依賴參數(shù),參數(shù)的好壞直接影響神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)效果.SVM 可以很好彌補(bǔ)傳統(tǒng)時(shí)序分析方法的缺點(diǎn)的同時(shí)對線性預(yù)測效果并不理想.在對閥冷系統(tǒng)產(chǎn)生的時(shí)序數(shù)據(jù)預(yù)測,單獨(dú)的ARIMA模型或者SVM 模型很難完全把握時(shí)序數(shù)據(jù)的變化規(guī)律,考慮將二者結(jié)合起來的混合模型是個(gè)更好的解決方法,并和神經(jīng)網(wǎng)絡(luò)GRU 進(jìn)行對比實(shí)驗(yàn),以驗(yàn)證混合模型的有效性.
在本文工作中,我們認(rèn)為閥冷時(shí)間序列yt可以分解為線性部分Lt和非線性部分Nt.
線性部分Lt可以由ARMA(p,q)模型根據(jù)閥冷數(shù)據(jù)時(shí)間序列中過去的值計(jì)算得出,計(jì)算公式如下:
傳統(tǒng)時(shí)序模型ARMA 只能處理平穩(wěn)時(shí)間序列,比AR 模型與MA 模型有較精確的估計(jì),但其參數(shù)估算也相對比較繁瑣.如果是非平穩(wěn)時(shí)間序列,則難以求得ARMA 模型參數(shù)的準(zhǔn)確估值.非平穩(wěn)時(shí)間序列并不能用ARMA 直接處理,需要經(jīng)過差分處理將非平穩(wěn)時(shí)間序列轉(zhuǎn)化成平穩(wěn)時(shí)間序列.ARIMA 模型在ARMA 模型的基礎(chǔ)上多了一個(gè)差分步驟,如ARIMA(p,d,q)模型中參數(shù)d為0 就是ARMA 模型,差分用參數(shù)d表示.式(2)里線性部分Lt由 一個(gè)平穩(wěn)序列{yt}和是一個(gè)白噪聲序列{εt} 組成,ai與bj分別是{yt}序列和{εt}序列的參數(shù).平穩(wěn)序列{yt}中的p稱為自回歸階數(shù),{εt}序列中的q稱為移動(dòng)平均階數(shù).在實(shí)際應(yīng)用中,很多時(shí)間序列是非平穩(wěn)時(shí)間序列時(shí),往往達(dá)不到嚴(yán)平穩(wěn)的要求,而序列平穩(wěn)性是時(shí)間序列變形分析建模的重要前提.需要對非平穩(wěn)序列進(jìn)行差分運(yùn)算,一階差分是相鄰的時(shí)序值相減,二階差分是對一階差分后的序列再做一次差分運(yùn)算,以此類推,可以得到n階差分.非平穩(wěn)序列往往一次到兩次差分之后,就會(huì)變成平穩(wěn)序列,達(dá)到可以建模分析的前提.如果時(shí)間序列在一階差分平穩(wěn)化后,效果不夠明顯,再進(jìn)行二階差分,直到獲得一個(gè)較好的平穩(wěn)序列.自回歸滑動(dòng)平均模型(ARMA)和差分整合移動(dòng)平均自回歸模型(ARIMA)時(shí)序分析總的策略主要包含3 步,第1 步確定合適的p,d,q值,第2 步,通過最有效的方法評估模型中具體的參數(shù)值,第3 步要檢驗(yàn)預(yù)測數(shù)據(jù)的準(zhǔn)確性,擬合模型的適當(dāng)性,最終不斷的適當(dāng)改進(jìn)模型達(dá)到準(zhǔn)確預(yù)測數(shù)據(jù)的目的.AIC:赤池信息準(zhǔn)則(Akaike Information Criterion).
BIC:貝葉斯信息準(zhǔn)則(Bayesian Information Criterion).
AIC準(zhǔn)則和BIC準(zhǔn)則用于確定ARIMA 模型中p,q值.其中,k為模型參數(shù)個(gè)數(shù),n為樣本數(shù)量,L為似然函數(shù).由于中國南方電網(wǎng)收集的閥冷數(shù)據(jù)本身就是時(shí)間平穩(wěn)序列,因此可直接建立ARIMA(p,d,q)模型中將d設(shè)為0,ARIMA中d為0 其實(shí)就是ARMA 模型.首先初步確定適當(dāng)?shù)膒,d,q的值,從低階到高階逐步試探方法來識(shí)別模型的參數(shù),然后結(jié)合赤池信息度量(AIC)和貝葉斯信息度量(BIC)有效方法估計(jì)出ARIMA模型的具體參數(shù)值,最后驗(yàn)證擬合模型的適當(dāng)性,并適當(dāng)改進(jìn)改進(jìn)該模型.AIC和BIC是為了找到ARIMA模型的合適參數(shù),要在模型的參數(shù)個(gè)數(shù)和模型的擬合精度做出適當(dāng)?shù)娜∩?能夠比較準(zhǔn)確預(yù)測未來數(shù)據(jù).最終確定ARIMA 模型參數(shù)p=1,d=0,q=2.ARIMA 模型對線性數(shù)據(jù)具有獨(dú)特的優(yōu)勢,但缺點(diǎn)也比較明顯只能捕獲時(shí)間序列中線性關(guān)系,不能捕獲非線性關(guān)系.ARIMA模型在捕獲線性關(guān)系過程中,還獲得線性關(guān)系之外時(shí)間序列的殘差信息,為接下來SVM 分析做準(zhǔn)備,可以進(jìn)一步優(yōu)化預(yù)測值.
殘差里會(huì)包括非線性關(guān)系,而 ARIMA 模型則沒有辦法捕獲非線性的信息而支持向量機(jī)(SVM)可以捕獲此類信息.所以殘差是提高預(yù)測準(zhǔn)確性的重要因素,因此殘差分析就至關(guān)重要了.支持向量機(jī)(SVM)在非線性預(yù)測方面能夠取得很好的效果.SVM是以統(tǒng)計(jì)學(xué)理論為基礎(chǔ)的學(xué)習(xí)方法,其豐富的理論基礎(chǔ)保證了SVM在解決數(shù)據(jù)高維度和非線性方面具有不可比擬的優(yōu)勢.ARIMA在捕獲線性部分之外獲得時(shí)間序列的殘差信息,殘差即非線性部分,殘差Nt作為SVM的輸入.
ARIMA 模型在t時(shí)刻得到,為ARIMA 模型捕獲的殘差部分,為SVM 模型的輸入,其表示為:
式中,G為非線性模型,?t是非線性部分的隨機(jī)誤差,n為輸入的長度.根據(jù)以上的分析可以得到最終的預(yù)測值為:
根據(jù)數(shù)據(jù)分析結(jié)果,我們選取、確定了ARIMA、SVM、GRU和提出的ARIMA-SVM 混合時(shí)序性分析方法,嘗試建立預(yù)測模型,對閥冷系統(tǒng)時(shí)序數(shù)據(jù)進(jìn)行預(yù)測分析.根據(jù)預(yù)測的結(jié)果需要評估模型的好壞,我們采用多個(gè)度量指標(biāo)來評估數(shù)據(jù)的是否平穩(wěn)時(shí)間序列以及模型的準(zhǔn)確性.
均方根誤差公式表示如下:
均方誤差公式表示如下:
平均絕對誤差表示如下:
DF 檢驗(yàn)(Dikey-Fuller test).DF 檢驗(yàn)是一種常見的用于判斷時(shí)間序列平穩(wěn)性的單位根檢測方法.若通過計(jì)算不存在單位根,時(shí)間序列就是平穩(wěn)時(shí)間序列,反之,需要進(jìn)行差分處理.時(shí)間序列的平穩(wěn)性檢測是時(shí)間序列建模過程中非常重要的一步,使用DF 檢測方法可以檢驗(yàn)之.
首先我們選取中國南方電網(wǎng)的一個(gè)閥冷系統(tǒng)真實(shí)數(shù)據(jù),從2017年12月份到2019年7月份的真實(shí)數(shù)據(jù)中選取連續(xù)3個(gè)月的數(shù)據(jù),我們選取的2018年1月到3月的數(shù)據(jù),對這3個(gè)月的數(shù)據(jù)量進(jìn)行實(shí)驗(yàn)分析評估,閥冷數(shù)據(jù)采集的時(shí)間間隔為半個(gè)小時(shí),數(shù)據(jù)的變化趨勢圖2所示.
從圖2中可以看到閥冷系統(tǒng)在平常正常工作狀態(tài)中,進(jìn)閥溫度,出閥溫度,進(jìn)閥壓力,冷卻水導(dǎo)電率趨于平穩(wěn),會(huì)產(chǎn)生隨機(jī)波動(dòng),但波動(dòng)都在正常范圍之內(nèi).由于進(jìn)閥溫度比較重要,所以我們預(yù)測輸入以進(jìn)閥溫度為預(yù)測標(biāo)準(zhǔn).
ARIMA 模型.第1 步確定合適的p,d,q值,在初步確定 ARIMA(p,d,q)由于閥冷數(shù)據(jù)都是時(shí)間平穩(wěn)序列,所以ARIMA 模型中d=0.第2 步,通過根據(jù)AIC和BIC檢測方法確定ARIMA 模型中的p和q.第3 步要檢驗(yàn)預(yù)測數(shù)據(jù)的準(zhǔn)確性,擬合模型的適當(dāng)性,最終不斷的適當(dāng)改進(jìn)模型達(dá)到準(zhǔn)確預(yù)測數(shù)據(jù)的目的,最終ARIMA 模型參數(shù)為p=1,d=0,q=2.
實(shí)線為數(shù)據(jù)真實(shí)值,虛線為模型在測試集上的預(yù)測.從圖3而言,ARIMA 模型的進(jìn)閥溫度預(yù)測結(jié)果和閥冷進(jìn)閥溫度數(shù)據(jù)很是接近,但在峰值區(qū)域的預(yù)測效果有些欠缺.
圖3 ARIMA 預(yù)測圖
SVM 模型.SVM 模型可以檢測非線性關(guān)系,以VC 理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小原理為基礎(chǔ)的,通過選擇適當(dāng)?shù)呐袆e函數(shù),希望SVM的測試誤差較小.用SVM 來單獨(dú)預(yù)測進(jìn)閥溫度數(shù)據(jù)中的非線性關(guān)系.
SVM的預(yù)測性能主要和誤差懲罰因子C和選取核函數(shù)有關(guān).優(yōu)化誤差懲罰因子C和核函數(shù)能夠很好提升SVM的性能,確定懲罰因子C=10,選用徑向基函數(shù)(rbf)作為核函數(shù).C懲罰因子是確定數(shù)據(jù)子空間時(shí)調(diào)節(jié)置信區(qū)間范圍.采用遺傳算法,對兩個(gè)參數(shù)優(yōu)化.
實(shí)線為數(shù)據(jù)真實(shí)值,虛線為模型在測試集上的預(yù)測.從圖4而言,SVM 模型的進(jìn)閥溫度預(yù)測很好擬合了真實(shí)閥冷進(jìn)閥溫度的變化趨勢,但是和真實(shí)進(jìn)閥溫度的真實(shí)值仍有差距.
圖4 SVM 預(yù)測圖
GRU 神經(jīng)網(wǎng)絡(luò)模型.為了進(jìn)一步說明混合模型能夠在單一模型的基礎(chǔ)上提高預(yù)測精度,將混合模型和GRU 神經(jīng)網(wǎng)絡(luò)做對比實(shí)驗(yàn).GRU在循環(huán)神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上改進(jìn)的變體,引入門控機(jī)制,自適應(yīng)控制信息流動(dòng),可以捕捉時(shí)序數(shù)據(jù)之間的相互依賴關(guān)系,具有一定的優(yōu)勢.GRU 神經(jīng)網(wǎng)絡(luò)模型在訓(xùn)練時(shí)涉及到許多超參數(shù)的設(shè)定,神經(jīng)元數(shù)量m,時(shí)間步長T,批數(shù)據(jù)大小batchsize,迭代次數(shù)epoch 輪.神經(jīng)元個(gè)數(shù)決定了神經(jīng)網(wǎng)絡(luò)對時(shí)序數(shù)據(jù)的擬合程度,時(shí)間步長和批數(shù)據(jù)大小決定了模型訓(xùn)練的結(jié)果.選擇ADAM 優(yōu)化器對參數(shù)進(jìn)行優(yōu)化調(diào)整.
實(shí)線為數(shù)據(jù)真實(shí)值,虛線為模型在測試集上的預(yù)測.從圖5而言,GRU 模型的進(jìn)閥溫度預(yù)測結(jié)果比ARIMA 模型預(yù)測結(jié)果更加接近真實(shí)的閥冷進(jìn)閥溫度數(shù)據(jù),在3個(gè)峰值區(qū)域的預(yù)測效果有些欠缺.
圖5 GRU 預(yù)測圖
ARIMA 模型可以很好捕獲時(shí)間序列中線性關(guān)系,但時(shí)序數(shù)據(jù)仍有非線性關(guān)系沒有捕捉.利用SVM 可以很好捕捉非線性關(guān)系,從ARIMA 獲得線性關(guān)系之外時(shí)間序列的殘差信息獲得非線性關(guān)系.進(jìn)一步優(yōu)化預(yù)測值.從而提出ARIMA-SVM 混合模型.
ARIMA-SVM 混合模型結(jié)合兩個(gè)模型的優(yōu)點(diǎn).首先使用 ARIMA 對進(jìn)閥溫度時(shí)間序列進(jìn)行預(yù)測,捕獲進(jìn)閥溫度時(shí)間序列的線性變化趨勢,然后利用 SVM 對進(jìn)閥溫度時(shí)間序列的非線性,以提高預(yù)測的準(zhǔn)確性.在ARIMA 模型預(yù)測的同時(shí)獲得了殘差數(shù)據(jù),將獲得的殘差部分作為SVM的輸入,根據(jù)SVM 模型的輸出進(jìn)一步調(diào)整ARIMA的預(yù)測值,使得預(yù)測值更加接近真實(shí)值.
實(shí)線為數(shù)據(jù)真實(shí)值,虛線為模型在測試集上的預(yù)測.從圖6而言,ARIMA-SVM 混合模型的進(jìn)閥溫度預(yù)測結(jié)果比ARIMA 模型預(yù)測結(jié)果更加接近真實(shí)的閥冷進(jìn)閥溫度數(shù)據(jù).ARIMA-SVM 混合模型結(jié)合兩個(gè)模型的優(yōu)點(diǎn).首先使用 ARIMA 對電網(wǎng)時(shí)間序列進(jìn)行預(yù)測,捕獲電網(wǎng)時(shí)間序列的線性變化趨勢,然后利用 SVM 對電網(wǎng)時(shí)間序列的非線性,以提高預(yù)測的準(zhǔn)確性.在ARIMA 模型預(yù)測的同時(shí)獲得了殘差數(shù)據(jù),將獲得的殘差部分作為SVM的輸入,根據(jù)SVM 模型的輸出進(jìn)一步調(diào)整ARIMA的預(yù)測值,使得預(yù)測值更加接近真實(shí)值.
圖6 混合模型預(yù)測
為了能夠從整體評估各個(gè)模型的預(yù)測能力.計(jì)算出各個(gè)模型的均方根誤差、均方誤差和平均絕對誤差進(jìn)行比較.結(jié)果如表1所示,根據(jù)本文選取的均方根誤差、均方誤差和平均絕對誤差3個(gè)評價(jià)指標(biāo)來衡量預(yù)測結(jié)果的準(zhǔn)確性,3個(gè)評價(jià)指標(biāo)可以很好的衡量各個(gè)模型預(yù)測值和真實(shí)值之間的偏差和擬合精度,值越小說明精度越高,預(yù)測效果也越好.從表1可以看出ARIMA-SVM混合模型在整體的誤差上相比其他3個(gè)模型都有一定的優(yōu)勢,能夠更好的預(yù)測出進(jìn)閥溫度,提高預(yù)測精度.
表1 各模型的評價(jià)指標(biāo)
高壓直流運(yùn)行中換流閥會(huì)產(chǎn)生熱能,作為換流閥的關(guān)鍵設(shè)備和重要降溫設(shè)備,閥冷系統(tǒng)以水為介質(zhì)將換流閥熱能帶出以達(dá)到冷卻目的.換流閥若要安全穩(wěn)定地運(yùn)行,將設(shè)備運(yùn)行時(shí)的溫度維持在合理范圍內(nèi)至關(guān)重要.進(jìn)閥溫度和出閥溫度是閥冷系統(tǒng)最為關(guān)鍵的兩個(gè)參數(shù).本文通過構(gòu)建ARIMA 模型、SVM 模型、GRU 神經(jīng)網(wǎng)絡(luò)模型以及ARIMA-SVM的混合模型對閥冷數(shù)據(jù)進(jìn)行時(shí)序分析,針對進(jìn)閥溫度這一關(guān)鍵參數(shù)進(jìn)行預(yù)測.實(shí)驗(yàn)結(jié)果表明,雖然某些地方有些許偏差,ARIMA 模型大體上能夠較好地預(yù)測進(jìn)閥溫度但偏差比較大.SVM 模型可以預(yù)測數(shù)據(jù)的變化趨勢.GRU 神經(jīng)網(wǎng)絡(luò)模型和ARIMA 模型相比預(yù)測值更加接近進(jìn)閥溫度的真實(shí)值,但在3個(gè)評價(jià)指標(biāo)上稍劣于ARIMASVM 混合模型.通過在ARIMA 模型分析線性數(shù)據(jù)的基礎(chǔ)上結(jié)合SVM 模型,進(jìn)而提高進(jìn)閥溫度預(yù)測準(zhǔn)確性.在ARIMA 模型預(yù)測結(jié)果的基礎(chǔ)上利用捕獲的殘差信息做進(jìn)一步優(yōu)化,實(shí)驗(yàn)結(jié)果表明將傳統(tǒng)時(shí)序模型與機(jī)器學(xué)習(xí)結(jié)合提出ARIMA-SVM的混合模型可以達(dá)到一個(gè)優(yōu)化的結(jié)果.