王旭,陳瀟一
(1.國網(wǎng)陜西省電力公司,陜西西安 710048;2.國網(wǎng)陜西省電力公司電力科學(xué)研究院,陜西西安 710100)
隨著國家電網(wǎng)公司信息化進(jìn)程的發(fā)展,信息系統(tǒng)在日常運(yùn)行時(shí),會(huì)對(duì)底層軟硬件造成負(fù)荷[1]。IT監(jiān)控系統(tǒng)每分鐘要從這些信息系統(tǒng)采集上萬個(gè)系統(tǒng)運(yùn)行數(shù)據(jù),這些數(shù)據(jù)包含了與信息系統(tǒng)運(yùn)行相關(guān)的動(dòng)換、網(wǎng)絡(luò)、主機(jī)、存儲(chǔ)、中間件、應(yīng)用、運(yùn)維等大量信息,任何一種資源負(fù)載過大,都可能會(huì)引起系統(tǒng)性能下降甚至癱瘓。針對(duì)目前存在的問題,以陜西電網(wǎng)信息系統(tǒng)為研究對(duì)象,通過統(tǒng)計(jì)、評(píng)價(jià)、預(yù)測(cè)等大數(shù)據(jù)分析技術(shù)探索適合公司的信息系統(tǒng)及網(wǎng)絡(luò)設(shè)備運(yùn)行狀態(tài)診斷的方法,解決公司目前被動(dòng)應(yīng)對(duì)信息系統(tǒng)的狀態(tài)異常及故障的問題。通過建立基于運(yùn)行狀態(tài)的故障診斷模式,創(chuàng)新運(yùn)維管理方式,不斷提升信息系統(tǒng)運(yùn)行水平,確保系統(tǒng)安全穩(wěn)定運(yùn)行[2]。
近年來,已有一些學(xué)者使用數(shù)據(jù)挖掘技術(shù)對(duì)信息系統(tǒng)負(fù)載進(jìn)行了研究,例如:文獻(xiàn)[2]有機(jī)結(jié)合負(fù)載預(yù)測(cè)的主動(dòng)控制技術(shù)和基于實(shí)際系統(tǒng)狀態(tài)信息的被動(dòng)控制技術(shù),利用大數(shù)據(jù)挖掘技術(shù),采用馬爾科夫鏈篩選組合模型預(yù)測(cè)未來時(shí)刻的工作負(fù)載情況[3];文獻(xiàn)[4]基于ESPRIT分解算法,實(shí)現(xiàn)短期電力負(fù)荷預(yù)測(cè),且具有較高的擬合度[4];文獻(xiàn)[5]建立改進(jìn)型SVR模型對(duì)電力信息系統(tǒng)負(fù)荷進(jìn)行預(yù)測(cè)[5];文獻(xiàn)[6]對(duì)南京城市電網(wǎng)核心區(qū)短期負(fù)荷特性進(jìn)行分析及預(yù)測(cè)[6];文獻(xiàn)[9-13]使用時(shí)間序列算法對(duì)電力負(fù)載進(jìn)行預(yù)測(cè)。
本研究根據(jù)應(yīng)用系統(tǒng)的負(fù)載情況,從系統(tǒng)運(yùn)維和系統(tǒng)應(yīng)用過程兩個(gè)角度分析影響信息系統(tǒng)負(fù)載的運(yùn)行狀態(tài)。
1)系統(tǒng)運(yùn)維問題分析:業(yè)務(wù)系統(tǒng)的負(fù)載受到軟件、硬件、中間件、網(wǎng)絡(luò)、外部接口系統(tǒng)等各方面因素的影響,系統(tǒng)出現(xiàn)不穩(wěn)定的因素可總結(jié)為以下幾種,如圖1所示。
圖1 系統(tǒng)運(yùn)行不正常問題魚刺分析圖Fig.1 Fish-bone analysis diagram of system operation abnormalities
程序問題:主要為業(yè)務(wù)系統(tǒng)程序編碼不夠嚴(yán)謹(jǐn)或安全,存在bug或漏洞,運(yùn)行可造成系統(tǒng)無法運(yùn)行、內(nèi)存泄露等問題。
軟件問題:主要是數(shù)據(jù)庫、中間件等軟件進(jìn)程的漏洞而引起的系統(tǒng)不穩(wěn)定。
網(wǎng)絡(luò)問題:在硬件設(shè)備運(yùn)行正常的前提下,系統(tǒng)的某一網(wǎng)段存在超過網(wǎng)絡(luò)負(fù)載的情況。
2)系統(tǒng)應(yīng)用過程分析:從業(yè)務(wù)系統(tǒng)應(yīng)用過程的角度分析,主要是對(duì)外服務(wù)能力和內(nèi)部處理能力。其中對(duì)外服務(wù)能力主要體現(xiàn)在系統(tǒng)對(duì)用戶的響應(yīng)速度或并發(fā)量,影響內(nèi)部處理的因素有數(shù)據(jù)量大小、程序邏輯處理能力、數(shù)據(jù)庫讀寫能力、調(diào)用其他系統(tǒng)接口的響應(yīng)能力等。
本文首先根據(jù)獲取的指標(biāo),使用AHP算法計(jì)算各個(gè)指標(biāo)的權(quán)重值,然后結(jié)合虛擬機(jī)權(quán)重計(jì)算指標(biāo)資源利用率,從而計(jì)算系統(tǒng)資源利用率,之后分別從系統(tǒng)資源利用率和系統(tǒng)性能指標(biāo)采用ARIMA和HOLT-WINTERS指數(shù)平滑預(yù)測(cè)方法對(duì)系統(tǒng)負(fù)荷進(jìn)行預(yù)測(cè),并對(duì)系統(tǒng)運(yùn)維負(fù)載分級(jí)預(yù)判和系統(tǒng)性能預(yù)判系統(tǒng)負(fù)荷狀態(tài),其技術(shù)路線如圖2所示。
圖2 電力信息系統(tǒng)負(fù)載預(yù)測(cè)技術(shù)路線圖Fig.2 Roadmap of load forecasting technology for power information system
AHP算法[7-8]全程為層次分析法,是將多目標(biāo)或多方案的決策方法,首先根據(jù)決策目標(biāo)、影響決策目標(biāo)的因素、決策的對(duì)象建立層次結(jié)構(gòu)模型,構(gòu)造各個(gè)層次中兩兩因素之間的相對(duì)權(quán)重,并對(duì)判斷矩陣進(jìn)行一致性檢驗(yàn),最終確定某層所有因素對(duì)總目標(biāo)相對(duì)重要性的權(quán)值,從最高層到最低層逐漸進(jìn)行。AHP法在對(duì)事物進(jìn)行決策分析時(shí),能對(duì)定性問題進(jìn)行綜合處理,得出明確的定量的結(jié)論[14]。
AHP算法的核心在于構(gòu)造判斷矩陣,將決策者對(duì)事物的評(píng)價(jià)由定性評(píng)價(jià)轉(zhuǎn)換為定量評(píng)價(jià),在此,首先引出構(gòu)造判斷矩陣兩兩元素間的相對(duì)權(quán)重,如表1所示。
表1 比例的標(biāo)度及其含義Tab.1 Scale of scale and its meaning
將兩兩元素進(jìn)行重要性程度對(duì)比,并根據(jù)對(duì)比結(jié)果,將數(shù)值填入對(duì)應(yīng)位置的矩陣中,構(gòu)造兩兩元素相互比較后的判斷矩陣,記為
式中:p表示某層中的元素個(gè)數(shù);eij表示某層中元素i對(duì)元素j的相對(duì)重要性度量值。元素i對(duì)元素j的重要性與元素j對(duì)元素i的相對(duì)重要性是互逆的,即eji=1/eij,且E為對(duì)稱矩陣。
判斷矩陣E的最大特征根λmax,及其對(duì)應(yīng)的特征向量Wf={w1,w2,…,wp},然后對(duì)思維的邏輯進(jìn)行一致性判定,其一致性檢驗(yàn)公式為
式中:CR為一致性比率;CI為一致性指標(biāo);RI為隨機(jī)一致性指標(biāo)。具體數(shù)據(jù)見表2所示。
表2 九階段矩陣RI值Tab.2 The RIvalue of Nine stage matrix
為了獲得合理的權(quán)屬分配和滿意的一致性,需要滿足條件為CR<0.1,一旦不滿足該條件,需要重新調(diào)整判斷矩陣的值,再重新計(jì)算CR,直到滿足條件為止。
歸一化權(quán)重向量計(jì)算公式為
為了方便,歸一化后的權(quán)重向量為Wf={w1,w2,…,wp},且向量中每個(gè)值均介于0和1之間,累計(jì)值為1,由此得到元素的權(quán)重,之后引入系數(shù)α,且α∈[0,1],得到指標(biāo)權(quán)重向量為
最終計(jì)算各指標(biāo)權(quán)重,結(jié)果如表3所示。
表3 某指標(biāo)權(quán)重Tab.3 The weight of an index
時(shí)間序列分析方法中ARIMA模型是應(yīng)用很廣泛的[9]。其大體思路是:首先判斷序列是不是平穩(wěn)的,可通過時(shí)序圖和ADF進(jìn)行檢驗(yàn),經(jīng)檢驗(yàn)后如果序列不平穩(wěn),需通過差分方法處理成平穩(wěn)時(shí)間序列,之后繪制平穩(wěn)后的ACF和PACF圖,并根據(jù)截尾和拖尾的性質(zhì),對(duì)模型進(jìn)行最終判定,得到模型的類型以及模型階數(shù)和未知參數(shù),并對(duì)模型進(jìn)行有效性檢驗(yàn),最后基于建立的模型預(yù)測(cè)未來時(shí)序?qū)?yīng)的目標(biāo)值。ARIMA模型一般記為ARIMA(p,d,q)[10-13],即d次差分后將平穩(wěn)序列Xt擬合為ARMA(p,q)模型,該模型的表達(dá)式為
式中:p為自回歸階數(shù);φ1,φ2,…,φp為自回歸系數(shù);Xt為平穩(wěn)數(shù)據(jù)序列;{εt}為白噪聲序列,形式為W~N(0,σ2)。
P階自回歸模型AR(p),表達(dá)式為
q階滑動(dòng)平均模型MA(q),表達(dá)式為
ARIMA時(shí)間序列模型建模過程如圖3所示。
Holt-Winters模型是較常見的預(yù)測(cè)模型,由Winters提出,又由后人不斷改進(jìn)。當(dāng)時(shí)間序列圖顯示的時(shí)間序列的季節(jié)變動(dòng)大致相等時(shí),采用加法模型,當(dāng)時(shí)間序列的長期趨勢(shì)大致成正比時(shí),應(yīng)該采用乘法模型。本文數(shù)據(jù)規(guī)律與加法模型相符合,選擇加法模型,假設(shè)進(jìn)行指數(shù)平滑的序列為{Xt},則Holt-Winters三參數(shù)指數(shù)平滑模型為式中:bt為長期趨勢(shì)值;γ為加權(quán)值;S為季節(jié)調(diào)整因素;π為季節(jié)性時(shí)間的長度;α,β為調(diào)整因子;Xt為現(xiàn)行數(shù)值;at為平滑值;t為當(dāng)前時(shí)間。
預(yù)測(cè)值由下式計(jì)算:
式中:k為向后平滑期數(shù),即決定預(yù)測(cè)未來幾個(gè)月份的序列的參數(shù);y值即所預(yù)測(cè)系統(tǒng)資源利用率和系統(tǒng)響應(yīng)時(shí)間序列。
圖3 ARIMA時(shí)間序列建模過程圖Fig.3 The procedure chart of ARIMA time series modeling
本文電力業(yè)務(wù)信息系統(tǒng)的負(fù)載評(píng)價(jià)主要從業(yè)務(wù)應(yīng)用和系統(tǒng)資源兩方面進(jìn)行評(píng)價(jià),從這兩個(gè)方面出發(fā),涉及到的基礎(chǔ)指標(biāo)如表4所示,采取的負(fù)荷預(yù)測(cè)的相關(guān)數(shù)據(jù)的日度數(shù)據(jù),歷史數(shù)據(jù)區(qū)間定位為2017年5月20日至2017年6月20日。
1)系統(tǒng)資源利用率各指標(biāo)權(quán)重:本文使用系統(tǒng)資源利用率的CPU使用率、內(nèi)存使用率和磁盤/文件系統(tǒng)使用率等相關(guān)指標(biāo),完成系統(tǒng)資源利用率各指標(biāo)權(quán)重計(jì)算。具體實(shí)現(xiàn)過程如圖4所示,系統(tǒng)資源利用率使用AHP算法得到的各指標(biāo)的權(quán)重如表5所示,且通過一致性檢驗(yàn)。
2)系統(tǒng)資源利用率和系統(tǒng)響應(yīng)時(shí)長的ARIMA、Holt-Winters指數(shù)平滑預(yù)測(cè):使用計(jì)算的系統(tǒng)資源利用率、系統(tǒng)響應(yīng)時(shí)長相關(guān)指標(biāo),完成系統(tǒng)資源利用率和系統(tǒng)響應(yīng)市場(chǎng)的短期預(yù)測(cè)計(jì)算。具體實(shí)現(xiàn)過程如圖5所示。
表4 系統(tǒng)負(fù)載評(píng)價(jià)模型基礎(chǔ)指標(biāo)Tab.4 The base index of System load evaluation model
圖4 系統(tǒng)資源利用率各指標(biāo)權(quán)重實(shí)現(xiàn)過程Fig.4 Realization process of each index weight of system resource utilization rate
表5 系統(tǒng)資源使用率各指標(biāo)權(quán)重Tab.5 The system resource utilization weight of each index
圖5 系統(tǒng)資源利用率、系統(tǒng)響應(yīng)時(shí)長預(yù)測(cè)實(shí)現(xiàn)過程Fig.5 The prediction process of system resource utilization rate and system response time
通過使用ARIMA和Holt-Winters指數(shù)平滑預(yù)測(cè)方法分別對(duì)系統(tǒng)資源利用率和系統(tǒng)性能指標(biāo)(系統(tǒng)平均響應(yīng)時(shí)長)進(jìn)行3天的預(yù)測(cè),其中系統(tǒng)資源利用率的ARIMA模型和Holt-Winters指數(shù)平滑法模型結(jié)果如表6所示。
表6 ARIMA和Holt-Winters結(jié)果對(duì)比Tab.6 Comparison of ARIMA and Holt-Winters results
綜合對(duì)比ARIMA和Holt-Winters指數(shù)平滑法的結(jié)果,得到ARIMA(2,1,1)模型具有更小的AIC值和MSE值,且根據(jù)模型建立的預(yù)測(cè)趨勢(shì)與實(shí)際趨勢(shì)一致,信息系統(tǒng)資源利用率的ARIMA(2,1,1)模型的預(yù)測(cè)值誤差絕對(duì)值、誤差絕對(duì)率分別在0.001~0.008和0.49%~3.77%,平均誤差絕對(duì)值為0.005,平均誤差絕對(duì)率為2.57%,具有較佳的預(yù)測(cè)性能,最終選擇ARIMA(2,1,1),同理系統(tǒng)平均響應(yīng)時(shí)間。ARIMA模型預(yù)測(cè)結(jié)果如下表7,表8所示。
表7 系統(tǒng)資源利用率ARIMA預(yù)測(cè)模型結(jié)果Tab.7 The ARIMA predicted model results of system resource utilization
表8 系統(tǒng)平均響應(yīng)時(shí)間ARIMA預(yù)測(cè)模型結(jié)果Tab.8 The ARIMA predicted model results of System average response time
3)系統(tǒng)負(fù)荷評(píng)價(jià):分別對(duì)資源利用率和系統(tǒng)響應(yīng)時(shí)間進(jìn)行分級(jí)評(píng)價(jià),記系統(tǒng)資源利用率X在t時(shí)刻的預(yù)測(cè)值為Xt,樣本標(biāo)準(zhǔn)差為s,通過加減3個(gè)標(biāo)準(zhǔn)差構(gòu)造基線,結(jié)果為[Xt-3s,Xt+3s],當(dāng)資源利用率小于Xadb-3s時(shí)候資源利用狀態(tài)空閑,當(dāng)資源利用率大于Xt+3s時(shí)候資源利用狀態(tài)過載,當(dāng)資源利用率位于[Xt-3s,Xt+3s]之間,資源利用狀態(tài)正常。系統(tǒng)響應(yīng)時(shí)間分級(jí)評(píng)價(jià),記平均響應(yīng)時(shí)間的閥值為T,當(dāng)平均響應(yīng)時(shí)間超過T則認(rèn)為響應(yīng)時(shí)間超長,處于服務(wù)繁忙狀態(tài),反之處于服務(wù)正常狀態(tài)。綜合系統(tǒng)資源利用率和平均響應(yīng)市場(chǎng)的狀態(tài)對(duì)業(yè)務(wù)系統(tǒng)負(fù)載做出最終評(píng)價(jià),評(píng)價(jià)標(biāo)準(zhǔn)見表9所示。最終業(yè)務(wù)信息系統(tǒng)負(fù)載狀態(tài)評(píng)價(jià)如表10所示。
表9 業(yè)務(wù)系統(tǒng)評(píng)價(jià)標(biāo)準(zhǔn)表Tab.9 The table of business system evaluation standard
表10 業(yè)務(wù)信息系統(tǒng)負(fù)載狀態(tài)評(píng)價(jià)結(jié)果Tab.10 The results of business information system load status evaluation
本文以電力業(yè)務(wù)信息系統(tǒng)收集到的系統(tǒng)資源指標(biāo)信息(CPU使用率、內(nèi)存使用率、磁盤使用率)、系統(tǒng)應(yīng)用指標(biāo)信息(系統(tǒng)平均響應(yīng)時(shí)間)為基礎(chǔ),從系統(tǒng)資源和系統(tǒng)性能兩個(gè)角度分別定量研究,從而完成了系統(tǒng)負(fù)載評(píng)價(jià)任務(wù)。實(shí)驗(yàn)結(jié)果表明本文提出的系統(tǒng)負(fù)載評(píng)價(jià)模型是有效的,且具有較高的預(yù)測(cè)準(zhǔn)確率,有效提升了整體資源利用率。下一步,將結(jié)合系統(tǒng)負(fù)載模型研究成果,對(duì)系統(tǒng)從其他維度進(jìn)行更深層次的擴(kuò)展,使系統(tǒng)負(fù)載評(píng)價(jià)模型更加全面。
[1]張根周.大數(shù)據(jù)在智能電網(wǎng)領(lǐng)域的應(yīng)用[J].電網(wǎng)與清潔能源,2016,32(6):114-117.ZHANG Genzhou.Applications of big data in the field of smart grid[J].Power System and Clean Energy,2016,32(6):114-117(in Chinese).
[2]羅杰,劉元丹,龔旭龍.基于貝葉斯與粗糙集方法的電網(wǎng)故障診斷的研究[J].電子設(shè)計(jì)工程,2015,23(2):28-31.LUO Jie,LIU Yuandan,GONG Xulong.The fault diagnosis for power grid based on rough set and bayesianetwork[J].Electronic Design Engieering,2015,23(2):28-31(in Chinese).
[3]張棟梁,嚴(yán)健,李曉波,等.基于馬爾可夫鏈篩選組合預(yù)測(cè)模型的中長期負(fù)荷預(yù)測(cè)方法[J].電力系統(tǒng)保護(hù)與控制,2016,44(12):63-68.ZHANG Dongliang,YAN Jian,LI Xiaobo,et al.Mid-long term load forecasting based on markov chain screening combination forecasting models[J].Power System Protection and Control,2016,44(12):63-68(in Chinese).
[4]馬哲,舒勤.基于ESPRIT分解算法的短期電力負(fù)荷預(yù)測(cè)[J].電力系統(tǒng)保護(hù)與控制,2015,43(7):90-96.MA Zhe,SHU Qin.Short term load forecasting based on ESPRIT integrated algorithm[J].Power System Protection and Control,2015,43(7):90-96(in Chinese).
[5]錢志.基于改進(jìn)型SVR的電網(wǎng)短期負(fù)荷預(yù)測(cè)[J].中國電力,2016,49(8):54-58.QIAN Zhi.Short term power load forcasting based on improved SVR[J].Electric Power,2016,49(8):54-58(in Chinese).
[6]朱斌,姜寧,霍雪松,等.南京城市電網(wǎng)核心區(qū)短期負(fù)荷特性分析及預(yù)測(cè)[J].中國電力,2016,48(2):67-72.ZHU Bin,JIANG Ning,HUO Xuesong,et al.Forecasting andstudiesonloadcharacteristicsofnanjingcenterareapower network[J].Electric Power,2016,49(8):54-58(in Chinese).
[7]陶鴻飛,孫藝新,吳國威,等.基于大數(shù)據(jù)和層次分析法的電力信息系統(tǒng)成熟度評(píng)估[J].中國電力,2016,49(10):114-118.TAO Hongfei,SUN Yixin,WU Guowei,et al.Maturity assessment of power information system based on big data and analytic hierarchy process[J].Electric Power,2016,49(10):114-118(in Chinese).
[8]李蕊,李躍,徐浩,等.基于層次分析法和專家經(jīng)驗(yàn)的重要電力用戶典型供電模式評(píng)估[J].電網(wǎng)技術(shù),2014,38(9):32-37.LI Rui,LI Yue,XU Hao,et al.Assessment on typical powersupply mode for important power consumers based on analyticalhierarchy process and expert experience[J].Power System Technology,2014,38(9):32-37 (in Chinese).
[9]張楷楷,燕萍.時(shí)間序列以及卡爾曼濾波在電力系統(tǒng)短期負(fù)荷預(yù)測(cè)中的應(yīng)用[J].電氣開關(guān),2016(2):91-97.ZHANG Kaikai,YAN Ping.Application of time series and kalman filetering in short-term load forecasting of power system[J].Electric Switch,2016(2):91-97(in Chinese).
[10]鄧雨榮,張煒,梁俊斌,等.基于時(shí)間序列分析的油中產(chǎn)氣數(shù)據(jù)趨勢(shì)測(cè)度[J].智能電網(wǎng),2016,4(8):744-748.DENG Yurong,ZHANG Wei,LIANG Junbin,et al.Prediction of the trends in the data of dissolved gas production in transformer oil based on time series analysis[J].Smart Grid,2016,4(8):744-748(in Chinese).
[11]田波,樸在林,王慧.基于時(shí)間序列建模在風(fēng)力發(fā)電功率短期預(yù)測(cè)中的研究[J].電網(wǎng)與清潔能源,2016,32(3):115-120.TIAN Bo,PIAO Zailin,WANG Hui.Short term prodiction of wind power based on time series modeling[J].Power System and Clean Energy,2016,32(3):115-120(in Chinese).
[12]麥鴻坤,肖堅(jiān)紅,吳熙辰,等.基于R語言的負(fù)荷預(yù)測(cè)ARIMA模型并行化研究[J].電網(wǎng)技術(shù),2015,39(11):3216-3220.MAI Hongkun,XIAO Jianhong,WU Xichen,et al.Research on ARIMA model parallelization in load prediction based on R language[J].Power System Technology,2015,39(11):3216-3220(in Chinese).
[13]張鵬飛,瞿海妮,肖其師,等.基于氣象因素和時(shí)間序列分析的配電網(wǎng)故障數(shù)量預(yù)測(cè)[J].陜西電力,2016,44(1):68-72.ZHANG Pengfei,QU Haini,XIAO Qishi,et al.Distribution network faults prediction based on meteorological factors and time series analysis[J].Shaanxi Electric Power,2016,44(1):68-72(in Chinese).
[13]李存斌,宋易陽.基于AHP-熵權(quán)法的電力企業(yè)信息化應(yīng)用效果模糊綜合評(píng)價(jià) [J].陜西電力,2015,43(7):48-53.LI Cunbin,SONG Yiyang.Performance fuzzy comprchensive evaluation of electric power enterprise informatization application based on AHP-entropy[J].Shaanxi Electric Power,2015,43(7):48-53(in Chinese).