張宗華,張海全, 李師航,牛新征
1)南京南瑞集團公司流程與信息管理中心,江蘇南京 211106;2)西南財經(jīng)大學(xué)經(jīng)濟信息工程學(xué)院,四川成都 611130;
3)電子科技大學(xué)計算機科學(xué)與工程學(xué)院,四川成都 611731
?
基于加權(quán)滑動平均的磁盤使用率預(yù)測模型
張宗華1,張海全1, 李師航2,牛新征3
1)南京南瑞集團公司流程與信息管理中心,江蘇南京 211106;2)西南財經(jīng)大學(xué)經(jīng)濟信息工程學(xué)院,四川成都 611130;
3)電子科技大學(xué)計算機科學(xué)與工程學(xué)院,四川成都 611731
摘要:為能提前做好擴容準(zhǔn)備,提出一種改進的加權(quán)滑動平均(weighted moving average, WMA)模型,用以預(yù)測未來短期內(nèi)磁盤的使用率. 針對磁盤使用率序列變化較為平緩、要求滯后較小的特性,采用自相關(guān)和偏自相關(guān)系數(shù)法對模型定階,處理數(shù)據(jù)后,在不影響精度的前提下計算最小滯后值,并使用結(jié)合了拉依達準(zhǔn)則的權(quán)重轉(zhuǎn)移法來均衡權(quán)重,用多新息遞推最小二乘法對參數(shù)進行更精確的估計,以提高預(yù)測的準(zhǔn)確性. 通過Matlab仿真實驗可知,該算法預(yù)測誤差小,滯后性弱,與原始WMA模型相比,具有更好的預(yù)測效果.
關(guān)鍵詞:計算技術(shù);加權(quán)滑動平均模型;磁盤使用率;自相關(guān)和偏自相關(guān)系數(shù)法;拉依達準(zhǔn)則;權(quán)重轉(zhuǎn)移;多新息遞推最小二乘法
Disk usage prediction based on an improved
weighted moving average method
Zhang Zonghua1?, Zhang Haiquan1, Li Shihang2, and Niu Xinzheng3
磁盤使用率的預(yù)測主要用于資源管理、故障管理、實時監(jiān)控以及對異常情況進行警報,防止磁盤寫滿造成數(shù)據(jù)丟失等問題. 目前有關(guān)磁盤使用率預(yù)測的研究不多.Murray等[1]提出了一種融合線性和指數(shù)回歸模型、自回歸積分滑動平均模型及貝葉斯結(jié)構(gòu)時間序列模型的算法,而在磁盤使用率短期預(yù)測方面目前尚欠有效算法.
短期預(yù)測要求精度較高,延遲較小,比較適合用時間序列模型[2]進行預(yù)測. 常見的時間序列預(yù)測模型包括用來對各種自然現(xiàn)象進行預(yù)測的自回歸(auto regressive, AR)模型、通過一組時間序列逐次移動完成計算的滑動平均(moving average, MA)模型、由自回歸模型和滑動平均模型迭加形成的自回歸滑動平均(auto regressive moving average, ARMA)模型及經(jīng)過差分處理后轉(zhuǎn)化為ARMA并與之形式類似的自回歸積分滑動平均模型(auto regressive integrated moving average, ARIMA). 磁盤使用率數(shù)據(jù)沒有明顯趨勢性,變化較平穩(wěn),而在時間序列模型中,MA模型最適合處理平穩(wěn)數(shù)據(jù),且運行效率高,符合預(yù)測和警告的即時性要求,已在諸如股票交易、降雨風(fēng)速和金融時間序列等方面有大量應(yīng)用[3-4],取得了較好的預(yù)測效果. MA模型基本類型可以分為簡單滑動平均(simple moving average, SMA)模型和加權(quán)滑動平均(weighting moving average, WMA)模型[5],SMA模型是用過去若干個時間點的平均值來預(yù)測當(dāng)前的時間值,但是忽略了各個時間點對當(dāng)前時間點的影響并不相同的問題,而實際上離當(dāng)前時間更接近的時間點通常都會對預(yù)測時間點造成更大的影響. 而WMA模型則可以在不同的時間點上分配不同的權(quán)值,讓那些對預(yù)測點影響更大的時間點擁有更大的權(quán)值,以減小過去較遠時間點造成的干擾.
針對以上問題,本研究選擇WMA模型對磁盤使用率進行預(yù)測,對傳統(tǒng)WMA模型進行改進,以保證其在處理磁盤使用率數(shù)據(jù)時能有更好的預(yù)測效果. 在保證精度的前提下減小滯后值[6],并在傳統(tǒng)WMA模型上加入權(quán)重轉(zhuǎn)移[7],用來防止采集數(shù)據(jù)時的意外誤差對預(yù)測造成的影響,并結(jié)合拉依達準(zhǔn)則[8],將出現(xiàn)異常的時間點的權(quán)重值轉(zhuǎn)移到其他正常的時間點上,而不是像傳統(tǒng)的權(quán)重轉(zhuǎn)移法只對丟失值進行處理,最后通過多新息遞推最小二乘算法[9]求出參數(shù)估計,得到更好的擬合效果. 經(jīng)實驗驗證,與傳統(tǒng)的SMA和WMA比較,本算法可有效減小誤差,對磁盤使用率序列滯后現(xiàn)象的修補效果也十分良好.
1磁盤使用率預(yù)測模型
WMA模型屬于MA模型的一種. MA模型是一種常見的標(biāo)準(zhǔn)線性模型. 設(shè)εt是白噪聲序列, i為序列指標(biāo). 若時間序列yt滿足
yt=εt-α1εt-1-α2εt-2-…-αqεt-q
(1)
則稱yt為q階滑動平均序列,簡稱MA(q)序列[10]. 式(1)中, αi是滑動平均因子(moving average coefficients, MACs).
本研究將WMA模型做出適當(dāng)改進,使其更符合磁盤使用率預(yù)測的要求,具體建模步驟如下:
1) 通過磁盤使用率數(shù)據(jù)的自相關(guān)和偏自相關(guān)系數(shù)來對模型定階[11],確定的階數(shù)即為后面需要計算的參數(shù)個數(shù);
2) 對時間序列進行平穩(wěn)性檢驗、消除奇異值和數(shù)據(jù)平滑[12]等處理,避免一些數(shù)據(jù)波動造成的影響,減小隨機誤差,使后面要進行的參數(shù)估計更加精確;
3) 通過均方誤差公式計算得到最小誤差的最小滯后值,將得到的滯后值作為返回值參與計算,可在相同計算精度下減小滯后值;
4) 使用結(jié)合了拉依達準(zhǔn)則的權(quán)重轉(zhuǎn)移法給各個時間點賦予權(quán)值,保證賦權(quán)的有效性;
5) 用多新息遞推最小二乘算法進行模型參數(shù)估計[13-21],將其值代替MA模型表達式中的參數(shù).
至此模型建立完畢.依此模型,用采集得到的真實磁盤使用率數(shù)據(jù)進行Matlab仿真,驗證算法的有效性.
1.1模型定階
WMA模型的階數(shù)通過對應(yīng)MA模型的階數(shù)來確定. 本研究使用自相關(guān)和偏相關(guān)系數(shù)法來確定模型階數(shù),首先對序列的自相關(guān)系數(shù)(auto correlation function, ACF)和偏自相關(guān)系數(shù)(partial auto correlation function, PACF)進行計算,然后通過對其拖尾性和截尾性的判斷來確定模型的類型及階數(shù). 拖尾性指這2個系數(shù)隨延遲k無限增長以負指數(shù)的速度趨向于0;截尾性指它們在k大于模型階數(shù)后,其值變?yōu)?. 具體判斷規(guī)則如表1. 其中,AR(p)和MA(q)分別表示p階AR模型與q階MA模型.
表1 模型及階數(shù)判斷標(biāo)準(zhǔn)
設(shè)x1,x2,…,xT是平穩(wěn)的磁盤使用率時間序列XT的一個樣本,則其自協(xié)方差系數(shù)定義為
(2)
(3)
樣本偏自相關(guān)系數(shù)定義為
(4)
其中,
(5)
由Bartlett公式,對于q>0, 自相關(guān)系數(shù)滿足正態(tài)分布
(6)
當(dāng)樣本容量充分大時,有
(7)
(8)
對于每個q>0, 檢查從第q+1個開始的ACF落入如式(9)范圍中的比例是否占總數(shù)的68.3%或95.5%左右.
(9)
如果在首階數(shù)q0之前,ACF都明顯不為0,而在q=q0時,ACF中滿足式(9)的個數(shù)達到上述比例,則可判斷ACF序列在q0處截尾,即序列Xt為MA(q0)序列. 計算實際磁盤使用率序列得到的結(jié)果如表2.
表2 自相關(guān)系數(shù)與偏自相關(guān)系數(shù)
因表2數(shù)據(jù)滿足式(9)條件,則可判斷磁盤使用率數(shù)據(jù)在k=1處截尾,即q0=1, 故此時間序列是符合MA(1)模型的,即磁盤使用率時間序列是符合1階WMA模型的.
1.2數(shù)據(jù)處理
對磁盤使用率的數(shù)據(jù)處理包括平穩(wěn)性檢驗、消除奇異值和平滑數(shù)據(jù)等方面. 表2自相關(guān)系數(shù)序列同時可以用作平穩(wěn)性檢驗的標(biāo)準(zhǔn). 當(dāng)自相關(guān)系數(shù)序列快速衰減至0,則說明此時間序列是平穩(wěn)序列.由表2可見,磁盤使用率序列是平穩(wěn)序列.
(10)
(11)
若序列中的值滿足式(12)條件則予以剔除,有
(12)
將與樣本均值的差值超過3倍標(biāo)準(zhǔn)差的數(shù)值確定為異常值,并將其用樣本均值代替.
數(shù)據(jù)平滑的方法有滑動窗口平均法、滑動窗口擬合多項式平滑法、分量回歸平滑法、小波變換法和傅里葉變換法等. 磁盤使用率數(shù)據(jù)本身變化較為平緩,不需要過多的平滑處理,故為了節(jié)省運算成本,并取得較好的平滑效果,本研究選取二次滑動窗口平均法來進行數(shù)據(jù)平滑,設(shè)定窗口大小為5個時間點,原理如下:
(13)
其中, y(i)為第i個時間點的值; yy(j)為第j個時間點經(jīng)平滑處理后的值.
對經(jīng)過1次平滑后的序列yy(j)用式(13)的方式進行第2次平滑處理,經(jīng)2次處理后數(shù)據(jù)的隨機誤差減小. 用平滑后的序列進行預(yù)測,可以保證數(shù)據(jù)精度,提高預(yù)測準(zhǔn)確性.
1.3滯后性的改進
由于滑動平均因子的對稱性,WMA模型預(yù)測有大約(n+1)/2個時間點的滯后,而進行短期的磁盤使用率預(yù)測時要求較小的滯后. 故在通過式(14)計算得到的一系列滯后值中,選取造成誤差最小的.
(14)
其中,
(15)
其中, α是滑動平均因子. 根據(jù)原始輸入序列,可以得到輸出序列的滯后值為
(16)
式(16)使用了均方誤差作為衡量標(biāo)準(zhǔn),用于計算每個滯后值造成的誤差,其中造成最小誤差的滯后值就作為模型的因子來計算輸出,可有效減小磁盤使用率預(yù)測模型的滯后性問題.
1.4改進的權(quán)重轉(zhuǎn)移
結(jié)合拉依達準(zhǔn)則法與權(quán)重轉(zhuǎn)移法,將不在假設(shè)檢驗范圍內(nèi)的異常點的權(quán)重交移給當(dāng)前預(yù)測中權(quán)重最大的點,針對磁盤使用率數(shù)據(jù)中出現(xiàn)的異常波動,加強優(yōu)化效果.
傳統(tǒng)的權(quán)重轉(zhuǎn)移是基于WMA模型提出的,將模型中已分配權(quán)重但實際值不存在的時間點的權(quán)重,重新分配給對當(dāng)前預(yù)測目標(biāo)點影響最大的時間點. 原始的權(quán)重轉(zhuǎn)移法只處理擁有權(quán)重但實際值為零的點,即處理丟失值,但對其他異常數(shù)據(jù)并不敏感,只在極少數(shù)情況下才能起到作用,用途受到極大限制. 現(xiàn)將其與達依拉準(zhǔn)則結(jié)合,即在對每個當(dāng)前值進行預(yù)測時,將每個賦有權(quán)重的點依次排成序列,并對此權(quán)重序列進行拉依達準(zhǔn)則的判斷,對于不滿足拉依達準(zhǔn)則的點,將其權(quán)重值重新分配給對當(dāng)前預(yù)測目標(biāo)點影響最大的點.
如現(xiàn)有磁盤使用率數(shù)據(jù)中的5個時間點y1、y2、y3、y4和y5分別對應(yīng)權(quán)重值w1、w2、w3、w4和w5, 用以預(yù)測下一時間點y6, 根據(jù)加權(quán)滑動平均公式有
y6=y1w1+y2w2+y3w3+y4w4+y5w5
(17)
若通過計算發(fā)現(xiàn)y2滿足式(12),根據(jù)上述規(guī)則,將要除去的點的權(quán)值賦給對當(dāng)前目標(biāo)點影響最大的點,而此例中y5距離目標(biāo)點y6最近,影響最大,故將y2的權(quán)值w2轉(zhuǎn)移到y(tǒng)5上,即此刻預(yù)測值滿足
y6=y1w1+y3w3+y4w4+y5(w5+w2)
(18)
通過改進的權(quán)重轉(zhuǎn)移,可有效避免因磁盤使用率數(shù)據(jù)的異常波動而造成的預(yù)測誤差.
1.5參數(shù)估計
若將磁盤使用率預(yù)測模型描述為
y(t)=D(z)v(t)
D(z)=1+d1z-1+d2z-2+…+dvz-v
(19)
其中, y(t)為系統(tǒng)輸出觀測序列; v為白噪聲; z為單位后移算子; di為待計算參數(shù).且有
z-1v(t)=v(t-1)
(20)
設(shè)整數(shù)p為新息長度(innovation length), Y(t)為堆積輸出向量, V(t)為堆積誤差向量, Γ為信息矩陣, θ為對參數(shù)di的估計基于最小二乘優(yōu)化原理[21],有多新息遞推最小二乘法(multiple innovation recursive least squares,MILS)為
(21)
(22)
(23)
[φ(t),φ(t-1),…,φ(t-p+1)]T
(24)
具體步驟的偽代碼如下:
Pseudocode of MILS
set p0=106, P(0)=p0I,θ(0)=1n/p0;
for t=1 to v do
constuct P(t), V(p,t);
for t=1 to n do
choose a new p;
end
end
該算法執(zhí)行了遞階計算過程,在設(shè)置初值后,用式(24)構(gòu)造Γ(p,t), 用式(22)構(gòu)造P(t), 用式(23)計算V(p,t), 用式(21)刷新估計值. 經(jīng)以上計算逐次刷新對di的估計值θ, 則可完成對磁盤使用率模型的所有參數(shù)估計.
通過第1節(jié)的各步驟,參數(shù)估計完畢,模型建立完成.
2實驗結(jié)果及分析
為驗證本算法的有效性,現(xiàn)對不同編號的10個磁盤進行一段時間的使用率記錄,磁盤類型為jfs2,操作系統(tǒng)為aix. 本研究采取的記錄方式為每隔10 min對磁盤進行1次采樣,每個磁盤的采樣點保證在300個以上. 得到每個磁盤使用率的時間序列,用于進行Matlab仿真實驗.
將傳統(tǒng)的WMA和SMA與本研究算法對比,用平均絕對誤差(mean absolute error, MAE)作為評判標(biāo)準(zhǔn). 平均絕對誤差是每個時間點上預(yù)測值與真實值之差絕對值的平均,相比平均誤差,能真實反映預(yù)測誤差,使結(jié)果具有良好的參考價值. MAE的計算公式為
(25)
其中, x(i)是原始時間序列; y(i)是預(yù)測時間序列.
各算法的預(yù)測結(jié)果對比如表3.
表3 算法平均絕對誤差對比
由表3可以看到,本研究算法相對于原始的WMA,平均絕對誤差減小了24%~73%,在磁盤使用率序列上取得了良好的效果.
本研究用Matlab實現(xiàn)仿真[22],對10組磁盤使用率數(shù)據(jù)進行處理和預(yù)測,部分實驗結(jié)果如圖1.
圖1 自相關(guān)系數(shù)Fig.1 Autocorrelation coefficients
圖1中將表2的自相關(guān)系數(shù)用散點圖畫出,并將判斷是否落在范圍內(nèi)的標(biāo)準(zhǔn)差用與x軸平行的兩條實線標(biāo)記,可以更明確地看到Lag=1時的點落在實線外,而后面的值都迅速衰減到0左右,并在x軸附近進行無規(guī)則的上下波動,根據(jù)以上情況可判斷該時間序列符合MA(1)模型.
采集到的原始時間序列如圖2.
圖2 采樣后的原始時間序列Fig.2 Original time series of sampling
圖2是10組磁盤使用率序列中的一組,可以看到磁盤使用率時間序列極其平緩,甚至?xí)趲讉€連續(xù)時間點里數(shù)值保持不變,但在圖2中很明顯有2個點的數(shù)值比其他點高出很多,所以需要處理數(shù)據(jù),以避免一些非算法精度問題造成的影響. 圖3為處理后的時間序列.
圖3 經(jīng)數(shù)據(jù)處理后的時間序列Fig.3 Time series after processing
由圖3可以清晰看到磁盤使用率序列經(jīng)過600多次采樣,變化范圍都在94.8~95.0,明顯高于其他數(shù)據(jù)的值被判斷為異常值并予以剔除. 處理過后的序列消除了異常情況和隨機誤差的干擾,可以進行預(yù)測,其預(yù)測結(jié)果如圖4.
圖4 預(yù)測結(jié)果擬合圖Fig.4 Fitting curve of prediction result
圖4給出了本研究改進的WMA模型的預(yù)測序列與原始時間序列的擬合圖,由于采樣點太多,此圖只能粗略地看到預(yù)測效果,所以截取了其中一小部分?jǐn)?shù)據(jù)并放大,與原始SMA和WMA算法對比.
圖5截取了序列中變化較頻繁的一段,可以更好地看出擬合效果.由圖5可見,改進后的WMA擬合效果優(yōu)于SMA和WMA,預(yù)測誤差明顯減小,能快速感知數(shù)據(jù)變化,且滯后也顯著減小,較好地解決了磁盤使用率預(yù)測中對高預(yù)測精度和較小滯后的需求.
圖5 改進算法與SMA和WMA的對比圖Fig.5 (Color online) Comparison diagram of prodiction by the proposed algorithm, SMA and WMA
結(jié)語
本研究提出了一種對WMA模型的改進算法,對真實磁盤進行使用率數(shù)據(jù)采樣,通過Matlab仿真驗證了算法的有效性. 實驗結(jié)果顯示本算法優(yōu)化效果良好,在減小預(yù)測誤差和滯后方面效果顯著.仿真過程中發(fā)現(xiàn),若數(shù)據(jù)出現(xiàn)連續(xù)的上下劇烈波動,則預(yù)測效果變差,即本算法對較尖銳的波峰波谷預(yù)測能力不強,雖然這種數(shù)據(jù)出現(xiàn)劇烈波動的情況在磁盤使用率數(shù)據(jù)中極為罕見,但也值得考慮并做出改進.
引文:張宗華,張海全, 李師航,等. 基于加權(quán)滑動平均的磁盤使用率預(yù)測模型[J]. 深圳大學(xué)學(xué)報理工版,2016,33(1):72-79.
參考文獻/ References:
[1] Murray S,Amaan M,Christoph A, et al. Projecting disk usage based on historical trends in cloud environment[C]// The 3rd ACM Workshop on Scientific Cloud Computing. Delft, Netherlands: Association for Computing Machinery, 2012.
[2] Husna S H, Cui Lishan, Herny R H. Time series analysis of Web server logs for an online newspaper[C]// Proceedings of the 7th International Conference on Ubiquitous Information Management and Communication. Kota Kinabalu, Malaysia: Association for Computing Machinery, 2013.
[3] Ahmad A S A,El-Shafie A,Naseri M, et al. Rainfall data analyzing using moving average (MA) model and wavelet multi-resolution intelligent model for noise evaluation to improve the forecasting accuracy[J]. Neural Computing and Applications, 2014, 25(7): 1853-1861.
[4] Raudys A. Optimal negative weight moving average for stock price series smoothing[C]// Conference on Computational Intelligence for Financial Engineering. London: Institute of Electrical and Electronics Engineers, 2014.
[5] Hansun Seng. A new approach of moving average method in time series analysis[C]// International Conference on New Media Studies.Tangerang,Indonesia: IEEE Computer Society, 2013.
[6] Adrian L, Gao Junbin, Zheng Lihong. Optimizing the moving average[C]//World Congress on Computational Intelligence. Brisbane,Australia: Institute of Electrical and Electronics Engineers Inc, 2012.
[7] 楊慧,許福栗. 基于權(quán)重轉(zhuǎn)移的加權(quán)滑動平均模型改進[J].計算機工程與應(yīng)用, 2014, 50(14):156-159.
Yang Hui, Xu Fuli. Improvement of weighted moving average model based on transferring weights[J]. Computer Engineering and Applications, 2014, 50(14):156-159.(in Chinese)
[8] Zhang Liang, Qin Yongyuan, Zhang Jinliang.Study of polynomial curve fitting algorithm for outlier elimination[C]// International Conference on Computer Science and Service System.Nanjing, China: IEEE Computer Society, 2011.
[9] 周易,丁峰. 滑動平均模型的最小二乘辨識方法比較研究[J].科學(xué)技術(shù)與工程, 2007, 18(7): 4570-4575.
Zhou Yi, Ding Feng. Comparison of least squares identification for moving average models[J]. Science Technology and Engineering, 2007, 18(7): 4570-4575.(in Chinese)
[10] 卜愛國,王炯. 基于MA(q)模型的動態(tài)電源管理預(yù)測策略[J].計算機應(yīng)用研究,2011,28(7): 2516-2518.
Bu Aiguo, Wang Jiong. Dynamic power management predictive policy based on MA(q) model[J]. Application Research of Computers, 2011,28(7): 2516-2518.(in Chinese)
[11] 張賢達. 用自相關(guān)確定MA模型階數(shù)的二種新方法[J].電子學(xué)報, 1994, 22(7): 103-104.
Zhang Xianda. Two new mothods for order determination of an MA model using autocorrelations[J]. Chinese Journal of Electronics, 1994, 22(7): 103-104.(in Chinese)
[12] 王達, 崔蕊.數(shù)據(jù)平滑技術(shù)綜述[J]. 電腦知識與技術(shù), 2009, 17(5):4507-4509.
Wang Da, Cui Rui. Data smoothing technology summary[J]. Computer Knowledge and Technology, 2009, 17(5):4507-4509.(in Chinese)
[13] 李守巨,霍軍周,曹麗娟. 盾構(gòu)機土壓平衡系統(tǒng)的ARMA模型及其參數(shù)估計[J]. 煤炭學(xué)報, 2014, 39(11):2201-2205
Li Shouju, Huo Junzhou, Cao Lijuan. Autoregressive moving average model and its parameter estimation for earth pressure balance system of shield[J]. Journal of China Coal Society, 2014, 39(11):2201-2205.(in Chinese)
[14] 宋安超. 滑動平均模型參數(shù)估計方法的仿真比較[J]. 大眾科技, 2011, 12(1):49-51.
Song Anchao. Simulation and comparison of three methods of parametric estimation for moving average model[J]. Popular Science and Technology, 2011, 12(1):49-51.(in Chinese)
[15] 汪海濱,龍俊波,查代奉. 分?jǐn)?shù)低階時頻滑動平均模型參數(shù)估計[J]. 計算機工程與應(yīng)用, 2015, 50(20):178-182.
Wang Haibin, Long Junbo, Zha Daifeng. Modeling and parameter estimation based on FLO-TFMA[J]. Computer Engineering and Applications, 2015, 50(20),178-182.(in Chinese)
[16] 單銳,施蘇桐,劉文. 基于改進共軛梯度思想的滑動平均模型參數(shù)估計優(yōu)化方法[J]. 蘭州理工大學(xué)學(xué)報, 2014, 40(1):144-147.
Shan Rui, Shi Sutong, Liu Wen. The auto regression moving average model optimization method of parameter estimation based on the improved conjugate gradient thoughts[J]. Journal of Lanzhou University of Technology, 2014, 40(1):144-147.(in Chinese)
[17] 鄧自立. 滑動平均模型參數(shù)估計的Gevers-Wouters算法的指數(shù)收斂性[J]. 科學(xué)技術(shù)與工程, 2005, 20(5):1473-1484.
Deng Zili. Exponential convergence of Gevers-Wouters algorithm for moving average model parameter estimation[J]. Science Technology and Engineering, 2005, 20(5):1473-1484.(in Chinese)
[18] 單銳,劉雅寧,劉文. 改進的差分自回歸移動平均模型的共軛梯度參數(shù)估計法[J]. 河南科技大學(xué)學(xué)報自然科學(xué)版, 2015, 36(4):85-90.
Shan Rui, Liu Yaning, Liu Wen. Improved conjugate gradient parameter estimation for autoregressive integrated moving average model[J]. Journal of Henan University of Science and Technology Natural Science, 2015, 36(4):85-90.(in Chinese)
[19] 高艷普,王向東,王冬青. 多變量受控自回歸滑動平均系統(tǒng)的極大似然辨識方法[J]. 山東大學(xué)學(xué)報工學(xué)版, 2015, 45(2):49-55.
Gao Yanpu, Wang Xiangdong, Wang Dongqing. Maximum likelihood identification method for a multivariable controlled autoregressive moving average system[J]. Journal of Shandong University Engineering Science, 2015, 45(2):49-55.(in Chinese)
[20] 李天一,鄭建榮.基于ARMAX模型的子空間辨識算法[J]. 計算機仿真, 2015, 32(1):310-313.
Li Tianyi, Zheng Jianrong. A new subspace identification method based on ARMAX model[J]. Computer Simulation, 2015, 32(1):310-313.(in Chinese)
[21] Ding Feng,Cheng Tongwen. Hierarchical least squares identification methods for multivariable ststems[J]. IEEE Transactions on Automatic Control,2005, 50(3): 397-402.
[22] 王國峰,王子良,王太勇,等. Matlab在時間序列分析中的應(yīng)用[J]. 應(yīng)用科技, 2003, 30(5):36-38.
Wang Guofeng, Wang Ziliang, Wang Taiyong, et al. Application of Matlab in time series analysis[J]. Applied Science and Technology, 2003, 30(5): 36-38.(in Chinese)
【中文責(zé)編:坪梓;英文責(zé)編:遠鵬】
1) Process and Information Management Center, NARI Group Corporation, Nanjing 211106, Jiangsu Province, P.R.China
2) College of Economics and Information Engineering, Southwestern University of Finance and Economics,
Chengdu 611130,Sichuan Province, P.R.China
3) College of Computer Science and Engineering, University of Electronic Science and Technology of China,
Chengdu 611731, Sichuan Province, P.R.China
Abstract:This paper proposes an improved weighted moving average (WMA) model to predict the usage of disks in the near future. Considering the characteristics of showing gentle change in disk usage and the requirements with small lag, we firstly utilize the autocorrelation and partial autocorrelation coefficient method to determine the order of the model. After processing the series, the minimum lag can be calculated on the premise without affecting the accuracy. Additionally, weights transferring combined with the Pauta criterion is used to balance the weight. At last, we estimate the parameters by using the multiple innovation recursive least squares to improve the result of prediction. According to the simulation result by Matlab, this algorithm is proved to have less result errors and a smaller lag. It provides a better prediction effect as compared with the original WMA model.
Key words:computing technology; weighted moving average model; disk usage; autocorrelation and partial autocorrelation coefficient method; Pauta criterion; transferring weight; multiple innovation recursive least squares
作者簡介:張宗華(1977—),男,南京南瑞集團公司工程師.研究方向:電力信息化. E-mail:hangzonghua@sgepri.sgcc.com.cn
基金項目:國家自然科學(xué)基金資助項目(61300192) ;國家科技支撐計劃資助項目(2013BAH33F00);南京南瑞集團公司研究基金資助項目(SGTYHT/14-XX-194)
中圖分類號:TP 301.6
文獻標(biāo)志碼:A
doi:10.3724/SP.J.1249.2016.01072