国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

云計算平臺監(jiān)控系統(tǒng)的預測模型設計

2015-05-30 17:52:58徐桂枝
軟件工程 2015年6期
關鍵詞:預測模型控制監(jiān)測

摘 要:基于云計算平臺的服務項目中非常重要的一塊就是監(jiān)控,因此研究基于云計算平臺的監(jiān)控系統(tǒng)有很重要的意義。文章針對監(jiān)控系統(tǒng)實時處理數據滯后的弊端,設計了依據監(jiān)控歷史數據進行研究的預測模型,用來預測系統(tǒng)將來會發(fā)生的異常行為,進而提前采取防范措施,以保證系統(tǒng)的正常運行。

關鍵詞:云計算平臺;監(jiān)測;控制;預測模型

中圖分類號:TP311 文獻標識碼:A

1 引言(Introduction)

云計算平臺監(jiān)控系統(tǒng)預測是根據監(jiān)控系統(tǒng)的已有數據資料預測將來會發(fā)生的行為。預測研究總體上分為三步:第一步研究基于云計算平臺的監(jiān)控資料數據性質,以此為依據來建立數據模型;第二步給數據預測模型分類,并為各模型設計實現算法及機制;第三步對預測模型的動態(tài)適應性進行研究,評估預測模型,檢驗各模型算法的準確度[1]。

2 數據模型設計(The design of data model)

建立預測模型,就要給監(jiān)控的歷史數據構建模型,監(jiān)控歷史數據可以抽象為有序數據集。有序數據集用()

表示,數據集的起始時間用表示,結束時間用表示,,為監(jiān)控性能數據,為發(fā)生時間。為有序,時,。例如監(jiān)控一個服務器上硬盤的使用情況,隔5分鐘采集1次數據,那么1小時收集的歷史數據集為,是時間時硬盤的使用量。也可以用幾個性能參數的集合加以抽象,表示在時間時的硬盤使用量,表示在時間時的CpU使用量,表示在時間時的內存使用量[2]。

3 數據模型分類(The classification of data model)

基于云計算平臺建立監(jiān)控預測模型,一要參考預測的數據類型,二要參考預測的時間范圍。預測的數據類型可能是連續(xù)的數值型,也可能是離散的布爾型。數據可以按周期采集,也可以按瞬時事件觸發(fā)式采集,可以預測多個方面,比如硬盤使用、內存使用、一個時間段中網絡節(jié)點的狀態(tài)、Web服務每秒的Http請求數等。預測的時間范圍也就是適合預測模型的預測時間長度,有短期和長期兩種。具體分類參考表1。

表1 模型參考

Tab.1 The model reference

項目 長期預測 短期預測

數值型數據 趨勢和季節(jié)性分析 靜態(tài)模型的時間序列分析

布爾型數據 故障周期性分析模型 數據挖掘

依據以上參考預測模型以及基于云計算平臺監(jiān)控數據的特性和預測需求,預測模型可分為三類:

(1)性能數據長期預測模型,通常用回歸算法長期預測性能參數。

(2)閾值越界預測模型。

(3)系統(tǒng)事件預測模型,一般利用數據挖掘技術尋找經常出現的系統(tǒng)故障。

3.1 性能數據長期預測模型

數值型的性能數據長期預測模型,可用于預測如內存使用、響應時間、CPU使用、最大響應時間、磁盤使用等性能參數。對各種性能數據的預測是為了掌握系統(tǒng)設備未來的需求,以確保提供通暢、快速的網絡服務。這種模型重點研究時間序列的動態(tài)部分,一般采用外推法建立模型,用超前外推K步法預測一般走勢。

(1)外推算法

外推預測算法用方程()表示,其中,和為常量,表示零平均數的隨機變量。用方程映射關系來預測的值,當數據達到預設的容量時就警告。

(2)超前K步分析法

超前K步分析預測算法的優(yōu)點很多,與傳統(tǒng)算法相比,準確率更高。相似結構的計算機性能也相似,收集監(jiān)控數據的服務器越多,預測模型越準確。

超前K步分析法通過分析監(jiān)控數據在時間與時間時的映射關系來預測,映射關系可用表示。根據采集的歷史監(jiān)控數據建立時間跨度為的數據集,通過研究數據集的映射關系構造一種預測模型,預測第步的性能參數,來自歷史數據集。此算法不限定具體形式為函數,可以是以為參數的線性函數、神經網絡、決策樹,能從狀態(tài)映射到狀態(tài)就可以[3]。

3.2 閾值越界預測模型

基于云計算平臺的監(jiān)控系統(tǒng)預測系統(tǒng)發(fā)生的故障是通過為監(jiān)測的性能數據設定閾值來實現。一旦監(jiān)測到某項系統(tǒng)性能參數值超出了閾值,就要引發(fā)系統(tǒng)警報。

(1)處理預測干擾因素

第一步,把一天當中偏移平均值 較大的性能參數樣本消除掉,消除方程為,為一天內按固定間隔第次采集的性能數據值,為第個周期采集的性能數據偏移平均數的偏移量,為噪音。

第二步,把一周中偏移平均值較大的性能參數樣本消除掉。消除方程為,其中表示一周中第天的偏移量,且。

第三步,把一個月中偏移平均值較大的性能參數樣本消除,消除方程為,其中表示一年中某月的偏移量,且。

通過以上過濾,每天、每周、每月的偏移平均值較大的性能參數樣本都已消除。

最后,消除時間序列的依賴性,用參數為的方程表示時間,建立一個二階非線性自回歸模型,用方程表示,和是用標準的算法由數據估測出來的模型參數,表示獨立恒等分布的隨機變量。

(2)查找異常行為

消除干擾因素后,接下來依據剩余的監(jiān)控數據,檢測系統(tǒng)偏離平均值的異常行為。參考方程,參照時間窗口中的偏移量為,時間長度為,檢驗時間窗口的時間長度為。

3.3 系統(tǒng)事件預測模型

云計算平臺監(jiān)控系統(tǒng)從歷史監(jiān)控數據中往往可以在短期內挖掘出許多系統(tǒng)事件,進而用數據分析法提取短期預測模型,用來預測系統(tǒng)短期內可能出現的異常事件。這種系統(tǒng)事件預測模型是以先前事件為基礎預測目標事件。具體分三步操作:

(1)挖掘頻繁事件集

在目標事件之前的時間窗口W內頻繁發(fā)生的事件稱作頻繁事件集。要構建系統(tǒng)事件預測模型,首先就要挖掘頻繁事件集。假設有一個單獨目標事件,在發(fā)生之前時間窗口W內的頻繁事件集引發(fā)了的發(fā)生,假如發(fā)生之前在時間窗口W中有四個事件發(fā)生,時間窗口W內的頻繁事件集可以用事件事務T表示,T由四個事件組成,表示為T=。所有事件事務都這樣表述,最后生成事件事務集合D。算法分三步:

①假設將來發(fā)生的目標事件都會沿著T中的順序事件發(fā)生,隨著時間的推移,算法在 時間段內的事件中記錄。

②隨著時間的推移,依次判斷當前事件是否是先前事件引發(fā)的目標事件。若是,就把最近發(fā)生在時間窗口W內的事件集生成一個事務,放進事務集合D中。

③用關聯規(guī)則找到容量最大的超前事件集。

值得強調的是,事件發(fā)生的順序和每個時間窗口的時間間隔沒有關系,連續(xù)目標事件發(fā)生的時間窗口前后可以重疊,這樣處理在間隔波動很大時用處很大。

(2)驗證超前事件集

在一臺服務器死機前會發(fā)生CPU使用量偏高、低響應事件,這種事件就為超前事件。假設在目標事件發(fā)生之前頻繁發(fā)生的超前事件集為Z,Z用一種模型表示。判斷Z發(fā)生的時間段,若Z只是在目標事件之前的時間窗口內發(fā)生,則Z就與目標事件關聯。否則,就不能關聯。

操作方法如下:

首先把低于最小置信度的超前事件都去掉。置信度用條件概率表示,用于計算超前事件以及事件模式的置信度。假設發(fā)生在時間窗口W內,目標事件發(fā)生前的超前事件集用D表示,不是目標事件前發(fā)生的事件集用表示。設D中事務的數量用表示,中事務的數量用表示,則Z中事務數量為,置信度用方程Confidence=表述。

由于置信度不檢查負關聯性,就需要再增加一個驗證超前事件Z的步驟。驗證函數用方程表述。為Z在D中發(fā)生的概率,為Z在中發(fā)生的概率,如果排斥空假設 的置信度很高,就驗證了Z。若事件很多,設事件滿足高斯分布,采用對立假設,通過方程表述。設和的概率差距為,標準偏差為,時,舍棄,當正確時,概率應當為。如果Z與目標事件發(fā)生有關聯,值較小。

(3)尋找規(guī)則

尋找規(guī)則需用規(guī)則系統(tǒng)法,如果可用的超前事件有很多,目標事件很少,那么不是每個關聯都能符合規(guī)則。規(guī)則系統(tǒng)的預測模型用驗證過的關聯模式來構建,預測算法根據置信度對超前事件集分類,算法分兩步:第一步,尋找置信度最高的超前事件,把包含的超前事件刪除。例如包含于,則保留,清除。這樣就有了目標事件的規(guī)則。第二步,在余下的超前事件集合里找到超前事件,重復第一步,以此類推,到剩余超前事件集合為空結束。

4 預測模型的動態(tài)適應性(The dynamic adaptability

of prediction model)

基于云計算平臺的預測模型可以采用許多種算法,往往較難判斷哪一種算法預測更準確。某一種算法對于一種監(jiān)控數據而言在一段時間內可能較適用,但隨著時間的推移、監(jiān)控數據行為的改變,另一種算法可能更適用。所以正確的做法是不要提前選擇某種算法,而是用預測模型可采用的各種算法同時預測監(jiān)控數據,再用錯誤率方程來評價各種算法的動態(tài)適應性。最后選擇在時間時適應性最好的算法來預測時的行為。具體做法為:

(l)用方程表示算法,為時間時的值,為收集到的歷史信息,為算法,表示算法預測到的在時間時的值。

(2)在某一時間用預測模型的各種算法推導出在時間時相應的預測值,再在時間時采集系統(tǒng)準確的采樣值,準確采樣值與預測值的差為預測錯誤,方程為。預測錯誤均方差用方程表述。預測平均錯誤率用方

程表述。

(3)探究算法在時間時的適應度,若是時間時該模型所有算法中的最小值,適應度就用表述。若是時間時該模型所有算法中的最小值,則適應度用表述。

5 結論(Conclusion)

該云計算平臺監(jiān)控系統(tǒng)預測模型,依據監(jiān)控歷史數據,預測系統(tǒng)將來會發(fā)生的異常行為,進而提前采取防范措施,能解決監(jiān)控系統(tǒng)實時處理數據滯后的問題,以保證系統(tǒng)的正常運行,對基于云計算平臺的監(jiān)控服務項目有很高的參考價值。

參考文獻(References)

[1] 陳康,鄭緯民.云計算:系統(tǒng)實例與研究現狀[J].軟件學報,2009, 20(5):13-15.

[2] 董波,沈青,肖德寶.云計算集群服務器系統(tǒng)監(jiān)控方法的研究 [J].計算機工程與科學,2012(10):68-72.

[3] 劉莉,屈志堅.基于GridGain云計算平臺的監(jiān)控管理信息分解 聚合研究[J].計算機測量與控制,2012(12):3235-3238.

作者簡介:

徐桂枝(1970-),女,碩士,副教授.研究領域:計算機應用.

猜你喜歡
預測模型控制監(jiān)測
特色“三四五六”返貧監(jiān)測幫扶做實做細
基于神經網絡的北京市房價預測研究
商情(2016年43期)2016-12-23 14:23:13
中國石化J分公司油氣開發(fā)投資分析與預測模型研究
經濟師(2016年10期)2016-12-03 22:27:54
社會轉型期行政權控制的路徑探索
科技視界(2016年21期)2016-10-17 17:06:18
會計預算控制現狀及方法
淺談高層建筑沉降監(jiān)測關鍵環(huán)節(jié)控制
科技視界(2016年20期)2016-09-29 13:07:14
保險公司財務風險管理及控制研究
基于IOWHA法的物流需求組合改善與預測模型構建
網絡安全監(jiān)測數據分析——2015年12月
互聯網天地(2016年2期)2016-05-04 04:03:28
網絡安全監(jiān)測數據分析——2015年11月
互聯網天地(2016年1期)2016-05-04 04:03:20
碌曲县| 涿州市| 青浦区| 张家口市| 沙雅县| 南昌县| 峨山| 吴江市| 若尔盖县| 衡水市| 武穴市| 沾益县| 策勒县| 宁晋县| 万荣县| 白山市| 新巴尔虎左旗| 嘉鱼县| 雷州市| 荣成市| 太仓市| 阳城县| 盈江县| 韶山市| 视频| 威信县| 抚远县| 贡觉县| 大田县| 香河县| 荥阳市| 平安县| 广丰县| 兴业县| 麟游县| 沙雅县| 肥乡县| 乌兰察布市| 射阳县| 莒南县| 舞钢市|