陳 瑋 顧思思
1(邵陽學(xué)院電氣工程系 湖南 邵陽 422004)2(湖南科技學(xué)院計算機與通信工程系 湖南 永州 425199)
?
基于企業(yè)服務(wù)總線的信息管理系統(tǒng)可靠性分析
陳瑋1顧思思2
1(邵陽學(xué)院電氣工程系湖南 邵陽 422004)2(湖南科技學(xué)院計算機與通信工程系湖南 永州 425199)
為了提高信息管理系統(tǒng)可靠性和生存能力,提出一種基于企業(yè)服務(wù)總線的信息管理系統(tǒng)可靠性分析方法。首先根據(jù)系統(tǒng)可靠度和可用性是系統(tǒng)可靠性和生存能力評估的關(guān)鍵指標(biāo)進行建模,然后通過仿真實驗對企業(yè)服務(wù)總線信息管理系統(tǒng)模型的可靠度及可用度進行分析。仿真結(jié)果表明,該方法可以提高系統(tǒng)可靠性和抗攻擊的能力。
信息管理系統(tǒng)可靠性硬件故障軟件故障
隨著企業(yè)信息化建設(shè)的高速發(fā)展,企業(yè)的運營規(guī)模正在急劇擴大,針對不同業(yè)務(wù)開發(fā)的應(yīng)用系統(tǒng)數(shù)量成倍增長,而企業(yè)對其業(yè)務(wù)系統(tǒng)的信息和數(shù)據(jù)整合的要求卻越來越高[1]??捎眯允菍⑾到y(tǒng)的可靠性、維修性及保障特性變換成效能時的一個參數(shù)[2]??尚迯?fù)串聯(lián)系統(tǒng)指在多個不同部件組成的系統(tǒng)中,一個或多個部件同時發(fā)生故障,則整個系統(tǒng)處于癱瘓狀態(tài),此時對所有故障部件進行維修,只有當(dāng)所有部件都修復(fù)成功時系統(tǒng)才能再次正常運行[3]?;谄髽I(yè)服務(wù)總線的信息管理系統(tǒng)可以抽象為一個可修復(fù)串聯(lián)系統(tǒng),本文主要研究多部件串聯(lián)可修復(fù)系統(tǒng)的可靠性模型[4-6]。
圖1 信息管理系統(tǒng)的結(jié)構(gòu)
將一基于企業(yè)服務(wù)總線的信息管理系統(tǒng)從信息交換傳輸角度進行抽象建模,基于企業(yè)服務(wù)總線的信息管理系統(tǒng)由n(n=5)個不同子系統(tǒng)(部件)組成[7,8]。系統(tǒng)模型結(jié)構(gòu)示意圖如圖1所示,該模型中信息發(fā)送端計算機系統(tǒng)與信息接收端計算機系統(tǒng)是網(wǎng)絡(luò)系統(tǒng)中兩個獨立硬件系統(tǒng),相互間必須通過交換平臺計算機系統(tǒng)進行數(shù)據(jù)信息交換路由。企業(yè)服務(wù)總線軟件系統(tǒng)用于支持信息管理系統(tǒng)的功能實現(xiàn),網(wǎng)絡(luò)系統(tǒng)對整個系統(tǒng)中的信息進行傳輸。設(shè)定該系統(tǒng)的故障、修復(fù)時間都滿足幾何分布[4]。當(dāng)有大于等于一個部件發(fā)生故障時,該企業(yè)服務(wù)總線信息管理系統(tǒng)不能正常運行,當(dāng)且僅當(dāng)所有部件都被修復(fù)成功時系統(tǒng)才能再次正常運行。本文設(shè)系統(tǒng)各部件的故障率和修復(fù)率為常數(shù),此時系統(tǒng)的狀態(tài)滿足馬爾可夫過程,可準(zhǔn)確得到系統(tǒng)可靠度和可用度的解析形式[9,10]。
企業(yè)信息管理系統(tǒng)模型的可靠性由系統(tǒng)可靠度與瞬時可用度體現(xiàn),下面對可靠度與瞬時可用度的定義進行相關(guān)說明。
2.1系統(tǒng)可靠度
在企業(yè)信息管理系統(tǒng)中,外在因素的攻擊通常對硬件系統(tǒng)沒有影響,而軟件系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)易受到病毒攻擊,發(fā)生一系列故障。m=1,表示硬件只受到自身故障影響,m=1,2表示軟件系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)的故障率。即有:
假設(shè)在t時刻有且僅有一個部件出故障為事件A,該串聯(lián)系統(tǒng)中事件A的概率為P(A):
(1)
設(shè)t時刻有且僅有兩個部件同時發(fā)生故障為事件B,該串聯(lián)系統(tǒng)中事件B的概率為P(B):
(2)
綜合上述可得企業(yè)服務(wù)總線系統(tǒng)可靠度,即有:
Sm(t)=Sm(t-1)×(1-P(A)-P(B))
(3)
(4)
對式(4)進行迭代可以得到:
(5)
在企業(yè)信息管理系統(tǒng)中,信息發(fā)送端、交換平臺、信息接收端的系統(tǒng)模型的可靠度為S′(t)=S1(t)(n=1,2,3)。軟件系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)所組成的系統(tǒng)模型可靠度為S″(t)=S1(t)orS2(t)(n=4,5),那么整個企業(yè)服務(wù)總線系統(tǒng)模型的可靠度為S(t)=S′(t)andS″(t)。
2.2系統(tǒng)瞬時可用度
其中:
(6)
(7)
(8)
3.1仿真條件
為了測試本文提出的基于企業(yè)服務(wù)總線的信息管理系統(tǒng)可靠性性能,在Intel Core(TM) 2.65 GHz CPU,8 G RAM,Windows 7操作系統(tǒng)的計算機中,采用Matlab 2012進行仿真實驗。企業(yè)信息管理系統(tǒng)包括信息發(fā)送端、交換平臺、信息接收端、網(wǎng)絡(luò)傳輸系統(tǒng),硬件系統(tǒng)固有故障率和修復(fù)率如表1所示。軟件系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)的固有故障率、病毒引起故障率及修復(fù)率如表2所示。
表1 信息管理系統(tǒng)的硬件故障率及修復(fù)率
表2 信息管理系統(tǒng)的軟件、網(wǎng)絡(luò)故障率及修復(fù)率
3.2結(jié)果與分析
圖2 硬件系統(tǒng)故障對系統(tǒng)可靠度的影響
通過對企業(yè)信息管理系統(tǒng)的信息發(fā)送端、交換平臺、信息接收端共3個硬件部件的可靠度進行仿真實驗,企業(yè)信息管理系統(tǒng)的可靠度變化曲線如圖2所示。從圖2可以清楚看出,隨著系統(tǒng)運行時間的增加,系統(tǒng)的可靠性越來越差,尤其是企業(yè)信息管理系統(tǒng)運行前期,由于硬件固有故障率增加,企業(yè)信息管理系統(tǒng)的可靠度下降速率十分快,達到一定的時間后,企業(yè)信息管理系統(tǒng)的可靠度處于一種穩(wěn)定狀態(tài),在20%的上下進行波動。
在系統(tǒng)模型中,由部件固有故障和受病毒攻擊共同產(chǎn)生的故障所得到的系統(tǒng)可靠度為S″(t)。
S″(t)=P(aorb)=P(a)+P(b)-P(aandb)
(9)
其中,部件固有故障和受攻擊故障是相互獨立事件,系統(tǒng)可靠度a和b也相互獨立,因此P(aandb)=P(a)×P(b),得到S″(t)如下:
S″(t)=1-{[1-S1(t)]+[1-S2(t)]-
[1-S1(t)][1-S2(t)]}
(10)
此時得到軟件、網(wǎng)絡(luò)系統(tǒng)模型的可靠度S″(t)如圖3所示。從圖3可知,系統(tǒng)可靠度與部件固有故障時的可靠度平均相差約25.2%,而與部件只受攻擊而產(chǎn)生故障時的可靠度平均相差約0.78%。說明在企業(yè)信息管理系統(tǒng)中,部件因遭受攻擊而產(chǎn)生的故障是部件故障的主要原因,這意味著需要采取有效措施來提高部件抗攻擊的能力。
因為硬件系統(tǒng)模型的可靠度和軟件系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)所組成模型的可靠度相互獨立,因此可由式(11)得到該企業(yè)信息管理系統(tǒng)模型的可靠度如圖4所示。由圖4知,企業(yè)服務(wù)總線系統(tǒng)可靠度在前100天,隨時間增長,下降迅速,在100天時,系統(tǒng)可靠度降到20%以下,而在100天后,下降速率變緩,當(dāng)?shù)?00天時,系統(tǒng)可靠度變化幾乎為0。
S(t)=S′(t) andS″(t)=S′(t)×S″(t)
(11)
圖3 軟件系統(tǒng)故障對系統(tǒng)可靠度的影響
圖4 企業(yè)信息管理系統(tǒng)可靠度
3.3系統(tǒng)瞬時可用度
當(dāng)m=1,n=1~3時,得到硬件系統(tǒng)模型的系統(tǒng)瞬時可用度如圖5所示,其中橫坐標(biāo)t為天數(shù),縱坐標(biāo)A′為部件只發(fā)生固有故障時系統(tǒng)的可靠性。當(dāng)m=1,n=4,5時,得到軟件系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)模型的系統(tǒng)瞬時可用度如圖6所示。其中橫坐標(biāo)t為天數(shù),縱坐標(biāo)Aa為部件只發(fā)生固有故障時系統(tǒng)的系統(tǒng)瞬時可用度。
圖5 硬件系統(tǒng)的可靠性(m=1,n=1,2,3)
圖6 軟件、網(wǎng)絡(luò)系統(tǒng)模型的瞬時可用度(m=1,n=4,5)
從圖5知,當(dāng)硬件系統(tǒng)只有固有故障率時,系統(tǒng)瞬時可用度隨時間呈下降趨勢。在前35天時,隨著時間的增加,可靠性下降迅速,從約99%下降到約97.3%;當(dāng)多于35天時,下降速度趨于平緩,基本上保持在96.67%以上。從圖6知,當(dāng)軟件、網(wǎng)絡(luò)系統(tǒng)模型只有固有故障率時,系統(tǒng)的瞬時可用度的變化趨勢與硬件系統(tǒng)相似。在前35天時,下降迅速,從約99%下降到約97.53%;多于35天時,下降速度趨于平緩,基本保持在97.37%以上。
由部件固有故障和受攻擊故障共同產(chǎn)生的故障所得到的系統(tǒng)瞬時可用度記作A″(0,0)(t)。
A″(0,0)(t)=P(a′ orb′)=P(a′)+P(b′)-P(a′ andb′)
(12)
其中,該系統(tǒng)模型的瞬時可用度a′和b′也相互獨立,因此P(a′ andb′)=P(a′)×P(b′),得到A″(0,0)(t)如下:
(13)
圖7 軟件、網(wǎng)絡(luò)系統(tǒng)的瞬時可用度
系統(tǒng)瞬時可用度如圖7所示。通過對圖5-圖7的仿真結(jié)果進行分析,可以清楚看出,信息管理系統(tǒng)可靠性與固有故障時的瞬時可用度相差比較大,超過了10%;與受攻擊故障時的瞬時可用度相差較小,在5%以下。實驗結(jié)果表明,在企業(yè)信息管理系統(tǒng)中,部件遭受攻擊導(dǎo)致系統(tǒng)發(fā)生故障是系統(tǒng)瞬時可用度下降的主要原因。
3.4修復(fù)率對系統(tǒng)可靠度的影響
在信息管理系統(tǒng)建立成功后,系統(tǒng)固有故障率一般都是自動產(chǎn)生,提高修復(fù)成功率可以通過改進管理策略、升級部件等相關(guān)措施完成。為了測試不同修復(fù)概率條件下,信息管理系統(tǒng)的可靠度變化,對它們進行仿真測試,測試結(jié)果如圖8所示。
信息管理系統(tǒng)中的軟件系統(tǒng)與固有故障率、病毒攻擊及修復(fù)率之間的變化關(guān)系如圖9所示。從圖8和圖9可知,在保持故障率不變的情況下,平均修復(fù)率得到了相應(yīng)提高,這表明通過提高部件修復(fù)率可以提高系統(tǒng)的可靠性。
圖8 硬件系統(tǒng)中固有故障率、修復(fù)率所占比率
圖9 固有故障率、病毒攻擊以及修復(fù)率所占比率
隨著技術(shù)的不斷進步,信息管理系統(tǒng)的可靠性越來越重要。為了提高信息管理系統(tǒng)可靠性,提出一種基于企業(yè)服務(wù)總線的可靠分析方法,并通過仿真實驗對該方法的性能進行綜合測試。實驗結(jié)果表明,在所有影響因素中,故障率和病毒攻擊是導(dǎo)致信息管理系統(tǒng)性能下降的最主要原因,系統(tǒng)部件修復(fù)率也是影響信息管理系統(tǒng)可靠性的重要因素。因此,為了提高信息管理系統(tǒng)的可靠性,首先需要降低系統(tǒng)各部件的故障率,然后提高系統(tǒng)的安全性,防止系統(tǒng)受到攻擊。最后,對系統(tǒng)的故障應(yīng)該及時修復(fù)。
[1] 胡亮,李瑋.一種高可靠性企業(yè)服務(wù)縱向的研究與設(shè)計[J].計算機應(yīng)用與軟件,2012,29(6):100-104.
[2] Cassady C R,Lyoob I M,Scheider K,et al.A Generic Model of Equipment Availability Under Imperfect Maintenance [J].IEEE Transactions on reliability,2005,54(4):564-571.
[3] 譚林,程志君,郭波.考慮不完全維修的可修串聯(lián)系統(tǒng)可用度模型[J].國防科技大學(xué)學(xué)報,2009,31(6):100-105.
[4] 楊繼坤,徐廷學(xué),叢林虎,等.新型導(dǎo)彈武器系統(tǒng)可靠性波動分析與優(yōu)化方法研究[J].戰(zhàn)術(shù)導(dǎo)彈技術(shù),2014,12(1):55-62.
[5] 董世良,劉海港,石健,等.容錯計算機網(wǎng)絡(luò)綜合可用性建模與仿真分析[J].系統(tǒng)仿真學(xué)報,2011,23(1):75-82.
[6] 吳月明.可修復(fù)系統(tǒng)事后維修可靠性仿真[J].計算機仿真,2007,24(7):108-112.
[7] Yi Yang,Lichao Wang,Rui Kang.Discretization model of instantaneous availability for continuous-time systems[J].Journal of Computers,2012,7(4):977-981.
[8] 張靜,岳德權(quán),王麗花.修理工休假的溫貯備可修系統(tǒng)的可靠性分析[J].中山大學(xué)學(xué)報:自然科學(xué)版,2011,50(5):28-33.
[9] Haihong Zhu.Reliability and availability analysis for large networking system[C]//Proc.of reliability and maintainability symposium,2012:1-6.
[10] 王思華,趙瓊,馬軍黨,等.接觸網(wǎng)系統(tǒng)可靠性的馬爾科夫建模分析[J].中國安全科學(xué)學(xué)報,2013,23(9):39-44.
RELIABILITY ANALYSIS ON INFORMATION MANAGEMENT SYSTEM BASED ON ENTERPRISE SERVICE BUS
Chen Wei1Gu Sisi2
1(DepartmentofElectricalEngineering,ShaoyangUniversity,Shaoyang422004,Hunan,China)2(DepartmentofComputerandCommunicationEngineering,HunanUniversityofScienceandEngineering,Yongzhou425199,Hunan,China)
In order to improve the reliability and survivability of information management system,this paper proposes an enterprise service bus-based analysis method for the reliability of information management system.First of all,the method builds the model according to the key indexes of system reliability and availability which are critical to evaluating the system reliability and survivability,then it analyses the reliability and availability of the enterprise service bus information management system model by simulation experiment.Simulation results show that the proposed method can improve the system in terms of reliability and anti-attack ability.
Information management systemReliabilityHardware failureSoftware failure
2014-06-06。湖南省教育廳科學(xué)研究項目(13C847)。陳瑋,講師,主研領(lǐng)域:嵌入式系統(tǒng)及應(yīng)用。顧思思,講師。
TP391
A
10.3969/j.issn.1000-386x.2016.03.006