王美玲,孫國良,李子義
(1.中國信息通信研究院,北京 100191;2.信通院(河北)科技創(chuàng)新研究院有限公司,河北 071000)
可靠性是通信設備的重要性能參數(shù),通信設備可靠性不佳將導致通信網(wǎng)絡運行不穩(wěn)定及用戶體驗差,甚至造成重要數(shù)據(jù)丟失,引起重大經(jīng)濟損失。因此通信設備交貨前均需可靠性驗收試驗來驗證其可靠性水平是否達到了規(guī)定要求。GJB 899A和GB 5080是通信設備可靠性鑒定和驗收試驗常用的兩項標準,軍用通信設備一般采用GJB 899A-2009進行可靠性鑒定和驗收試驗,民用通信設備一般采用GB/T 5080.7進行可靠性鑒定和驗收試驗。這兩項標準均采用平均故障間隔時間(MTBF)來度量設備的可靠性水平,且兩個標準實施的前提均為假設設備的統(tǒng)計試驗分布為指數(shù)分布,但兩項標準的指標體系、置信度及置信區(qū)間的計算方面卻有所區(qū)別。
試驗人員在進行通信設備可靠性鑒定和驗收試驗時不僅需要根據(jù)客戶需求正確選擇檢測標準,而且還要做到對標準正確理解和運用,才能避免由于標準混用造成結果錯誤。
因此本文通過仔細分析標準,明確指出了GJB 899A和GB/T 5080兩項標準的差異點,深入研究了兩類標準定時截尾試驗方案的設計原理,通過研究給出了民用通信設備的定時截尾試驗方案的設計方法,為非標準方案的試驗方案設計提供了參考,最后以某民用通信設備為例設計一套非標準試驗方案的MTBF測試方案。
兩項標準均定義了生產(chǎn)方風險、使用方風險,設備被接收或被拒收的概率等相關指標,且這些指標之間的對應關系是相同的。
例如GJB 899中的檢驗指標分為:MTBF檢驗下限θ1和 MTBF檢驗上限θ0。θ1為設備的最低可接收值,即當設備MTBF的真值接近θ1時,被高概率拒收,低概率接收;θ0為設備MTBF假設值的上限值,即當設備MTBF真值接近θ0時,設備被高概率接收,低概率拒收,且θ0/θ1的比值被定義為鑒別比d[1]。與θ1和θ0相對應的是生產(chǎn)方風險ɑ和使用方風險?。ɑ即為設備MTBF真值等于或大于θ0時被拒收的概率,?即為設備MTBF真值等于或小于θ1時被接收的概率。
同樣的,在GB/T 5080.7中也用可接受的平均無故障時間m0和不可接受的平均無故障時間m1,對應生產(chǎn)風險ɑ和使用方風險?[2]。GB/T 5080.7標準中的m0、m1分別對應國軍標中的θ0、θ1。
雙方風險與接收概率之間的關系可用如圖1表示。
圖1 OC曲線示意圖
對通信設備做可靠性鑒定和驗收試驗時,民用通信設備一般參考GB/T 5080.7標準,規(guī)定設備的MTBF值一般看作為規(guī)定值m0;軍用通信設備一般參考GJB 899A標準,規(guī)定設備的MTBF值一般看作為下限值θ1。
由于m0和θ1之間理論上相差一個鑒別比,因此試驗開始前首先要明確設備的鑒定需求,否則試驗時間、試驗結果將會產(chǎn)生很大差距。
到達截尾時間后,試驗結束,此時需要試驗人員做出“接收”或“拒收”判決,同時需要給出在某一置信度下的MTBF置信區(qū)間。若試驗結束后失效數(shù)為0,只需要給出MTBF單邊置信下限估計,若失效數(shù)不為0,此時需要根據(jù)標準需要計算置信上限和置信下限。兩項標準的計算方法并不相同,根本原因在于標準各自定義的置信度不同,計算置信區(qū)間所用的卡方分布分位數(shù)亦不相同。
GJB 899A定義單邊置信度C′和雙邊置信度C,當雙方風險相同時,單邊置信度C′=1-?,雙邊置信度C=1-2?。而在GB/T 5080系列標準中定義置信度C′=C=1-?,因此同樣的試驗條件且雙方風險取值相同時,GB/T 5080標準的雙邊置信度比GJB 899A標準的置信度大,其相應的置信區(qū)間也比GJB 899A標準的置信區(qū)間要寬一些。
下面對定時截尾方案接收判決的計算公式進行推導,兩項標準給出的置信區(qū)間的計算公式如表1所示。
表1 計算公式變換
首先將標準各自定義的雙邊置信度C代入置信區(qū)間的計算公式,其次需要對置信區(qū)間中χ2分布的分位數(shù)進行處理。這是由于GJB 899A中置信區(qū)間的計算方法沿用美國標準的方法,取χ2分布的上側(cè)分位數(shù),而GB/T 5080系列標準中則取χ2分布的下側(cè)分位數(shù),因此需要根據(jù)χ2分布上下側(cè)分位數(shù)相加等于1的關系將上述公式進一步變換如表2。
表2中全部取分布的上側(cè)分位數(shù),在?常用取值10 %、20 %、30 %情況下,代入?進行計算驗證,在同樣的截尾時間和可接收故障數(shù)下,GB/T 5080的雙側(cè)置信區(qū)間明顯寬于GJB 899A,這也符合其雙邊置信度大于GJB 899A的定義。
表2 計算公式變換
從一批樣品中隨機抽取n個樣品,試驗進行到截尾時間T就結束試驗,根據(jù)T內(nèi)可接收的故障數(shù)c進行判決。
假設MTBF真值為θ的n個產(chǎn)品在試驗時間T內(nèi)發(fā)生故障的次數(shù)服從參數(shù)為T/θ的泊松分布,因此假設截尾時間T內(nèi)發(fā)生的故障數(shù)為r,可接收故障數(shù)為c,由OC曲線可知產(chǎn)品被接收的概率L(θ0)和L(θ1)與ɑ、?的關系如式(1):
由于兩項標準均假設產(chǎn)品壽命X服從參數(shù)為平均壽命θ的指數(shù)分布,即因此可以推導出統(tǒng)計量2T/θ~χ2(2r),由χ2分布的概率密度函數(shù)可推導出:
上式中也可以把θ0、θ1替換成m0、m1,因為兩類標準在計算方案的原理上是相同的。
由3.1的試驗原理還原定時截尾試驗方案的設計過程。首先需要給定ɑ、?名義值,之后從故障數(shù)r=0開始代入上述公式(4)求出并與鑒別比d比較,若結果遠大于或小于d,則r+1繼續(xù)按上述方法代入公式,一直迭代計算直至結果最接近d為止,此時r為可接收故障數(shù)c,將c、?代入公式(2),進一步求得試驗時間T。由于故障數(shù)r只能取整,因此d只能最大限度接近預期值,試驗時間T的計算結果也會存在誤差,最后將c、T代入式(1)中根據(jù)泊松公式計算實際風險值ɑ′、?′。
例如GB/T 5080.7中方案5:6,ɑ=?=20 %,d=2,設定可接收故障數(shù)r=0代入公式(4),按上述方法迭代計算,最終求出近似解代入公式(3)求出測試時間已知T,c的情況下利用公式(1)計算實際風險值ɑ′=20.0 %,?′=21.0 %,與標準方案5:6參數(shù)一致。
雖然由3.2已知了GB/T 5080.7定時截尾試驗方案的設計方法,但是比較繁瑣,因此可以根據(jù)GJB 899A和GB/T 5080.7的截尾時間相差鑒別比的關系進行簡化計算。例如GB/T 5080.7定時截尾試驗方案中5∶5方案,方案參數(shù)與GJB 899A第11號方案相同,因此GB/T 5080.7的試驗時間T可以取21.5θ1/1.5=14.3m0,進一步用T求得實際風險值ɑ′=19.5,?′=19.9,與標準方案參數(shù)T=14.1m0,ɑ′=18.0,?′=21.7比較接近。但是經(jīng)計算驗證發(fā)現(xiàn)只有當由上述公式(4)計算出的與設備MTBF規(guī)定值和最低值之比非常接近時,才可直接采用GJB 899A中截尾時間與鑒別比相除做近似計算。
此時可對由公式(2)和(3)分別求得的時間T1和T2,進一步修正取平均處理T=(T1+T2)/2,再反帶入公式中求出雙方實際風險值,這種方法可以抵消一部分由于c取整造成的誤差[6],使生產(chǎn)方和使用方風險盡可能與標稱值接近。同樣以GB/T 5080.7標準中5:7號方案為例,用上述方法求出明顯小于標準規(guī)定的鑒別比3。此時對試驗時間T的計算進行修正處理。若產(chǎn)品MTBF最低可接受值θ1=100 h,規(guī)定值θ0=300 h,將方案5:7的c、?代入公式(2)、(3)中求出T1和T2,經(jīng)處理求出T=444.21 h=1.48m0,進一步根據(jù)泊松公式計算實際風險值ɑ′=18.6 %、?′=18.0 %,此時計算出的結果與標準方案十分接近(表3)。
表3 計算結果
由上述論述可知,民用通信設備可靠性鑒定和驗收時如果需要用到GB/T 5080.7標準以外的定時截尾試驗方案,可視具體情況,采用上述兩種方法進行擴展應用。
某民用通信用交換機設備參考GB/T 5080.7標準進行定時截尾可靠性驗收試驗,其MTBF最低可接受值m1=1 000 h,規(guī)定值m0=2 000 h,鑒別比d=2,樣品數(shù)量為10臺,可接受的生產(chǎn)方風險ɑ=20 %、使用方風險?=10 %,根據(jù)試驗需求無法直接套用標準方案。按上述方法將可接收故障數(shù)c從0開始迭代計算直至最接近規(guī)定鑒別比為止,由表4計算結果可知c=8即到達截尾時間時可接收故障數(shù)為8。
表4 計算結果
由于計算結果非常接近d=2,因此通過查詢GJB 899A的試驗方案10-9,計算試驗時間T=12.99θ1/d=6.50m0,實際風險值ɑ′=20.8 %、?′=10.0 %接近可接受的風險值。
根據(jù)方案參數(shù)計算試驗時間T=6.5×2 000=13 000 h,樣品數(shù)量10臺則每臺樣品試驗時間13 000/10=1 300 h。
4.2.1 運輸振動試驗
民用交換機屬于環(huán)境控制條件下固定使用的設備,因此根據(jù)設備使用條件不考慮振動應力,只在可靠性試驗前考慮包裝運輸振動。根據(jù)用戶使用需求,振動試驗條件參考GB/T 4857.23-2012《包裝 運輸包裝件基本試驗 第23部分:隨機振動試驗方法》中試驗強度嚴酷水平Ⅱ,試驗時間為30 min,試驗條件如表5所示。
表5 公路運輸嚴酷水平Ⅱ隨機振動試驗條件
4.2.2 可靠性試驗
1)循環(huán)數(shù)
交換機為24 h不間斷工作,因此設計試驗剖面時,以24 h為一個周期,共54個循環(huán)。
2)環(huán)境應力
交換機使用環(huán)境為可溫度控制的固定環(huán)境,溫度為失效的主要影響因素,因此每24 h內(nèi)環(huán)境應力按常溫-高溫-低溫規(guī)律變化。根據(jù)其使用工況,選擇試驗條件為:高溫60 ℃、常溫20 ℃及低溫-20 ℃。
3)電應力
根據(jù)標準要求,設備工作狀態(tài)要求50 %的時間輸入電壓為標稱電壓,25 %的時間輸入電壓為標稱電壓的上限,25 %為標稱電壓的下限。交換機設備的標稱電壓為220 V AC,輸入電壓范圍為(198~242)V。因此在第一個24 h周期輸入電壓為220 V,第二個24 h周期輸入電壓為242 V,第三個24 h周期輸入電壓為198 V,以此規(guī)律循環(huán)直至循環(huán)結束。
4)失效判據(jù)
由于在實際使用中交換機需要24 h不間斷工作,因此試驗中需要模擬交換機設備實際工況。試驗剖面圖如圖2,其所有端口應與網(wǎng)絡測試儀連接,同時以端口滿速率互發(fā)數(shù)據(jù)包。試驗過程中如果出現(xiàn)交換機宕機且無法啟動、設備硬件損壞導致的故障告警或出現(xiàn)丟包、錯包即認為是責任故障,判斷為交換機失效。
圖2 試驗剖面圖
試驗結束后,若在截尾時間T時,失效數(shù)小于等于8,則做出接收判決,否則拒收,認為不符合規(guī)定要求。
隨著通信設備可靠性水平的不斷提升,試驗人員對其可靠性驗收試驗方法的研究也在不斷深入。軍用通信產(chǎn)品和民用通信產(chǎn)品在進行可靠性驗收試驗時,指標體系和結果評估均存在不同之處,需要試驗人員了解試驗方案原理,區(qū)分不同標準的使用方法,避免結果計算失誤。本文明確了國軍標和國標在指標體系、結果評估方面的區(qū)別,解析了卡方分布計算、置信度計算的要點,另外通過研究定時截尾試驗方案的設計原理,分析了民用通信設備定時截尾試驗方案設計的方法,最后以某通信設備為例設計了非標準方案的可靠性驗收試驗的流程,詳細給出了各試驗步驟的設計方法及失效評判方法,希望為試驗人員提供參考。