(新疆大學(xué)機(jī)械工程學(xué)院 新疆 烏魯木齊 830046)
基站退服是基站系統(tǒng)最為嚴(yán)重的故障,引起基站退服的原因有天饋故障、傳輸故障、載頻故障等。基站退服將不能為信號(hào)覆蓋區(qū)域提供無(wú)線(xiàn)服務(wù)。傳統(tǒng)的故障監(jiān)控模式通常采用事中監(jiān)測(cè)和事后分析方式,此模式在預(yù)測(cè)故障方面不足。故而,通過(guò)數(shù)據(jù)挖掘算法可以達(dá)到故障事前預(yù)警,將網(wǎng)絡(luò)監(jiān)控?cái)?shù)據(jù)轉(zhuǎn)化為運(yùn)維數(shù)據(jù)價(jià)值,進(jìn)而使基站退服的故障預(yù)警有可行性。
針對(duì)以上問(wèn)題提出了基于移動(dòng)運(yùn)維數(shù)據(jù)的基站退服故障預(yù)測(cè)方法。首先對(duì)運(yùn)維數(shù)據(jù)進(jìn)行清洗、特征篩選,然后進(jìn)行網(wǎng)元分類(lèi)、指標(biāo)降維,對(duì)主成分分析聚類(lèi),最后建立回歸方程進(jìn)行故障預(yù)測(cè),并驗(yàn)證了退服預(yù)警模型的準(zhǔn)確性。
1.退服關(guān)聯(lián)告警概率統(tǒng)計(jì)
以某市移動(dòng)兩個(gè)月性能指標(biāo)數(shù)據(jù)為例,約45萬(wàn)個(gè)性能數(shù)據(jù),數(shù)據(jù)來(lái)源為基站、傳輸和動(dòng)環(huán)三個(gè)方面,包含退服、報(bào)警及狀態(tài)類(lèi)型,時(shí)間粒度為15分鐘。取退服故障發(fā)生前4小時(shí)內(nèi)的數(shù)據(jù),當(dāng)出現(xiàn)報(bào)錯(cuò)、狀態(tài)變化等信息之后到出現(xiàn)退服的30-60分鐘之內(nèi)。
2.數(shù)據(jù)清洗
以該市45萬(wàn)個(gè)性能數(shù)據(jù)為例,其中基站數(shù)量為5119個(gè)、基站設(shè)備性能指標(biāo)維度455個(gè)[1]。對(duì)全量均值化指標(biāo)數(shù)據(jù)計(jì)算相關(guān)矩陣,按照工作和休息時(shí)間段進(jìn)行協(xié)方差[2]的均質(zhì)化處理,協(xié)方差矩陣的第(i,j)項(xiàng)(第(i,j)項(xiàng)是一個(gè)協(xié)方差被定義為如下形式:
cov(X,Y)=E[(X-μi)(Y-μj)]
(1)
其中是以n個(gè)隨機(jī)變量組成的列向量,并且是的期望值,即=(μi=E(Xi))。協(xié)方差矩陣的第(i,j)項(xiàng)。
3.特征篩選
根據(jù)相關(guān)系數(shù)判別標(biāo)準(zhǔn)選擇相關(guān)系數(shù)大于0.6的性能指標(biāo),將全量455個(gè)基站設(shè)備性能指標(biāo)集降至62個(gè)。進(jìn)一步去除相關(guān)性不大的性能指標(biāo)后,基站設(shè)備性能指標(biāo)集降至21個(gè)。
4.數(shù)據(jù)分類(lèi)
在研究指標(biāo)間的相關(guān)性時(shí)利用kendall相關(guān)系數(shù),可分析連續(xù)、屬性和混合等三種方法來(lái)分析指標(biāo)間的相關(guān)性。
kendall相關(guān)系數(shù)可有下式計(jì)算:
(1)
其中表示,中擁有一致性的元素對(duì)數(shù);表示,中不一致性的元素對(duì)數(shù)。為元素個(gè)。通過(guò)相關(guān)系數(shù)計(jì)算得到每個(gè)基站性能的相關(guān)指標(biāo),將每個(gè)基站的相關(guān)指標(biāo)利用各個(gè)指標(biāo)的頻率特征經(jīng)初查個(gè)基站的設(shè)備性能相關(guān)指標(biāo)。
5.基站性能指標(biāo)聚類(lèi)
對(duì)基站設(shè)備的21個(gè)性能指標(biāo)集進(jìn)行聚類(lèi)分析,聚類(lèi)分析利用均值漂移算法[3](mean shift)對(duì)基站性能指標(biāo)進(jìn)行聚類(lèi)。算法如下:假設(shè)每個(gè)基站指標(biāo)可觀(guān)測(cè)設(shè)備性能指標(biāo)維度為d,指標(biāo)個(gè)數(shù)為n,記第個(gè)性能指標(biāo)為,=1.2.3…,則對(duì)于第個(gè)基站,其mean shift向量的基本形式為:
(2)
其中,指的是一個(gè)半徑為的高維球區(qū)域,其定義為:
Sh(x)={y|(y-x)T(y-x)≤h2}
(3)
根據(jù)基站的位置、業(yè)務(wù)量等因素,基站可分為重要A基站、重要B基站、普通A站、普通B站等。
根據(jù)網(wǎng)元分類(lèi)結(jié)果以第1簇為例對(duì)基站進(jìn)行分類(lèi)以及降維[4]。具體方法如下,設(shè)某類(lèi)基站共有n個(gè)基站,每個(gè)基站共有個(gè)可觀(guān)測(cè)的設(shè)備性能指標(biāo),本文通過(guò)樣本相關(guān)全區(qū)間對(duì)設(shè)備性能指標(biāo)做降維工作,記為第個(gè)基站的觀(guān)測(cè)向量。
xi=(x1,x2,…xim)
(4)
得的相關(guān)矩陣,具體表示如下
(5)
由|R-λEm|=0得R的個(gè)特征值及對(duì)應(yīng)的特征向量。當(dāng)≥80%時(shí),將標(biāo)準(zhǔn)化后的基站設(shè)備性能指標(biāo)變量轉(zhuǎn)換為主要成分,得其中(k=1.2…)(i=1.2…n),其中,X1為第一主成分,X2為第二主成分,依次類(lèi)推,Xq為第q個(gè)主要成分。對(duì)個(gè)主要成分進(jìn)行加權(quán)求,從而得到最終指標(biāo)組合。
線(xiàn)性回歸模型滿(mǎn)足自變量與因變量要有線(xiàn)性關(guān)系??梢杂?jì)算相關(guān)系數(shù)從而可以對(duì)降維后的基站性能指標(biāo)中主要成分和基站退服次數(shù)關(guān)聯(lián)分析。經(jīng)過(guò)關(guān)聯(lián)分析后,設(shè)最低相關(guān)系數(shù)的絕對(duì)值為0.11,大于最低相關(guān)系數(shù)的主要成分表達(dá)式,這表明主要成分與基站退服次數(shù)有一定的關(guān)聯(lián)。
回歸方程[5]建立如下:記(表示第個(gè)基站的第個(gè)主要成分)記為第個(gè)基站是發(fā)生退服故障所做的記錄,則擬建立。
zi=β1yi1+β1yi1+…β1yi1+β0+εi
(14)
i=(1…n)的線(xiàn)性回歸模型。進(jìn)而對(duì)x1=(xi1…xim)T進(jìn)行閾值的分析,達(dá)到對(duì)基站發(fā)生故障退服的預(yù)測(cè)。
以基站退服故障數(shù)據(jù)為基礎(chǔ),將故障與告警數(shù)據(jù)關(guān)聯(lián)起來(lái),對(duì)數(shù)據(jù)進(jìn)行清洗、特征篩選,指標(biāo)選取聚類(lèi)并降維,最終得到客觀(guān)且有價(jià)值的數(shù)據(jù)。經(jīng)過(guò)降維后的數(shù)據(jù)降低了故障數(shù)據(jù)之間的相關(guān)性,這就為基站故障預(yù)測(cè)提供更加有價(jià)值的數(shù)據(jù)。依托線(xiàn)性回歸方程建立的預(yù)測(cè)模型簡(jiǎn)潔明了且計(jì)算高效。該預(yù)測(cè)模型充分發(fā)揮了具有時(shí)間屬性的有效數(shù)據(jù),為維修人員通訊設(shè)備的檢查優(yōu)先順序提供了價(jià)值參考,為今后故障排查作出科學(xué)客觀(guān)的指導(dǎo)。