国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于指標(biāo)相關(guān)性的網(wǎng)絡(luò)運(yùn)維質(zhì)量評(píng)估模型

2018-10-16 08:23吳沐陽(yáng)
計(jì)算機(jī)應(yīng)用 2018年9期
關(guān)鍵詞:運(yùn)維權(quán)重節(jié)點(diǎn)

吳沐陽(yáng),劉 崢,王 洋,李 云,李 濤

(1.南京郵電大學(xué) 計(jì)算機(jī)學(xué)院,南京 210046; 2.中國(guó)移動(dòng)通信集團(tuán)山西有限公司 網(wǎng)絡(luò)部,太原 030009)

0 引言

近年來(lái),隨著移動(dòng)設(shè)備的不斷普及、通信網(wǎng)絡(luò)的日益完善,移動(dòng)用戶(hù)數(shù)量激增,各大運(yùn)營(yíng)商的競(jìng)爭(zhēng)也越來(lái)越激烈。為了持續(xù)提供高質(zhì)量的網(wǎng)絡(luò)服務(wù)以及改善用戶(hù)體驗(yàn),網(wǎng)絡(luò)的運(yùn)行和維護(hù)質(zhì)量管理成為運(yùn)營(yíng)商關(guān)注的重點(diǎn),如何評(píng)估網(wǎng)絡(luò)運(yùn)維質(zhì)量一直是通信服務(wù)領(lǐng)域的一個(gè)難題。

網(wǎng)絡(luò)運(yùn)維質(zhì)量包含網(wǎng)絡(luò)服務(wù)質(zhì)量、維護(hù)質(zhì)量等多個(gè)維度的評(píng)估目標(biāo),涉及到基站性能數(shù)據(jù)、維護(hù)工單數(shù)據(jù)、告警數(shù)據(jù)等多種異構(gòu)數(shù)據(jù)?,F(xiàn)代通信網(wǎng)絡(luò)范圍越來(lái)越廣泛,使用的設(shè)備越來(lái)越多樣化,各種監(jiān)控?cái)?shù)據(jù)持續(xù)增長(zhǎng),而傳統(tǒng)專(zhuān)家經(jīng)驗(yàn)的評(píng)估方式過(guò)于依賴(lài)人工分析,需要消耗大量人力資源和時(shí)間資源,并且難以應(yīng)對(duì)海量的異構(gòu)數(shù)據(jù)和設(shè)備線(xiàn)路優(yōu)化等網(wǎng)絡(luò)環(huán)境變化,最重要的是專(zhuān)家經(jīng)驗(yàn)法包含太多主觀(guān)意見(jiàn),很難合理運(yùn)用這些數(shù)據(jù),建立客觀(guān)可靠的網(wǎng)絡(luò)運(yùn)維質(zhì)量評(píng)估模型,達(dá)到全面準(zhǔn)確評(píng)估各維度質(zhì)量的目的。國(guó)際電信聯(lián)盟(International Telecommunication Union, ITU)[1]或是電信管理論壇(Telecom Management Forum, TMF)[2]等國(guó)際互聯(lián)網(wǎng)標(biāo)準(zhǔn)化組織只對(duì)于網(wǎng)絡(luò)質(zhì)量相關(guān)參數(shù)進(jìn)行了定義和分類(lèi),給出了概念性的模型,但沒(méi)有對(duì)評(píng)估方法進(jìn)行描述,也沒(méi)有給出具體的評(píng)估指標(biāo)體系,因此網(wǎng)絡(luò)運(yùn)維質(zhì)量評(píng)估標(biāo)準(zhǔn)化在實(shí)踐中的應(yīng)用比較困難。

本文關(guān)注構(gòu)建網(wǎng)絡(luò)運(yùn)維質(zhì)量評(píng)估模型過(guò)程中的指標(biāo)體系建立問(wèn)題,旨在通過(guò)數(shù)據(jù)驅(qū)動(dòng)的無(wú)監(jiān)督方式來(lái)選擇評(píng)估指標(biāo),減少其中人工干預(yù)的部分,最終確定全面客觀(guān)的網(wǎng)絡(luò)運(yùn)維質(zhì)量指標(biāo)體系。本文提出一種指標(biāo)分類(lèi)方法,通過(guò)分析指標(biāo)間的互相關(guān)性,將指標(biāo)劃分為多個(gè)簇,每個(gè)簇中的指標(biāo)具有相似的信息量,從每個(gè)簇中選出一些指標(biāo)來(lái)代表這個(gè)類(lèi)包含的信息,以此來(lái)達(dá)到全面而不重復(fù)地涵蓋原數(shù)據(jù)信息量的效果。這種方法尤其適用于含有過(guò)多指標(biāo)的監(jiān)控?cái)?shù)據(jù),可以減少人力消耗,簡(jiǎn)化質(zhì)量評(píng)估中權(quán)重指定等步驟,防止評(píng)估結(jié)果受到重復(fù)信息的影響。

1 相關(guān)工作

網(wǎng)絡(luò)運(yùn)維質(zhì)量評(píng)估始終是運(yùn)營(yíng)商關(guān)注的重點(diǎn),有很多研究者提出了自己的質(zhì)量評(píng)估模型或是改進(jìn)了其中的關(guān)鍵技術(shù)。對(duì)于選定評(píng)價(jià)指標(biāo)步驟,運(yùn)營(yíng)商使用的傳統(tǒng)方法是依靠領(lǐng)域?qū)<医?jīng)驗(yàn)選取評(píng)價(jià)指標(biāo),客觀(guān)方法主要有條件廣義方差極小法和主成分分析法。文獻(xiàn)[3]使用了條件廣義方差極小法,該方法在確定一個(gè)指標(biāo)集的值后,另一個(gè)指標(biāo)集的值如果變化幅度很小則表示兩個(gè)指標(biāo)集相似,可以刪除其中一個(gè)指標(biāo)集。文獻(xiàn)[4]介紹了主成分分析法,將原指標(biāo)數(shù)據(jù)線(xiàn)性變換為另一組不相關(guān)的變量,并且保持總方差不變,然后對(duì)新變量的方差按從大到小排序得到指標(biāo)的重要程度排序。主成分分析法可以同時(shí)完成指標(biāo)選取和權(quán)重確定步驟,但是因?yàn)榻?jīng)過(guò)變換后的變量不再具有物理意義,所以很難解釋評(píng)估結(jié)果。上述兩種方法都可以精簡(jiǎn)指標(biāo)集合,但是計(jì)算復(fù)雜不適用于海量異構(gòu)數(shù)據(jù)情況。文獻(xiàn)[5]提出一種關(guān)鍵績(jī)效指標(biāo)(Key Performance Indicator, KPI)指標(biāo)分類(lèi)方法,計(jì)算指標(biāo)在不同數(shù)據(jù)集中的相關(guān)關(guān)系,統(tǒng)計(jì)出現(xiàn)多次相關(guān)關(guān)系的指標(biāo)確定為相似指標(biāo)來(lái)減少指標(biāo)維度。

對(duì)于指標(biāo)數(shù)據(jù)的量化與處理,文獻(xiàn)[6]采用了模糊數(shù)學(xué)理論進(jìn)行定性指標(biāo)的量化處理。文獻(xiàn)[7]總結(jié)了數(shù)據(jù)的標(biāo)準(zhǔn)化處理方法,包括Z-score標(biāo)準(zhǔn)化法和0-1標(biāo)準(zhǔn)化法等。還有一些文獻(xiàn)[8-11]研究了客觀(guān)的指標(biāo)權(quán)重確定方法:文獻(xiàn)[8]提出了一種基于標(biāo)準(zhǔn)方差系數(shù)的權(quán)重確定方法;文獻(xiàn)[9]提出基于指標(biāo)信息熵的熵權(quán)法,通過(guò)衡量指標(biāo)值的變異程度來(lái)決定權(quán)重;文獻(xiàn)[10]比較了離差最大法、熵權(quán)法、標(biāo)準(zhǔn)差法和CRITIC(CRiteria Importance Through Inter-criteria Correlation)法等多種客觀(guān)權(quán)重確定方法;文獻(xiàn)[11]引入沖突性的概念,對(duì)上述方法進(jìn)行了改進(jìn)和比較,其中引入沖突性的標(biāo)準(zhǔn)差法效果最好。網(wǎng)絡(luò)參數(shù)指標(biāo)權(quán)重的分析對(duì)于網(wǎng)絡(luò)設(shè)備的管理、事件挖掘和故障溯源都能起到輔助作用[12]。

也有一些文獻(xiàn)[13-16]構(gòu)建了完整的質(zhì)量評(píng)估模型:文獻(xiàn)[13]使用模糊層次分析法建立了面向網(wǎng)絡(luò)業(yè)務(wù)性能的綜合評(píng)價(jià)模型;文獻(xiàn)[14]使用灰色關(guān)聯(lián)分析得到選定指標(biāo)的權(quán)重集,并構(gòu)建了指標(biāo)集到評(píng)價(jià)的模糊關(guān)系矩陣來(lái)完成網(wǎng)絡(luò)性能質(zhì)量的評(píng)估;文獻(xiàn)[15]利用相關(guān)向量機(jī)對(duì)灰色模糊綜合評(píng)估方法得到的網(wǎng)絡(luò)質(zhì)量評(píng)估模型進(jìn)行訓(xùn)練,解決了基于支持向量機(jī)的評(píng)估模型所存在的過(guò)擬合等問(wèn)題;文獻(xiàn)[16]基于TMF的服務(wù)水平協(xié)議(Service Level Agreement, SLA)建立了網(wǎng)絡(luò)服務(wù)質(zhì)量評(píng)估體系模型,但是這些質(zhì)量評(píng)估模型都采用人工分析方法選擇評(píng)估指標(biāo),缺乏客觀(guān)性。

各標(biāo)準(zhǔn)組織也提出了一些通用模型和給出了相關(guān)術(shù)語(yǔ)的定義,對(duì)構(gòu)建網(wǎng)絡(luò)運(yùn)維質(zhì)量評(píng)估模型具有啟發(fā)作用。TMF在GB923標(biāo)準(zhǔn)[17]中提出了與KPI指標(biāo)相應(yīng)的關(guān)鍵質(zhì)量指標(biāo)(Key Quality Indicator, KQI)的概念以及兩者的映射模型,關(guān)鍵指標(biāo)層級(jí)結(jié)構(gòu)。KQI是用于衡量網(wǎng)絡(luò)服務(wù)業(yè)務(wù)質(zhì)量的一系列指標(biāo),是面向業(yè)務(wù)的評(píng)估指標(biāo),是對(duì)KPI指標(biāo)的集成和補(bǔ)充。相比而言,KPI是以網(wǎng)絡(luò)性能為中心的衡量指標(biāo),而KQI則直接反映了網(wǎng)絡(luò)所承載的端到端的業(yè)務(wù)服務(wù)性能水平。關(guān)鍵指標(biāo)層級(jí)結(jié)構(gòu)只是一種通用思想,并沒(méi)有給出具體的評(píng)估指標(biāo)。

ITU定義將服務(wù)質(zhì)量[18](Quality of Service, QoS)定義為一種電信業(yè)務(wù)的特性總和,表明其滿(mǎn)足明示和暗示業(yè)務(wù)用戶(hù)需求的能力;而網(wǎng)絡(luò)性能(Network Performance, NP)指的是網(wǎng)絡(luò)或部分網(wǎng)絡(luò)提供用戶(hù)之間通信功能的能力。這兩個(gè)概念容易混淆,在評(píng)價(jià)服務(wù)質(zhì)量的過(guò)程中只考慮網(wǎng)絡(luò)性能指標(biāo)是不全面的,服務(wù)質(zhì)量的評(píng)估應(yīng)該包含網(wǎng)絡(luò)性能和非網(wǎng)絡(luò)性能兩個(gè)方面。網(wǎng)絡(luò)性能包括誤碼率、延遲等,而非網(wǎng)絡(luò)性能包括提供時(shí)間、修復(fù)時(shí)間、資費(fèi)范圍及投訴解決時(shí)間等。

根據(jù)ITU給出的官方定義,與服務(wù)質(zhì)量相關(guān)的術(shù)語(yǔ)分為服務(wù)、網(wǎng)絡(luò)和管理三大類(lèi)[18]。服務(wù)類(lèi)術(shù)語(yǔ)包括了呼叫建立時(shí)間、業(yè)務(wù)可接入性性能、平均服務(wù)接入延遲、服務(wù)恢復(fù)手段及時(shí)間、語(yǔ)音質(zhì)量以及意見(jiàn)評(píng)分等;網(wǎng)絡(luò)類(lèi)術(shù)語(yǔ)主要包括了可接入性、錯(cuò)誤及故障概率和誤碼率等類(lèi)別的指標(biāo),這類(lèi)指標(biāo)側(cè)重于所提供的網(wǎng)絡(luò)服務(wù)的可用性和可靠性;管理類(lèi)的術(shù)語(yǔ)涉及服務(wù)提供的速度和準(zhǔn)確率,因此包含很多時(shí)延類(lèi)的指標(biāo),也涉及探究故障原因的指標(biāo),如中斷時(shí)長(zhǎng)、平均恢復(fù)時(shí)間等。除了以上對(duì)服務(wù)質(zhì)量相關(guān)術(shù)語(yǔ)的分類(lèi),ITU在E.803建議書(shū)[19]中還提出了支持業(yè)務(wù)方面的服務(wù)質(zhì)量參數(shù)[20],一種88個(gè),分為12類(lèi),涉及服務(wù)供應(yīng)、服務(wù)變更、技術(shù)升級(jí)、服務(wù)文檔、技術(shù)支持、商業(yè)支持、計(jì)費(fèi)和收費(fèi)等多個(gè)方面。ITU在G.1020建議書(shū)[21]也給出了與用戶(hù)相關(guān)的服務(wù)質(zhì)量與性能的定義。另外,ITU還在E.802建議書(shū)[22]中提出了一些概念性的通用模型、性能模型和市場(chǎng)模型。

2 質(zhì)量評(píng)估模型構(gòu)建的一般化流程

質(zhì)量評(píng)估有助于尋找評(píng)估對(duì)象存在的問(wèn)題,幫助改善產(chǎn)品和服務(wù)質(zhì)量,因此近年來(lái)受到各業(yè)界的廣泛關(guān)注。質(zhì)量評(píng)估模型及其相關(guān)思想技術(shù)已成功運(yùn)用于教育、管理、工程、計(jì)算機(jī)與通信網(wǎng)絡(luò)等多個(gè)領(lǐng)域[23-25]。雖然各領(lǐng)域的評(píng)估對(duì)象和評(píng)估目的都不相同,但是構(gòu)建模型的流程是相似的。本章總結(jié)并提出了構(gòu)建運(yùn)維質(zhì)量評(píng)估模型的一般化流程,一共分為4步。

1)選定評(píng)價(jià)指標(biāo):選取參與評(píng)估的指標(biāo);

2)指標(biāo)量化與數(shù)據(jù)標(biāo)準(zhǔn)化處理:對(duì)定性數(shù)據(jù)進(jìn)行量化,對(duì)所有數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理;

3)確定指標(biāo)權(quán)重:質(zhì)量評(píng)估的關(guān)鍵步驟,根據(jù)指標(biāo)的重要性程度確定權(quán)重;

4)建立評(píng)價(jià)模型:綜合標(biāo)準(zhǔn)化后的數(shù)據(jù)和對(duì)應(yīng)權(quán)重,建立評(píng)價(jià)模型,得到評(píng)估結(jié)果。

本章還以網(wǎng)絡(luò)運(yùn)維質(zhì)量評(píng)估模型為例,介紹各個(gè)步驟中的常用技術(shù)和關(guān)鍵方法

2.1 選定評(píng)價(jià)指標(biāo)

評(píng)價(jià)指標(biāo)是評(píng)價(jià)內(nèi)容的載體,評(píng)價(jià)結(jié)果由對(duì)評(píng)價(jià)指標(biāo)進(jìn)行統(tǒng)計(jì)分析獲得,因此,選定的合適的評(píng)價(jià)指標(biāo)對(duì)構(gòu)建評(píng)估模型至關(guān)重要。在評(píng)估網(wǎng)絡(luò)運(yùn)維質(zhì)量的過(guò)程中通常涉及到大量的參數(shù),全部分析會(huì)給計(jì)算帶來(lái)一定的困難,需要進(jìn)一步地篩選指標(biāo)得到一個(gè)更小的而又不丟失原來(lái)指標(biāo)信息的指標(biāo)集。選擇指標(biāo)主要遵循3個(gè)原則[5,13]。

1)精簡(jiǎn)性:指標(biāo)過(guò)多會(huì)使計(jì)算變得復(fù)雜,而且會(huì)使分析結(jié)果沒(méi)有側(cè)重點(diǎn),缺乏參考性;

2)代表性:指標(biāo)需要盡量全面覆蓋待評(píng)估對(duì)象的屬性,避免信息丟失;

3)不重疊性:指標(biāo)間應(yīng)該盡量不重疊,相關(guān)性越小越好,防止重復(fù)評(píng)估給結(jié)果帶來(lái)偏差。

網(wǎng)絡(luò)運(yùn)維質(zhì)量評(píng)估指標(biāo)的選取通常由運(yùn)營(yíng)商的專(zhuān)家憑主觀(guān)經(jīng)驗(yàn)完成。隨著業(yè)務(wù)類(lèi)型和網(wǎng)絡(luò)設(shè)備的增加,網(wǎng)絡(luò)性能數(shù)據(jù)的參數(shù)數(shù)量劇增,例如本文實(shí)驗(yàn)所使用的某運(yùn)營(yíng)商公司的無(wú)線(xiàn)網(wǎng)絡(luò)優(yōu)化數(shù)據(jù)的參數(shù)就多達(dá)590多個(gè),其中包括“切換成功率”“無(wú)線(xiàn)掉線(xiàn)率”和“切換成2G平均時(shí)長(zhǎng)”等,涉及網(wǎng)絡(luò)的呼叫建立、移動(dòng)性管理、資源利用和時(shí)延等多個(gè)維度的內(nèi)容。憑借人為定義的方式可以達(dá)到簡(jiǎn)化評(píng)估指標(biāo)的效果,但是難以避免信息丟失和信息重復(fù)的問(wèn)題。通信網(wǎng)絡(luò)也存在設(shè)備和線(xiàn)路更新、數(shù)據(jù)參數(shù)變化的情況,耗費(fèi)大量資源建立的指標(biāo)體系很可能無(wú)法重復(fù)使用。

本文提出一種基于相關(guān)性分類(lèi)的指標(biāo)選取策略,挖掘指標(biāo)間相互關(guān)聯(lián)關(guān)系,將具有相似信息量的指標(biāo)劃分為一簇,選取簇中關(guān)鍵指標(biāo)來(lái)代表整個(gè)簇的指標(biāo),達(dá)到覆蓋盡可能多的信息量和減少重疊指標(biāo)的效果;并且在構(gòu)建質(zhì)量評(píng)估模型的第一步驟縮小待評(píng)估的指標(biāo)集合,減少后續(xù)步驟的計(jì)算量。具體方法將在后續(xù)的章節(jié)中詳細(xì)敘述。

2.2 指標(biāo)量化與數(shù)據(jù)標(biāo)準(zhǔn)化處理

按照指標(biāo)的數(shù)據(jù)類(lèi)型指標(biāo),通常被分為定性指標(biāo)和定量指標(biāo)。按照ITU給出的定義,定量指標(biāo)是指可以(利用工具或觀(guān)察)衡量的參數(shù)以及量化確定的性能值[18],如“時(shí)延”“接通率”等。這些指標(biāo)的數(shù)據(jù)通常表示為數(shù)值形式,不需要進(jìn)過(guò)量化處理就可以使用。而定性指標(biāo)是主觀(guān)參數(shù),是可利用人工評(píng)判和理解來(lái)表示的參數(shù)[18],例如“是否預(yù)處理”“是否延期”等。定性指標(biāo)的數(shù)據(jù)表現(xiàn)為如是否、優(yōu)良中差等文字形式。只有對(duì)定性指標(biāo)進(jìn)行量化以后才能和其他定量指標(biāo)一起用于綜合評(píng)價(jià)的計(jì)算。

定性指標(biāo)又可以分為非順序指標(biāo)和順序指標(biāo)[26]。順序指標(biāo)指的是指標(biāo)之間存在明確的程度大小關(guān)系,可以將指標(biāo)進(jìn)行排序的指標(biāo)[27]。例如:簡(jiǎn)單的“是”“否”可以量化為“1”“0”;而復(fù)雜一點(diǎn)的如通話(huà)質(zhì)量參數(shù)數(shù)據(jù)優(yōu)良中差等,影響程度由差到好排序?yàn)镚1

gi=i/n;i=1,2,…,n

(1)

也可以采取文獻(xiàn)[27]提出的取中位數(shù)的方法。非順序指標(biāo)的數(shù)據(jù)不存在明顯大小關(guān)系,很難用客觀(guān)方法進(jìn)行量化,只能依靠領(lǐng)域?qū)<医?jīng)驗(yàn)進(jìn)行粗略估算。

完成定性指標(biāo)的量化工作后,指標(biāo)之間還存在單位和度量不一樣的問(wèn)題,必須將數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理后才能用于評(píng)估網(wǎng)絡(luò)運(yùn)維質(zhì)量。數(shù)據(jù)標(biāo)準(zhǔn)化處理又稱(chēng)無(wú)量綱化處理[8,11,13-14,27],是指消除指標(biāo)間不同單位和度量的影響,使其數(shù)據(jù)分布在同一個(gè)區(qū)間內(nèi),用來(lái)解決指標(biāo)的可綜合性問(wèn)題。在數(shù)據(jù)標(biāo)準(zhǔn)化時(shí),需要將指標(biāo)分為成本型指標(biāo)和效益型指標(biāo)。簡(jiǎn)單地說(shuō),成本型指標(biāo)指的是數(shù)值越大越會(huì)對(duì)評(píng)估對(duì)象產(chǎn)生負(fù)面影響的指標(biāo),效益型指標(biāo)是數(shù)值越大越會(huì)給評(píng)估對(duì)象帶來(lái)積極影響的指標(biāo)。假設(shè)某指標(biāo)I有數(shù)據(jù)序列d1,d2,…,dn,其中最大值為dmax,最小值為dmin,使用基于歷史數(shù)據(jù)的0-1標(biāo)準(zhǔn)化方法,可以把數(shù)據(jù)處理為位于[0,1]區(qū)間內(nèi)的標(biāo)準(zhǔn)數(shù)據(jù)d1,d2,…,dn。如果指標(biāo)數(shù)據(jù)全部相同時(shí),將成本型指標(biāo)數(shù)據(jù)標(biāo)準(zhǔn)化為0,將效益型指標(biāo)數(shù)據(jù)標(biāo)準(zhǔn)化為1;dmax和dmin不相等時(shí),0-1標(biāo)準(zhǔn)化法計(jì)算方法如式(2)所示。

(2)

2.3 確定指標(biāo)權(quán)重

指標(biāo)權(quán)重的確定是構(gòu)建網(wǎng)絡(luò)運(yùn)維質(zhì)量評(píng)估模型的關(guān)鍵問(wèn)題之一,權(quán)重會(huì)對(duì)評(píng)價(jià)結(jié)果產(chǎn)生巨大的影響。給指標(biāo)賦予不同的權(quán)重后,就能進(jìn)一步聚合成綜合指標(biāo),運(yùn)營(yíng)商就可以不用關(guān)注繁多的原始指標(biāo)數(shù)據(jù),而是通過(guò)分析綜合指標(biāo)得到一段時(shí)間內(nèi)網(wǎng)絡(luò)運(yùn)維質(zhì)量某個(gè)方面的波動(dòng)情況,并以此來(lái)判定某個(gè)時(shí)刻網(wǎng)絡(luò)運(yùn)維質(zhì)量的狀態(tài)?,F(xiàn)代通信網(wǎng)絡(luò)覆蓋范圍廣、涉及設(shè)備多樣帶來(lái)了兩個(gè)問(wèn)題:一是網(wǎng)絡(luò)性能數(shù)據(jù)指標(biāo)過(guò)多;二是指標(biāo)間存在復(fù)雜的關(guān)聯(lián)關(guān)系。這兩個(gè)問(wèn)題貫穿網(wǎng)絡(luò)運(yùn)維質(zhì)量評(píng)估模型構(gòu)建的整個(gè)流程,尤其給指標(biāo)確定帶來(lái)難度。

傳統(tǒng)方法憑借領(lǐng)域?qū)<医?jīng)驗(yàn)來(lái)確定權(quán)重,這種方法雖然可以突出運(yùn)營(yíng)商關(guān)注的重點(diǎn),體現(xiàn)經(jīng)濟(jì)效益規(guī)律,但是缺點(diǎn)也有很多:一是無(wú)法客觀(guān)地呈現(xiàn)指標(biāo)的重要性差異;二是無(wú)法顧及到指標(biāo)間的關(guān)聯(lián)關(guān)系,無(wú)法剔除信息重復(fù)的指標(biāo)帶來(lái)的影響;另外分析過(guò)程還需要耗費(fèi)大量時(shí)間和人力資源。目前很多研究工作[8,11,27-28]提出了一些客觀(guān)確定指標(biāo)權(quán)重的方法來(lái)減少人工的參與。這些方法希望只通過(guò)確定權(quán)重這一步驟來(lái)解決上述兩個(gè)問(wèn)題,勢(shì)必會(huì)增加權(quán)重確定步驟的計(jì)算量。本文將考慮指標(biāo)間關(guān)聯(lián)關(guān)系的問(wèn)題放到指標(biāo)選取步驟,而在確定指標(biāo)權(quán)重時(shí)只需要考慮體現(xiàn)指標(biāo)數(shù)據(jù)間的重要程度差異。

通過(guò)標(biāo)準(zhǔn)差法來(lái)客觀(guān)確定指標(biāo)的權(quán)重。標(biāo)準(zhǔn)差又稱(chēng)均方差,反映了數(shù)據(jù)集中的數(shù)據(jù)偏離均值的程度。對(duì)于某個(gè)指標(biāo)I,如果不同評(píng)估對(duì)象的該指標(biāo)的標(biāo)準(zhǔn)差越大,就說(shuō)明指標(biāo)I對(duì)于不同評(píng)估對(duì)象的數(shù)據(jù)差異性越大,也就能提供更多的信息量,在評(píng)估質(zhì)量時(shí)將會(huì)起到更大的作用,所以權(quán)重也應(yīng)該越大;反之,權(quán)重應(yīng)該越小[11]。具體的計(jì)算方法如下:假設(shè)選定n個(gè)指標(biāo)構(gòu)成指標(biāo)集K={I1,I2,…,In},其中某個(gè)指標(biāo)Ii的全部評(píng)估對(duì)象在某段時(shí)間內(nèi)的數(shù)據(jù)序列為Di={d1,d2,…,dm},其均值為Avgi,則指標(biāo)Ii的標(biāo)準(zhǔn)差可以根據(jù)式(3)計(jì)算:

(3)

則指標(biāo)Ii的權(quán)重wi為:

(4)

2.4 建立評(píng)價(jià)模型

完成上述工作后需要確定評(píng)價(jià)公式將權(quán)重和指標(biāo)數(shù)據(jù)結(jié)合起來(lái),得到定量的評(píng)估結(jié)果,結(jié)合適當(dāng)?shù)目梢暬故荆梢暂o助相關(guān)人員分析評(píng)估對(duì)象的質(zhì)量變化情況。常用的評(píng)價(jià)公式有線(xiàn)性加權(quán)和、對(duì)數(shù)線(xiàn)性加權(quán)和以及混合加權(quán)和等方法。本文采用線(xiàn)性加權(quán)和的方法來(lái)計(jì)算網(wǎng)絡(luò)運(yùn)維質(zhì)量評(píng)估結(jié)果。假設(shè)選定指標(biāo)集合K={I1,I2,…,In},運(yùn)用標(biāo)準(zhǔn)差法算得權(quán)重集合為W={w1,w2,…,wn},該指標(biāo)集在某一時(shí)刻經(jīng)過(guò)量化和標(biāo)準(zhǔn)化處理的數(shù)據(jù)為D={d1,d2,…,dn},則這個(gè)時(shí)刻的評(píng)估結(jié)果為:

score=d1·w1+d2·w2+…+dn·wn

(5)

該結(jié)果為[0,1]區(qū)間的一個(gè)數(shù)值,按同樣方法計(jì)算出各個(gè)時(shí)刻的評(píng)估結(jié)果后可以得到網(wǎng)絡(luò)運(yùn)維質(zhì)量結(jié)果序列,可以將其可視化展示為網(wǎng)絡(luò)運(yùn)維質(zhì)量變化曲線(xiàn),再進(jìn)一步進(jìn)行分析。

3 基于相關(guān)性分類(lèi)的指標(biāo)選取策略

3.1 算法思想

指標(biāo)選取是構(gòu)建網(wǎng)絡(luò)運(yùn)維質(zhì)量評(píng)估模型的第一步,指標(biāo)選取是否合理將會(huì)影響后續(xù)步驟的計(jì)算復(fù)雜程度和最終的評(píng)估效果。如上文提到的,指標(biāo)選取需要遵循三個(gè)原則:精簡(jiǎn)性、代表性和不重疊性。這三個(gè)原則指的是在選擇指標(biāo)時(shí),需要用盡量少的指標(biāo),盡量全面而又不重疊地覆蓋原數(shù)據(jù)的信息量。

而在現(xiàn)有的指標(biāo)選取方法中,人工選取依賴(lài)專(zhuān)家經(jīng)驗(yàn),只能體現(xiàn)運(yùn)營(yíng)商關(guān)注的重點(diǎn)卻無(wú)法保障這三個(gè)原則,同時(shí)需要耗費(fèi)大量人力資源;常用的主成分分析法運(yùn)用降維的思想,將多指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)主成分指標(biāo),但存在信息丟失的問(wèn)題。本文提出的基于相關(guān)性分類(lèi)的指標(biāo)選取策略旨在通過(guò)分析指標(biāo)數(shù)據(jù)序列之間的相關(guān)性,挖掘指標(biāo)之間的關(guān)聯(lián)關(guān)系以此來(lái)減少評(píng)估指標(biāo)信息間的重疊,最終形成全面客觀(guān)的指標(biāo)體系。

相關(guān)性又稱(chēng)相關(guān)系數(shù),是用來(lái)反映變量之間相關(guān)程度的統(tǒng)計(jì)指標(biāo)。相關(guān)系數(shù)不只有一種,常見(jiàn)的有皮爾遜相關(guān)系數(shù)等。自然科學(xué)界存在著廣泛的相關(guān)關(guān)系,如植物的生長(zhǎng)與光照時(shí)長(zhǎng)、電壓相同的情況下電流與電阻等。利用相關(guān)性來(lái)判斷變量間關(guān)系的相關(guān)分析法已經(jīng)在社會(huì)學(xué)、生物學(xué)、經(jīng)濟(jì)學(xué)等多個(gè)領(lǐng)域得到應(yīng)用并取得了一定成效。通信網(wǎng)絡(luò)的性能指標(biāo)之間也存在著相關(guān)性,比如無(wú)線(xiàn)數(shù)據(jù)中“上行物理資源模塊(Physical Resource Block, PRB)平均利用率”和“下行PRB平均利用率”。物理資源模塊(PRB)是指是頻域上12個(gè)連續(xù)的載波的資源,“上行PRB平均利用率”和“下行PRB平均利用率”指的是分別在上載和下載時(shí)物理資源模塊的平均利用率,這兩個(gè)指標(biāo)是評(píng)價(jià)無(wú)線(xiàn)性能的常用指標(biāo)。圖1統(tǒng)計(jì)了一個(gè)月內(nèi)這兩個(gè)指標(biāo)的數(shù)據(jù)序列波動(dòng)情況,橫坐標(biāo)為時(shí)間,縱坐標(biāo)為數(shù)據(jù)值。其中虛線(xiàn)為上行PRB平均利用率,實(shí)線(xiàn)為下行PRB平均利用率。兩者的波動(dòng)趨勢(shì)基本相同,而且在后期計(jì)算過(guò)程中發(fā)現(xiàn)兩者之間的確具有相關(guān)性,而這兩個(gè)指標(biāo)卻都在人工選取的指標(biāo)體系中,這勢(shì)必會(huì)對(duì)評(píng)價(jià)結(jié)果產(chǎn)生影響。通過(guò)指標(biāo)間相關(guān)性比較,把具有高度相關(guān)性的指標(biāo)歸為一簇,將原始指標(biāo)集合劃分為多個(gè)簇,在每個(gè)簇中選取具有代表性的指標(biāo),以此來(lái)達(dá)到降維的效果。

圖1 上/下行PRB平均利用率統(tǒng)計(jì)

3.2 方法描述

為了計(jì)算指標(biāo)間的相關(guān)性,需要引入互相關(guān)函數(shù)的概念?;ハ嚓P(guān)在統(tǒng)計(jì)學(xué)中表示為兩個(gè)隨機(jī)矢量間的協(xié)方差,而互相關(guān)函數(shù)用于信號(hào)分析領(lǐng)域時(shí),描述的是兩個(gè)隨機(jī)信號(hào)或是兩個(gè)時(shí)間序列之間的相關(guān)程度。網(wǎng)絡(luò)性能、維護(hù)等數(shù)據(jù)都帶有時(shí)間標(biāo)簽,因此指標(biāo)數(shù)據(jù)也是一種離散的時(shí)間序列數(shù)據(jù)。

(6)

在實(shí)際操作時(shí)也可以使用Matlab自帶的corrcoef函數(shù)來(lái)完成計(jì)算,使用這個(gè)函數(shù)計(jì)算得到的結(jié)果是一個(gè)2×2的矩陣,其主對(duì)角線(xiàn)是序列的自相關(guān)系數(shù),恒為1。需要的互相關(guān)系數(shù)位于副對(duì)角線(xiàn)。

rij是處于[-1,1]區(qū)間的一個(gè)數(shù)值,它只能代表指標(biāo)的線(xiàn)性相關(guān)性,正負(fù)號(hào)只表示相關(guān)的方向,只需要使用它的絕對(duì)值來(lái)代表相關(guān)性的程度。對(duì)于相關(guān)系數(shù)的大小所表示的相關(guān)程度,在業(yè)界還沒(méi)有統(tǒng)一的說(shuō)法。文獻(xiàn)[5]提出當(dāng)|rij|處于[0.4,0.7)區(qū)間時(shí)表示顯著相關(guān),|rij|處于[0.7,1]區(qū)間時(shí)表示高度相關(guān)。也有說(shuō)法表示相關(guān)系數(shù)|rij|處于[0.3,0.5)區(qū)間表示實(shí)相關(guān),處于[0.5,0.8)區(qū)間表示顯著相關(guān),處于[0.8,1]區(qū)間表示高度相關(guān)等。

接下來(lái),將指標(biāo)間存在相關(guān)性的描述抽象成指標(biāo)相關(guān)性圖來(lái)說(shuō)明指標(biāo)選取策略。每個(gè)指標(biāo)Ii對(duì)應(yīng)一個(gè)圖中的一個(gè)節(jié)點(diǎn)Ni,如果兩個(gè)指標(biāo)Ii和Ij之間存在相關(guān)性,則存在連接它們對(duì)應(yīng)節(jié)點(diǎn)Ni和Nj的邊E(i,j)=1,否則E(i,j)=0。另設(shè)Vij=1/|rij|,用于表示節(jié)點(diǎn)Ni和Nj之間的距離,Vij越大,節(jié)點(diǎn)間的距離就越大。整個(gè)指標(biāo)相關(guān)性圖成為一個(gè)無(wú)向圖,設(shè)置閾值T來(lái)對(duì)無(wú)向圖進(jìn)行剪邊,公式為:

(7)

剪邊是將低于閾值T的|rij|所對(duì)應(yīng)的E(i,j)設(shè)為0,表示認(rèn)為指標(biāo)Ii和Ij間相關(guān)性微弱,默認(rèn)為不相關(guān)。剪邊將原本的無(wú)向圖劃分為數(shù)個(gè)不連通的子圖。利用某運(yùn)營(yíng)商公司2017年5月某小區(qū)的無(wú)線(xiàn)網(wǎng)絡(luò)優(yōu)化數(shù)據(jù),分析兩兩指標(biāo)間的相關(guān)性,如果定義閾值T為0.5進(jìn)行剪邊,可以得到如圖2的剪邊結(jié)果示意圖,其中每個(gè)標(biāo)有數(shù)字的節(jié)點(diǎn)都代表一個(gè)指標(biāo),連線(xiàn)代表兩個(gè)指標(biāo)之間具有相關(guān)關(guān)系。在圖2中,有的子圖只有單個(gè)節(jié)點(diǎn),它們不與其他任何節(jié)點(diǎn)相連,也就是和其他指標(biāo)都沒(méi)有相似性,稱(chēng)這些單個(gè)節(jié)點(diǎn)的指標(biāo)為孤立指標(biāo);而另外一些子圖,它們由數(shù)個(gè)節(jié)點(diǎn)和邊相連構(gòu)成了連通圖,表示這些相連節(jié)點(diǎn)的指標(biāo)存在信息量上的相似性。

圖2 剪邊后的指標(biāo)相關(guān)性圖

需要注意的是,閾值T的選擇需要根據(jù)具體的情況選擇:T過(guò)小會(huì)導(dǎo)致丟失信息,過(guò)大會(huì)導(dǎo)致出現(xiàn)大量的孤立指標(biāo)。雖然孤立指標(biāo)反映了和其他指標(biāo)都不重疊的信息,但是將所有孤立指標(biāo)都納入指標(biāo)集會(huì)帶來(lái)評(píng)估指標(biāo)集不精簡(jiǎn)、評(píng)估結(jié)果沒(méi)有針對(duì)性等問(wèn)題。如何在孤立指標(biāo)中選擇合適的評(píng)估指標(biāo)仍然是業(yè)界的一個(gè)難題。可以使用上文提到的指標(biāo)權(quán)重確定方法來(lái)對(duì)孤立指標(biāo)進(jìn)行排序,選擇重要性高的指標(biāo)加入評(píng)估指標(biāo)體系,或者參考領(lǐng)域?qū)<医?jīng)驗(yàn)選取運(yùn)營(yíng)商普遍關(guān)注的指標(biāo)。

除去孤立指標(biāo)外,需要在那些被劃分為一簇的指標(biāo)中選取一個(gè)或多個(gè)指標(biāo)來(lái)代表這一類(lèi)指標(biāo)的信息量。選取的原則是盡量選取位于中心的指標(biāo)。使用圖論和網(wǎng)絡(luò)分析中代表節(jié)點(diǎn)重要性的中心性屬性來(lái)衡量一個(gè)點(diǎn)在類(lèi)中的重要程度。根據(jù)對(duì)節(jié)點(diǎn)重要性的解釋不同,中心性的度量方法也有所不同。最常用的幾種方法有度中心性、接近中心性和中介中心性等。度中心性比較節(jié)點(diǎn)間的度,即與節(jié)點(diǎn)相關(guān)聯(lián)的邊數(shù),節(jié)點(diǎn)的度越大,其度中心性越高,表示它在圖中連接的其他節(jié)點(diǎn)越多,也就越重要。節(jié)點(diǎn)Ni的度中心性DCi的計(jì)算公式為:

(8)

接近中心性度量節(jié)點(diǎn)到其他節(jié)點(diǎn)的加權(quán)路徑,到其他節(jié)點(diǎn)的平均最短加權(quán)路徑越小的節(jié)點(diǎn),它的接近中心度越大,表示它距離其他節(jié)點(diǎn)越近。計(jì)算接近中心性時(shí)需要先計(jì)算出節(jié)點(diǎn)間的最短路徑,可以使用迪杰斯特拉算法來(lái)計(jì)算最短路徑。假設(shè)節(jié)點(diǎn)Ni和Nj間的最短路徑為集合Pathij={p1,p2,…,pl},最短路徑對(duì)應(yīng)的權(quán)重集合PaWij={v1,v2,…,vl}。在同一個(gè)類(lèi)中的節(jié)點(diǎn)Ni和Nj間必存在路徑,因?yàn)轭?lèi)中的指標(biāo)相關(guān)性圖是一個(gè)連通圖,任何一個(gè)節(jié)點(diǎn)經(jīng)過(guò)有限條邊必定能到達(dá)另外一個(gè)節(jié)點(diǎn),即Pathij中必定含有一條起始于Ni的邊和一條以Nj為終點(diǎn)的邊,最短路徑集合的長(zhǎng)度l大于等于1;而不在同一個(gè)集合內(nèi)的節(jié)點(diǎn)間不存在路徑,最短路徑集合為空集,長(zhǎng)度為0,那么,接近中心度CCi的計(jì)算公式為:

(9)

中介中心性指一個(gè)節(jié)點(diǎn)作為其他節(jié)點(diǎn)間最短路徑的中間節(jié)點(diǎn)的次數(shù),作為中間節(jié)點(diǎn)的次數(shù)越多,中介中心性就越高。文獻(xiàn)[29]詳細(xì)介紹了計(jì)算某點(diǎn)Nv的中介中心性的方法,可以概括為2步:首先需要找出所有節(jié)點(diǎn)對(duì)間的最短路徑,然后找出經(jīng)過(guò)Nv的最短路徑的數(shù)量。如果一個(gè)節(jié)點(diǎn)Nv在節(jié)點(diǎn)Ns和Nt的最短路徑上,那么Ns到Nv和Nv到Nt都需要是最短路徑。節(jié)點(diǎn)Nv對(duì)于一對(duì)節(jié)點(diǎn)Ns和Nt的中介中心性BCst為:

(10)

假設(shè)所有節(jié)點(diǎn)的集合為N,那么節(jié)點(diǎn)Nv的總中介中心性為:

(11)

文獻(xiàn)[29]對(duì)計(jì)算中介中心性的算法作出了改進(jìn),這里不展開(kāi)敘述。

得到所有節(jié)點(diǎn)的中心性后,選擇簇中代表指標(biāo)的問(wèn)題可以抽象為頂點(diǎn)覆蓋(Vertex Cover)問(wèn)題。頂點(diǎn)覆蓋問(wèn)題是指在組成無(wú)向圖的點(diǎn)集中選擇一個(gè)最小的子集,并且使得無(wú)向圖的所有邊都至少有一個(gè)端點(diǎn)在這個(gè)子集中。本文的目的是,希望在簇中選出的指標(biāo)能夠覆蓋到盡可能多的相關(guān)關(guān)系,以保證指標(biāo)的代表性而且能精簡(jiǎn)掉更多的指標(biāo)。也就是說(shuō),如果假設(shè)每個(gè)指標(biāo)Ii對(duì)應(yīng)連通圖中的一個(gè)節(jié)點(diǎn)Ni,兩個(gè)指標(biāo)Ii和Ij相似則對(duì)應(yīng)節(jié)點(diǎn)Ni和Nj間存在的邊E(i,j)=1的話(huà),本文的目標(biāo)和解決Vertex Cover問(wèn)題相似,對(duì)于任意的邊E(i,j)=1,選擇出的點(diǎn)集N*盡可能小,且其中必存在節(jié)點(diǎn)Ni或Nj。

另設(shè)構(gòu)成剪邊后的子圖G的是含有n個(gè)點(diǎn)的點(diǎn)集N={N1,N2,…,Nn}(n≥1),以及邊的集合E={E(i,j)|i≤n,j≤n,i

算法1 簇中代表指標(biāo)選取。

輸入:子圖G;

輸出:點(diǎn)集N*。

1)

計(jì)算子圖G中所有點(diǎn)Ni的中心度Ci;

2)

選擇具有最大中心度的點(diǎn)Nmax加入點(diǎn)集N*;

3)

從子圖G中刪除點(diǎn)Nmax以及和點(diǎn)Nmax相連的邊和點(diǎn);

4)

重復(fù)第2)步直到子圖G的點(diǎn)被全部刪除;

5)

返回點(diǎn)集N*。

4 實(shí)驗(yàn)

實(shí)驗(yàn)使用的數(shù)據(jù)為某地區(qū)2016年11月份和2017年5月份的無(wú)線(xiàn)網(wǎng)絡(luò)優(yōu)化數(shù)據(jù),共記錄4 034個(gè)基站的無(wú)線(xiàn)網(wǎng)絡(luò)性能信息。每條數(shù)據(jù)的最前面4個(gè)字段分別是“時(shí)間戳”“小區(qū)標(biāo)識(shí)碼ECI”“基站標(biāo)識(shí)碼DN”和“小區(qū)名稱(chēng)”,通過(guò)這4個(gè)字段可以定位到覆蓋某小區(qū)的基站在某一時(shí)刻的無(wú)線(xiàn)網(wǎng)絡(luò)信息。另外,數(shù)據(jù)還記錄了“RRC連接重建成功次數(shù)”“小區(qū)最大發(fā)射功率”“無(wú)線(xiàn)接通率”“無(wú)線(xiàn)掉線(xiàn)率”等共596個(gè)指標(biāo)字段。

在選取指標(biāo)的步驟中,為了選擇更加適合實(shí)際數(shù)據(jù)的閾值T,使用某運(yùn)營(yíng)商2017年5月數(shù)據(jù)中的264 584條作為測(cè)試數(shù)據(jù)。首先,統(tǒng)計(jì)了兩兩指標(biāo)間的相關(guān)性分布,如圖3所示。其中橫坐標(biāo)是指標(biāo)間的相關(guān)性,分布在[0,1]區(qū)間,縱坐標(biāo)是位于對(duì)應(yīng)區(qū)間的相關(guān)性的個(gè)數(shù)。文獻(xiàn)[5]中提到業(yè)界常用的相關(guān)性系數(shù)對(duì)應(yīng)相關(guān)程度的區(qū)間分布,主要有兩種說(shuō)法:一種是認(rèn)為相關(guān)性處于[0.4,0.7)區(qū)間時(shí)表示顯著相關(guān),處于[0.7,1]區(qū)間時(shí)表示高度相關(guān);另一種說(shuō)法表示相關(guān)性處于[0.3,0.5)區(qū)間表示實(shí)相關(guān),處于[0.5,0.8)區(qū)間表示顯著相關(guān),處于[0.8,1]區(qū)間表示高度相關(guān)。這兩種方法都是統(tǒng)計(jì)學(xué)中常用的相關(guān)性閾值的經(jīng)驗(yàn)法則。為了使參數(shù)更加適合網(wǎng)絡(luò)運(yùn)維質(zhì)量的評(píng)估,選擇兩種經(jīng)驗(yàn)法則中閾值的端點(diǎn)0.3、0.4、0.5、0.7和0.8這5個(gè)值,比較不同閾值得到的指標(biāo)集合對(duì)人工選取的指標(biāo)的覆蓋度。

圖3 指標(biāo)間相關(guān)性統(tǒng)計(jì)

以閾值T等于0.4為例,利用基于相關(guān)性的指標(biāo)選取算法得到38個(gè)指標(biāo)簇和196個(gè)孤立指標(biāo)。剔除領(lǐng)域?qū)<冶硎静粫?huì)使用的服務(wù)質(zhì)量類(lèi)別識(shí)別符(Quality of service Class Identifier, QCI)指標(biāo),即一組為了減少接口上的控制信令數(shù)據(jù)傳輸量并且使設(shè)備或系統(tǒng)間的互連更加容易的度量值指標(biāo)后,得到包含77個(gè)指標(biāo)的關(guān)鍵指標(biāo)集合。領(lǐng)域?qū)<疫x取的指標(biāo)共有36個(gè),該集合與專(zhuān)家選取的指標(biāo)共有18個(gè)相同指標(biāo),覆蓋度為50%。利用同樣的方法,得到使用其他閾值對(duì)專(zhuān)家選取指標(biāo)的覆蓋率,如表1所示。

表1 使用不同閾值對(duì)人工指標(biāo)的覆蓋率對(duì)比

根據(jù)統(tǒng)計(jì)結(jié)果,當(dāng)選擇0.7作為閾值時(shí),關(guān)鍵指標(biāo)集合對(duì)于人工指標(biāo)的覆蓋度最高,也符合經(jīng)驗(yàn)法則中相關(guān)性處于[0.7,1]時(shí)表示高度相關(guān)的說(shuō)法。因此,使用0.7作為剪邊的閾值T,去掉QCI指標(biāo)后可以得到19個(gè)指標(biāo)簇和76個(gè)孤立指標(biāo)。

從覆蓋率上可以看出,利用本文方法選擇的指標(biāo)和領(lǐng)域?qū)<疫x擇的指標(biāo)很大部分是重疊的,這也印證了本文方法的正確性和實(shí)用性。為了能在同等條件下進(jìn)一步比較本文構(gòu)建的指標(biāo)集與專(zhuān)家構(gòu)建的指標(biāo)集的質(zhì)量,除了簇中代表指標(biāo)外,規(guī)定選擇的孤立指標(biāo)的個(gè)數(shù),使得到的關(guān)鍵指標(biāo)個(gè)數(shù)與人工選取的相同,都為36個(gè)。根據(jù)指標(biāo)選取的原則,指標(biāo)集應(yīng)該盡可能覆蓋攜帶不同信息量的信息,也就是評(píng)估指標(biāo)集中的指標(biāo)相關(guān)性應(yīng)該越小越好。因此,為了評(píng)估基于相關(guān)性的指標(biāo)選取策略的效果,使用指標(biāo)集合內(nèi)部的相關(guān)性平均數(shù)AC來(lái)衡量待評(píng)估指標(biāo)集的信息的不重疊程度。計(jì)算公式如下:

(12)

進(jìn)行比較的兩個(gè)指標(biāo)集都使用某運(yùn)營(yíng)商2017年5月份數(shù)據(jù)中的24 702條,根據(jù)式(12)計(jì)算得到人工指標(biāo)集的相關(guān)性平均數(shù)ACh為0.085 8,而基于相關(guān)性的指標(biāo)選取算法所得的關(guān)鍵指標(biāo)集的相關(guān)性平均數(shù)ACm為0.059 1,低于前者31%??梢钥闯鲈趦蓚€(gè)指標(biāo)集的指標(biāo)個(gè)數(shù)相同、相似性較高的情況下,基于相關(guān)性的指標(biāo)選取算法得到的指標(biāo)集合的指標(biāo)相關(guān)性更低、結(jié)構(gòu)更加稀疏,信息更加全面。

然后,將基于相關(guān)性選擇的36個(gè)關(guān)鍵指標(biāo)代入到網(wǎng)絡(luò)運(yùn)維質(zhì)量評(píng)估模型中,可以得到如圖4的某小區(qū)基站在2016年11月份的網(wǎng)絡(luò)質(zhì)量分?jǐn)?shù)變化曲線(xiàn),其中橫坐標(biāo)是時(shí)間節(jié)點(diǎn),縱坐標(biāo)是某個(gè)時(shí)間節(jié)點(diǎn)的性能評(píng)分,分?jǐn)?shù)在[0,1]區(qū)間內(nèi)。定位到某個(gè)時(shí)刻可以看到該基站此時(shí)的網(wǎng)絡(luò)質(zhì)量評(píng)分,一段時(shí)間的評(píng)分結(jié)果可以反映該基站的網(wǎng)絡(luò)質(zhì)量波動(dòng),可以協(xié)助運(yùn)維人員排除故障原因,挖掘故障規(guī)律。

通過(guò)咨詢(xún)領(lǐng)域?qū)<?,了解到基站的性能質(zhì)量低下可以關(guān)聯(lián)到告警數(shù)據(jù)中“EnodeB”類(lèi)型告警;因此推測(cè),評(píng)分曲線(xiàn)中凹點(diǎn)對(duì)應(yīng)的時(shí)間前后或者評(píng)分的下降幅度超過(guò)一定比例時(shí)將會(huì)會(huì)出現(xiàn)“EnodeB”類(lèi)型的告警。為了驗(yàn)證評(píng)估模型的準(zhǔn)確性,將基站的評(píng)分、評(píng)分導(dǎo)數(shù)和該基站產(chǎn)生的告警結(jié)合起來(lái),得到了如圖5的某基站的告警-評(píng)分對(duì)應(yīng)圖。在圖5中,橫坐標(biāo)是時(shí)間,單位為h,縱坐標(biāo)是評(píng)分結(jié)果。其中,縱坐標(biāo)值在0.8上下波動(dòng)的線(xiàn)條是分?jǐn)?shù)變化曲線(xiàn),縱坐標(biāo)值在0上下波動(dòng)線(xiàn)條是評(píng)分的一階導(dǎo)數(shù),豎直線(xiàn)條對(duì)應(yīng)的橫坐標(biāo)值代表在該時(shí)刻發(fā)生了告警??梢钥闯霭l(fā)生告警的時(shí)刻都是分?jǐn)?shù)的凹點(diǎn)或一階導(dǎo)數(shù)的凹點(diǎn),證明了質(zhì)量評(píng)估模型的正確性,但是,在圖中還存在一些凹點(diǎn)并沒(méi)有發(fā)生告警,說(shuō)明模型存在誤報(bào)的問(wèn)題。探究其原因,可能的是指標(biāo)中包含一些不足以產(chǎn)生“EnodeB”型告警的指標(biāo),比如“切換成功率”“無(wú)線(xiàn)利用率”等。這類(lèi)指標(biāo)數(shù)值的低下無(wú)疑反映了一段時(shí)間內(nèi)網(wǎng)絡(luò)性能質(zhì)量存在問(wèn)題,但這類(lèi)問(wèn)題會(huì)自然恢復(fù),不會(huì)產(chǎn)生需要相關(guān)人員處理的告警。

圖4 性能分?jǐn)?shù)變化曲線(xiàn)

圖5 基站告警-評(píng)分對(duì)應(yīng)圖

5 結(jié)語(yǔ)

本文總結(jié)了構(gòu)建網(wǎng)絡(luò)運(yùn)維質(zhì)量評(píng)估模型的一般化流程,并提出了一種基于指標(biāo)間互相關(guān)性的指標(biāo)選取方法。該方法基于指標(biāo)間的互相關(guān)性對(duì)原始指標(biāo)集進(jìn)行分類(lèi),并利用中心度的概念來(lái)選擇最具有代表性的指標(biāo),完成關(guān)鍵指標(biāo)集合的構(gòu)建。實(shí)驗(yàn)證明該指標(biāo)集對(duì)人工選取的評(píng)估指標(biāo)集有較高的覆蓋度,能夠?qū)δ壳斑\(yùn)營(yíng)商使用的評(píng)估指標(biāo)作出補(bǔ)充和修正。本文還整合了0-1數(shù)據(jù)標(biāo)準(zhǔn)化法和標(biāo)準(zhǔn)差權(quán)重確定方法建立了網(wǎng)絡(luò)運(yùn)維評(píng)估模型,該模型可以輔助運(yùn)維人員監(jiān)控網(wǎng)絡(luò)質(zhì)量,挖掘網(wǎng)絡(luò)故障規(guī)律。本文利用實(shí)際數(shù)據(jù)驗(yàn)證評(píng)分結(jié)果對(duì)告警具有較高的預(yù)測(cè)準(zhǔn)確度,但是存在很多誤報(bào)。為了進(jìn)一步完善模型,接下來(lái)將通過(guò)廣泛的實(shí)驗(yàn),利用歷史告警發(fā)生前后的評(píng)分情況、評(píng)分波動(dòng)程度等作為特征,制定告警判定標(biāo)準(zhǔn),減少誤報(bào),提高預(yù)測(cè)準(zhǔn)確率。

猜你喜歡
運(yùn)維權(quán)重節(jié)點(diǎn)
高速公路智能運(yùn)維平臺(tái)
權(quán)重望寡:如何化解低地位領(lǐng)導(dǎo)的補(bǔ)償性辱虐管理行為?*
權(quán)重常思“浮名輕”
概念格的一種并行構(gòu)造算法
結(jié)合概率路由的機(jī)會(huì)網(wǎng)絡(luò)自私節(jié)點(diǎn)檢測(cè)算法
采用貪婪啟發(fā)式的異構(gòu)WSNs 部分覆蓋算法*
智能+時(shí)代的新運(yùn)維
——2019(第十屆)IT 運(yùn)維大會(huì)特別報(bào)道
Crosstalk between gut microbiota and antidiabetic drug action
為黨督政勤履職 代民行權(quán)重?fù)?dān)當(dāng)
權(quán)重漲個(gè)股跌 持有白馬藍(lán)籌
林甸县| 东莞市| 天气| 乌什县| 陆河县| 邯郸县| 龙山县| 科技| 松潘县| 西城区| 金乡县| 旬阳县| 房山区| 阿巴嘎旗| 新密市| 唐河县| 亳州市| 巨鹿县| 西畴县| 济阳县| 营口市| 五峰| 英德市| 萝北县| 岚皋县| 星子县| 融水| 平和县| 会泽县| 怀远县| 兴义市| 中西区| 龙泉市| 专栏| 涡阳县| 武隆县| 贡山| 盐池县| 根河市| 镇宁| 崇左市|