姜 珂/文
隨著信息技術(shù)的發(fā)展,物聯(lián)網(wǎng)、云計算、移動互聯(lián)技術(shù)、云時代等各種新信息化名詞不斷出現(xiàn),人們驟然發(fā)現(xiàn)已不知不覺地處在新的信息化時代——大數(shù)據(jù)時代,并成了大數(shù)據(jù)中的一員。隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)的重要性逐漸突顯,數(shù)據(jù)已經(jīng)成為一種重要的生產(chǎn)要素,它和黃金、能源一樣寶貴,卻又能實現(xiàn)反復(fù)的利用。大數(shù)據(jù)在帶來挑戰(zhàn)與機遇的同時,也給人帶來了更多的思考。
大數(shù)據(jù)可以理解為大規(guī)模和超大規(guī)模的數(shù)據(jù)集,但是大數(shù)據(jù)時代不僅僅是對這些數(shù)據(jù)的存儲和掌握,最重要的意義在于對特定的數(shù)據(jù)集進行專業(yè)化處理,以達到盈利的目的。業(yè)界對大數(shù)據(jù)的特征概括為4個V:Volume(數(shù)據(jù)量)、Variety(類型多樣)、Value(價值)、Velocity(速度)。
數(shù)據(jù)量巨大:由于新媒體技術(shù)的發(fā)展,信息傳遞的方式在改變,速度在加快,各種終端設(shè)備產(chǎn)生了大量的數(shù)據(jù)。
數(shù)據(jù)類型繁多:由于新媒體技術(shù)的產(chǎn)生,數(shù)據(jù)不僅僅是結(jié)構(gòu)化數(shù)據(jù),更多的是非架構(gòu)化數(shù)據(jù),例如視頻、聲音、文字、照片等,數(shù)據(jù)類型的多樣化給數(shù)據(jù)處理分析能力提出了更高的要求。
價值密度低:大數(shù)據(jù)時代,人們被各種數(shù)據(jù)不停地轟炸著,但是真正有價值的數(shù)據(jù)也許瞬時而過。以監(jiān)控視頻為例,不間斷的錄制好幾天,可能真正需要的數(shù)據(jù)也就那2、3秒。但是就這2、3秒也許就能起到關(guān)鍵性的作用,具有很高的利用價值,
速度處理快:快速處理相關(guān)數(shù)據(jù)是大數(shù)據(jù)時代的一個顯著的特征,也是區(qū)別傳統(tǒng)數(shù)據(jù)處理的一個重要指標(biāo)。尤其是在數(shù)據(jù)量龐大、數(shù)據(jù)類型繁多,數(shù)據(jù)價值密集度低的情況下,數(shù)據(jù)的處理速度將會直接影響企業(yè)的發(fā)展,且受到數(shù)據(jù)時效性的約束,大數(shù)據(jù)要求數(shù)據(jù)的處理速度更快,實時性更高,提煉的數(shù)據(jù)更精準(zhǔn)。
從大數(shù)據(jù)的4個特征看,大數(shù)據(jù)不僅僅是一項技術(shù)或一個平臺,而應(yīng)該是一個集成性的平臺,一個能夠幫助我們很好的收集、匯總、處理數(shù)據(jù)的平臺,能迅速地從垃圾數(shù)據(jù)中提煉出對企業(yè)有幫助的信息。
大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)的另一個顯著差異是具有更加豐富的數(shù)據(jù)類型。傳統(tǒng)數(shù)據(jù)偏重于描述對象,而大數(shù)據(jù)更傾向于對數(shù)據(jù)過程的記錄。為了便于大家理解,下面簡單地舉個例子說明傳統(tǒng)數(shù)據(jù)與大數(shù)據(jù)的記錄方式有何區(qū)別。
傳統(tǒng)數(shù)據(jù)的記錄方式如表1。
表1 傳統(tǒng)方式下小明的一日三餐記錄
大數(shù)據(jù)的記錄方式如表2。
表2 大數(shù)據(jù)時代下小明的一日三餐記錄
可以很明顯地看出,傳統(tǒng)數(shù)據(jù)和大數(shù)據(jù)記錄數(shù)據(jù)的最大區(qū)別是大數(shù)據(jù)不僅對對象進行了描述,還加入了地點、時間等維度,這樣的數(shù)據(jù)記錄的是一個過程,從小明到達餐廳之前開始一直到小明離開餐廳結(jié)束,這整個過程都會被記錄下來。而傳統(tǒng)數(shù)據(jù)的記錄方式更傾向于對結(jié)果的簡單描述。
當(dāng)然,大數(shù)據(jù)能記錄的用戶就餐數(shù)據(jù)遠不局限于上述所列的字段,理想狀況的大數(shù)據(jù)監(jiān)控甚至?xí)涗浻脩舫燥埖姆绞健⒊燥垥r的行為、吃飯時的面部表情等一系列數(shù)據(jù),這些數(shù)據(jù)反映了用戶對就餐環(huán)境的感受,對餐食口味的反應(yīng),進一步可以用來改進就餐環(huán)境、食物口味,給出點餐建議。
大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)的關(guān)鍵差異在于其價值的不可估量。傳統(tǒng)數(shù)據(jù)的價值體現(xiàn)在信息表象和傳遞,是對現(xiàn)象的反饋和描述,讓人通過數(shù)據(jù)去了解數(shù)據(jù)。而大數(shù)據(jù)記錄了現(xiàn)象發(fā)生的整個過程,通過數(shù)據(jù)不僅能夠了解對象,還能分析對象,把握對象運作的規(guī)律,挖掘?qū)ο髢?nèi)部的結(jié)構(gòu)與特點,甚至能了解對象自己都不知道的信息。
大數(shù)據(jù)價值的特殊之處在于它的可挖掘性,同樣的一堆數(shù)據(jù),不同的人能從中看到不同層次的東西。就好像同樣見一個人,有些人只看他的外形漂不漂亮,有些人能從他的表情中讀出心理活動,從眼神中看出閱歷,從衣著打扮中了解品位,從鞋子上了解生活習(xí)慣。我們要用技巧與實力去挖掘出來這些深層次的非表象的內(nèi)容,這就是我們統(tǒng)計大數(shù)據(jù)的現(xiàn)實意義。
運維中心在運維過程中有可能產(chǎn)生的數(shù)據(jù)一般來說有以下四種:(1)工作交流類軟件:用戶通過工作交流軟件與運維人員進行交流,工作交流軟件上會記錄用戶的疑問和難點。(2)管理類流程數(shù)據(jù):用戶的申請記錄、故障問題的處理工單、設(shè)備的部署信息等。(3)服務(wù)目錄變更、出入口管理數(shù)據(jù):設(shè)備的出入庫管理和服務(wù)目錄變更管理類數(shù)據(jù)。(4)硬件系統(tǒng)的狀態(tài)監(jiān)控信息:主要是對硬件設(shè)備的電源供電環(huán)境、機房環(huán)境狀況和設(shè)備的運行狀態(tài)進行監(jiān)控而得到的數(shù)據(jù),如機房溫度、機房濕度、(電源、內(nèi)存、CPU)的運行狀態(tài)信息等。
運維中心每天都會從各種渠道得到大量的數(shù)據(jù),而這些數(shù)據(jù)完全滿足大數(shù)據(jù)時代的4V特征:數(shù)據(jù)量龐大,每天有無數(shù)人咨詢各種各樣的問題或提出各種各樣的服務(wù)請求;數(shù)據(jù)類型繁雜多樣,有文字、視頻、圖片、語音等非結(jié)構(gòu)化數(shù)據(jù)較多;數(shù)據(jù)價值密度低,很多監(jiān)控類數(shù)據(jù)均沒有利用價值;目前運維中心數(shù)據(jù)處理能力不高,對這些數(shù)據(jù)的分析和利用均靠運維人員的運維經(jīng)驗和專業(yè)技能,且大多數(shù)都是以報表或圖表的形式來進行展示,分析的效率極低,使用率還不足10%,且實效性差,因此,難以滿足運維中心高效工作的要求。
解決故障問題時,通常由于信息不對稱或不及時造成故障,問題遲遲得不到徹底解決,大部分時候運維人員僅僅能想出一個臨時解決方案,這樣的結(jié)果是導(dǎo)致重復(fù)告警,多次的重復(fù)告警會讓運維人員產(chǎn)生麻痹思想,降低了運維人員對故障的警覺性和敏感性。
傳統(tǒng)的運維方式通常依賴于運維專家的運維經(jīng)驗,而一個運維專家需要長時間的培訓(xùn)或工作才能得到,周期非常長,且運維專家在處理問題時的主觀性很強,對處理故障問題有很大的影響。因此,如何快速的提高運維數(shù)據(jù)的利用率成了擺在運維人員面前的一道難題。
現(xiàn)階段如何在這海量的運維數(shù)據(jù)里,發(fā)現(xiàn)運維的價值、方向,提升運維管理水平,提高運維人員的業(yè)務(wù)技能、從而獲得較高的用戶滿意度,將成為運維中心需要深度思索的問題。
工作藍信、郵件、微信、QQ等充斥著運維中心的角角落落。這種以網(wǎng)絡(luò)為基礎(chǔ)的溝通方式方便快捷,而得到了人們的青睞,現(xiàn)在的人們可以輕松地用電腦或手機實現(xiàn)各種類型的文檔和信息的傳遞,運維中心人員在和用戶交流過程中,大數(shù)據(jù)分析平臺可以協(xié)作運維人員分析出哪些區(qū)域的用戶基礎(chǔ)比較薄弱,哪些區(qū)域的用戶對某些服務(wù)請求有比較高的需求,哪種問題有比較多的用戶咨詢這種通過數(shù)據(jù)互通,場景互聯(lián),讓數(shù)據(jù)維度更加豐富,從而能更好地知道用戶是誰,用戶的痛點在哪里。然后幫助運維人員更好地知道用戶需求,運維中心人員就可以有針對性地對這些用戶和問題進行分類處理,提供更好的服務(wù),以提高用戶滿意度,從而帶來更大的數(shù)據(jù)價值。
近年來隨著網(wǎng)絡(luò)和信息安全問題的日益復(fù)雜和攻擊手段多樣化,對網(wǎng)絡(luò)與信息安全風(fēng)險的防護能力提出了更高的要求。雖然不少用戶都通過Web應(yīng)用防火墻、入侵防御系統(tǒng)、抗拒絕服務(wù)攻擊系統(tǒng)、下一代防火墻等安全防護手段構(gòu)成了一整套安全防護體系,但是如果各類安全防護手段都是獨立部署,缺乏公司層面統(tǒng)一的日志管理分析系統(tǒng),就不能及時發(fā)現(xiàn)各種異常行為事件,給信息系統(tǒng)的整體安全性和可用性帶來極大的安全隱患。因此,需要通過部署大數(shù)據(jù)分析平臺,收集、索引和利用所有應(yīng)用程序、服務(wù)器或網(wǎng)絡(luò)設(shè)備所生成的機器數(shù)據(jù),包括操作系統(tǒng)、虛擬化、應(yīng)用程序、數(shù)據(jù)庫和聯(lián)網(wǎng)數(shù)據(jù)。通過搜索、警告、報表和知識庫,關(guān)聯(lián)分析跨越多個系統(tǒng)的復(fù)雜事件,并快速定位安全事件、集中排查安全風(fēng)險和及時發(fā)現(xiàn)安全威脅,提升IT業(yè)務(wù)整體智能化水平。
隨著高科技產(chǎn)品的不斷推出,用戶獲取知識的渠道也越來越廣泛多樣。通過手機或電腦獲取相關(guān)知識成為人們目前使用的最為廣泛的方式。因此,把用戶常咨詢的問題或故障處理步驟,做成知識存放在知識庫里,建立長期有效的知識庫。把運維經(jīng)驗知識化,利用人工智能系統(tǒng)可以做到7×24小時的常見問題答疑,從而實現(xiàn)知識共享,又能極大地方便用戶,提高用戶對系統(tǒng)的滿意度,同時還能提高運維響應(yīng)速度和服務(wù)質(zhì)量,最后還能避免由于運維人員的流失造成的知識流失,降低運維成本。而大數(shù)據(jù)分析平臺可以根據(jù)依據(jù)用戶的咨詢情況分析哪些可以形成知識存放于知識庫,并提醒運維人員對該知識進行相應(yīng)的處理;可以協(xié)助運維人員知曉知識庫里哪些知識常被查詢,用于確定哪些知識是屬于有效的知識;還可以在用戶查詢知識庫信息的時候,把相關(guān)信息都推送給用戶,以縮短用戶查詢的時間,提高用戶查詢的準(zhǔn)確性,并可以督促運維人員不停地優(yōu)化知識庫里的相關(guān)知識,達到更好服務(wù)用戶的目的。
在大數(shù)據(jù)時代,高效利用各種數(shù)據(jù)資源為用戶提供更好的服務(wù),已成為運維中心競爭的關(guān)鍵手段,大數(shù)據(jù)挖掘分析計算就是從海量的、非完整性的、價值密度低的和隨機的數(shù)據(jù)中提取隱含在其中的有價值的數(shù)據(jù)和信息的過程。對運維中心而言,對運維數(shù)據(jù)進行進一步的分析挖掘?qū)⒂兄趲椭\維中心發(fā)現(xiàn)新的價值點,有助于幫助運維中心轉(zhuǎn)變被動響應(yīng)的運維模式,提供高其積極主動性。