曹 琦
(解放軍68048部隊密管中心 蘭州 730030)
?
大數(shù)據(jù)技術(shù)在網(wǎng)絡(luò)辦公中的應(yīng)用研究
曹琦
(解放軍68048部隊密管中心蘭州730030)
摘要本文分析了網(wǎng)絡(luò)辦公中大數(shù)據(jù)技術(shù)的作用,探討了大數(shù)據(jù)技術(shù)在網(wǎng)絡(luò)辦公中的多種應(yīng)用方式,并指出大數(shù)據(jù)技術(shù)在應(yīng)用過程中需要注意的幾點問題。
關(guān)鍵詞大數(shù)據(jù)網(wǎng)絡(luò)辦公數(shù)據(jù)挖掘
Applied Research on the Big Data Technology in Network Office
Cao Qi
(Confidential Administration Center, the PLA 68048 Troops Lanzhou 730030)
Absract The role of network office big data technology is analyzed in this paper, and discussed the technology of data in network office in a variety of applications, and points out that the technology of data need to be awared of some problems in the process of application.
Keywords Big data Network office Data mining
信息時代萬物數(shù)化,大數(shù)據(jù)的重要性已成為共識,如何從中提取出有用的信息,應(yīng)用于網(wǎng)絡(luò)辦公,使其發(fā)揮出最大的效益,是當(dāng)前辦公信息化建設(shè)中亟待解決的一個重要問題。
隨著互聯(lián)網(wǎng)、移動設(shè)備、各類傳感器的廣泛應(yīng)用,數(shù)據(jù)正呈現(xiàn)爆炸式的增長。所謂大數(shù)據(jù)(Big data),通常是指一個組織、一個機構(gòu)創(chuàng)造的大量結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù),如網(wǎng)絡(luò)日志、視頻、語音、圖片和地理位置信息等,其數(shù)量往往達到千億億字節(jié)。然而“大數(shù)據(jù)”之“大”,不僅是數(shù)據(jù)量龐大,使得數(shù)據(jù)的收集、保存、維護以及共享都頗具挑戰(zhàn),其更多的意義在于通過這些數(shù)據(jù)的交換、整合、分析,可以發(fā)現(xiàn)新知識,創(chuàng)造新價值,帶來“大知識”、“大利潤”、“大發(fā)展”[2]。
早在1969年,全球零售巨頭沃爾瑪便利用計算機對消費者的購物行為進行數(shù)據(jù)分析,發(fā)現(xiàn)男性顧客在購買嬰兒尿布時,常常會順便“搭配”幾瓶啤酒來犒勞自己,于是推出了“啤酒+尿布”的捆綁銷售手段。這一數(shù)據(jù)分析成果,給沃爾瑪帶來了巨大的經(jīng)濟收益。我國在大數(shù)據(jù)的應(yīng)用方面也進行了一些初步有效的嘗試,如公安部的身份證在線驗證已廣泛應(yīng)用在金融、交通、公共安全等領(lǐng)域,政府網(wǎng)絡(luò)輿情監(jiān)控中的大數(shù)據(jù)應(yīng)用也取得了不錯的效果。
近年來,隨著數(shù)據(jù)庫、網(wǎng)絡(luò)等信息技術(shù)手段的廣泛應(yīng)用,無紙化、數(shù)字化、信息化的網(wǎng)絡(luò)辦公模式已逐步并將最終取代傳統(tǒng)的辦公模式。然而在發(fā)展過程中我們發(fā)現(xiàn),現(xiàn)有各類網(wǎng)絡(luò)辦公軟件由于部門層次多、管理鏈條長、面向?qū)ο髲V、管理范圍大、研發(fā)維護雜,導(dǎo)致網(wǎng)絡(luò)上需存儲、處理、關(guān)聯(lián)、挖掘的數(shù)據(jù)量愈加龐大,如何在海量的網(wǎng)絡(luò)數(shù)據(jù)中提取可用數(shù)據(jù),在繁雜的數(shù)據(jù)海洋中快速辨識所需信息,在斑駁的廢舊資料中準確捕獲高價有效名錄,對提高辦公效率、節(jié)約辦公資源、充分發(fā)揮網(wǎng)絡(luò)辦公的最大效能,是當(dāng)前迫切需要解決的問題。而大數(shù)據(jù)技術(shù)的發(fā)展,將海量的網(wǎng)絡(luò)數(shù)據(jù)作為辦公數(shù)據(jù)的可靠支撐,為網(wǎng)絡(luò)辦公的優(yōu)化、便捷、快速、預(yù)判、可靠等多類可見發(fā)展前景提供了技術(shù)支撐。
網(wǎng)絡(luò)辦公環(huán)境中的大數(shù)據(jù)來源只要表現(xiàn)為兩大類:
一是各業(yè)務(wù)部門用戶所處理的大量業(yè)務(wù)流。主要是指在業(yè)務(wù)辦理過程中,日常辦公系統(tǒng)所產(chǎn)生的各類業(yè)務(wù)信息。例如:人事、財務(wù)、科研、生產(chǎn)等各業(yè)務(wù)口存儲、交互的大量信息,這些業(yè)務(wù)信息大多分門別類、歸口管理。
二是基于辦公網(wǎng)絡(luò)各類硬件設(shè)備所產(chǎn)生的大量數(shù)據(jù)。它又可以分為靜態(tài)數(shù)據(jù)和動態(tài)數(shù)據(jù)兩類。網(wǎng)絡(luò)結(jié)構(gòu)、帶寬、各類服務(wù)器的性能指標等都屬于靜態(tài)數(shù)據(jù)。用戶的點擊量、服務(wù)器的故障率、網(wǎng)絡(luò)資源的占用、病毒在網(wǎng)絡(luò)中的爆發(fā)等大量日志信息都屬于動態(tài)數(shù)據(jù)。
而在通常的網(wǎng)絡(luò)辦公活動中,我們大多只滿足于對各類業(yè)務(wù)信息的處理,缺乏數(shù)據(jù)收集意識,尤其是利用數(shù)據(jù)創(chuàng)造效益的意識。隨著大數(shù)據(jù)時代的到來以及大數(shù)據(jù)技術(shù)的發(fā)展,網(wǎng)絡(luò)辦公和大數(shù)據(jù)技術(shù)的結(jié)合,將會創(chuàng)造一個全新的網(wǎng)絡(luò)辦公模式。
大數(shù)據(jù)技術(shù)能夠?qū)崿F(xiàn)網(wǎng)絡(luò)的智能規(guī)劃和管理,極大提高辦公網(wǎng)絡(luò)信息獲取、存儲、分析、分發(fā)等能力,推進建立安全、高效、智能的網(wǎng)絡(luò)辦公模式,滿足用戶的多樣化需求,促進網(wǎng)絡(luò)辦公信息化建設(shè)水平的整體躍升。
1、提升網(wǎng)絡(luò)辦公故障的預(yù)處理能力
隨著辦公網(wǎng)絡(luò)結(jié)構(gòu)的日益復(fù)雜,網(wǎng)絡(luò)中設(shè)備故障、網(wǎng)絡(luò)攻擊等情況出現(xiàn)的概率逐漸增加,“先報警、再處理”的維護管理流程已不能滿足用戶使用需求,需要運用大數(shù)據(jù)技術(shù)對網(wǎng)絡(luò)中的各種現(xiàn)象進行分析、預(yù)測,確保網(wǎng)絡(luò)安全、暢通。
一是實現(xiàn)對故障設(shè)備的預(yù)警。通過對網(wǎng)絡(luò)中運行設(shè)備的基礎(chǔ)信息、歷史運行數(shù)據(jù)、設(shè)備故障信息進行數(shù)據(jù)挖掘,可以得到設(shè)備故障狀態(tài)下的特征值及關(guān)聯(lián)參數(shù)值等信息,將獲取的信息與設(shè)備當(dāng)前運行狀態(tài)監(jiān)測值進行比較分析,可以判斷設(shè)備運行是否正常,或設(shè)備的某種故障將會產(chǎn)生哪些聯(lián)動效應(yīng),并對設(shè)備一段時間內(nèi)的運行狀態(tài)進行預(yù)測,以便能夠及早發(fā)現(xiàn)故障,確保各類設(shè)備的正常運行。
二是實現(xiàn)對網(wǎng)絡(luò)防御的預(yù)警。大數(shù)據(jù)瓦解了傳統(tǒng)信息體系架構(gòu),從以數(shù)據(jù)倉庫為中心轉(zhuǎn)化為具有流動、連接和信息共享的數(shù)據(jù)池。通過大數(shù)據(jù)技術(shù),可以實時檢測計算機網(wǎng)絡(luò)的各種活動,通過對網(wǎng)絡(luò)異常行為的發(fā)現(xiàn)、預(yù)警,網(wǎng)絡(luò)流量與狀態(tài)的監(jiān)測、分析,來處理眾多安全事件,從而提升網(wǎng)絡(luò)辦公體系的安全防御能力[4]。
2、增強數(shù)據(jù)互操作性,共享大數(shù)據(jù)資源
各業(yè)務(wù)部門的數(shù)據(jù)信息除少量由于業(yè)務(wù)需要交流互通外,大多被孤立于其所屬部門,不能被廣泛訪問和使用,阻礙了信息的共享,限制了一些需要綜合運用各方面數(shù)據(jù)的應(yīng)用的發(fā)展,降低了數(shù)據(jù)的價值,因此,有必要進行資源的整合與共享。
一是實現(xiàn)數(shù)據(jù)的關(guān)系價值。數(shù)據(jù)整合往往會產(chǎn)生“1+1>2”的效果,兩組貌似相互獨立、沒有關(guān)聯(lián)的數(shù)據(jù),一旦整合相聯(lián),可能會產(chǎn)生意想不到的效果。在信息時代,無論是個人的日常消費等小事,還是事關(guān)健康、教育的重大決策,都會在各類信息系統(tǒng)中留下數(shù)據(jù)痕跡[2]。這些痕跡,保存在不同的系統(tǒng)中,可能各自的作用都不大,但如果建立起集中存儲的大數(shù)據(jù)環(huán)境,通過數(shù)據(jù)整合和信息加總,就可以再現(xiàn)一個人的生活軌跡和全景。在網(wǎng)絡(luò)辦公環(huán)境內(nèi)亦是如此,通過破解業(yè)務(wù)部門間獨立分割的傳統(tǒng)思維,打破數(shù)據(jù)資源的自我封閉狀態(tài),實現(xiàn)各業(yè)務(wù)系統(tǒng)數(shù)據(jù)的整合,使得各業(yè)務(wù)部門之間的數(shù)據(jù)可以彼此印證、互相解釋,挖掘數(shù)據(jù)的關(guān)系價值,用數(shù)據(jù)揭示事物的全景式真相,為決策者提供決策依據(jù)。
二是實現(xiàn)數(shù)據(jù)的多維查詢。這里所謂的“維”,是指人們觀察事物、計算數(shù)據(jù)的特定角度。例如,全球零售巨頭沃爾瑪如果要分析自己的銷售量,可以按時間序列分析、商品門類分析、地區(qū)國別分析,也可以按進貨渠道分析、客戶群體分析,這些不同的分析角度,就是“維度”。在網(wǎng)絡(luò)辦公環(huán)境中,通過對數(shù)據(jù)的整合、共享,用戶可以根據(jù)自己的實際需求,從多個維度對數(shù)據(jù)進行查詢分析,從而更大程度低發(fā)揮數(shù)據(jù)自身的價值。
3、合理配置資源,實現(xiàn)綠色通信
隨著辦公網(wǎng)絡(luò)終端數(shù)據(jù)的激增,網(wǎng)絡(luò)規(guī)模的擴大,以及用戶對網(wǎng)絡(luò)辦公的依賴,網(wǎng)絡(luò)負載日益加重。因此有必要對用戶行為、資源使用、網(wǎng)絡(luò)帶寬占用情況等數(shù)據(jù)進行提取、轉(zhuǎn)換、分析,找出影響網(wǎng)絡(luò)質(zhì)量的原因,降低能源消耗,營造綠色網(wǎng)絡(luò)。
一是實現(xiàn)網(wǎng)絡(luò)資源的動態(tài)分配。通過動態(tài)自適應(yīng)的方法,充分考慮服務(wù)需求、網(wǎng)絡(luò)流量等情況,再配備相應(yīng)的網(wǎng)絡(luò)資源。例如,當(dāng)用戶暫不使用某些資源時,關(guān)閉這些應(yīng)用模塊,使其進入休眠狀態(tài),再需使用時,對其進行喚醒,使得現(xiàn)有網(wǎng)絡(luò)資源獲得最佳效益,降低網(wǎng)絡(luò)能源消耗。
二是實現(xiàn)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化調(diào)整。通過對網(wǎng)絡(luò)中網(wǎng)速、流量、資源占用等各類監(jiān)測數(shù)據(jù)的收集、分析,實現(xiàn)對網(wǎng)絡(luò)結(jié)構(gòu)的調(diào)整,通過對參數(shù)的修改、網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化、設(shè)備配置的更改等一些技術(shù)手段,提高網(wǎng)絡(luò)運行質(zhì)量,提升用戶使用感受[3]。
網(wǎng)絡(luò)辦公中大數(shù)據(jù)技術(shù)的應(yīng)用既不可一蹴而就,又不可??坎磺?,尤其是現(xiàn)在仍處于大數(shù)據(jù)技術(shù)研究應(yīng)用的初步階段,有很多實際問題需要解決。在具體部署時,應(yīng)考慮各種技術(shù)組件的有效組合,聚焦于具體環(huán)境,實現(xiàn)大數(shù)據(jù)技術(shù)的有效應(yīng)用,這里簡單談五個方面的問題。
1、以用促建
數(shù)據(jù)平臺作為信息系統(tǒng)的“心臟”,不“跳動”,就會僵死;不運用,就難以發(fā)現(xiàn)和解決平臺建設(shè)的具體問題,就不可能推動其不斷完善更新。因此,必須堅持“以用促建、建用結(jié)合”的方針。有人認為當(dāng)前大數(shù)據(jù)技術(shù)還不夠成熟,存在“等、靠、看”心理,覺得大數(shù)據(jù)建設(shè)必須是全面的、完備的,然而這樣的觀念只能阻礙大數(shù)據(jù)技術(shù)的發(fā)展。我們必須立足現(xiàn)有基礎(chǔ)、細致分析需求、認真查找不足、規(guī)范建章立制,逐步推進大數(shù)據(jù)技術(shù)在辦公網(wǎng)絡(luò)中的應(yīng)用,并且在應(yīng)用過程中,通過不斷發(fā)現(xiàn)問題、解決問題,促進應(yīng)用的完善。
2、數(shù)據(jù)整合
辦公系統(tǒng)中的數(shù)據(jù)類型早已不是單一的以文本為主的結(jié)構(gòu)化數(shù)據(jù),還存在著如圖片、公告、文件、工具和項目交流信息等大量的非結(jié)構(gòu)化數(shù)據(jù),更有充斥著廣泛存在于社交網(wǎng)絡(luò)和電子商務(wù)中的音頻、視頻、地理位置等多類型數(shù)據(jù)。據(jù)統(tǒng)計,網(wǎng)絡(luò)辦公中75%的數(shù)據(jù)屬于非結(jié)構(gòu)化數(shù)據(jù)。雖然目前結(jié)構(gòu)化數(shù)據(jù)的處理方法已相對成熟,但是數(shù)量龐大的非結(jié)構(gòu)化數(shù)據(jù)還沒有真正有效的快速處理方法,只有將非結(jié)構(gòu)化數(shù)據(jù)進行統(tǒng)一、整合,大數(shù)據(jù)技術(shù)才能夠在更廣泛的范圍中真正發(fā)揮其作用。
3、數(shù)據(jù)關(guān)聯(lián)
當(dāng)前網(wǎng)絡(luò)辦公環(huán)境復(fù)雜、政出多門、各行各業(yè)各部門基本都有自己的業(yè)務(wù)平臺和數(shù)據(jù)庫,各類業(yè)務(wù)模塊和數(shù)據(jù)類型分布在不同的辦公平臺上,這些被割裂的數(shù)據(jù)在單一業(yè)務(wù)平臺無法得到充分利用,而不同業(yè)務(wù)模塊的數(shù)據(jù)由于數(shù)據(jù)類型、編碼等原因還未實現(xiàn)共享、關(guān)聯(lián),即使部分部門對數(shù)據(jù)進行了整合,也僅僅基于對諸如姓名、時間等關(guān)鍵業(yè)務(wù)的數(shù)據(jù)進行整合和利用,非關(guān)鍵業(yè)務(wù)的數(shù)據(jù)仍然被忽視。而網(wǎng)絡(luò)辦公中單一業(yè)務(wù)模塊的數(shù)據(jù)存在價值遠遠小于所有辦公平臺數(shù)據(jù)關(guān)聯(lián)起來后產(chǎn)生的質(zhì)變性的價值爆炸,因此,要在網(wǎng)絡(luò)辦公中充分發(fā)揮大數(shù)據(jù)技術(shù)的神奇作用,數(shù)據(jù)關(guān)聯(lián)與分析將面臨巨大的挑戰(zhàn)。
4、數(shù)據(jù)安全
在大數(shù)據(jù)環(huán)境構(gòu)建過程中,如何確保數(shù)據(jù)的安全保密是首先需要解決的問題,主要是指數(shù)據(jù)內(nèi)容的安全保密,防止數(shù)據(jù)的泄露、篡改、偽造或破壞。為此,可以通過身份認證、數(shù)字簽名、加密保護等技術(shù)手段,確保數(shù)據(jù)傳輸、使用和存儲安全。
5、網(wǎng)絡(luò)安全
對于網(wǎng)絡(luò)安全來說,大數(shù)據(jù)技術(shù)可謂是一把雙刃劍,既能通過海量數(shù)據(jù)的收集、分析,對網(wǎng)絡(luò)安全形勢作出預(yù)測,同時,不可控的海量數(shù)據(jù)又為病毒傳播、黑客攻擊、系統(tǒng)漏洞等安全威脅的滋生提供了土壤和漏洞,對網(wǎng)絡(luò)辦公系統(tǒng)的安全設(shè)計提出了挑戰(zhàn)。在大數(shù)據(jù)環(huán)境下的辦公網(wǎng)絡(luò),需要使用多種安全技術(shù)來防范??梢詮脑L問控制、網(wǎng)絡(luò)隔離、入侵檢測、病毒防治、安全審計等多個方面來確保大數(shù)據(jù)環(huán)境辦公網(wǎng)絡(luò)安全。
大數(shù)據(jù)是一個單位、行業(yè)乃至國家的重要財產(chǎn),能夠提高決策的科學(xué)性、精準性,提升預(yù)測預(yù)警能力、應(yīng)急響應(yīng)能力,優(yōu)化工作流程,輔助各類決策,實現(xiàn)數(shù)字化管理。借助大數(shù)據(jù)技術(shù)能夠逐步實現(xiàn)立體化、多層次、全方位的網(wǎng)絡(luò)辦公體系,加快推進智能化網(wǎng)絡(luò)辦公模式的應(yīng)用。
參考文獻
[1]孔德智,劉群興,王穎凱,張瑩瑩.大數(shù)據(jù)技術(shù)及其應(yīng)用研究[J].計算機科學(xué)與技術(shù),2013.11(31).
[2]徐子沛.大數(shù)據(jù)[M].廣西師范大學(xué)出版社,2012.
[3]張平,崔琪楣.大數(shù)據(jù)驅(qū)動的綠色通信網(wǎng)絡(luò)[J].深圳大學(xué)學(xué)報(理工版),2013.06.
[4]穆祥昆,王勁松,薛羽豐.基于活躍熵的網(wǎng)絡(luò)異常流量檢測方法[J].通信學(xué)報,2013.24.
曹琦:解放軍68048部隊密管中心,高級工程師。
作者簡介
中圖分類號C931.4
文獻標識碼B
文章編號160106-7186