陳 臣(蘭州財經(jīng)大學信息中心)
基于大數(shù)據(jù)驅(qū)動的圖書館動態(tài)網(wǎng)絡(luò)性能評估和服務(wù)質(zhì)量保證研究
陳臣(蘭州財經(jīng)大學信息中心)
文章研究了基于大數(shù)據(jù)驅(qū)動的圖書館網(wǎng)絡(luò)動態(tài)性能評估和服務(wù)質(zhì)量保證,可滿足圖書館新服務(wù)模式對網(wǎng)絡(luò)性能的需求,有效提升網(wǎng)絡(luò)的可用性和可靠性,實現(xiàn)了圖書館網(wǎng)絡(luò)的靈活組網(wǎng)、無線資源的優(yōu)化配置和低能耗綠色通信。
大數(shù)據(jù);圖書館;網(wǎng)絡(luò)性能;服務(wù)質(zhì)量
網(wǎng)絡(luò)是圖書館生產(chǎn)力的重要組成和讀者服務(wù)供給的支撐平臺,作為圖書館管理、服務(wù)和運營數(shù)據(jù)的傳輸中樞,網(wǎng)絡(luò)的安全性、有效性、經(jīng)濟性和可控性,直接關(guān)系到圖書館QOS(服務(wù)質(zhì)量)保證的有效性和讀者閱讀活動滿意度。當前,圖書館網(wǎng)絡(luò)呈現(xiàn)出系統(tǒng)結(jié)構(gòu)復(fù)雜度快速增長、承載業(yè)務(wù)類型多樣化、服務(wù)負載突發(fā)和網(wǎng)絡(luò)傳輸質(zhì)量要求高的特點,圖書館網(wǎng)絡(luò)的數(shù)據(jù)環(huán)境也具有數(shù)據(jù)海量、多類型、低價值密度和處理快速的特點,因此,圖書館已經(jīng)進入了大數(shù)據(jù)時代。如何對圖書館網(wǎng)絡(luò)大數(shù)據(jù)進行有效的采集、挖掘、處理、分析和決策,準確發(fā)現(xiàn)圖書館網(wǎng)絡(luò)要素之間的關(guān)系和蘊涵的知識,為圖書館網(wǎng)絡(luò)基礎(chǔ)設(shè)施平臺的構(gòu)建和網(wǎng)絡(luò)承載力提升提供科學的大數(shù)據(jù)決策支持,已成為圖書館界重點關(guān)注的問題。
1.1圖書館網(wǎng)絡(luò)面臨嚴重的安全威脅
(1)伴隨物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)和云計算等技術(shù)在圖書館中應(yīng)用的深入,圖書館網(wǎng)絡(luò)承載的數(shù)據(jù)量正以指數(shù)級增長。這些數(shù)據(jù)主要由個人計算設(shè)備、移動智能閱讀終端設(shè)備、可穿戴設(shè)備、管理與運營服務(wù)器、視頻采集設(shè)備、監(jiān)控設(shè)備等產(chǎn)生,具有高價值、知識描述、分析預(yù)測和隱私性的特點,已成為政府部門、第三方服務(wù)商和黑客爭奪的重要資源。黑客可通過惡意軟件、惡意代碼等終端滲透攻擊的方式,在網(wǎng)絡(luò)上實現(xiàn)對圖書館敏感數(shù)據(jù)的竊取、篡改和刪添。這類攻擊具有深層滲透、長期潛伏和隱蔽等特點。[1]
(2)隨著圖書館網(wǎng)絡(luò)性能和數(shù)據(jù)承載能力的提升,網(wǎng)絡(luò)的系統(tǒng)結(jié)構(gòu)也日趨龐大、復(fù)雜。如何實現(xiàn)硬件、軟件和管理員的最優(yōu)化結(jié)合,對網(wǎng)絡(luò)資源進行有效的監(jiān)視、測試、配置、分析、評價和控制,是及時發(fā)現(xiàn)、報告和處理網(wǎng)絡(luò)安全問題與故障的重要環(huán)節(jié)。
(3)當前,圖書館服務(wù)的模式、內(nèi)容和系統(tǒng)平臺呈現(xiàn)多樣化發(fā)展趨勢,多元化的操作系統(tǒng)平臺、閱讀終端、第三方數(shù)據(jù)庫和中間件,會導(dǎo)致圖書館網(wǎng)絡(luò)的開放性、兼容性、可靠性和可控性降低。如何有效發(fā)現(xiàn)、修補第三方應(yīng)用系統(tǒng)與軟件的漏洞及后門,是提高圖書館網(wǎng)絡(luò)安全性以及預(yù)防重大安全事件的關(guān)鍵。
1.2網(wǎng)絡(luò)實時優(yōu)化的需求
(1)大數(shù)據(jù)時代,圖書館網(wǎng)絡(luò)具有IT系統(tǒng)結(jié)構(gòu)復(fù)雜、承載業(yè)務(wù)多樣、用戶數(shù)快速增長、網(wǎng)絡(luò)設(shè)備異構(gòu)的特點,且網(wǎng)絡(luò)運行也存在著移動數(shù)據(jù)傳輸海量、數(shù)據(jù)流突發(fā)、負載分布不均勻和服務(wù)可控性差的問題。目前,傳統(tǒng)網(wǎng)絡(luò)IT環(huán)境下所采用的話務(wù)數(shù)據(jù)統(tǒng)計分析、現(xiàn)場數(shù)據(jù)采集測試、信令分析、數(shù)據(jù)庫核查與參數(shù)分析、網(wǎng)絡(luò)設(shè)備告警與排查、用戶投訴分析等方法,過分依賴人工對數(shù)據(jù)的采集、統(tǒng)計與分析,已不適應(yīng)大數(shù)據(jù)環(huán)境下快速、實時地對復(fù)雜網(wǎng)絡(luò)性能檢測與優(yōu)化的需求。圖書館必須結(jié)合網(wǎng)絡(luò)大數(shù)據(jù)的動態(tài)、實時決策支持,才能對網(wǎng)絡(luò)進行實時的優(yōu)化,并且確保網(wǎng)絡(luò)具有較高的資源利用率和管理時效性。
(2)基于無線網(wǎng)絡(luò)支持的圖書館個性化移動閱讀增值服務(wù),已成為圖書館服務(wù)發(fā)展的主要趨勢。目前,移動閱讀服務(wù)對無線網(wǎng)絡(luò)傳輸帶寬、網(wǎng)絡(luò)的綜合吞吐量、無線網(wǎng)絡(luò)覆蓋范圍的動態(tài)實時可控性具有較高要求,讀者希望基于智能終端和無線網(wǎng)絡(luò)的支持,可以動態(tài)、高速地實現(xiàn)對圖書館大數(shù)據(jù)閱讀內(nèi)容的即時存儲、下載和展示。因此,如何基于移動互聯(lián)網(wǎng)絡(luò)資源的分配、服務(wù)負載分布和讀者地理位置等大數(shù)據(jù)決策支持,實現(xiàn)無線傳輸網(wǎng)絡(luò)拓撲結(jié)構(gòu)的優(yōu)化和資源科學分配,是降低圖書館移動閱讀服務(wù)成本和實現(xiàn)網(wǎng)絡(luò)資源精細化管理的關(guān)鍵。[2]
1.3圖書館網(wǎng)絡(luò)的QOS保證需求
(1)隨著移動智能閱讀終端電池續(xù)航能力的提升和制造成本的大幅下降,移動閱讀已成為圖書館服務(wù)擺脫時間、地域和閱讀方式對讀者限制的主要模式。但移動通信自身存在的無線信號傳輸開放、安全保障難度大、易受干擾和信道不穩(wěn)定等因素,可能會導(dǎo)致圖書館在一對多點用戶服務(wù)時,讀者閱讀服務(wù)數(shù)據(jù)傳輸?shù)馁|(zhì)量、實時性和連續(xù)性受到影響。
(2)移動智能閱讀具有閱讀內(nèi)容復(fù)雜、閱讀方式多樣和讀者廣泛分布于世界不同地域的特點,因此,圖書館服務(wù)網(wǎng)絡(luò)會跨越多個運營商網(wǎng)絡(luò)和AS(自治系統(tǒng))。這些網(wǎng)絡(luò)存在著拓撲結(jié)構(gòu)復(fù)雜多變、網(wǎng)絡(luò)傳輸基礎(chǔ)設(shè)施設(shè)備和通信協(xié)議兼容性差的問題,特別是當圖書館服務(wù)數(shù)據(jù)跨越多個AS鏈路時,較高的的數(shù)據(jù)傳輸時延和帶寬瓶頸問題,會嚴重影響讀者的閱讀服務(wù)體驗。[3]
(3)圖書館服務(wù)網(wǎng)絡(luò)具有多網(wǎng)絡(luò)結(jié)構(gòu)、多運營商保障、多傳輸模式和多服務(wù)對象的特點。由于網(wǎng)絡(luò)不同域間路由采用BGP(邊界網(wǎng)關(guān)協(xié)議)協(xié)議,而BGP協(xié)議是唯一能夠妥善處理好不相關(guān)路由域間的多路連接的協(xié)議,因此,當圖書館服務(wù)網(wǎng)絡(luò)出現(xiàn)故障時,BGP協(xié)議所采用的“盡力而為”工作方式會不停地選擇最佳路由,會因路由震蕩而導(dǎo)致路由選擇時間過長,從而影響圖書館網(wǎng)絡(luò)的傳輸質(zhì)量。
1.4移動大數(shù)據(jù)閱讀對無線網(wǎng)絡(luò)性能有較高的需求
伴隨智能手機、移動閱讀終端和可穿戴設(shè)備的快速發(fā)展與普及,圖書館移動數(shù)據(jù)流量和控制信令呈現(xiàn)非線性指數(shù)增長趨勢,移動數(shù)據(jù)已逐漸成為圖書館大數(shù)據(jù)的組成主體。
(1)移動數(shù)據(jù)具備海量、多類型、高價值和處理快速的大數(shù)據(jù)“4V”特性,傳統(tǒng)的擴展移動傳輸網(wǎng)絡(luò)規(guī)模和無線資源管理等方法,已不能適應(yīng)移動大數(shù)據(jù)時代的海量數(shù)據(jù)無線傳輸需求,要求圖書館移動通信網(wǎng)絡(luò)必須通過無線新頻譜拓展、移動傳輸新技術(shù)、智能立體化組網(wǎng)等方法,從多角度、多層面提高圖書館無線網(wǎng)絡(luò)對海量無線數(shù)據(jù)傳輸?shù)闹文芰Α?/p>
(2)圖書館服務(wù)模式的變革和讀者閱讀需求的提升,使移動閱讀服務(wù)的模式向具有多樣化和互聯(lián)網(wǎng)特征的新業(yè)務(wù)拓展。移動閱讀新業(yè)務(wù)的非結(jié)構(gòu)化數(shù)據(jù)比例占據(jù)圖書館大數(shù)據(jù)總量的95%以上,這些海量非結(jié)構(gòu)化數(shù)據(jù)隨機存儲、散落于圖書館移動網(wǎng)絡(luò)的傳輸節(jié)點和讀者閱讀終端中,且這些數(shù)據(jù)具有存儲、讀取和傳輸隨機空-時域,數(shù)據(jù)間的格式兼容性差,對圖書館移動傳輸網(wǎng)絡(luò)的承載能力、智能可控性、控制信令開銷和無線資源分配等帶來了挑戰(zhàn)。
(3)據(jù)統(tǒng)計,讀者移動閱讀活動的熱點區(qū)域業(yè)務(wù)量占總業(yè)務(wù)量的80%以上,且服務(wù)數(shù)據(jù)流和業(yè)務(wù)控制信令數(shù)據(jù)在空、時域上,具有極強的動態(tài)變化、分布不均勻和難以預(yù)測特性等特點。比如學校、政府機構(gòu)、企事業(yè)機關(guān)在法定的工作時間,其移動傳輸數(shù)據(jù)流呈現(xiàn)海量、突發(fā)的特點,而在休息時間讀者的住宅區(qū)則呈現(xiàn)移動數(shù)據(jù)流快速激增現(xiàn)象。因此,如何根據(jù)每一天中圖書館移動閱讀負載在空、時域中轉(zhuǎn)換的特性,實現(xiàn)無線網(wǎng)絡(luò)在基站部署、熱點區(qū)域覆蓋、無線資源分配和網(wǎng)絡(luò)能耗上的科學優(yōu)化,對提升讀者移動閱讀QOS保障顯得尤為重要。
1.5圖書館虛擬化運維安全管理的需求
大數(shù)據(jù)時代,圖書館誕生了許多新的業(yè)務(wù)類型和服務(wù)模式,其大數(shù)據(jù)環(huán)境呈現(xiàn)出數(shù)據(jù)海量激增、多類型、低價值密度和快速處理的特點,要求圖書館在IT運維管理上,必須將傳統(tǒng)的以數(shù)據(jù)中心IT基礎(chǔ)設(shè)施管理為核心,有效轉(zhuǎn)變到以圖書館服務(wù)資源虛擬化管理和服務(wù)能力快速交付上。因此,圖書館應(yīng)依據(jù)各業(yè)務(wù)部門需求,利用虛擬化技術(shù)為圖書館提供服務(wù)資源按需分配和按需配置的管理策略,才能保證服務(wù)資源在使用上經(jīng)濟、低碳、動態(tài)、靈活。
虛擬化技術(shù)雖然簡化了圖書館服務(wù)系統(tǒng)的部署過程,提高了運行維護的效率和降低了管理復(fù)雜性,并最終通過提升服務(wù)資源利用率而實現(xiàn)圖書館數(shù)據(jù)中心的低碳運營。但對圖書館網(wǎng)絡(luò)系統(tǒng)、服務(wù)資源的重復(fù)虛擬化邏輯分割,以及虛擬機的過度遷移和擴容,會導(dǎo)致圖書館虛擬化管理設(shè)備邏輯關(guān)系過度復(fù)雜,一些虛擬機會脫離管理員的有效監(jiān)控與配置管理?;蛘咭蚍?wù)器上的虛擬機負載分布不均勻,而導(dǎo)致圖書館計算系統(tǒng)整體計算性能和資源利用率大幅下降。圖書館虛擬機管理程序設(shè)計過程中存在的安全隱患,也會傳染到位于同臺物理主機上的其它虛擬機,而導(dǎo)致“虛擬機溢出”現(xiàn)象產(chǎn)生。黑客會通過有效攻擊虛擬機的管理程序,躲避虛擬機的安全控制與保護系統(tǒng)。[4]另外,虛擬機總量的快速增長,會導(dǎo)致圖書館虛擬機的安全管理與補丁修復(fù)工作量成倍增加。此外,虛擬化操作系統(tǒng)龐大的系統(tǒng)構(gòu)造和技術(shù)缺陷,以及其硬件系統(tǒng)和使用環(huán)境的不兼容性,也增大了圖書館虛擬化應(yīng)用的安全風險。
2.1圖書館網(wǎng)絡(luò)評估大數(shù)據(jù)的組成
通過對網(wǎng)絡(luò)評估大數(shù)據(jù)的采集、過濾、處理和分析,圖書館可準確發(fā)現(xiàn)網(wǎng)絡(luò)在IT基礎(chǔ)設(shè)施構(gòu)建、網(wǎng)絡(luò)系統(tǒng)服務(wù)資源配置、讀者服務(wù)QOS保障、精細化營銷策略上存在的瓶頸問題。同時,基于網(wǎng)絡(luò)大數(shù)據(jù)的決策支持,可實現(xiàn)圖書館網(wǎng)絡(luò)運營性能和管理策略的優(yōu)化,為讀者個性化閱讀活動提供安全、高效、經(jīng)濟和低碳的大數(shù)據(jù)網(wǎng)絡(luò)傳輸服務(wù)。
根據(jù)網(wǎng)絡(luò)大數(shù)據(jù)的產(chǎn)生、流向和作用對象劃分,主要由圖書館數(shù)據(jù)中心網(wǎng)絡(luò)IT基礎(chǔ)設(shè)施運行與控制信令數(shù)據(jù)、網(wǎng)絡(luò)節(jié)點交換設(shè)備監(jiān)測數(shù)據(jù)、讀者閱讀終端數(shù)據(jù)等組成。數(shù)據(jù)中心網(wǎng)絡(luò)IT基礎(chǔ)設(shè)備運行與控制信令數(shù)據(jù)包括網(wǎng)絡(luò)設(shè)備配置信息、網(wǎng)絡(luò)業(yè)務(wù)或控制信令參數(shù)值、服務(wù)器與交換設(shè)備運行日志、網(wǎng)絡(luò)負載分布與變化數(shù)據(jù)、網(wǎng)絡(luò)優(yōu)化相關(guān)信令資源、網(wǎng)絡(luò)性能統(tǒng)計指標(呼叫成功率、掉線率、切換成功率、擁塞率、交換系統(tǒng)接通率)等。網(wǎng)絡(luò)節(jié)點交換設(shè)備監(jiān)測數(shù)據(jù)包括節(jié)點設(shè)備運營數(shù)據(jù)與日志、無線基站分布與工作參數(shù)、DT(驅(qū)車測試)和CQT(呼叫質(zhì)量撥打測試)數(shù)據(jù)、讀者業(yè)務(wù)使用行為數(shù)據(jù)、讀者分布與閱讀負載數(shù)據(jù)等。[5]讀者閱讀終端數(shù)據(jù)包括讀者的閱讀終端工作模式、閱讀數(shù)據(jù)的類型與數(shù)量、數(shù)據(jù)吞吐量和誤碼率、傳輸延遲和丟包率等。這些網(wǎng)絡(luò)大數(shù)據(jù)具有海量、多類型、非結(jié)構(gòu)化和實時性強的特點,是圖書館了解網(wǎng)絡(luò)組織和運行現(xiàn)狀,優(yōu)化網(wǎng)絡(luò)資源配置和提升讀者閱讀體驗的重要依據(jù)。
2.2基于大數(shù)據(jù)驅(qū)動的圖書館動態(tài)網(wǎng)絡(luò)評估與管理系統(tǒng)的構(gòu)建
(1)網(wǎng)絡(luò)大數(shù)據(jù)驅(qū)動的網(wǎng)絡(luò)動態(tài)分析與決策系統(tǒng)的組織結(jié)構(gòu)。網(wǎng)絡(luò)大數(shù)據(jù)產(chǎn)生的實時性、數(shù)據(jù)元素對事件的精確定時、網(wǎng)絡(luò)系統(tǒng)數(shù)據(jù)采集的同步性、網(wǎng)絡(luò)數(shù)據(jù)之間的強相關(guān)性等,是關(guān)系圖書館準確評估網(wǎng)絡(luò)運行狀況和發(fā)現(xiàn)、判定網(wǎng)絡(luò)性能的瓶頸問題,也是優(yōu)化網(wǎng)絡(luò)系統(tǒng)IT基礎(chǔ)設(shè)施結(jié)構(gòu)、修復(fù)網(wǎng)絡(luò)環(huán)境和科學分配網(wǎng)絡(luò)資源的關(guān)鍵。因此,圖書館在網(wǎng)絡(luò)評估與管理系統(tǒng)的構(gòu)建中,應(yīng)堅持對網(wǎng)絡(luò)大數(shù)據(jù)生命周期的全程質(zhì)量保證和以讀者為中心的原則,才能保證評估系統(tǒng)科學、高效、經(jīng)濟和實時。構(gòu)建的基于大數(shù)據(jù)驅(qū)動的圖書館網(wǎng)絡(luò)動態(tài)分析與決策系統(tǒng)結(jié)構(gòu)如圖所示。
圖圖書館網(wǎng)絡(luò)大數(shù)據(jù)分析與決策系統(tǒng)結(jié)構(gòu)圖
該系統(tǒng)主要由網(wǎng)絡(luò)大數(shù)據(jù)采集平臺、大數(shù)據(jù)管理與調(diào)度平臺、大數(shù)據(jù)分析平臺、網(wǎng)絡(luò)優(yōu)化決策平臺4部分組成。網(wǎng)絡(luò)大數(shù)據(jù)采集平臺由數(shù)據(jù)采集管理模塊、數(shù)據(jù)采集模塊、數(shù)據(jù)傳輸與存儲模塊組成,負責對圖書館網(wǎng)絡(luò)多維、多源大數(shù)據(jù)的測量、采集、傳輸和存儲操作,并將采集的網(wǎng)絡(luò)大數(shù)據(jù)傳輸至存儲數(shù)據(jù)庫保存。數(shù)據(jù)管理與調(diào)度平臺通過對網(wǎng)絡(luò)大數(shù)據(jù)的統(tǒng)一數(shù)據(jù)模式、標明數(shù)據(jù)方位、分析數(shù)據(jù)關(guān)系和部署數(shù)據(jù)應(yīng)用,完成對實時與非實時大數(shù)據(jù)的存儲管理、數(shù)據(jù)處理、共享、交換與調(diào)度,為網(wǎng)絡(luò)大數(shù)據(jù)的分析提供高效、可靠的數(shù)據(jù)管理與調(diào)度服務(wù)。[6]數(shù)據(jù)分析平臺依據(jù)圖書館網(wǎng)絡(luò)大數(shù)據(jù)的分析、決策需要,通過大數(shù)據(jù)分析引擎開展網(wǎng)絡(luò)大數(shù)據(jù)的實時與離線分析,實現(xiàn)大數(shù)據(jù)向信息和知識的轉(zhuǎn)變,并將最終分析結(jié)果傳輸至網(wǎng)絡(luò)優(yōu)化與決策平臺。網(wǎng)絡(luò)優(yōu)化與決策平臺通過數(shù)據(jù)分析平臺的多層次分析支持,實現(xiàn)圖書館網(wǎng)絡(luò)狀態(tài)的診斷、網(wǎng)絡(luò)故障預(yù)測與發(fā)現(xiàn)、網(wǎng)絡(luò)傳輸瓶頸判斷、網(wǎng)絡(luò)QOS評估、網(wǎng)絡(luò)系統(tǒng)優(yōu)化等,確保圖書館網(wǎng)絡(luò)運行安全、高效、經(jīng)濟和可控。
(2)圖書館網(wǎng)絡(luò)大數(shù)據(jù)分析與評估的基本指標。網(wǎng)絡(luò)IT基礎(chǔ)設(shè)施的構(gòu)建標準、網(wǎng)絡(luò)運營管理的效率、網(wǎng)絡(luò)服務(wù)對讀者閱讀QOS保證的可靠性等,是判定與評估圖書館網(wǎng)絡(luò)系統(tǒng)組織與運營科學性的3個關(guān)鍵因素。因此,我們從網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè)、網(wǎng)絡(luò)性能指標及運營參數(shù)、讀者對網(wǎng)絡(luò)服務(wù)的感知等3個維度,對圖書館網(wǎng)絡(luò)的性能、運營狀況和用戶體驗等,進行實時、不間斷的測量與數(shù)據(jù)采集。[7]此外,為了保證圖書館網(wǎng)絡(luò)系統(tǒng)結(jié)構(gòu)與運營管理評估科學、準確,可分別對網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè)、網(wǎng)絡(luò)性能指標及運營參數(shù)、讀者感知等3個指標,進行了二級指標的詳細劃分,如表所示。
表網(wǎng)絡(luò)大數(shù)據(jù)分析與評估的指標體系
圖書館網(wǎng)絡(luò)管理員通過對指標體系大數(shù)據(jù)的實時計算、分析和判定,可及時、準確地發(fā)現(xiàn)圖書館IT基礎(chǔ)設(shè)施構(gòu)建、運營管理和網(wǎng)絡(luò)QOS保證中存在的瓶頸與問題,不斷提升網(wǎng)絡(luò)IT系統(tǒng)結(jié)構(gòu)科學性、管理有效性和個性化閱讀服務(wù)的保障水平,實現(xiàn)網(wǎng)絡(luò)管理的快速預(yù)警和服務(wù)優(yōu)化建議。
2.3基于大數(shù)據(jù)決策支持的圖書館網(wǎng)絡(luò)管理與優(yōu)化
(1)提升網(wǎng)絡(luò)對圖書館大數(shù)據(jù)應(yīng)用的支撐能力。大數(shù)據(jù)時代,圖書館大數(shù)據(jù)應(yīng)用程序具有規(guī)模大、數(shù)據(jù)突發(fā)的特性,且服務(wù)熱點區(qū)域和高峰期易導(dǎo)致網(wǎng)絡(luò)擁塞,致使圖書館大數(shù)據(jù)服務(wù)時延和數(shù)據(jù)丟失率快速增長。同時,網(wǎng)絡(luò)擁塞觸發(fā)的數(shù)據(jù)重轉(zhuǎn)會導(dǎo)致網(wǎng)絡(luò)運行效率進一步下降。此外,圖書館不同的應(yīng)用與服務(wù),對網(wǎng)絡(luò)的傳輸帶寬需求和延遲也不同。因此,圖書館必須依據(jù)網(wǎng)絡(luò)大數(shù)據(jù)分析的結(jié)果,準確判斷網(wǎng)絡(luò)的負載分布和傳輸瓶頸,并通過網(wǎng)絡(luò)拓撲架構(gòu)優(yōu)化、網(wǎng)絡(luò)流量多路徑分散和傳輸負載均衡等措施,提升圖書館網(wǎng)絡(luò)的綜合傳輸效率,確保不同類型的數(shù)據(jù)、應(yīng)用可共存于一個通用的網(wǎng)絡(luò)環(huán)境中。
圖書館大數(shù)據(jù)呈現(xiàn)海量、指數(shù)級遞增特點,如何增強圖書館網(wǎng)絡(luò)的可伸縮性,保證圖書館網(wǎng)絡(luò)可在未來大數(shù)據(jù)環(huán)境中安全、經(jīng)濟和平滑地擴展,是關(guān)系圖書館網(wǎng)絡(luò)可用性和持續(xù)發(fā)展的一個重要問題。此外,圖書館大數(shù)據(jù)應(yīng)用具有流量突發(fā)、海量的特點,大數(shù)據(jù)流量在網(wǎng)絡(luò)的高速、持續(xù)傳輸,會對圖書館網(wǎng)絡(luò)上傳輸?shù)目刂菩帕?、服?wù)數(shù)據(jù)和其它關(guān)鍵數(shù)據(jù)流產(chǎn)生影響。因此,圖書館應(yīng)根據(jù)未來服務(wù)模式變革和讀者閱讀需求變化,在網(wǎng)絡(luò)拓撲結(jié)構(gòu)和網(wǎng)絡(luò)傳輸集群的設(shè)計上,利用大數(shù)據(jù)分析結(jié)果合理規(guī)劃網(wǎng)絡(luò)拓撲結(jié)構(gòu),確保圖書館網(wǎng)絡(luò)可根據(jù)負載和數(shù)據(jù)流特點動態(tài)擴展。[8]此外,還可利用圖書館網(wǎng)絡(luò)大數(shù)據(jù)的分析結(jié)果,按照數(shù)據(jù)流量大小和應(yīng)用對象,通過網(wǎng)絡(luò)負載的邏輯分離,將大數(shù)據(jù)流與其它小流量數(shù)據(jù)、關(guān)鍵數(shù)據(jù)流與普通數(shù)據(jù)流分離,增強大數(shù)據(jù)環(huán)境下圖書館數(shù)據(jù)傳輸?shù)陌踩院涂煽匦浴?/p>
(2)實現(xiàn)無線網(wǎng)絡(luò)的科學部署和無線資源的精準投放。圖書館無線傳輸網(wǎng)絡(luò)拓撲結(jié)構(gòu)的科學性和無線資源投放的準確性,是關(guān)系到讀者個性化移動閱讀有效性和圖書館QOS保證的關(guān)鍵因素。大數(shù)據(jù)時代,圖書館無線閱讀服務(wù)具有讀者快速移動、海量移動數(shù)據(jù)較高的空-時變化、用戶群分布不均衡的特點,圖書館移動傳輸網(wǎng)絡(luò)難以依據(jù)服務(wù)區(qū)域讀者群的流量、負載和閱讀模式變化,有效地對無線資源進行動態(tài)部署和分配。為了滿足讀者移動閱讀服務(wù)復(fù)雜、多模式和不確定的閱讀特點,圖書館應(yīng)根據(jù)網(wǎng)絡(luò)大數(shù)據(jù)的分析結(jié)果,準確判定讀者移動閱讀的模式、無線傳輸負載的分布和讀者群移動閱讀路徑,通過提高無線頻譜資源利用率、無線信道傳輸效率和組建智能立體化移動通信網(wǎng)絡(luò),從無線組網(wǎng)、資源分配和數(shù)據(jù)傳輸3個方面,提升移動傳輸網(wǎng)絡(luò)對移動閱讀服務(wù)的保障能力。
通過對網(wǎng)絡(luò)大數(shù)據(jù)的分析、判斷,圖書館能夠精確預(yù)測讀者移動閱讀內(nèi)容和無線資源需求的發(fā)展趨勢??筛鶕?jù)讀者對圖書館服務(wù)收益的貢獻度,依據(jù)“二八法則”將讀者劃分為20%的關(guān)鍵讀者群和80%的普通讀者群,通過為20%的關(guān)鍵讀者群提供定制的、資源精準投放和個性化無線網(wǎng)絡(luò)傳輸服務(wù),在較小成本投入的前提下較大幅度地提升關(guān)鍵讀者群的閱讀收益,從而實現(xiàn)圖書館移動閱讀服務(wù)綜合收益率的提升。此外,通過對讀者移動大數(shù)據(jù)的分析,圖書館可有效獲得讀者的移動閱讀模式、方法、習慣和需求等個體特征數(shù)據(jù)。基于對此類個體特征大數(shù)據(jù)的分析,圖書館能夠?qū)ψx者未來無線資源的需求、用戶移動特點(個體位置、軌跡和速度等)、業(yè)務(wù)分布等進行精確預(yù)測,可采取超密集異構(gòu)網(wǎng)絡(luò)中不同層級基站的動態(tài)激活與休眠、資源共享、協(xié)作傳輸?shù)炔呗?,大幅降低圖書館無線網(wǎng)絡(luò)的整體能耗,實現(xiàn)低碳、綠色的移動閱讀服務(wù)。[9]
(3)對圖書館網(wǎng)絡(luò)實時、動態(tài)地進行優(yōu)化。對網(wǎng)絡(luò)大數(shù)據(jù)資源進行處理、整合和深度關(guān)聯(lián)分析,并基于大數(shù)據(jù)分析結(jié)果將圖書館網(wǎng)絡(luò)IT硬件系統(tǒng)、網(wǎng)絡(luò)服務(wù)和讀者作為一個整體關(guān)聯(lián)考慮,實現(xiàn)圖書館網(wǎng)絡(luò)全方位、立體化的網(wǎng)絡(luò)資源配置和運營優(yōu)化管理,是提升圖書館網(wǎng)絡(luò)運營效率和服務(wù)收益的有效途徑。
圖書館可將采集到的網(wǎng)絡(luò)監(jiān)控服務(wù)器數(shù)據(jù)、無線基站數(shù)據(jù)、核心網(wǎng)數(shù)據(jù)、網(wǎng)關(guān)數(shù)據(jù)和讀者數(shù)據(jù)等,通過高效的過濾、處理、關(guān)聯(lián)和整合后,按照數(shù)據(jù)的來源、用戶類型、閱讀終端類型、數(shù)據(jù)的流量和業(yè)務(wù)類型,實施評估指標參數(shù)的構(gòu)建和權(quán)重值的分配,確保網(wǎng)絡(luò)大數(shù)據(jù)分析結(jié)果科學和以可視化方式直觀地表現(xiàn)。依據(jù)網(wǎng)絡(luò)大數(shù)據(jù)分析結(jié)果,圖書館可明確具有高服務(wù)收益率的地域和讀者群,并對這些地域和讀者群進行網(wǎng)絡(luò)資源和服務(wù)的優(yōu)先傾斜投入,實現(xiàn)圖書館網(wǎng)絡(luò)的精細化管理與運營。[10]
同時,圖書館還可依據(jù)網(wǎng)絡(luò)大數(shù)據(jù)分析結(jié)果科學構(gòu)建評估模型,實現(xiàn)對網(wǎng)絡(luò)拓撲結(jié)構(gòu)科學性、網(wǎng)絡(luò)資源分配合理性、網(wǎng)絡(luò)的服務(wù)成本、網(wǎng)絡(luò)運營效率的科學評估,并依據(jù)評估結(jié)果對網(wǎng)絡(luò)的拓撲結(jié)構(gòu)、系統(tǒng)資源分配、網(wǎng)絡(luò)IT基礎(chǔ)設(shè)施構(gòu)建、無線基站的分布進行優(yōu)化。此外,還可通過對網(wǎng)絡(luò)大數(shù)據(jù)的流向、流量和網(wǎng)絡(luò)運營日志的分析,靈活、主動地預(yù)測網(wǎng)絡(luò)傳輸瓶頸和提前分配網(wǎng)絡(luò)資源,有效消除圖書館網(wǎng)絡(luò)隱患和增強網(wǎng)絡(luò)系統(tǒng)的健壯性。
(4)增強圖書館網(wǎng)絡(luò)的安全、可控性。大數(shù)據(jù)環(huán)境下,圖書館網(wǎng)絡(luò)大數(shù)據(jù)的總量、類型、復(fù)雜度和敏感性快速增長。此外,圖書館網(wǎng)絡(luò)面臨新安全威脅的種類和方式層出不窮,傳統(tǒng)的安全防護系統(tǒng)和策略,已不能適應(yīng)大數(shù)據(jù)環(huán)境下圖書館網(wǎng)絡(luò)安全的需求。如何利用大數(shù)據(jù)決策增強圖書館網(wǎng)絡(luò)的安全、可控性,成為關(guān)系圖書館網(wǎng)絡(luò)服務(wù)質(zhì)量和有效性的關(guān)鍵問題。
基于網(wǎng)絡(luò)大數(shù)據(jù)的決策支持,網(wǎng)絡(luò)管理員可從圖書館網(wǎng)絡(luò)的物理安全分析、信息傳播安全分析、訪問與使用者安全分析、管理制度安全分析等4個方面,對圖書館網(wǎng)絡(luò)規(guī)劃的有效性、網(wǎng)絡(luò)IT基礎(chǔ)設(shè)施硬件指標的科學性、硬件設(shè)備的配置和數(shù)據(jù)傳輸能力、網(wǎng)絡(luò)通信協(xié)議的安全可控性、訪問者的權(quán)限管理和異常行為檢測、網(wǎng)絡(luò)管理的安全性、安全事件的可監(jiān)控與預(yù)警性能、未知威脅檢測等安全要素,利用智能分析技術(shù)與沙箱技術(shù)進行全面檢測,實現(xiàn)新威脅的精確預(yù)測、發(fā)現(xiàn)和安全防護邊界的科學劃分。
此外,圖書館網(wǎng)絡(luò)具有組網(wǎng)模式多樣、網(wǎng)絡(luò)系統(tǒng)結(jié)構(gòu)復(fù)雜和網(wǎng)絡(luò)資源多用戶共享的特性。因此,網(wǎng)絡(luò)系統(tǒng)在IT物理結(jié)構(gòu)、系統(tǒng)拓撲結(jié)構(gòu)和運維管理上容易產(chǎn)生各種漏洞。通過對網(wǎng)絡(luò)大數(shù)據(jù)的分析、判斷,網(wǎng)絡(luò)管理員可及時地發(fā)現(xiàn)網(wǎng)絡(luò)系統(tǒng)在構(gòu)建、運維和管理中存在的安全漏洞與安全威脅,并對漏洞與安全威脅程度有效檢測、分析和評估后,依據(jù)漏洞與安全問題實際情況,采取數(shù)據(jù)加密、訪問控制、網(wǎng)絡(luò)隔離、漏洞掃描、入侵檢測、病毒防治、硬件冗余、終端惡意軟件屏蔽和數(shù)據(jù)備份等措施,確保圖書館網(wǎng)絡(luò)安全、高效、經(jīng)濟和可控。
伴隨云計算、傳感器網(wǎng)絡(luò)、物聯(lián)網(wǎng)和大數(shù)據(jù)技術(shù)的發(fā)展,圖書館的管理與服務(wù)模式發(fā)生了巨大變革,圖書館在為讀者提供安全、高效、多模式和便捷個性化智慧閱讀服務(wù)的同時,其數(shù)據(jù)環(huán)境呈現(xiàn)出Volume(海量)、Velocity(高速)、Variety(多樣性)、Value(高價值)的大數(shù)據(jù)“4V”特性,圖書館界已進入大數(shù)據(jù)時代。
計算機網(wǎng)絡(luò)是數(shù)據(jù)、信息和知識的載體,其運營的安全性、效率、經(jīng)濟性和可控性,是關(guān)系圖書館系統(tǒng)管理、服務(wù)組織和讀者閱讀滿意度的關(guān)系因素。如何科學采集、處理和分析網(wǎng)絡(luò)大數(shù)據(jù),是圖書館有效利用網(wǎng)絡(luò)大數(shù)據(jù)資源增強網(wǎng)絡(luò)管理的洞察與決策力,優(yōu)化圖書館網(wǎng)絡(luò)系統(tǒng)拓撲結(jié)構(gòu)和運營流程的關(guān)鍵。因此,圖書館在基于大數(shù)據(jù)的計算機網(wǎng)絡(luò)構(gòu)建與運營中,應(yīng)重點增強網(wǎng)絡(luò)大數(shù)據(jù)在采集、傳輸、處理、分析和決策活動中的價值保證與可用性管理,提升網(wǎng)絡(luò)大數(shù)據(jù)的價值挖掘和知識發(fā)現(xiàn)的有效性,才能為圖書館網(wǎng)絡(luò)的實時評估、資源調(diào)度、動態(tài)優(yōu)化和運維管理提供科學的大數(shù)據(jù)決策支持,才能不斷提升圖書館網(wǎng)絡(luò)對讀者服務(wù)的承載能力,才能保證圖書館服務(wù)模式變革科學和讀者閱讀服務(wù)可持續(xù)發(fā)展。
[1]何非,何克清.大數(shù)據(jù)及其科學問題與方法的探討[J].武漢大學學報(理學版),2014,60(1):1-12.
[2]曹旭,曹瑞彤.基于大數(shù)據(jù)分析的網(wǎng)絡(luò)異常檢測方法[J].電信科學,2014(7):84-89.
[3]劉蘭,等.面向大數(shù)據(jù)的異構(gòu)網(wǎng)絡(luò)安全監(jiān)控及關(guān)聯(lián)算法研究[J].電信科學,2014(6):152-156.
[4]陳斌,等.分布式系統(tǒng)可伸縮性研究綜述[J].計算機科學,2011,38(8):17-24.
[5]鞠洪堯.大數(shù)據(jù)網(wǎng)絡(luò)服務(wù)器群智能伸縮機制與架構(gòu)研究[J].電信科學,2015(3):27-36.
[6]H.Yin,X.et al.NetClust:A Framework for ScalableandPareto-OptimalMediaServerPlacement.IEEE TransactionsonMultimedia,2013,15(8):2114-2124.
[7]張萌,等.延遲時間和嵌入維數(shù)聯(lián)合優(yōu)化的網(wǎng)絡(luò)流量預(yù)測[J].計算機工程與應(yīng)用,2014,50(4):103-109.
[8]王意潔,等.云計算環(huán)境下的分布存儲關(guān)鍵技術(shù)[J].軟件學報,2012,23(4):962-986.
[9]尹浩,喬波.大數(shù)據(jù)驅(qū)動的網(wǎng)絡(luò)信息平面的研究[J].計算機學報,2015,38(73):1-13.
[10]QinghuaWu,etal.SOFIA:towardservice-oriented informationcentricnetworking.IEEENetwork,2014,28(3):12-18.
Research on Performance Evaluation and Service Quality Assurance of Library Dynamic Network Based on Big Data Driven
Chen Chen
This article discusses the dynamic network performance evaluation and service quality assurance for library based on Big Data driven,which can effectively satisfy the network performance's requirements to new services mode of library,improve network availability and reliability,realize flexible networking,optimize network resources configuration,and low energy consume of library services.
Big Data;Library;Network Performance
G250.73
A
1005-8214(2016)08-0089-05
陳臣((1974-),男,碩士,蘭州財經(jīng)大學信息中心副教授,研究方向:大數(shù)據(jù)、數(shù)字圖書館建設(shè)。
2015-11-30[責任編輯]菊秋芳