王曙霞 胡瑞敏 梁意文 熊曾剛
摘 要: 針對當(dāng)前的云計算服務(wù)器缺少對不穩(wěn)定數(shù)據(jù)的識別與檢測,設(shè)計并實現(xiàn)一種云服務(wù)器中不穩(wěn)定數(shù)據(jù)挖掘系統(tǒng)。介紹系統(tǒng)的總體結(jié)構(gòu),利用數(shù)據(jù)采樣預(yù)處理模塊實現(xiàn)從源數(shù)據(jù)到挖掘數(shù)據(jù)的映射,完成離散化、數(shù)據(jù)過濾等處理過程。依據(jù)2.0 mm ERmet Hard Metric 連接器,采用 RapidIO協(xié)議,通過接口模塊完成數(shù)據(jù)間的傳輸,以達(dá)到信號傳輸效率與穩(wěn)定性的要求。通過數(shù)據(jù)挖掘模塊對云服務(wù)器中不穩(wěn)定數(shù)據(jù)的確認(rèn)與挖掘,將挖掘結(jié)果傳輸至控制模塊進(jìn)行處理。軟件設(shè)計過程中,對云服務(wù)器中不穩(wěn)定數(shù)據(jù)挖掘系統(tǒng)進(jìn)行了詳細(xì)地分析,并給出不穩(wěn)定數(shù)據(jù)挖掘的實現(xiàn)過程以及系統(tǒng)部分程序代碼。實驗結(jié)果表明,所設(shè)計的系統(tǒng)具有很高的實用性和可靠性。
關(guān)鍵詞: 云服務(wù)器; 不穩(wěn)定數(shù)據(jù)挖掘; 數(shù)據(jù)采樣預(yù)處理; 數(shù)據(jù)過濾
中圖分類號: TN915?34; TP311 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2016)06?0049?04
Research and design of unstable data mining system in cloud server
WANG Shuxia1, HU Ruimin2, LIANG Yiwen2, XIONG Zenggang1
(1. School of Computer and Information Science, Hubei Engineering University, Xiaogan 432000, China;
2. School of Computer, Wuhan University, Wuhan 430072, China)
Abstract: Since the current cloud computing server lacks recognition and detection of unstable data, a mining system of unstable data in cloud server was designed and realized. The overall structure of the system is introduced. With the data sampling pretreatment module, the mapping from the source data to the mining data is implemented, and the process of discretization and data filtering is completed. Based on 2.0 mm ERmet Hard Metric connector, the RapidIO protocol is used to complete the data transmission through the interface module, and meet the requirements of the signal transmission efficiency and stability. The unstable data in the cloud server is validated and mined by means of data mining module. The mining results are transmitted to the control module for processing. In the process of software design, the unstable data mining system in the cloud server was analyzed in detail. The implementation process of unstable data mining and the part program codes of the system are given. The experimental result shows that the system has high practicability and reliability.
Keywords: cloud server; unstable data mining; data sampling pretreatment; data filtering
隨著計算機的逐漸發(fā)展及信息技術(shù)的不斷推進(jìn),人們對服務(wù)器運行穩(wěn)定性的要求越來越高[1?2]。云服務(wù)器作為一種簡單高效、安全可靠、處理能力可彈性伸縮的計算服務(wù),被越來越廣泛的應(yīng)用[3?5]。但是,當(dāng)前的云計算服務(wù)器都只是從入侵的角度考慮服務(wù)器的安全性,沒有充分考慮不穩(wěn)定數(shù)據(jù)帶來的影響。因此,研究一種不穩(wěn)定數(shù)據(jù)挖掘系統(tǒng),使云服務(wù)器能夠更加穩(wěn)定、安全地服務(wù)于用戶,向客戶提供高質(zhì)量的服務(wù)具有重要意義,已經(jīng)成為相關(guān)學(xué)者研究的重點課題[6?8]。本文設(shè)計并實現(xiàn)了一種云服務(wù)器中不穩(wěn)定數(shù)據(jù)挖掘系統(tǒng),介紹了系統(tǒng)的總體結(jié)構(gòu)、硬件結(jié)構(gòu)以及軟件結(jié)構(gòu),為實現(xiàn)云服務(wù)器的穩(wěn)定運行提供有效依據(jù)。實驗結(jié)果表明,所設(shè)計的系統(tǒng)具有很高的實用性和可靠性。
1 不穩(wěn)定數(shù)據(jù)挖掘系統(tǒng)總體邏輯結(jié)構(gòu)
本文設(shè)計的云服務(wù)器中不穩(wěn)定數(shù)據(jù)挖掘系統(tǒng)主要由控制模塊、數(shù)據(jù)采樣預(yù)處理模塊、接口模塊、數(shù)據(jù)挖掘模塊和云服務(wù)器中不穩(wěn)定數(shù)據(jù)挖掘模塊等構(gòu)成,系統(tǒng)總體邏輯結(jié)構(gòu)如圖1所示。
2 硬件模塊的選擇與設(shè)計
2.1 云服務(wù)器不穩(wěn)定數(shù)據(jù)采樣處理模塊設(shè)計
數(shù)據(jù)采樣預(yù)處理模塊主要用于從源數(shù)據(jù)到挖掘數(shù)據(jù)的映射,實現(xiàn)離散化、數(shù)據(jù)過濾等處理過程。數(shù)據(jù)采樣預(yù)處理模塊主要由FPGA、SSRAM、模/數(shù)轉(zhuǎn)換器、以太網(wǎng)接口等構(gòu)成,詳細(xì)硬件結(jié)構(gòu)如圖2所示。
數(shù)據(jù)采樣預(yù)處理模塊以ADS1178芯片為核心,其屬于delta?sigma(Δ?Σ)型模/數(shù)轉(zhuǎn)換器,共存在8 個差分輸入通道,可同時對8個云通道的輸入數(shù)據(jù)進(jìn)行數(shù)據(jù)采用,采樣電路的數(shù)據(jù)輸出端與 FPGA相連。為后期的不穩(wěn)定數(shù)據(jù)的識別打下基礎(chǔ)。系統(tǒng)將Cyclone Ⅳ GX 系列的 EP4CGX110CF23C7N 型號芯片作為FPGA 芯片,該芯片為Altera公司Cyclone系列FPGA 的新一代產(chǎn)品,不僅功耗低,而且成本不高。系統(tǒng)選擇的SSRAM型號是GS864018?300,其為72 Mb同步突發(fā)傳輸靜態(tài)存儲器。FPGA和以太網(wǎng)接口之間選擇的網(wǎng)橋芯片詳細(xì)型號是 DP83848C。
2.2 不穩(wěn)定數(shù)據(jù)的傳遞接口模塊
接口模塊主要用于對不穩(wěn)定數(shù)據(jù)進(jìn)行傳輸,主要由信號調(diào)直機、高速數(shù)據(jù)傳輸系統(tǒng)、Ermet Hard 354142型接口和Ermet Hard 973046型接口等構(gòu)成,詳細(xì)硬件結(jié)構(gòu)如圖3所示。因為本文設(shè)計系統(tǒng)之間的數(shù)據(jù)傳輸采用 RapidIO協(xié)議,因此,本文數(shù)據(jù)傳輸接口選擇ERNI公司生產(chǎn)的2.0 mm ERmet Hard Metric 連接器。為了達(dá)到信號傳輸效率與穩(wěn)定性的要求,本文系統(tǒng)將連接器作為系統(tǒng)輸入端口,將型號是973046的連接器作為系統(tǒng)傳輸端口。數(shù)據(jù)采集電路對采集的數(shù)據(jù)進(jìn)行判斷,一旦發(fā)現(xiàn)是疑似不穩(wěn)定數(shù)據(jù),會存儲到SSRAM,判斷的過程是EP4CGX110CF23C7N完成的。
2.3 不穩(wěn)定數(shù)據(jù)的判斷模塊
判斷模塊是整個云服務(wù)器中不穩(wěn)定數(shù)據(jù)挖掘系統(tǒng)的核心,主要用于設(shè)置相關(guān)不穩(wěn)定數(shù)據(jù)挖掘參數(shù),同時調(diào)用數(shù)據(jù)挖掘模塊完成數(shù)據(jù)挖掘。不僅如此,判斷模塊還存在各子模塊相關(guān)數(shù)據(jù)的維護與管理。對不穩(wěn)定數(shù)據(jù)判斷模塊的結(jié)構(gòu)圖如圖4所示。
DSP處理器采用美國TI公司生產(chǎn)的TMS320C54X芯片,其主要用參數(shù)設(shè)置,完成對不穩(wěn)定數(shù)據(jù)的判斷;IPC選擇Diamond系列的IPC芯片,其負(fù)責(zé)數(shù)據(jù)的傳輸。DSP處理器類似于磁盤陣列中陣列控制器,在驅(qū)動器和SAN間添加了一個智能層,它與外部連接到SAN。
2.4 不穩(wěn)定數(shù)據(jù)挖掘模塊的設(shè)計
數(shù)據(jù)挖掘模塊主要負(fù)責(zé)對云服務(wù)器中的不穩(wěn)定數(shù)據(jù)進(jìn)行深層次的挖掘,同時將挖掘結(jié)果發(fā)送至控制模塊進(jìn)行處理。數(shù)據(jù)挖掘模塊主要由處理器、智能接口控制器、數(shù)字I/O和職能I/O構(gòu)成,詳細(xì)硬件結(jié)構(gòu)如圖5所示。
數(shù)字I/O選擇的型號為IONI USB?6501 ,其為低價位USB數(shù)字I/O設(shè)備。職能I/O選擇的型號為Eclipse Java,其大大縮減挖掘過程,提高了挖掘效率。
3 系統(tǒng)軟件設(shè)計
3.1 總流程圖設(shè)計
在對云服務(wù)器中不穩(wěn)定數(shù)據(jù)挖掘系統(tǒng)所需執(zhí)行任務(wù)進(jìn)行分析的基礎(chǔ)上,結(jié)合系統(tǒng)軟件設(shè)計的特性和要求,設(shè)計了云服務(wù)器中不穩(wěn)定數(shù)據(jù)挖掘系統(tǒng)的軟件流程圖,如圖6所示。
在云服務(wù)器中,用戶在登陸界面上登陸系統(tǒng)后,如果不穩(wěn)定數(shù)據(jù)挖掘所需的算法及數(shù)據(jù)都存在,則利用數(shù)據(jù)挖掘模塊進(jìn)行數(shù)據(jù)的挖掘,獲取結(jié)果。
3.2 代碼設(shè)計
根據(jù)上述軟件系統(tǒng)流程圖進(jìn)行代碼設(shè)計。本文設(shè)計的云服務(wù)器中不穩(wěn)定數(shù)據(jù)挖掘系統(tǒng)的軟件,在Windows 7.0環(huán)境下,通過C++完成,詳細(xì)的軟件程序設(shè)計流程如下所述:
4 仿真實驗分析
4.1 測試環(huán)境
為了驗證本文設(shè)計的云服務(wù)器中不穩(wěn)定數(shù)據(jù)挖掘系統(tǒng)的有效性,需要進(jìn)行相關(guān)的實驗分析。實驗將基于蟻群算法的不穩(wěn)定數(shù)據(jù)挖掘系統(tǒng)作為對比進(jìn)行分析。本實驗研究的云服務(wù)器是由一個主(Master)節(jié)點和三個從(Slave)節(jié)點構(gòu)成的,節(jié)點硬件環(huán)境見表1、表2。
云服務(wù)器和客戶端均連接在千兆局域網(wǎng)內(nèi),網(wǎng)絡(luò)拓?fù)鋱D如圖7所示。
4.2 實驗結(jié)果分析
分別采用本文系統(tǒng)和基于蟻群算法的不穩(wěn)定數(shù)據(jù)挖掘系統(tǒng)對上述測試環(huán)境下云服務(wù)器的不穩(wěn)定數(shù)據(jù)進(jìn)行挖掘;在數(shù)據(jù)集數(shù)量逐漸升高的情況下,對兩種系統(tǒng)的挖掘時間和挖掘準(zhǔn)確率進(jìn)行比較,得到的結(jié)果見表3。
分析表3可以看出,隨著數(shù)據(jù)量的逐漸增加,本文系統(tǒng)和基于蟻群算法的不穩(wěn)定數(shù)據(jù)挖掘系統(tǒng)的挖掘時間均逐漸升高,但與基于蟻群算法的不穩(wěn)定數(shù)據(jù)挖掘系統(tǒng)相比,本文系統(tǒng)挖掘時間的增長幅度明顯降低,而且一直低于基于蟻群算法的不穩(wěn)定數(shù)據(jù)挖掘系統(tǒng)。不僅如此,本文系統(tǒng)的的挖掘準(zhǔn)確率一直高于基于蟻群算法的不穩(wěn)定數(shù)據(jù)挖掘系統(tǒng),說明本文系統(tǒng)具有很高的挖掘性能,驗證了本文系統(tǒng)的可行性和實用性。
5 結(jié) 語
本文設(shè)計并實現(xiàn)了一種云服務(wù)器中不穩(wěn)定數(shù)據(jù)挖掘系統(tǒng),介紹了系統(tǒng)的總體結(jié)構(gòu),將控制模塊作為整個云服務(wù)器中不穩(wěn)定數(shù)據(jù)挖掘系統(tǒng)的核心,通過控制模塊設(shè)置相關(guān)的數(shù)據(jù)挖掘參數(shù)、調(diào)用數(shù)據(jù)挖掘模塊完成數(shù)據(jù)挖掘以及對各子模塊相關(guān)數(shù)據(jù)進(jìn)行維護與管理。
利用數(shù)據(jù)采樣預(yù)處理模塊實現(xiàn)從源數(shù)據(jù)到挖掘數(shù)據(jù)的映射,完成離散化、數(shù)據(jù)過濾等處理過程。依據(jù)2.0 mm ERmet Hard Metric 連接器,采用 RapidIO協(xié)議,通過接口模塊完成數(shù)據(jù)間的傳輸,以達(dá)到信號傳輸效率與穩(wěn)定性的要求。通過數(shù)據(jù)挖掘模塊對云服務(wù)器中不穩(wěn)定數(shù)據(jù)進(jìn)行挖掘,將挖掘結(jié)果傳輸至控制模塊進(jìn)行處理。軟件設(shè)計過程中,對云服務(wù)器中不穩(wěn)定數(shù)據(jù)挖掘系統(tǒng)進(jìn)行了詳細(xì)的分析,并給出不穩(wěn)定數(shù)據(jù)挖掘的實現(xiàn)過程以及系統(tǒng)部分程序代碼。實驗結(jié)果表明,所設(shè)計的系統(tǒng)具有很高的實用性和可靠性。
參考文獻(xiàn)
[1] 魏中賀,李少波.基于云制造的數(shù)據(jù)挖掘研究[J].貴州大學(xué)學(xué)報(自然科學(xué)版),2015,32(1):75?80.
[2] 時念云,王文佳,馬力.基于普適云的大數(shù)據(jù)挖掘[J].計算機系統(tǒng)應(yīng)用,2013,22(11):7?12.
[3] 竇波,陳曉云,李均委.基于數(shù)據(jù)挖掘分析的電力營銷稽查監(jiān)控系統(tǒng)[J].新疆電力技術(shù),2014(3):92?94.
[4] 甘楊蘭,趙梅,牛森,等.基于云仿真環(huán)境數(shù)據(jù)挖掘的服務(wù)分類方法[J].計算機仿真,2014(10):460?465.
[5] 郭鑫,顏一鳴.一種動態(tài)云模型下樹數(shù)據(jù)挖掘算法[J].小型微型計算機系統(tǒng),2013,34(12):2749?2752.
[6] 李化明,王家云,馬利華.基于知識依賴度約簡數(shù)據(jù)挖掘的個性化服務(wù)研究[J].大學(xué)圖書情報學(xué)刊,2015,33(1):90?94.
[7] 厲一梅.基于云計算的電力數(shù)據(jù)挖掘軟件和優(yōu)化服務(wù)[J].電子世界,2014(6):13?14.
[8] 李華,陳立云,張星.云計算條件下數(shù)據(jù)挖掘技術(shù)對高校信息服務(wù)水平的提升作用[J].電子技術(shù)與軟件工程,2014(10):197.