国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

網(wǎng)絡(luò)大數(shù)據(jù)平臺中的特征數(shù)據(jù)分類系統(tǒng)設(shè)計與實現(xiàn)

2017-05-09 22:05:52張科星
現(xiàn)代電子技術(shù) 2017年8期
關(guān)鍵詞:云計算

張科星

摘 要: 網(wǎng)絡(luò)大數(shù)據(jù)平臺中特征數(shù)據(jù)的有效分類,是提高網(wǎng)民查詢體驗、開發(fā)新型應(yīng)用的有效途徑。為此,設(shè)計穩(wěn)定性好、資源占用率低的網(wǎng)絡(luò)大數(shù)據(jù)平臺特征數(shù)據(jù)分類系統(tǒng)。系統(tǒng)的顯示端是網(wǎng)民的直接應(yīng)用端,其主要進行網(wǎng)絡(luò)大數(shù)據(jù)的獲取、大數(shù)據(jù)獲取結(jié)果的顯示和特征分類結(jié)果的顯示。服務(wù)端利用SOA體系結(jié)構(gòu)為網(wǎng)絡(luò)大數(shù)據(jù)平臺提供特征數(shù)據(jù)的分類服務(wù),其將特征數(shù)據(jù)的分類標(biāo)準(zhǔn)納入到網(wǎng)絡(luò)大數(shù)據(jù)中,并傳遞給邏輯層處理端。邏輯層處理端根據(jù)特征數(shù)據(jù)分類標(biāo)準(zhǔn),利用云計算和策略設(shè)計對網(wǎng)絡(luò)大數(shù)據(jù)集合進行特征提取,其特征提取算法于軟件中給出。特征數(shù)據(jù)分類端根據(jù)邏輯層處理端所提取出的大數(shù)據(jù)特征,利用特征向量機進行特征數(shù)據(jù)的自動分類工作。實驗結(jié)果表明,所設(shè)計的系統(tǒng)穩(wěn)定性好、資源占用率低。

關(guān)鍵詞: 網(wǎng)絡(luò)大數(shù)據(jù)平臺; 特征數(shù)據(jù)分類系統(tǒng); 分類服務(wù); 云計算

中圖分類號: TN711?34; TP391 文獻標(biāo)識碼: A 文章編號: 1004?373X(2017)08?0025?04

Design and implementation of feature data classification system in

network big data platform

ZHANG Kexing

(Taiyuan University, Taiyuan 030012, China)

Abstract: Effective classification of the characteristics data of the network big data platform is to improve the Internet query experience of netizens, and an effective way to develop new applications. Therefore, a characteristic data classification system with good stability and low resource utilization was designed for the network large data platform. The system′s display terminal is the direct application client of netizens, which is used to acquire the network big data, and display the data acquisition result and feature classification result. The server utilizes SOA architecture to provide the classification service of the characteristics data for network big data platform. The classification standard of characteristic data is brought into network large data, and passed to the logic layer processing side, which extracts the characteristics of network big data set according to the characteristic data classification standard, cloud computing and strategy design. The feature extraction algorithm is given in the third paragraph of this paper. Feature data classification end classifies the characteristics data automatically by using the feature vector machine (SVM) according to the big data characteristics extracted by logic layer processing side. The experimental results show that the designed system has high stability, low resource utilization.

Keywords: network big data platform; characteristic data classification system; classification service; cloud computing

0 引 言

隨著科技的不斷進步,網(wǎng)絡(luò)大數(shù)據(jù)時代悄然來臨,為了各國網(wǎng)民提供了更為高效、便捷的服務(wù)。網(wǎng)絡(luò)大數(shù)據(jù)平臺中的特征數(shù)據(jù)的有效分類,是提高網(wǎng)民查詢體驗、開發(fā)新型應(yīng)用的有效途徑[1?3]。以往設(shè)計出的網(wǎng)絡(luò)大數(shù)據(jù)平臺特征數(shù)據(jù)分類系統(tǒng),未能合理分析大數(shù)據(jù)的固有特征趨勢,穩(wěn)定性不高并造成了系統(tǒng)運行資源的浪費。故能否設(shè)計出一種穩(wěn)定性好、資源占用率低的網(wǎng)絡(luò)大數(shù)據(jù)平臺特征數(shù)據(jù)分類系統(tǒng),是特征分類領(lǐng)域關(guān)注的重點內(nèi)容[4?6]。

曾設(shè)計出的網(wǎng)絡(luò)大數(shù)據(jù)平臺特征數(shù)據(jù)分類系統(tǒng)都或多或少地存在一些問題。如文獻[7]設(shè)計基于信息互動的網(wǎng)絡(luò)大數(shù)據(jù)平臺特征數(shù)據(jù)分類系統(tǒng),此系統(tǒng)以信息互動這一學(xué)習(xí)方式,對網(wǎng)絡(luò)大數(shù)據(jù)平臺中的特征數(shù)據(jù)進行對比互動分析,并利用軟件設(shè)計出迭代算法,對特征數(shù)據(jù)進行“再教育”,進而將其準(zhǔn)確分類。此系統(tǒng)的準(zhǔn)確性高、資源占用率低,但穩(wěn)定性欠佳。文獻[8]設(shè)計基于語義的網(wǎng)絡(luò)大數(shù)據(jù)平臺特征數(shù)據(jù)分類系統(tǒng),此系統(tǒng)根據(jù)語義方式對網(wǎng)絡(luò)大數(shù)據(jù)進行相似搜索,并在網(wǎng)絡(luò)大數(shù)據(jù)平臺的資源庫中構(gòu)建語義特征向量,通過計算特征向量的角度對特征數(shù)據(jù)進行分類。整個系統(tǒng)利用分布式設(shè)計,擁有較高的穩(wěn)定性,但其資源占用率較高。文獻[9]設(shè)計基于地圖縮放模型的網(wǎng)絡(luò)大數(shù)據(jù)平臺特征數(shù)據(jù)分類系統(tǒng),此系統(tǒng)將AVM算法引入網(wǎng)絡(luò)大數(shù)據(jù)平臺中,并構(gòu)建地圖縮放模型,將特征數(shù)據(jù)準(zhǔn)確提取并分類。但此系統(tǒng)只能用于數(shù)據(jù)量較少的網(wǎng)絡(luò)大數(shù)據(jù)平臺中,數(shù)據(jù)量過多時,系統(tǒng)的穩(wěn)定性較低。

為了解決以上問題,設(shè)計穩(wěn)定性好、資源占用率低的網(wǎng)絡(luò)大數(shù)據(jù)平臺特征數(shù)據(jù)分類系統(tǒng)。實驗結(jié)果證明,所設(shè)計的系統(tǒng)能夠較好地實現(xiàn)設(shè)計初衷,為特征分類領(lǐng)域指引了新的方向。

1 網(wǎng)絡(luò)大數(shù)據(jù)平臺中的特征數(shù)據(jù)分類系統(tǒng)設(shè)計

所設(shè)計的網(wǎng)絡(luò)大數(shù)據(jù)平臺特征數(shù)據(jù)分類系統(tǒng)是基于SOA體系結(jié)構(gòu)和云計算設(shè)計的。SOA體系結(jié)構(gòu)能夠根據(jù)網(wǎng)民需求,將網(wǎng)絡(luò)大數(shù)據(jù)進行分布式配置,其應(yīng)用價值是無法估量的。將云計算凌駕于SOA體系結(jié)構(gòu)基礎(chǔ)上進行系統(tǒng)設(shè)計,則大大增強了云計算的兼容性和穩(wěn)定性,使穩(wěn)定性好、資源占用率低的特征數(shù)據(jù)分類工作得以實現(xiàn)。

1.1 顯示端設(shè)計

顯示端是網(wǎng)民的直接應(yīng)用端,其主要進行網(wǎng)絡(luò)大數(shù)據(jù)的獲取、大數(shù)據(jù)獲取結(jié)果的顯示和特征分類結(jié)果的顯示。對于不同的網(wǎng)絡(luò)大數(shù)據(jù)平臺,顯示端所進行的工作流程并不相同,這需要根據(jù)實際情況進行分析。

顯示端為網(wǎng)民提供了非常簡單易懂的交互頁面,便于網(wǎng)民的操作以及系統(tǒng)的自管理。網(wǎng)絡(luò)大數(shù)據(jù)平臺特征數(shù)據(jù)分類系統(tǒng)對網(wǎng)絡(luò)大數(shù)據(jù)的特征數(shù)據(jù)分類結(jié)果,是按照一定的分類標(biāo)準(zhǔn)進行統(tǒng)計并顯示的,顯示方法主要是文字、圖形和視頻。網(wǎng)絡(luò)大數(shù)據(jù)的獲取工作一部分是根據(jù)網(wǎng)民個性化定制的,但大部分的網(wǎng)絡(luò)大數(shù)據(jù)還是基于網(wǎng)絡(luò)大數(shù)據(jù)平臺特征數(shù)據(jù)分類系統(tǒng)的預(yù)設(shè)參數(shù)進行的。顯示端所獲取到大數(shù)據(jù)將傳輸?shù)椒?wù)端。

1.2 服務(wù)端設(shè)計

服務(wù)端是網(wǎng)絡(luò)大數(shù)據(jù)平臺特征數(shù)據(jù)分類系統(tǒng)的基礎(chǔ),其能夠接受軟件的直接調(diào)用,為特征數(shù)據(jù)的準(zhǔn)確分類提供技術(shù)支持。服務(wù)端利用SOA體系結(jié)構(gòu)為網(wǎng)絡(luò)大數(shù)據(jù)平臺提供特征數(shù)據(jù)的分類服務(wù),并將特征數(shù)據(jù)的分類標(biāo)準(zhǔn)納入到網(wǎng)絡(luò)大數(shù)據(jù)中。圖1是SOA對外接口示意圖。由圖1可知,SOA的接口是中立的,并與網(wǎng)絡(luò)大數(shù)據(jù)平臺特征數(shù)據(jù)分類系統(tǒng)的硬件設(shè)施和編程軟件獨立開來,使進入服務(wù)端的網(wǎng)絡(luò)大數(shù)據(jù)均通過相同的流程進行交互,以縮減系統(tǒng)資源利用率、增強系統(tǒng)穩(wěn)定性?;赟OA的服務(wù)端的大數(shù)據(jù)傳輸接口分為兩種,一種是同顯示端的輸入接口,另一種是同邏輯層處理端的輸出接口,如圖2所示。

圖2中,服務(wù)端上部是其與顯示端的輸入接口,下部是與邏輯層處理端的輸出接口。輸入接口的輸入數(shù)據(jù)主要作為服務(wù)端設(shè)定標(biāo)準(zhǔn)的借鑒參數(shù),包括接口參數(shù)和后臺分類參數(shù)。服務(wù)端根據(jù)以上兩種參數(shù)設(shè)定自身的處理參數(shù),包括軟件調(diào)用參數(shù)和后臺運行參數(shù),這兩種參數(shù)主要進行大數(shù)據(jù)目標(biāo)層后臺操作和網(wǎng)民返還的標(biāo)準(zhǔn)制定。同時,顯示端獲取到的網(wǎng)絡(luò)大數(shù)據(jù)將以集合形式無差別地傳輸?shù)椒?wù)端處理并存儲。

輸出接口能夠?qū)⒎?wù)端所制定的特征數(shù)據(jù)分類標(biāo)準(zhǔn)傳輸?shù)竭壿媽犹幚矶?,包括網(wǎng)民的個性化分類標(biāo)準(zhǔn)和系統(tǒng)的后臺操作標(biāo)準(zhǔn),網(wǎng)絡(luò)大數(shù)據(jù)仍將以集合的形式無差別傳輸。

1.3 邏輯層處理端設(shè)計

邏輯層處理端能夠?qū)崿F(xiàn)服務(wù)端所制定的特征數(shù)據(jù)分類標(biāo)準(zhǔn),并利用云計算對網(wǎng)絡(luò)大數(shù)據(jù)集合進行特征提取。邏輯層處理端根據(jù)特征數(shù)據(jù)分類標(biāo)準(zhǔn),首先對網(wǎng)絡(luò)大數(shù)據(jù)集合開始定性分析,并對分析結(jié)果進行管理。

為了提高網(wǎng)絡(luò)大數(shù)據(jù)平臺特征數(shù)據(jù)分類系統(tǒng)的穩(wěn)定性,邏輯層處理端的定性分析工作主要通過云計算和策略設(shè)計進行,云計算先將網(wǎng)絡(luò)大數(shù)據(jù)集合從傳輸接口中調(diào)出,再經(jīng)由大數(shù)據(jù)坐標(biāo)系構(gòu)建、大數(shù)據(jù)更正和限制等計算操作,給出網(wǎng)絡(luò)大數(shù)據(jù)特征類型,為策略設(shè)計的特征提取工作打下堅實的基礎(chǔ)。圖3是策略設(shè)計原理圖。

由圖3可知,策略設(shè)計由網(wǎng)絡(luò)環(huán)境、策略和策略實施三步驟組成,這三個步驟雖然是相互封裝進行的,但也存在一定的關(guān)聯(lián)性。策略設(shè)計首先檢測網(wǎng)絡(luò)環(huán)境,再給出特征數(shù)據(jù)的提取策略。特征數(shù)據(jù)提取策略的實施是雙向進行的,通常給出A,B兩種通道同時開始實施工作。邏輯層處理端將網(wǎng)絡(luò)大數(shù)據(jù)的特征提取出來后,網(wǎng)絡(luò)大數(shù)據(jù)平臺特征數(shù)據(jù)分類系統(tǒng)將進入最終處理流程,這項工作是經(jīng)由特征數(shù)據(jù)分類端完成的。

1.4 特征數(shù)據(jù)分類端設(shè)計

特征數(shù)據(jù)分類端能夠?qū)崿F(xiàn)人工操作的完全解放,其根據(jù)邏輯層處理端所提取出的大數(shù)據(jù)特征,利用分類器進行特征數(shù)據(jù)的自動分類工作。圖4是特征數(shù)據(jù)分類端給出的特征數(shù)據(jù)最優(yōu)分類原理圖。

由圖4可知,特征數(shù)據(jù)分類端所設(shè)計的特征數(shù)據(jù)最優(yōu)分類原理,是基于特征向量機這一分類器實現(xiàn)的。特征向量機是一種將統(tǒng)計學(xué)應(yīng)用于特征數(shù)據(jù)分類工作的設(shè)備,其運算精準(zhǔn),有很高的工作效率,且對網(wǎng)絡(luò)大數(shù)據(jù)類型的分類限制較少,有效簡化了網(wǎng)絡(luò)大數(shù)據(jù)平臺特征數(shù)據(jù)分類系統(tǒng)的工作流程,縮減了系統(tǒng)的資源占用率。

特征向量機根據(jù)邏輯層處理端提取出的網(wǎng)絡(luò)大數(shù)據(jù)特征,將網(wǎng)絡(luò)大數(shù)據(jù)分解成向量形式,其中的支持向量將被分配到兩端,一端用于接收與特征數(shù)據(jù)無關(guān)的向量,另一端則經(jīng)由最優(yōu)超平面進行分類。特征向量機的分類間隔由特征數(shù)據(jù)分類端根據(jù)網(wǎng)絡(luò)的實際情況進行設(shè)置。

2 特征數(shù)據(jù)分類系統(tǒng)軟件設(shè)計

所設(shè)計的網(wǎng)絡(luò)大數(shù)據(jù)平臺特征數(shù)據(jù)分類系統(tǒng)需要對網(wǎng)絡(luò)大數(shù)據(jù)的特征提取,才能進行特征數(shù)據(jù)的分類工作。由于網(wǎng)絡(luò)大數(shù)據(jù)類型過多,無法一一列出,故以其中的多媒體大數(shù)據(jù)為例,給出特征提取算法。多媒體大數(shù)據(jù)的時域特征雖在特征分類中很少應(yīng)用,但對于特定的多媒體大數(shù)據(jù)來講卻是不可缺少的;頻域則應(yīng)用較多。因此,系統(tǒng)對多媒體大數(shù)據(jù)的時域和頻域分別進行了特征提取。

2.1 時域特征提取算法

時域特征主要包括瞬時能量及其均方值、過零率以及高過零幀比。

瞬時能量的單位通常是幀,對網(wǎng)絡(luò)大數(shù)據(jù)中的多媒體大數(shù)據(jù)來講,一般是將每幀的參照點幅值的平方和作為時間同多媒體大數(shù)據(jù)增減的參照能量值,其表達式如下:

多媒體大數(shù)據(jù)中語音信號的不同音色往往交替出現(xiàn),這將造成過零率波動趨勢的增大,高過零幀比較大;而視頻信號的音色波動卻不明顯,高過零幀比較小。根據(jù)以上原理能夠準(zhǔn)確進行多媒體大數(shù)據(jù)的特征分類。

2.2 頻域特征提取算法

時域特征主要進行多媒體大數(shù)據(jù)中梅爾頻率倒譜系數(shù)和線性預(yù)測系數(shù)的特征提取,其對頻譜以及子帶能量等的特征提取均為輔助提取。

梅爾頻率倒譜系數(shù)是一種對梅爾尺度等距劃分頻帶的特征,其擁有較高的抵抗噪音能力,且與頻率具有線性關(guān)系。因此,常將梅爾頻率倒譜系數(shù)作為多媒體大數(shù)據(jù)頻率特征的替代特征。若想獲取梅爾頻率倒譜系數(shù),軟件需對多媒體大數(shù)據(jù)進行語音加重、幀分類、添窗等處理,此時將獲取到幀的時域信號用表示。對幀的時域信號進行傅里葉變換后將獲取到離散頻譜,用表示,則離散頻譜的表達式為:

3 實驗驗證

實驗對本文所設(shè)計的網(wǎng)絡(luò)大數(shù)據(jù)平臺特征數(shù)據(jù)分類系統(tǒng)的穩(wěn)定性和資源占用率進行了驗證。實驗選取兩種類型不同的網(wǎng)絡(luò)大數(shù)據(jù)平臺(分別編號為平臺1和平臺2),驗證本文系統(tǒng)的穩(wěn)定性和資源占用率。實驗結(jié)果如表1~表3所示。

由表1和表2可知,召回率和F1值代表著本文系統(tǒng)對特征數(shù)據(jù)分類水平的預(yù)測值。本文系統(tǒng)在平臺1和平臺2中,均具有較高的分類準(zhǔn)確率,且平臺的分類準(zhǔn)確率、召回率和F1值結(jié)果相差不大,驗證了本文的穩(wěn)定性較好。由表3可知,本文系統(tǒng)的CPU占用率實驗結(jié)果范圍為[48%,58%],內(nèi)存占用率實驗結(jié)果范圍為[20%,33%]。而以往研究出的網(wǎng)絡(luò)大數(shù)據(jù)平臺特征數(shù)據(jù)分類系統(tǒng)的CPU占用率和內(nèi)存占用率大致在70%和40%,驗證了本文系統(tǒng)資源占用率低。

4 結(jié) 論

本文設(shè)計穩(wěn)定性好、資源占用率低的網(wǎng)絡(luò)大數(shù)據(jù)平臺特征數(shù)據(jù)分類系統(tǒng)。系統(tǒng)的顯示端是網(wǎng)民的直接應(yīng)用端,其主要進行網(wǎng)絡(luò)大數(shù)據(jù)的獲取、大數(shù)據(jù)獲取結(jié)果的顯示和特征分類結(jié)果的顯示工作。服務(wù)端利用SOA體系結(jié)構(gòu)為網(wǎng)絡(luò)大數(shù)據(jù)平臺提供特征數(shù)據(jù)的分類服務(wù),其將特征數(shù)據(jù)的分類標(biāo)準(zhǔn)納入到網(wǎng)絡(luò)大數(shù)據(jù)中,并傳遞給邏輯層處理端。邏輯層處理端利用云計算對網(wǎng)絡(luò)大數(shù)據(jù)集合進行特征提取,其特征提取算法于軟件中給出。特征數(shù)據(jù)分類端根據(jù)邏輯層處理端所提取出的大數(shù)據(jù)特征,利用特征向量機進行特征數(shù)據(jù)的自動分類工作。實驗結(jié)果表明,所設(shè)計的系統(tǒng)穩(wěn)定性好、資源占用率低。

參考文獻

[1] 尹曉華,胡楠,劉為,等.OpenFlow在電力大數(shù)據(jù)平臺中的應(yīng)用[J].電力建設(shè),2015,36(3):43?48.

[2] 李維乾,李莉,張曉濱,等.Hadoop平臺下突發(fā)水污染應(yīng)急預(yù)案并行化處置[J].西安工程大學(xué)學(xué)報,2015,29(6):733?739.

[3] 樸雪,張立,俞嘯,等.面向醫(yī)療大數(shù)據(jù)平臺的異構(gòu)網(wǎng)絡(luò)網(wǎng)關(guān)的設(shè)計[J].自動化儀表,2015,36(9):42?44.

[4] 王昌輝.云計算設(shè)備中的大數(shù)據(jù)特征高效分類挖掘方法研究[J].現(xiàn)代電子技術(shù),2015,38(22):55?58.

[5] 林海.基于SO平臺的4G網(wǎng)絡(luò)大數(shù)據(jù)優(yōu)化分析手段研究[J].新媒體研究,2015,1(9):18?19.

[6] 關(guān)培源,陳志剛,王云華,等.基于移動醫(yī)療大數(shù)據(jù)平臺下降低能量消耗機會網(wǎng)絡(luò)的研究與應(yīng)用[J].計算機應(yīng)用研究,2015,32(12):3790?3793.

[7] 吳純青,任沛閣,王小峰.基于語義的網(wǎng)絡(luò)大數(shù)據(jù)組織與搜索[J].計算機學(xué)報,2015,38(1):1?17.

[8] 張建,孫銘,段娟.基于大數(shù)據(jù)平臺的精準(zhǔn)廣告系統(tǒng)研究與設(shè)計[J].電腦與信息技術(shù),2015,23(4):47?50.

[9] 張兆楠,萬錄品.基于移動互聯(lián)網(wǎng)及大數(shù)據(jù)的學(xué)校心理健康自服務(wù)系統(tǒng)的研究[J].移動通信,2016,40(5):35?40.

猜你喜歡
云計算
云計算虛擬化技術(shù)在電信領(lǐng)域的應(yīng)用研究
基于云計算的醫(yī)院信息系統(tǒng)數(shù)據(jù)安全技術(shù)的應(yīng)用探討
談云計算與信息資源共享管理
志愿服務(wù)與“互聯(lián)網(wǎng)+”結(jié)合模式探究
云計算與虛擬化
基于云計算的移動學(xué)習(xí)平臺的設(shè)計
基于云計算環(huán)境下的ERP教學(xué)改革分析
科技視界(2016年22期)2016-10-18 14:33:46
基于MapReduce的故障診斷方法
實驗云:理論教學(xué)與實驗教學(xué)深度融合的助推器
云計算中的存儲虛擬化技術(shù)應(yīng)用
科技視界(2016年20期)2016-09-29 13:34:06
深水埗区| 河间市| 桃园市| 体育| 天水市| 客服| 闽清县| 志丹县| 收藏| 望都县| 乳山市| 汉中市| 潞城市| 兴化市| 丽水市| 蒙阴县| 临颍县| 青州市| 辉南县| 余江县| 铁岭县| 忻州市| 彭阳县| 措勤县| 商南县| 宜阳县| 玛沁县| 温州市| 陇南市| 锦州市| 罗田县| 桓仁| 普兰店市| 水富县| 商都县| 景德镇市| 淳化县| 射洪县| 南阳市| 铜鼓县| 建昌县|