国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機(jī)器學(xué)習(xí)的通信網(wǎng)絡(luò)非結(jié)構(gòu)化大數(shù)據(jù)分析算法

2018-02-14 12:49:08李偉陳如旭
關(guān)鍵詞:通信網(wǎng)絡(luò)大數(shù)據(jù)分析機(jī)器學(xué)習(xí)

李偉 陳如旭

摘要:本文主要對(duì)大數(shù)據(jù)中的典型緯度和特點(diǎn)進(jìn)行分析,然后提出基于機(jī)器學(xué)習(xí)的通信網(wǎng)絡(luò)非結(jié)構(gòu)化大數(shù)據(jù)算法,最后對(duì)算法的性能進(jìn)行全面的分析。

關(guān)鍵詞:機(jī)器學(xué)習(xí);通信網(wǎng)絡(luò);非結(jié)構(gòu)化;大數(shù)據(jù)分析

中圖分類號(hào):TP311.13? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? 文章編號(hào):1007-9416(2018)10-0000-00

現(xiàn)如今的大數(shù)據(jù)中復(fù)雜數(shù)據(jù)集和超大的數(shù)據(jù)量級(jí)等特點(diǎn),需要專業(yè)的分析工具對(duì)其予以分析,為此,提出以機(jī)器學(xué)習(xí)為基礎(chǔ)的通信網(wǎng)絡(luò)非結(jié)構(gòu)化大數(shù)據(jù)分析算法,將其應(yīng)用到大數(shù)據(jù)分析中。雖然關(guān)于不同類型數(shù)據(jù)的處理技術(shù)研究已經(jīng)在展開,但是在并行效率的優(yōu)化方面依舊有待提升,尤其是針對(duì)信息分散較廣的在線用戶端信息分析難度更大。

1 大數(shù)據(jù)的特點(diǎn)及緯度

對(duì)于在極短時(shí)間內(nèi),完成數(shù)以百萬次計(jì)算的動(dòng)態(tài)數(shù)據(jù)集的需求,大數(shù)據(jù)分析所面臨的挑戰(zhàn)是前所未有的。而這種挑戰(zhàn)很大程度上源于大數(shù)據(jù)的數(shù)據(jù)特征。大容量是大數(shù)據(jù)最基本的特點(diǎn),結(jié)合數(shù)據(jù)為異構(gòu)數(shù)據(jù)的原因,想要進(jìn)行批量處理是不太現(xiàn)實(shí)的。另外,考慮到大數(shù)據(jù)一般是分布式的,所以是做不到集中處理工具一次性多種操作的處理[1]。

在當(dāng)今最新大數(shù)據(jù)分析過程中,對(duì)大數(shù)據(jù)的特點(diǎn)進(jìn)行調(diào)整,然后成為:(1)以每分鐘為單位的數(shù)據(jù)量會(huì)增加;(2)數(shù)據(jù)雖然可以擁有多種格式,卻無法進(jìn)行批量處理;(3)數(shù)據(jù)之間的關(guān)系會(huì)隨著大數(shù)據(jù)量的不斷增加變得更加復(fù)雜,同時(shí)這種復(fù)雜關(guān)系愈來愈高;(4)當(dāng)決策人員進(jìn)行決策時(shí),其可以提供數(shù)據(jù)支持和實(shí)證;(5)由于數(shù)據(jù)來源廣,其聚合的難度也是非常高的。

接著將視線轉(zhuǎn)移到大數(shù)據(jù)的緯度,大數(shù)據(jù)的緯度是C3緯度,而關(guān)于存儲(chǔ)、挖掘、機(jī)器學(xué)習(xí)及分析數(shù)據(jù)等方面,都是建模時(shí)必須要著重考慮的。C3所對(duì)應(yīng)的內(nèi)容包括:(1)集合化的對(duì)象,其能夠?qū)μ卣骱蛿?shù)量進(jìn)行記錄;(2)大數(shù)據(jù)的表達(dá)特點(diǎn),包括其所占用的空間;(3)負(fù)載性通常指的是三維度,分別是:數(shù)據(jù)類型變化、數(shù)據(jù)集維度和數(shù)據(jù)高速處理需求。

大數(shù)據(jù)分析解決方案的核心,也就是所討論的數(shù)據(jù)大小和復(fù)雜度,只有解決了這些問題,這樣大數(shù)據(jù)分析的結(jié)果方可被更好的使用。為了驗(yàn)證這一說法,我們將時(shí)下的在線教育作為例子,以此加以說明?,F(xiàn)如今,教育方式已經(jīng)發(fā)生了翻天覆地的變化,不再僅僅局限于傳統(tǒng)的課堂教育,當(dāng)前在線交互式教育越來越受歡迎,它可以實(shí)現(xiàn)將世界各地的學(xué)生們匯聚在同一個(gè)“虛擬教室”里進(jìn)行學(xué)習(xí)。這種模式的更迭,最終造成互聯(lián)網(wǎng)數(shù)據(jù)呈井噴式增長(zhǎng)趨勢(shì),伴隨著聯(lián)系和交集的加深,在線教學(xué)所產(chǎn)生的交互數(shù)據(jù)格式和形式也有了很大的變化。在線教育當(dāng)今的數(shù)據(jù)源的特征非常鮮明,并不是所有的教學(xué)材料都是電子化形式,非電子材質(zhì)還是占據(jù)一定比例的,而新數(shù)據(jù)的組成部分也是豐富的,分別有:學(xué)校服務(wù)器運(yùn)行日志、信息系統(tǒng)自身運(yùn)行數(shù)據(jù)信息、學(xué)生在公共網(wǎng)絡(luò)上表達(dá)的言論觀點(diǎn)等等。結(jié)合現(xiàn)代大數(shù)據(jù)呈現(xiàn)多樣化和大容量的特點(diǎn),這意味著數(shù)據(jù)的分析和處理性能有著更高的要求,方可滿足大數(shù)據(jù)的發(fā)展需求。

2 大數(shù)據(jù)分析算法

本文所提及的,關(guān)于以機(jī)器學(xué)習(xí)為基礎(chǔ)通信網(wǎng)絡(luò)非結(jié)構(gòu)化大數(shù)據(jù)分析算法,實(shí)際上就是在線終端分析算法(簡(jiǎn)稱OTA),其具體的設(shè)計(jì)如[2]:

(1)OTA的學(xué)習(xí)算法的性質(zhì)為監(jiān)督作用,其主要功能在于挖掘在線客戶的數(shù)據(jù)庫(kù)。已識(shí)別的標(biāo)簽,生成集,非生成集和數(shù)字,這些均可以成為訓(xùn)練集的輸入數(shù)據(jù),每一次更迭,輸入一種數(shù)據(jù)類型。事物都有兩面性,預(yù)測(cè)結(jié)果有時(shí)候也會(huì)出錯(cuò),所以訓(xùn)練過程顯得非常重要,當(dāng)出錯(cuò)時(shí),訓(xùn)練過程就能夠發(fā)揮自我修訂的作用,一直到訓(xùn)練集數(shù)據(jù)達(dá)到正確為準(zhǔn)。

(2)在線終端分析算法主要圍繞非結(jié)構(gòu)化數(shù)據(jù)所設(shè)計(jì)。OTA是直接面向應(yīng)用場(chǎng)景的,非結(jié)構(gòu)化數(shù)據(jù)是其訓(xùn)練集實(shí)例的組成部分,在進(jìn)行對(duì)象之間的聯(lián)系關(guān)聯(lián)時(shí),OTA的加權(quán)參數(shù)是以相鄰節(jié)點(diǎn)距離參考的,然后進(jìn)行評(píng)估關(guān)聯(lián)度。

(3)對(duì)于名字節(jié)點(diǎn)文件的存儲(chǔ)系統(tǒng)轉(zhuǎn)換數(shù)據(jù)的形態(tài),一般來說主要有兩種,一種是在塊編號(hào)中融入數(shù)據(jù)節(jié)點(diǎn),另外一種是在數(shù)據(jù)節(jié)點(diǎn)中融入數(shù)據(jù)塊。為了實(shí)現(xiàn)對(duì)工作節(jié)點(diǎn)的任務(wù)執(zhí)行全面監(jiān)督,本文對(duì)OTA中設(shè)置了任務(wù)跟蹤器,同時(shí)還能匯報(bào)工作跟蹤器的實(shí)時(shí)情況。如果任務(wù)跟蹤器有接收到任務(wù)時(shí),本地工作跟蹤器將會(huì)獲得由其分配的任務(wù),然后是數(shù)據(jù)的生成,這樣就可以工作跟蹤器的進(jìn)程進(jìn)行匯報(bào)。為了達(dá)成檢驗(yàn)Map過程的目的,將其中所要輸入的數(shù)據(jù)劃分成很多個(gè)數(shù)據(jù)切片,其次對(duì)其輸入在線終端分析算法,完成之后,再接著把數(shù)據(jù)切片輸入到Hadoop平臺(tái)中加以處理分析。

當(dāng)在Map結(jié)束后,則會(huì)進(jìn)入下一個(gè)階段:Red階段,而這個(gè)階段則是數(shù)據(jù)并行處理的過程。其主要任務(wù)是將數(shù)據(jù)合并,該合并的數(shù)據(jù)則視為最終的分析結(jié)果。考慮到Red是將Map結(jié)果作為依據(jù)而執(zhí)行的,為此在運(yùn)行處理過程中,絕對(duì)的并行顯然并不現(xiàn)實(shí),而在Map結(jié)束之后所進(jìn)行的Red階段,要實(shí)現(xiàn)優(yōu)化的難度很大。然后理論上來看,通過Map與Red 來進(jìn)行傳輸數(shù)據(jù)的過程中,其結(jié)構(gòu)和接收數(shù)據(jù)值是相對(duì)應(yīng)的。接收數(shù)據(jù)映射的輸出為相同映射機(jī)構(gòu),并且要結(jié)合實(shí)際情況,不一樣的值,要采用對(duì)應(yīng)的步驟進(jìn)行處理。

3 算法的性能分析

為了對(duì)在線終端分析算法性能進(jìn)一步挖掘和分析,本篇文章將在線購(gòu)物作為例子展開研究,通過分析其原始數(shù)據(jù)性能,從而獲得在線購(gòu)物的用戶數(shù)據(jù)信息。

(1)先創(chuàng)建大數(shù)據(jù)平臺(tái),可以進(jìn)行測(cè)試數(shù)據(jù),然后配置平臺(tái)。待一切準(zhǔn)備就緒后,可以全方面地分析運(yùn)行數(shù)據(jù),每一次運(yùn)行的信息節(jié)點(diǎn)數(shù)量是有差異的,與此同時(shí)每次處理的時(shí)間也是不一樣的??梢愿鶕?jù)不同的時(shí)間和節(jié)點(diǎn)數(shù)量來制作相應(yīng)的圖表進(jìn)行對(duì)比分析。就會(huì)發(fā)現(xiàn),時(shí)間與節(jié)點(diǎn)數(shù)量為正比關(guān)系。(2)為了可以全面評(píng)估OTA在運(yùn)行過程中數(shù)據(jù)分析的結(jié)果,可以采用四次運(yùn)算的名字及數(shù)據(jù)節(jié)點(diǎn)的大小對(duì)比的方法來對(duì)以上的分析結(jié)果名稱節(jié)點(diǎn)及數(shù)據(jù)節(jié)點(diǎn)進(jìn)行全面的分析。(3)關(guān)于比較計(jì)算過程中的效率,也就是OTA和傳統(tǒng)數(shù)據(jù)庫(kù)兩者的對(duì)比,以每秒實(shí)現(xiàn)處理的次數(shù)作為單位,再去對(duì)比這兩種算法,最后可以發(fā)現(xiàn):其運(yùn)行節(jié)點(diǎn)和數(shù)量與最初的分析結(jié)果相符合一致。

4 結(jié)語

綜上所述,數(shù)字化進(jìn)程不斷加快,隨著數(shù)據(jù)呈直線式的增長(zhǎng),大數(shù)據(jù)中也會(huì)存在著一定的問題,其構(gòu)成也會(huì)由簡(jiǎn)單轉(zhuǎn)向復(fù)雜化,而且數(shù)據(jù)的量之大,變之快,如果還是采用傳統(tǒng)的機(jī)器學(xué)習(xí)算法來分析和處理大數(shù)據(jù),恐怕是難以實(shí)現(xiàn)。因此,本文在機(jī)器學(xué)習(xí)的基礎(chǔ)上,對(duì)通信網(wǎng)絡(luò)非結(jié)構(gòu)化的大數(shù)據(jù)分析算法進(jìn)行全面分析,通過對(duì)其算法性能進(jìn)行研究分析得出,線終端分析算法性能是良好的,可以實(shí)現(xiàn)對(duì)大數(shù)據(jù)的有效分析處理,此外關(guān)于傳統(tǒng)機(jī)器學(xué)習(xí)過程中所遇到的問題也可以行之有效地予以解決。

參考文獻(xiàn)

[1] 亢華愛.面向機(jī)器學(xué)習(xí)的通信網(wǎng)絡(luò)大數(shù)據(jù)相關(guān)性分析算法研究[J].激光雜志,2016,(8):145-148.

[2] 許春玲,范志剛,宋應(yīng)文.機(jī)器學(xué)習(xí)算法的網(wǎng)絡(luò)大數(shù)據(jù)級(jí)應(yīng)用實(shí)踐[J].網(wǎng)絡(luò)新媒體技術(shù),2012,(6):63-69.

Machine Learning Based Unstructured Large

Data Analysis Algorithm for Communication Networks

LI Wei, CHEN Ru-xu

(China Tong Service Consulting and Design Institute Co., Ltd. ,Nanjing Jiangsu 210019)

Abstract: This paper mainly analyses the typical latitude and characteristics of large data, then proposes an unstructured large data algorithm for communication network based on machine learning, and finally makes a comprehensive analysis of the performance of the algorithm.

Key words: machine learning; communication network; unstructured; big data analysis

猜你喜歡
通信網(wǎng)絡(luò)大數(shù)據(jù)分析機(jī)器學(xué)習(xí)
空間激光通信研究及發(fā)展趨勢(shì)
物聯(lián)網(wǎng)關(guān)鍵技術(shù)的發(fā)展對(duì)通信網(wǎng)絡(luò)的影響
軍民融合背景下通信網(wǎng)絡(luò)協(xié)調(diào)發(fā)展策略
面向大數(shù)據(jù)遠(yuǎn)程開放實(shí)驗(yàn)平臺(tái)構(gòu)建研究
面向大數(shù)據(jù)分析的信息管理實(shí)踐教學(xué)體系構(gòu)建
傳媒變局中的人口電視欄目困境與創(chuàng)新
科技傳播(2016年19期)2016-12-27 14:35:21
電力系統(tǒng)通信的網(wǎng)絡(luò)安全問題
大數(shù)據(jù)分析的移動(dòng)端在網(wǎng)絡(luò)課堂教學(xué)中的應(yīng)用
基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析
错那县| 额济纳旗| 化州市| 普定县| 通山县| 黑河市| 高邑县| 马山县| 邮箱| 华容县| 依兰县| 乡城县| 墨江| 莱西市| 日喀则市| 德令哈市| 湖州市| 绵竹市| 淮南市| 丰都县| 和政县| 大城县| 湖州市| 勃利县| 江安县| 乐安县| 清水河县| 延安市| 曲阜市| 抚顺市| 巴青县| 海宁市| 兴仁县| 阿尔山市| 平顶山市| 东丽区| 遂平县| 崇左市| 梓潼县| 台山市| 滨州市|