摘 要
作為一種新型計算模式,云計算的應用對于改善物聯(lián)網(wǎng)運營平臺的信息處理與計算能力具有重要作用。本文首先介紹了物聯(lián)網(wǎng)運營平臺的總體結構構建,然后具體探討了物聯(lián)網(wǎng)運營平臺構建中采用的關鍵云計算技術,以期為相關技術與設計人員提供參考。
【關鍵詞】云計算 物聯(lián)網(wǎng)運行平臺 構建
物聯(lián)網(wǎng)的智能處理過程需在信息技術的支持下才能完成,而IT技術與通信技術未來發(fā)展的結合點便為云計算技術。云計算具備信息數(shù)據(jù)快速處理的性能,若要將其迅速普及到各行各業(yè)和社會中,則必須依靠高速及寬大的網(wǎng)絡發(fā)展。因此,加強有關基于云計算的物聯(lián)網(wǎng)運營平臺構建分析,對于改善物聯(lián)網(wǎng)運營平臺的設計質量具有重要的現(xiàn)實意義。
1 物聯(lián)網(wǎng)運營平臺的總體結構構建
在綜合分析物聯(lián)網(wǎng)運營平臺需求與特點的基礎上可以發(fā)現(xiàn),物聯(lián)網(wǎng)需具備大規(guī)模的資源與數(shù)據(jù)處理能力,而對于大規(guī)模數(shù)據(jù)的處理與計算則必須使用云計算技術?;谠朴嬎愕奈锫?lián)網(wǎng)運營平臺通常包含以下內(nèi)容:
1.1 平臺服務
作為物聯(lián)網(wǎng)的重要組成部分,云平臺具備控制與配置網(wǎng)絡節(jié)點、信息計算與采集的功能,其通過分布式計算技術和分布式存儲技術對海量數(shù)據(jù)信息進行分析,并給出大數(shù)據(jù)量數(shù)據(jù)動態(tài)處理服務。云平臺能同時對多項業(yè)務及任務進行處理,且能依據(jù)不同業(yè)務特點對計算功能進行分離,以構建優(yōu)化計算模型供云調用利用。
1.2 軟件服務
物聯(lián)網(wǎng)與云計算可通過虛擬物力資源向客戶提供基本的業(yè)務服務,也可專門供第三方使用。第三方提供軟件,云平臺通過虛擬化過程分別租賃給不同的商戶,且讓不同租戶間進行資源共享,依據(jù)租戶需求實施計費,此種方式不僅能大幅度降低運行成本,還可改善資源利用率。
1.3 基礎設備服務
云計算應用過程中所需的基礎設備有網(wǎng)路設備、服務器、帶寬、存儲設備等出售設備。利用虛擬化模型對物理資源進行有效處理,可促進物聯(lián)網(wǎng)平臺不同行業(yè)間或同行業(yè)間不同客戶間的資源共享,且不會受到設備與地點的限制,由此便能加大資源的有效配置,減少資源浪費,且可大幅度降低成本,提高使用質量。
2 物聯(lián)網(wǎng)運營平臺構建采用的關鍵云計算技術
2.1 用戶個性化推薦與用戶聚類的分布式應用構建
在應用構建前應先開展應用業(yè)務分析,在組織和評估內(nèi)外部資源的基礎上界定不同類的業(yè)務問題;依據(jù)應用種類的差異進行數(shù)據(jù)采集與處理,并按照應用需要采用網(wǎng)頁解析、爬蟲、分詞等技術對數(shù)據(jù)實施獲取與辨認。對于已采集到的數(shù)據(jù)進行處理方法通常有數(shù)據(jù)重構、數(shù)據(jù)格式化、數(shù)據(jù)量化處理與數(shù)據(jù)整合等。在選用獨立性變量時要構建分類模型,采用不同的數(shù)據(jù)挖掘算法以實現(xiàn)用戶分群功能。依據(jù)聚類結果開展業(yè)務解析,并依據(jù)不同用戶群的特質建立個性化方案。
2.2 數(shù)據(jù)挖掘算法
以云計算為基礎的數(shù)據(jù)挖掘算法的分布式文件系統(tǒng)HDFS是分布式計算平臺的重要組成部分。在平臺構建時要先全面分析了解分布式文件系統(tǒng)的write-one-read-many訪問模型及其對于并行計算、分布式文件系統(tǒng)的層次結構及其Namespace、分布式文件系統(tǒng)的Datanode與Namenode劃分機制及Master/Slave架構;然后研究分析Hadoop中的并行計算算法,其主要包括并行計算算法的應用程序接口、通訊過程與其RPC實現(xiàn)機制、應用程序處理流程與基本組成、解決死鎖問題的錯誤處理機制等。在此類研究的基礎上,構建基于Hadoop的包括SSH安裝配置、硬件環(huán)境配置、Hadoop服務、環(huán)境變量設置、分布式文件系統(tǒng)的目錄文件結構設置、Data Node與Name Node配置、配置文件參數(shù)等部分的云計算集群平臺。
2.3 數(shù)據(jù)挖掘算法的并行算法實現(xiàn)
數(shù)據(jù)娃聚算法的并行算法實現(xiàn)主要通過以下流程:對類數(shù)據(jù)挖掘算法實施對應的MapReduce改造;對算法中的各MapReduce過程進行具體定義;在Hadoop平臺上開展編碼;測試已完成的數(shù)據(jù)挖掘并行算法。解析效果評測數(shù)據(jù)主要為SougouT 1TB或天王200G網(wǎng)頁數(shù)據(jù),任意抽取不同網(wǎng)頁開展人工測評,正文提取的準確率應保證高于90%。
采用MapReduce對定義輸入輸出格式化OutFormat與InputFormat類、Reducer與Mapper類等過程進行處理,利用對MapReduce的參數(shù)和過程函數(shù)定義調整來改善算法的并行度,由此完成具有高度并行的分布式數(shù)據(jù)挖掘算法,集群中的機器數(shù)量與算法數(shù)據(jù)處理能力接近線性分布。
3 結束語
云計算技術的應用質量將直接關系到物聯(lián)網(wǎng)運營平臺的構建水平與功能使用,因此,相關技術與研究人員應加強有關基于云計算的物聯(lián)網(wǎng)運營平臺構建研究,總結平臺構建的基本要點及關鍵云計算處理措施,以逐步改善平臺構建中的云計算應用水平。
參考文獻
[1]梅海濤.基于云計算的物聯(lián)網(wǎng)運營平臺淺析[J].電信技術,2011,13(14):74-75.
[2]于洋.構建基于云計算的物聯(lián)網(wǎng)運營平臺分析與研究[J].電腦知識與技術,2013,06(10):61-62.
[3]王昆昆.論基于云計算的物聯(lián)網(wǎng)運營平臺建設[J].計算機光盤軟件與應用,2013,05(35):57-58.
作者簡介
劉倩(1981-),女,滿族,碩士研究生學歷。現(xiàn)為寧夏大學數(shù)學計算機學院講師。主要研究方向為圖形圖像處理與多媒體技術。
作者單位
寧夏大學數(shù)學計算機學院 寧夏銀川市 750001endprint