国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于BIM云系統(tǒng)的數(shù)據(jù)分類與處理研究

2017-12-10 08:31:58
關(guān)鍵詞:次數(shù)利用算法

陳 曦

(撫順職業(yè)技術(shù)學(xué)院,遼寧 撫順113122)

關(guān)鍵字:云計(jì)算;建筑信息模型;MRU算法;數(shù)據(jù)分類與處理

0 引言

近年來,云計(jì)算的發(fā)展十分迅速,運(yùn)用的范圍也非常廣泛,從原先的科研環(huán)境逐漸走向了各種行業(yè),比如生物學(xué)、天文學(xué)、交通管理、BIM管理等.如何針對各種異構(gòu)的分布式存儲環(huán)境來保持其穩(wěn)定性、快速響應(yīng),并且發(fā)揮硬件資源的高可用性,是目前研究的一個熱點(diǎn).

傳統(tǒng)的云計(jì)算模式是利用HBase傳送海量的數(shù)據(jù)給HDFS,分析后發(fā)送給服務(wù)器進(jìn)行處理.但是每次運(yùn)行都進(jìn)行海量的數(shù)據(jù)傳輸,不僅造成BIM云平臺的高負(fù)荷,也不利于提高資源的利用率.為減少數(shù)據(jù)的傳輸量,利用Most Recently Used算法[1]將數(shù)據(jù)分類為常用與不常用數(shù)據(jù),并利用常用數(shù)據(jù)來預(yù)測用戶下次使用的數(shù)據(jù)并提前進(jìn)行處理,從而提升整體運(yùn)算的效率.

1 相關(guān)技術(shù)介紹

1.1 BIM云系統(tǒng)

建筑信息模型 (Building Information Modeling,縮寫為BIM)是利用信息技術(shù)對建筑生命周期各個階段進(jìn)行管理的工具,包括規(guī)劃設(shè)計(jì)、建筑審查、工程施工、項(xiàng)目管理等,提供了最佳的應(yīng)用載體和信息管理模式,對傳統(tǒng)的建筑設(shè)計(jì)方法進(jìn)行了創(chuàng)新[1].

現(xiàn)有的商業(yè)BIM系統(tǒng),如Autodesk Revit、Bentley Architecture和Tekla Structures,都是專門用于建筑項(xiàng)目的集成和可視化開發(fā)的.但是這些商業(yè)BIM系統(tǒng)是在各自相對獨(dú)立的平臺上運(yùn)行的,數(shù)據(jù)無法共享,給用戶造成了一定的限制,建模實(shí)驗(yàn)對于硬件的要求較高,不利于推廣普及.

基于云計(jì)算的BIM,以BIM建筑信息模型作為基礎(chǔ),利用云計(jì)算進(jìn)行建筑效能分析 (Building Performance Analysis,BPA),從而得到符合環(huán)境效益的最佳設(shè)計(jì)方案.基于云計(jì)算的BIM具有以下優(yōu)點(diǎn):(1)與環(huán)境效益相匹配;(2)具有科學(xué)有效的評估建模過程;(3)BIM系統(tǒng)下的信息系統(tǒng)與可視化分析技術(shù).基于云計(jì)算的BIM,在大數(shù)據(jù)計(jì)算、可視化設(shè)計(jì)、建模分析、硬件投資、操作界面風(fēng)格等方面有著強(qiáng)大的優(yōu)勢,可以很好地節(jié)約項(xiàng)目實(shí)施時間和成本[2].

1.2 Hadoop系統(tǒng)

Hadoop集群作為系統(tǒng)的基礎(chǔ)設(shè)施,它可以利用大量廉價的硬件設(shè)備搭建服務(wù)器集群,在底層可以實(shí)現(xiàn)對集群的管理,在上層可以很方便地構(gòu)建企業(yè)級的應(yīng)用.Hadoop系統(tǒng)的核心是HDFS、MapReduce和HBase,前者允許在多臺普通機(jī)器上存儲和復(fù)制文件,后兩者分別用于執(zhí)行并行程序任務(wù)和儲存數(shù)據(jù)[3].

HDFS(Hadoop Distributed File System)具有高度容錯性,可以在低價的硬件設(shè)備上部署.HDFS很適合對大量資料重復(fù)的數(shù)據(jù)進(jìn)行讀寫.HDFS是一個Haster/Slave的結(jié)構(gòu),通常而言,只具有一個Master,上面運(yùn)行一個Name node,可能具有多個Slave,在上面各自運(yùn)行一個Data node.

MapReduce是來自Google的一項(xiàng)重要技術(shù),它是用以進(jìn)行大數(shù)據(jù)量計(jì)算的模型.MapReduc就是一種簡化并行計(jì)算的模型,可以較為簡單地對并行計(jì)算進(jìn)行開發(fā)并且應(yīng)用.它包括了兩項(xiàng)核心操作:Map和Reduce.在Map操作中,主要是對一些獨(dú)立元素組成的列表上的每個元素進(jìn)行操作.Reduce操作中是對列表上的元素進(jìn)行適當(dāng)合并[4].

1.3 HBase數(shù)據(jù)庫

HBase是一個開源的非關(guān)系型分布式數(shù)據(jù)庫,采用與Google的BigTable相似設(shè)計(jì)的分布式結(jié)構(gòu)化數(shù)據(jù)儲存系統(tǒng),其運(yùn)行于HDFS之上,提供Hadoop類似BigTable規(guī)模的服務(wù),有別于一般數(shù)據(jù)庫系統(tǒng)使用規(guī)模的服務(wù).利用HBase技術(shù)可在廉價PC Server上搭建起大規(guī)模結(jié)構(gòu)化儲存群集[5、6].

2 MRU算法模型設(shè)計(jì)與實(shí)現(xiàn)

2.1 MRU算法的實(shí)現(xiàn)策略

Most Recently Used(MRU)算法原本是為高速緩存而設(shè)計(jì)的算法,目的是為提升高速緩存中的Hit Rate,MRU算法的原理是依據(jù)數(shù)據(jù)被存取的頻率高低來區(qū)分?jǐn)?shù)據(jù)在高速緩存的存放順序.

在BIM云系統(tǒng)的HBase中,以數(shù)據(jù)的使用次數(shù)及時間為篩選條件,并利用MRU算法將數(shù)據(jù)分成常用與不常用,并利用數(shù)據(jù)庫進(jìn)行分類及管理,之后將常用數(shù)據(jù)傳輸給分布式文件系統(tǒng)進(jìn)行處理,以減少系統(tǒng)的處理量來達(dá)到效能的提升.其實(shí)現(xiàn)策略如圖1所示.

2.2 MRU算法的設(shè)定與使用

運(yùn)用MRU算法的原理,依據(jù)數(shù)據(jù)的存取次數(shù)及訪問時間,判斷出常用與不常用數(shù)據(jù),并在下一次循環(huán)中將常用數(shù)據(jù)進(jìn)行優(yōu)先處理.在BIM云系統(tǒng)中主要是在HBase和HDFS中間加上一個判斷模塊來進(jìn)行數(shù)據(jù)的分類處理.其架構(gòu)如圖2所示.

為了減少數(shù)據(jù)庫中的數(shù)據(jù)一次性大量地傳輸給HDFS處理,我們利用MRU算法來解決這個問題.通過MRU算法來區(qū)分常用與不常用的數(shù)據(jù),以數(shù)據(jù)的使用時間及次數(shù)來當(dāng)作MRU算法的篩選條件.同時利用兩個條件的原因在于:如果只設(shè)單一條件的話,對于判斷數(shù)據(jù)是常用數(shù)據(jù)會有非常大的問題,例如,如果只采用次數(shù)來判斷,可能會發(fā)生用戶因?yàn)閿?shù)據(jù)傳輸失敗而重復(fù)請求的情況;同樣,如果只采用時間的話,則會發(fā)生使用者只有這次要求傳輸?shù)褂脮r間比平時長的情況.所以,設(shè)定一個循環(huán)時間內(nèi)該數(shù)據(jù)的訪問次數(shù),并且使用時間設(shè)置在一定時間以上為篩選條件來判斷該數(shù)據(jù)是否為常用數(shù)據(jù).以30min為循環(huán)時間單位,存取次數(shù)N~M次,訪問時間達(dá)到Tmin以上的數(shù)據(jù)會被標(biāo)以常用數(shù)據(jù),與其他數(shù)據(jù)進(jìn)行區(qū)分,然后在下一個循環(huán)時間時會將常用數(shù)據(jù)優(yōu)先傳輸給HDFS進(jìn)行處理.其過程如圖3(見 34頁)所示.

利用這個方法不僅可以減少數(shù)據(jù)處理的數(shù)量,也可以達(dá)到利用預(yù)判方式來加快數(shù)據(jù)在HDFS中的處理過程.其過程如圖4所示.

3 BIM云系統(tǒng)實(shí)驗(yàn)分析

3.1 實(shí)驗(yàn)環(huán)境

(1)用戶常用數(shù)據(jù)次數(shù)分布.根據(jù)用戶的使用情況,對于程序的使用次數(shù)會有很多種不同的情況,必須經(jīng)過大量的樣本統(tǒng)計(jì)后取得相關(guān)信息.本實(shí)驗(yàn)所采用的樣本為撫順職業(yè)技術(shù)學(xué)院建筑工程系的80位學(xué)生于實(shí)驗(yàn)室使用BIM云系統(tǒng)的情況,因?yàn)楸仨毰懦龕阂饣驘o效的情形,所以將最低與最高的10%設(shè)為無效樣本,并在統(tǒng)計(jì)數(shù)據(jù)中舍棄.如圖5所示,可得存取次數(shù)的閾值N=3,M=5,以此當(dāng)作常用數(shù)據(jù)分類的標(biāo)準(zhǔn).

(2)用戶常用數(shù)據(jù)時間分布.僅以一個條件作為分類標(biāo)準(zhǔn)并不嚴(yán)謹(jǐn),所以需要另外一個判斷條件.因?yàn)楸仨毰懦龕阂饣驘o效的情形,所以將最低與最高的10%設(shè)為無效樣本.如圖6所示,可得超過15min為判斷條件,然后以30min的時間當(dāng)成一次循環(huán).

(3)實(shí)驗(yàn)環(huán)境.平臺主機(jī)2臺,配置為E5-2687W八核處理器3.1GHz(兩顆),內(nèi)存容量為64GB 1600MH,硬盤容量為2TB,1個Quardo K5000圖形卡,系統(tǒng)為Ubuntu-9.10-Server-Amd64,Hadoop版本為 Hadoop-2.2.0.

3.2 實(shí)驗(yàn)指標(biāo)及分析

本實(shí)驗(yàn)每次傳送1 000個數(shù)據(jù)當(dāng)作測試樣本,以30min為一次循環(huán),一次實(shí)驗(yàn)為12h.如圖7所示 (見 36頁),基于MRU算法的方法比起傳統(tǒng)Hadoop所需的時間明顯下降,利用減少硬盤I/O的存取量與時間,達(dá)到整體硬件負(fù)荷量下降,可以有效地節(jié)省資源.

從表1中可以看到,本實(shí)驗(yàn)依照圖7得到下列信息,分別可以得到兩者完成時間的最小值、最大值和平均值,最大值減少了19.86%,最小值減少12.82%,整體平均時間減少了19.99%.

表1 效率提升表

4 結(jié)論

云計(jì)算技術(shù)在圖形圖像加速、建筑信息建模、大數(shù)據(jù)分析等領(lǐng)域具有廣泛的應(yīng)用.本文設(shè)計(jì)了在BIM云系統(tǒng)上的MRU算法,詳細(xì)論述了MRU算法的框架和實(shí)現(xiàn)過程.通過實(shí)驗(yàn)表明,該系統(tǒng)是提升數(shù)據(jù)處理效率的實(shí)用工具.

猜你喜歡
次數(shù)利用算法
利用min{a,b}的積分表示解決一類絕對值不等式
機(jī)場航站樓年雷擊次數(shù)計(jì)算
2020年,我國汽車召回次數(shù)同比減少10.8%,召回?cái)?shù)量同比增長3.9%
商用汽車(2021年4期)2021-10-13 07:16:02
一類無界算子的二次數(shù)值域和譜
利用一半進(jìn)行移多補(bǔ)少
基于MapReduce的改進(jìn)Eclat算法
Travellng thg World Full—time for Rree
進(jìn)位加法的兩種算法
利用數(shù)的分解來思考
Roommate is necessary when far away from home
太白县| 尼玛县| 建阳市| 罗源县| 高州市| 江北区| 拉萨市| 谷城县| 庆阳市| 吐鲁番市| 拜城县| 江北区| 芷江| 汶上县| 江川县| 图片| 东宁县| 施秉县| 临城县| 孟津县| 韶关市| 上饶市| 泗阳县| 搜索| 东方市| 乐亭县| 台北市| 广水市| 苏尼特右旗| 平顶山市| 竹山县| 临清市| 页游| 游戏| 开封县| 三明市| 新平| 松阳县| 阜康市| 荃湾区| 兴宁市|