国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于決策樹分類的可拓建筑策劃預(yù)測(cè)方法

2017-06-01 12:21:31郭強(qiáng)鄒廣天
智能系統(tǒng)學(xué)報(bào) 2017年1期
關(guān)鍵詞:決策樹分類案例

郭強(qiáng),鄒廣天

(1.哈爾濱工業(yè)大學(xué) 建筑學(xué)院,黑龍江 哈爾濱 150006;2. 哈爾濱工業(yè)大學(xué) 建筑計(jì)劃與設(shè)計(jì)研究所,黑龍江 哈爾濱 150006;3.黑龍江省寒地建筑科學(xué)重點(diǎn)實(shí)驗(yàn)室,黑龍江 哈爾濱,150006)

基于決策樹分類的可拓建筑策劃預(yù)測(cè)方法

郭強(qiáng),鄒廣天

(1.哈爾濱工業(yè)大學(xué) 建筑學(xué)院,黑龍江 哈爾濱 150006;2. 哈爾濱工業(yè)大學(xué) 建筑計(jì)劃與設(shè)計(jì)研究所,黑龍江 哈爾濱 150006;3.黑龍江省寒地建筑科學(xué)重點(diǎn)實(shí)驗(yàn)室,黑龍江 哈爾濱,150006)

為提升建筑師在策劃過(guò)程中科學(xué)預(yù)測(cè)的能力,提出了一種基于決策樹分類的可拓建筑策劃預(yù)測(cè)方法。首先,運(yùn)用數(shù)據(jù)采集軟件批量采集互聯(lián)網(wǎng)中的建筑案例數(shù)據(jù),將數(shù)據(jù)預(yù)處理后存儲(chǔ)至建筑案例庫(kù)中;其次,通過(guò)評(píng)價(jià)特征選取、評(píng)價(jià)信息元集生成、決策樹構(gòu)建等步驟,獲得決策樹模型;最后,運(yùn)用該模型預(yù)測(cè)當(dāng)前策劃項(xiàng)目的性能指標(biāo)是否滿足要求,并給出不滿足要求情況下性能指標(biāo)變換的途徑。案例檢驗(yàn)表明,該方法能有效提高建筑師運(yùn)用互聯(lián)網(wǎng)數(shù)據(jù)的能力,能夠挖掘決策樹分類知識(shí),從而加速計(jì)算機(jī)輔助可拓建筑策劃的進(jìn)程。

可拓建筑策劃;決策樹;分類;指標(biāo)預(yù)測(cè);可拓變換

可拓建筑策劃(extension architectural program, EAP)是將可拓創(chuàng)新方法引入建筑策劃領(lǐng)域,通過(guò)問(wèn)題界定、可拓分析、可拓變換、策略評(píng)價(jià)等一系列程序來(lái)生成創(chuàng)新策略的方法,其目的是指導(dǎo)建筑設(shè)計(jì)創(chuàng)新[1]??赏亟ㄖ邉澾^(guò)程中急需對(duì)場(chǎng)地、規(guī)模、功能、空間、形象、技術(shù)等方面的性能指標(biāo)進(jìn)行科學(xué)預(yù)測(cè)的方法。

隨著計(jì)算機(jī)輔助建筑設(shè)計(jì)(CAAD)和信息技術(shù)的迅速發(fā)展,互聯(lián)網(wǎng)中的建筑案例已成為建筑師不可或缺的數(shù)據(jù)資源。案例輔助建筑設(shè)計(jì)已經(jīng)引起建筑學(xué)界的廣泛關(guān)注。魏力愷構(gòu)建并開發(fā)了基于建筑空間關(guān)系原型的建筑案例檢索系統(tǒng)Architable[2],孟潔提出了基于案例推理(case-based reasoning)的建筑方案設(shè)計(jì)流程[3],段正勵(lì)等提出了基于ArcGIS軟件的杭州市工業(yè)建筑遺產(chǎn)案例庫(kù)構(gòu)建與綜合分析方法[4],張頡等提出了基于建筑信息模型的建筑空間拓?fù)潢P(guān)系提取插件和案例檢索方法[5],孫澄等提出了基于神經(jīng)網(wǎng)絡(luò)的嚴(yán)寒地區(qū)辦公建筑節(jié)能性能預(yù)測(cè)與形態(tài)設(shè)計(jì)方法[6]。然而,上述方法均未涉及互聯(lián)網(wǎng)中的海量案例,也缺乏比較深入的案例分析方法。因此,研究互聯(lián)網(wǎng)中案例數(shù)據(jù)獲取及從中挖掘知識(shí)的方法將具有重要意義。

決策樹是一種常用的分類預(yù)測(cè)工具。它通過(guò)建立一個(gè)模型或分類器來(lái)預(yù)測(cè)類別,其優(yōu)勢(shì)是需要的數(shù)據(jù)準(zhǔn)備很少,不需要任何領(lǐng)域知識(shí),既擅長(zhǎng)處理連續(xù)型變量,也擅長(zhǎng)處理建筑案例中常見的離散型變量?;跊Q策樹知識(shí)的可拓知識(shí)挖掘方法是決策樹分類和可拓創(chuàng)新方法相交叉的結(jié)果。首先利用遞推的基本思想構(gòu)造決策樹,并從中提取規(guī)則,然后分析當(dāng)前面對(duì)的矛盾問(wèn)題,利用這些規(guī)則預(yù)測(cè)可拓變換的實(shí)施效果,進(jìn)而篩選出可行的變換[7]。該方法能夠預(yù)測(cè)可拓建筑策劃項(xiàng)目的性能指標(biāo)(通常難以通過(guò)計(jì)算獲得)是否滿足策劃要求,并給出不滿足要求情況下性能指標(biāo)變換的途徑。相關(guān)研究還有趙燕偉等提出的基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的可拓分類器構(gòu)建方法[8];李亞飛等提出的基于決策樹分類的云南省迪慶地區(qū)景觀類型預(yù)測(cè)方法[9];王茂軍等[10]提出的基于決策樹法的北京城市居民通勤距離模式挖掘方法。針對(duì)互聯(lián)網(wǎng)中的海量建筑案例,我們提出了基于決策樹分類的可拓建筑策劃預(yù)測(cè)方法。

1 建筑案例數(shù)據(jù)的獲取和預(yù)處理

1.1 數(shù)據(jù)獲取

可拓建筑策劃分類的對(duì)象是建筑案例庫(kù)中的案例,用物元[11]描述為

式中:c1,c2,…,cn為建筑案例的特征;v1,v2,…,vn為建筑案例特征對(duì)應(yīng)的量值。案例特征應(yīng)盡可能反映建筑的全部信息,分為建筑所處環(huán)境特征和建筑物自身特征。前者包括建筑基地的社會(huì)、人文、交通、環(huán)境、景觀、經(jīng)濟(jì)等方面,后者包括基本信息、設(shè)計(jì)構(gòu)思、場(chǎng)地、功能、空間、形象、技術(shù)、評(píng)價(jià)等方面(見表1)。兩者通過(guò)空間方位屬性相關(guān)聯(lián),可以形成每棟建筑物的完整數(shù)據(jù)。

表1 建筑案例數(shù)據(jù)特征

數(shù)據(jù)獲取是運(yùn)用數(shù)據(jù)采集軟件將互聯(lián)網(wǎng)中的案例數(shù)據(jù)獲取到建筑案例庫(kù)的過(guò)程。鑒于智能性和穩(wěn)定性,本文選用火車采集器,從政府門戶網(wǎng)站、建筑策劃與設(shè)計(jì)機(jī)構(gòu)網(wǎng)站、建筑案例共享平臺(tái)、各類百科等網(wǎng)站來(lái)采集案例。首先需要設(shè)置網(wǎng)址采集規(guī)則、內(nèi)容采集規(guī)則、導(dǎo)入數(shù)據(jù)庫(kù)規(guī)則和其他規(guī)則,數(shù)據(jù)采集結(jié)果以二維關(guān)系數(shù)據(jù)表形式存儲(chǔ)在MySQL軟件中,多個(gè)數(shù)據(jù)表之間以主鍵和外鍵相關(guān)聯(lián)。另外,火車采集軟件能夠制定采集計(jì)劃來(lái)完成建筑案例庫(kù)數(shù)據(jù)的動(dòng)態(tài)更新。

1.2 數(shù)據(jù)預(yù)處理

在分類與預(yù)測(cè)之前,需要進(jìn)行數(shù)據(jù)預(yù)處理,包括數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)集成、數(shù)據(jù)歸約等。

數(shù)據(jù)轉(zhuǎn)換是參照項(xiàng)目名稱-空間位置對(duì)照表、建筑中英文對(duì)照表、建筑同義詞對(duì)照表、計(jì)量單位轉(zhuǎn)換表,對(duì)案例數(shù)據(jù)進(jìn)行轉(zhuǎn)換處理,解決數(shù)據(jù)語(yǔ)義多樣性問(wèn)題。

數(shù)據(jù)集成是將來(lái)自多個(gè)數(shù)據(jù)源的數(shù)據(jù)進(jìn)行合并,以提高分類的速度和精確性。為統(tǒng)一格式,在數(shù)據(jù)集成中起關(guān)鍵作用的空間方位屬性用(E,N)來(lái)表示,例如:哈爾濱工業(yè)大學(xué)建筑學(xué)院的空間方位屬性,記作(126°37′53.85″E,45°45′02.16″N)。

數(shù)據(jù)集成時(shí)經(jīng)常出現(xiàn)屬性值缺失、數(shù)據(jù)不一致、數(shù)據(jù)存在噪聲等問(wèn)題,這些問(wèn)題將對(duì)預(yù)測(cè)結(jié)果產(chǎn)生重大影響。噪聲數(shù)據(jù)常用回歸分析、離群點(diǎn)分析等方法來(lái)進(jìn)行光滑處理[12]。缺失值通過(guò)以下方式來(lái)處理:1)當(dāng)缺失值恰好為分類特征時(shí),直接刪除該條數(shù)據(jù);2)使用全局常量,如Unkown來(lái)填充;3)使用屬性所有值的中心度量(如均值或中位數(shù))來(lái)填充;4)使用其他演算推理的方式來(lái)批量填充。

數(shù)據(jù)值域不一致往往將造成預(yù)測(cè)結(jié)果與意義難以解釋,常用數(shù)據(jù)歸約的方法進(jìn)行標(biāo)準(zhǔn)化處理。

2 可拓建筑策劃分類預(yù)測(cè)方法

可拓建筑策劃分類預(yù)測(cè)的核心是決策樹算法,利用信息熵的原理,選擇具有最高信息增益的特征作為分裂特征,遞歸地構(gòu)建決策樹的分支。它包括模型構(gòu)建、模型檢驗(yàn)、模型應(yīng)用3個(gè)環(huán)節(jié),具體分為評(píng)價(jià)特征選取、評(píng)價(jià)信息元集生成、決策樹模型構(gòu)建和當(dāng)前策劃項(xiàng)目指標(biāo)預(yù)測(cè)4個(gè)步驟,如圖1所示。

圖1 基于決策樹分類的EAP預(yù)測(cè)方法流程圖Fig.1 Flow chart of the predict method for EAP based on decision tree classification

2.1 根據(jù)建筑專業(yè)知識(shí)選取評(píng)價(jià)特征

通過(guò)前期訪談、現(xiàn)場(chǎng)調(diào)研、模式構(gòu)想、方案試做等環(huán)節(jié),建筑師已經(jīng)確定當(dāng)前建筑策劃項(xiàng)目的基本特征。現(xiàn)需要對(duì)它的性能指標(biāo)進(jìn)行預(yù)測(cè),檢驗(yàn)是否滿足策劃要求。首先確定要預(yù)測(cè)的性能指標(biāo),在決策樹分類時(shí)將這些指標(biāo)稱為分類特征,如建筑風(fēng)格、空間開放性、流線合理性、技術(shù)可行性、環(huán)境協(xié)調(diào)性等。確定分類特征后,根據(jù)建筑專業(yè)知識(shí),選取與之密切相關(guān)的評(píng)價(jià)特征,如與建筑風(fēng)格相關(guān)的評(píng)價(jià)特征(包括屋頂類型、立面色彩、建筑材料等)。有時(shí)某些評(píng)價(jià)特征可能并未出現(xiàn)在建筑案例表中,需要根據(jù)表中數(shù)據(jù)計(jì)算,如容積率可通過(guò)規(guī)劃用地范圍內(nèi)建筑面積總和與用地面積的比值計(jì)算得到。

2.2 選取目標(biāo)數(shù)據(jù)生成評(píng)價(jià)信息元集

根據(jù)可拓建筑策劃的預(yù)測(cè)要求,從建筑案例庫(kù)中選取相關(guān)案例,應(yīng)盡可能選擇評(píng)價(jià)等級(jí)較高的數(shù)據(jù),以保證分類結(jié)果的準(zhǔn)確性。將取出的案例刪除其他特征,只保留分類特征和評(píng)價(jià)特征,得到建筑案例的評(píng)價(jià)信息元集,記作

該集合表示:對(duì)象O關(guān)于特征Cj的量值為Vj構(gòu)成的信息元集合[7]。

將建筑案例評(píng)價(jià)信息元集隨機(jī)地分為兩組:一組是訓(xùn)練案例集,用于構(gòu)建決策樹模型,一般取建筑案例總量的80%~90%;另一組是檢驗(yàn)案例集,取剩下的部分,用于檢驗(yàn)?zāi)P偷臏?zhǔn)確性。模型準(zhǔn)確率是指檢驗(yàn)案例集中被正確分類的建筑案例數(shù)量與該集合中建筑案例總數(shù)量的比值。

2.3 構(gòu)建決策樹提取分類規(guī)則知識(shí)

假設(shè)按評(píng)價(jià)特征A對(duì)I中的建筑案例進(jìn)行劃分,且特征A具有k個(gè)量值(v1,v2,…,vk)。

2.3.1 特征A為離散型特征

以特征A為根進(jìn)行分類的信息增益定義為

2.3.2 特征A為數(shù)值型特征

決策樹模型采用貪心算法,以自頂向下遞歸方式構(gòu)建,直到達(dá)到下列條件之一終止:

①結(jié)點(diǎn)處的評(píng)價(jià)信息元屬于同一個(gè)類;

②沒有剩余特征用來(lái)進(jìn)一步劃分;

③給定的分支中沒有信息元,即該子集為空,該結(jié)點(diǎn)不需要構(gòu)建。

以上算法均在RapidMiner7.2軟件中進(jìn)行編輯,決策樹模型的剪枝和準(zhǔn)確性檢驗(yàn)通過(guò)設(shè)置X-Validation命令的相關(guān)參數(shù)來(lái)完成,經(jīng)過(guò)多次反復(fù)訓(xùn)練在很大程度上提升了模型的魯棒性。

決策樹模型構(gòu)建完畢后,從根結(jié)點(diǎn)到葉結(jié)點(diǎn)的每條路徑建立一個(gè)規(guī)則,以IF-THEN形式的分類規(guī)則表示,并用支持度(support)和置信度(confidence)進(jìn)行評(píng)估。這些規(guī)則將形成分類知識(shí)庫(kù),作為建筑性能指標(biāo)預(yù)測(cè)的依據(jù)。規(guī)則R可表示為R:A?B[confidence,support]

以可拓建筑策劃中的規(guī)則R1為例,R1可表示為

R1:屋頂類型=坡屋頂∧屋面材料=瓦片?

建筑風(fēng)格=歐式 (80%,40%)

上述規(guī)則表示,屋頂類型為坡屋頂并且屋面材料為瓦片的建筑案例中,建筑風(fēng)格為歐式的案例占到80%。同時(shí)滿足坡屋頂、屋面材料為瓦片、歐式風(fēng)格的建筑案例占到所有案例的40%。

2.4 預(yù)測(cè)當(dāng)前策劃指標(biāo)獲取可拓變換途徑

提取當(dāng)前建筑策劃項(xiàng)目的評(píng)價(jià)特征,將其導(dǎo)入決策樹模型,獲得預(yù)測(cè)結(jié)果。若預(yù)測(cè)結(jié)果滿足策劃要求,則表明當(dāng)前建筑策劃方案是合理的,可以進(jìn)入后續(xù)的建筑策劃書生成與表達(dá)環(huán)節(jié)。

若預(yù)測(cè)結(jié)果不能滿足策劃要求,則需要改變當(dāng)前建筑策劃方案的某些特征,可拓學(xué)提供了5種基本變換,即置換變換、增刪變換、擴(kuò)縮變換、分解變換和復(fù)制變換,還有多特征的組合變換等。在可拓建筑策劃中,可拓變換T定義為

針對(duì)多特征的變換很容易產(chǎn)生組合爆炸,因此,需要對(duì)變換的結(jié)果進(jìn)行取舍,獲得可行的解變換,獲取解變換的步驟如下。

1)利用上述的決策樹模型對(duì)變換后的項(xiàng)目數(shù)據(jù)進(jìn)行預(yù)測(cè),了解實(shí)施變換以后產(chǎn)生怎樣的效果,并將預(yù)測(cè)結(jié)果中滿足策劃要求的變換提取出來(lái),形成當(dāng)前策劃問(wèn)題的解變換集。

2)通過(guò)計(jì)算變換難度,對(duì)解變換集進(jìn)行排序和評(píng)優(yōu)。變換難度通過(guò)變換系數(shù)來(lái)定義:

①對(duì)于只存在類別差異,而不存在等級(jí)差異的建筑特征,如建筑平面類型、建筑材料類型等,無(wú)論變換為哪個(gè)值,變換系數(shù)都定義為1;

②對(duì)于存在等級(jí)差異的建筑特征,如建筑評(píng)價(jià)等級(jí),當(dāng)變換為降低等級(jí)時(shí),無(wú)論降低幾個(gè)等級(jí),變換系數(shù)定義都為1;當(dāng)提高一個(gè)等級(jí)時(shí),變換系數(shù)定義為1;當(dāng)提高兩個(gè)等級(jí)時(shí),變換系數(shù)定義為2,以此類推。

對(duì)于多個(gè)變換而言,其變換難度[7]按照每個(gè)變換系數(shù)加1后累乘再減1進(jìn)行計(jì)算,定義為

變換難度

對(duì)于建筑師而言,根據(jù)變換難度對(duì)解變換集進(jìn)行排序后,排名越靠前的變換,可操作性越強(qiáng),越容易產(chǎn)生最優(yōu)策略。

3 實(shí)驗(yàn)與分析

為了減少建筑建成后給周邊環(huán)境帶來(lái)的影響和破壞,在可拓建筑策劃中需要預(yù)先評(píng)估建筑與周邊環(huán)境的協(xié)調(diào)程度(即建筑環(huán)境協(xié)調(diào)度)。因此,選取某建筑策劃項(xiàng)目的建筑環(huán)境協(xié)調(diào)度預(yù)測(cè)為例,將火車采集器作為互聯(lián)網(wǎng)案例數(shù)據(jù)抓取工具,將MySQL軟件作為數(shù)據(jù)存儲(chǔ)工具,將RapidMiner作為數(shù)據(jù)預(yù)處理和決策樹構(gòu)建工具,具體步驟如下。

1)選取評(píng)價(jià)特征。首先將建筑環(huán)境協(xié)調(diào)度定義為分類特征,可能取值為差、一般、好,記作Y。根據(jù)建筑專業(yè)知識(shí)選取周邊環(huán)境類型、總建筑面積、建筑主體材料、窗墻比、建筑與環(huán)境的形體穿插滲透關(guān)系(即穿插滲透程度),并將這些參數(shù)作為評(píng)價(jià)特征,分別記作c1、c2、c3、c4、c5。為簡(jiǎn)化計(jì)算的難度,對(duì)評(píng)價(jià)特征的取值作出如下規(guī)定。

周邊環(huán)境類型的可能取值為街道型、廣場(chǎng)型、濱水型、植被型;總建筑面積的取值為原案例數(shù)據(jù)表中的值;建筑主體材料對(duì)原案例數(shù)據(jù)表中的材料進(jìn)行歸納,可能取值為天然型、人工型、混合型;窗墻比將原案例數(shù)據(jù)表中的窗墻比數(shù)值進(jìn)行歸納,可能取值為墻絕對(duì)主導(dǎo)型、墻主導(dǎo)型、窗墻對(duì)等型、窗主導(dǎo)型、窗絕對(duì)主導(dǎo)型,分別記作Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ;穿插滲透程度根據(jù)建筑與環(huán)境的穿插滲透關(guān)系進(jìn)行評(píng)估,可能取值為無(wú)滲透、局部滲透、完全滲透。

2)生成評(píng)價(jià)信息元表。通常直接從建筑案例庫(kù)中選擇案例數(shù)據(jù)。目前尚無(wú)這方面的數(shù)據(jù),因此運(yùn)用火車采集器抓取了ArchDaily網(wǎng)站最新發(fā)布的300個(gè)建筑案例,并導(dǎo)入MySQL中。經(jīng)過(guò)轉(zhuǎn)換評(píng)價(jià)特征值,填補(bǔ)缺失值,對(duì)不一致數(shù)據(jù)進(jìn)行糾錯(cuò)后,最終得到建筑案例評(píng)價(jià)信息元表(見表2)。

表2 建筑案例評(píng)價(jià)信息元表

3)構(gòu)建決策樹模型。首先,將評(píng)價(jià)信息元表導(dǎo)入RapidMiner軟件,定義好分類特征后,運(yùn)用X-Validation命令完成決策樹模型的構(gòu)建、檢驗(yàn)與評(píng)估。該命令將評(píng)價(jià)信息元表隨機(jī)分為10等份,依次將其中9份作為訓(xùn)練集,另外1份作為檢驗(yàn)集,對(duì)模型進(jìn)行10次評(píng)估,基本保證了該模型的魯棒性。經(jīng)評(píng)估,該模型準(zhǔn)確率為84.60%,滿足要求。其次,從上述模型中提取出決策樹分類規(guī)則。由圖2和圖3可知,穿插滲透程度是影響決策樹分類最顯著的特征。

圖2 構(gòu)建的決策樹模型簡(jiǎn)圖Fig.2 The chart of decision tree model

圖3 提取的決策樹分類規(guī)則(部分)Fig.3 The decision tree classification rules extracted

4)應(yīng)用決策樹模型。從當(dāng)前建筑策劃方案中提取該建筑的5項(xiàng)特征,其中周邊景觀類型c1為街道型,總建筑面積c2為4 000 m2,建筑主體材料c3為混合型,窗墻比c4為Ⅲ型,穿插滲透程度c5為無(wú)滲透,需要對(duì)建筑環(huán)境協(xié)調(diào)度Y進(jìn)行預(yù)測(cè)。將該建筑數(shù)據(jù)導(dǎo)入上述決策樹模型,預(yù)測(cè)結(jié)果為“差”,不滿足策劃要求。

為使預(yù)測(cè)結(jié)果變?yōu)椤昂谩?,需要?duì)該建筑的特征實(shí)施可拓變換。由于基地條件限制,總建筑面積在建筑立項(xiàng)時(shí)已經(jīng)確定,不能改變,因此,需要對(duì)特征c1、c3、c4、c5實(shí)施可拓變換,具體包括:

以上是針對(duì)單一特征值的變換,還包括多特征組合變換,最終共產(chǎn)生179(即4×3×5×3-1)種變換,對(duì)應(yīng)著179個(gè)變換后的策劃項(xiàng)目數(shù)據(jù)。

利用決策樹模型對(duì)這些數(shù)據(jù)進(jìn)行預(yù)測(cè)。經(jīng)測(cè)試,預(yù)測(cè)結(jié)果為好、一般、差的項(xiàng)目數(shù)據(jù)分別為69條、77條、33條。這69條數(shù)據(jù)對(duì)應(yīng)的變換,即為當(dāng)前策劃問(wèn)題的解變換。將項(xiàng)目數(shù)據(jù)按照變換難度重新進(jìn)行排序,排名前5位的數(shù)據(jù)將作為最優(yōu)策略提供給建筑師,用于指導(dǎo)策劃方案修改(見表3)。

表3 可拓變換排序結(jié)果(前5位)

4 結(jié)論

基于決策樹分類的可拓建筑策劃預(yù)測(cè)方法是充分發(fā)揮可拓創(chuàng)新方法和決策樹分類方法的優(yōu)勢(shì),對(duì)當(dāng)前策劃項(xiàng)目的性能指標(biāo)進(jìn)行科學(xué)預(yù)測(cè)的方法。

1)通過(guò)提出的建筑案例數(shù)據(jù)獲取、數(shù)據(jù)預(yù)處理、決策樹構(gòu)建、分類預(yù)測(cè)、變換篩選等步驟,建筑師能夠從互聯(lián)網(wǎng)中的海量建筑案例中提取出決策樹分類規(guī)則,并給出建筑性能指標(biāo)的變換途徑。

2)案例檢驗(yàn)表明,該方法是可行的,具有較強(qiáng)的操作性,能有效解決可拓建筑策劃研究與應(yīng)用的預(yù)測(cè)難題。

3)將計(jì)算機(jī)領(lǐng)域的數(shù)據(jù)采集、決策樹分類技術(shù)引入建筑學(xué)領(lǐng)域,能有效提升建筑師運(yùn)用互聯(lián)網(wǎng)數(shù)據(jù)的能力,加快計(jì)算機(jī)輔助可拓建筑策劃的進(jìn)程。

[1]連菲. 可拓建筑策劃的基本理論與應(yīng)用方法研究[D]. 哈爾濱: 哈爾濱工業(yè)大學(xué), 2010: 25-27. LIAN Fei. The study on basic theory and applying methods of extension architectural program[D]. Harbin: Harbin Institute of Technology, 2010: 25-27.

[2]魏力愷. 基于CBR和HTML5的建筑空間檢索與生成研究[D]. 天津: 天津大學(xué), 2013: 108-114. WEI Likai. Architectural spatial retrieval and generating based on CBR and HTML5[D]. Tianjin: Tianjin University, 2013: 108-114.

[3]孟潔. 基于案例推理的建筑方案設(shè)計(jì)流程研究[D]. 哈爾濱: 哈爾濱工業(yè)大學(xué), 2014: 56-76. MENG Jie. Research on architectural scheme design process using case-based reasoning[D]. Harbin: Harbin Institute of Technology, 2014: 56-76.

[4]段正勵(lì), 劉撫英. 杭州市工業(yè)遺產(chǎn)綜合信息數(shù)據(jù)庫(kù)構(gòu)建研究[J]. 建筑學(xué)報(bào), 2013, 33(10): 45-48. DUAN Zhengli, LIU Fuying. Study on the comprehensive information database of industrial heritage in Hangzhou[J]. Architectural journal, 2013, 33(10): 45-48.

[5]張頡, 李昌華, 李智杰. 基于拓?fù)涮卣鞯慕ㄖ畔⒛P蜋z索方法[J]. 計(jì)算機(jī)應(yīng)用研究, 2016, 33(3): 916-921. ZHANG Jie, LI Changhua, LI Zhijie. Building information model retrieval based on topological features[J]. Application research of computers, 2016, 33(3): 916-921.

[6]孫澄,韓昀松.光熱性能考慮下的嚴(yán)寒地區(qū)辦公建筑形態(tài)節(jié)能設(shè)計(jì)研究[J].建筑學(xué)報(bào),2016(2):38-42. SUN Cheng, HAN Yunsong. A study on energysaving design of office building forms in the severe cold region regarding daylighting and thernal performanc[J].Architectural journal,2016(2):38-42.

[7]楊春燕, 李小妹, 陳文偉, 等. 可拓?cái)?shù)據(jù)挖掘方法及其計(jì)算機(jī)實(shí)現(xiàn)[M]. 廣州: 廣東高等教育出版社, 2010: 206-214.

[8]趙燕偉, 任設(shè)東, 陳尉剛, 等. 基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的可拓分類器構(gòu)建[J]. 計(jì)算機(jī)集成制造系統(tǒng), 2015, 21(10): 2807-2815. ZHAO Yanwei, REN Shedong, CHEN Weigang, et al. Extension classifier construction based on improved BP neural network[J]. Computer integrated manufacturing systems, 2015, 21(10): 2807-2815.

[9]李亞飛, 劉高煥, 黃翀. 基于決策樹分類的云南省迪慶地區(qū)景觀類型研究[J]. 資源科學(xué), 2011, 33(2): 328-334. LI Yafei, LIU Gaohuan, HUANG Chong. Exploring landscapes based on decision tree classification in the Diqing region, Yunnan province[J]. Resources science, 2011, 33(2): 328-334.

[10]王茂軍, 宋國(guó)慶, 許潔. 基于決策樹法的北京城市居民通勤距離模式挖掘[J]. 地理研究, 2009, 28(6): 1516-1527. WANG Maojun, SONG Guoqing, XU Jie. Data mining on commuting distance mode of urban residents based on the analysis of decision tree[J]. Geographical research, 2009, 28(6): 1516-1527.

[11]YANG Chunyan, CAI Wen. Extenics: theory, method and application[M]. Beijing: Science Press, 2013: 20-27.

[12]HAN Jiawei, KAMBER M, PEI Jian. 數(shù)據(jù)挖掘: 概念與技術(shù)[M]. 范明, 孟小峰, 譯. 3版. 北京: 機(jī)械工業(yè)出版社, 2012: 55-65.

Prediction methods for extension architecture programming based on decision tree classification

GUO Qiang1,2,3, ZOU Guangtian1,2,3

(1. School of Architecture, Harbin Institute of Technology, Harbin 150006, China; 2.Architectural Planning and Design Institute, Harbin Institute of Technology, Harbin 150006, China;3.Heilongjiang Cold Region Architectural Science Key Laboratory, Harbin 150006,China)

To improve the prediction ability of architects, a prediction method for extension architecture programming (EAP) based on decision tree classification was proposed. First, the architectural case data from the Internet were obtained by data acquisition software, and stored in an architectural case database after data preprocessing. Second, through evaluation characteristics selection, evaluation information element set generation and decision tree construction, the decision tree model was discovered. Then, the performance indicators of the current project were predicted using this model, providing transformation approaches if the result did not satisfy the requirement. This study indicates that the proposed method can effectively improve an architects ability to use Internet data and mine decision tree classification knowledge, thus accelerating the process of computer aided EAP.

extension architectural program; decision tree; classification; indicators prediction; extension transformation

郭強(qiáng),男,1985年生,博士研究生,中國(guó)人工智能學(xué)會(huì)會(huì)員,主要研究方向?yàn)榭赏亟ㄖW(xué)、可拓建筑策劃數(shù)據(jù)挖掘,參加完成國(guó)家自然科學(xué)基金項(xiàng)目1項(xiàng),參編《中國(guó)原創(chuàng)學(xué)科——可拓學(xué)發(fā)展報(bào)告2016》。

鄒廣天,男,1960年生,教授,博士生導(dǎo)師,博士,中國(guó)人工智能學(xué)會(huì)可拓學(xué)專業(yè)委員會(huì)副主任、中國(guó)建筑學(xué)會(huì)建筑師分會(huì)建筑策劃專業(yè)委員會(huì)副主任、中國(guó)環(huán)境行為學(xué)會(huì)副會(huì)長(zhǎng),主要研究方向?yàn)榻ㄖ?jì)劃學(xué)、可拓建筑學(xué)、建筑設(shè)計(jì)創(chuàng)新學(xué)、環(huán)境行為心理學(xué)。主持完成國(guó)家自然科學(xué)基金項(xiàng)目2項(xiàng),出版專著1部,主編與參編論文集多部,發(fā)表學(xué)術(shù)論文200余篇,被EI、CSSCI檢索論文20余篇。

10.11992/tis.201610015

http://kns.cnki.net/kcms/detail/23.1538.TP.20170227.2217.028.html

2016-10-13.

日期:2017-02-27.

國(guó)家自然科學(xué)基金項(xiàng)目(51178132).

鄒廣天. E-mail:zougt@hit.edu.cn.

TP18; TU18

A

1673-4785(2017)01-0117-07

郭強(qiáng),鄒廣天. 基于決策樹分類的可拓建筑策劃預(yù)測(cè)方法[J]. 智能系統(tǒng)學(xué)報(bào), 2017, 12(1): 117-123.

英文引用格式:GUO Qiang,ZOU Guangtian. Prediction methods for extension architecture programming based on decision tree classification[J]. CAAI transactions on intelligent systems, 2017, 12(1):117-123.

猜你喜歡
決策樹分類案例
分類算一算
案例4 奔跑吧,少年!
一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹算法
隨機(jī)變量分布及統(tǒng)計(jì)案例拔高卷
分類討論求坐標(biāo)
決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
電子制作(2018年16期)2018-09-26 03:27:06
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
發(fā)生在你我身邊的那些治超案例
基于決策樹的出租車乘客出行目的識(shí)別
固阳县| 淄博市| 贵定县| 万年县| 辉南县| 东莞市| 宁德市| 中卫市| 通海县| 永修县| 普格县| 大港区| 新密市| 新田县| 府谷县| 辽阳县| 封开县| 东源县| 西林县| 黄陵县| 武平县| 舒城县| 巴彦县| 黄骅市| 呼伦贝尔市| 寻甸| 衡阳县| 胶州市| 新疆| 桑植县| 汨罗市| 沧州市| 金乡县| 乌拉特中旗| 环江| 潞西市| 洪泽县| 高密市| 邳州市| 黑龙江省| 信丰县|