国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于卷積神經(jīng)網(wǎng)絡(luò)的三維建筑形體分類實(shí)驗(yàn)

2022-11-21 10:27:20陳一帆南京大學(xué)建筑與城市規(guī)劃學(xué)院江蘇南京210093
安徽建筑 2022年11期
關(guān)鍵詞:形體卷積神經(jīng)網(wǎng)絡(luò)

陳一帆 (南京大學(xué)建筑與城市規(guī)劃學(xué)院,江蘇 南京 210093)

1 引言

分類行為是人類認(rèn)識(shí)事物的一種方式。人們對(duì)事物進(jìn)行抽象和歸納,便有了不同的類型,認(rèn)識(shí)的過(guò)程本身就是分類的過(guò)程。分類的思想在建筑學(xué)中由來(lái)已久,關(guān)于“原型”“類型”的探討在建筑學(xué)中長(zhǎng)盛不息,這不僅僅可以幫助我們歸納總結(jié)已有的設(shè)計(jì)知識(shí),還能更好更快地設(shè)計(jì)出不同的作品。建筑形體特征包括了形體、空間和人的各種活動(dòng)[1],具象的形體則是其中最重要的表現(xiàn)形式。傳統(tǒng)的研究方法在建筑的形體大小、比例、占地面積、高度等進(jìn)行了定量研究,但是在形體類型的量化指標(biāo)一直是研究的空白。

深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)的重要的一個(gè)分支,近年來(lái)得到了巨大的發(fā)展。在建筑設(shè)計(jì)領(lǐng)域,深度學(xué)習(xí)技術(shù)也得到了廣泛地應(yīng)用。大數(shù)據(jù)驅(qū)動(dòng)的建筑圖像分類,廣泛的應(yīng)用于不同的對(duì)象和不同的尺度,涵蓋了城市、鄉(xiāng)村、單體建筑等。例如,OCHOA S[2]在2020年利用t-SNE和CNN的技術(shù)完成了對(duì)城市不同區(qū)域的衛(wèi)星圖的分類工作,并與人的活動(dòng)軌跡相聯(lián)系。張欽[3]在2019年利用VGG的技術(shù)完成了街景中目標(biāo)類型建筑物的識(shí)別。覃巧華等人[4]在2020年利用CNN的技術(shù)完成了傳統(tǒng)村落的分類工作。大數(shù)據(jù)驅(qū)動(dòng)的研究大多局限于樣本數(shù)據(jù)的不規(guī)范、樣本種類缺少變化等。但Chenyi Cai[5]在2020年利用基于特定規(guī)則生成的平面圖數(shù)據(jù)庫(kù),再利用CNN完成了建筑平面圖的識(shí)別分類工作。這一做法一定程度上避免了因?yàn)閿?shù)據(jù)集收集整理不足帶來(lái)的問(wèn)題,但卻帶來(lái)了另一問(wèn)題,就是訓(xùn)練的神經(jīng)網(wǎng)絡(luò)的泛化能力會(huì)因?yàn)閿?shù)據(jù)集樣本的影響而一定程度上降低。

同時(shí)可以看到當(dāng)前圖像分類技術(shù)在三維形態(tài)上的研究目前還比較缺乏,主要難點(diǎn)在于建筑的三維形態(tài)如何處理為深度學(xué)習(xí)能夠處理的圖像數(shù)據(jù)和三維建筑形體數(shù)據(jù)庫(kù)的缺乏。Jinmo Rhee[6]在2021年將Open Street Map上世界主要城市的三維建筑模型,經(jīng)過(guò)分層切片處理后,輸入給以卷積神經(jīng)網(wǎng)絡(luò)組成的變分自編碼器中(VAE),獲得了14種類型的高層數(shù)據(jù)。但這種方式存在一定的不足,其中一點(diǎn)就是無(wú)監(jiān)督學(xué)習(xí)得到的樣本類別取決于隱空間中的數(shù)據(jù)分布特征。

本文通過(guò)預(yù)先設(shè)定好的建筑形體類別和相應(yīng)的規(guī)則,生成相對(duì)應(yīng)的形體,由此組成訓(xùn)練的數(shù)據(jù)集。再通過(guò)形體切片的方式獲取分層圖像,將建筑形體信息轉(zhuǎn)化為卷積神經(jīng)網(wǎng)絡(luò)能夠識(shí)別的圖像數(shù)據(jù),由此來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)識(shí)別建筑形體的種類,也為建筑形體的計(jì)算機(jī)識(shí)別和分類提供量化支撐,由此也可以展開形體優(yōu)化生成的后續(xù)研究。

2 理論方法

2.1 形體分類方式

在傳統(tǒng)的建筑形態(tài)分類方式中,通常認(rèn)為建筑形態(tài)包括建筑的體量、立面、內(nèi)部空間、外部空間等,形態(tài)則是場(chǎng)所環(huán)境、內(nèi)外活動(dòng)、內(nèi)部功能和材料建造多種因素作用下的結(jié)果。例如,《建筑:形式空間和秩序》[7]一書中將平面形態(tài)劃分為中心的、線性的、放射性的、組團(tuán)的、網(wǎng)格的;《建筑空間組合論》[8]則強(qiáng)調(diào)了體量組合的主從和有機(jī)、對(duì)比和變化、穩(wěn)定和均衡三種類型。本文不討論抽象的三維建筑形態(tài)分類方式,只結(jié)合筆者的實(shí)際經(jīng)驗(yàn),將建筑形體概括為五種常見的類型:基本型、中庭型、U型、L型和并列型?;拘徒ㄖ误w常較方正,常見于博物館等不需要采光的建筑或者小型建筑等;中庭型作為常用的組織形體的方法,增加建筑的采光通風(fēng),也豐富了內(nèi)部空間;U型、L型建筑形體則常用于處理入口廣場(chǎng)、集散場(chǎng)地,同時(shí)提高了室內(nèi)環(huán)境的舒適度;并列型建筑常用于群體建筑。

2.2 卷積神經(jīng)網(wǎng)絡(luò)與ResNet

卷積神經(jīng)網(wǎng)絡(luò)與基本的多層全連接神經(jīng)網(wǎng)絡(luò)最重要的區(qū)別就是應(yīng)用了卷積層,避免了全連接層帶來(lái)的過(guò)大數(shù)據(jù)運(yùn)算量。由于圖像數(shù)據(jù)具有局部相關(guān)性,在局部數(shù)據(jù)上進(jìn)行全連接運(yùn)算,并且權(quán)值矩陣共享到整個(gè)圖像,這就是卷積的原理。

通過(guò)堆疊卷積層,卷積神經(jīng)網(wǎng)絡(luò)模型能夠獲得更好的表達(dá)能力,但是模型卻會(huì)因此變得難以訓(xùn)練。這是因?yàn)樵诜聪騻鞑ミ\(yùn)算的過(guò)程中,神經(jīng)網(wǎng)絡(luò)層會(huì)出現(xiàn)梯度消失或者梯度爆炸的現(xiàn)象。2015年,微軟亞洲研究院何凱明發(fā)表了基于SkipConnection的深度殘差網(wǎng)絡(luò)(ResNet)。通過(guò)添加 skipconnection實(shí)現(xiàn)層數(shù)的回退,很好地解決了這些問(wèn)題。本文采用ResNet-18作為多分類神經(jīng)網(wǎng)絡(luò)的框架。

3 實(shí)驗(yàn)與分析

3.1 數(shù)據(jù)收集與處理

參照Cai[5]提出的基于規(guī)則生成特定的二維平面數(shù)據(jù)庫(kù)的方法,筆者在Rhinoceros(參數(shù)化建模軟件,以下簡(jiǎn)稱rhino)按照預(yù)定的規(guī)則生成帶有形體類別標(biāo)簽的三維建筑形體數(shù)據(jù)庫(kù)。

基本型建筑的形體滿足的必需條件:建筑的長(zhǎng)寬大于2個(gè)柱跨;建筑與周邊場(chǎng)地的距離大于1個(gè)柱跨。中庭型建筑滿足的必需條件:建筑的長(zhǎng)寬大于3個(gè)柱跨;建筑與周邊場(chǎng)地的距離大于1個(gè)柱跨;建筑中庭的尺寸大于1個(gè)柱跨;建筑最窄處的進(jìn)深大于1個(gè)柱跨。L型建筑滿足的必需條件:建筑的長(zhǎng)寬大于3個(gè)柱跨;建筑與周邊場(chǎng)地的距離大于1個(gè)柱跨;建筑圍合的場(chǎng)地大于1個(gè)柱跨;建筑最窄處的進(jìn)深大于1個(gè)柱跨。U型建筑滿足的必需條件:建筑的長(zhǎng)寬大于3個(gè)柱跨;建筑與周邊場(chǎng)地的距離大于1個(gè)柱跨;建筑圍合的場(chǎng)地大于1個(gè)柱跨;建筑最窄處的進(jìn)深大于1個(gè)柱跨。并列型建筑滿足的必需條件:各個(gè)建筑的進(jìn)深和面寬大于1個(gè)柱跨;建筑與周邊場(chǎng)地的距離大于1個(gè)柱跨;建筑間距大于1個(gè)柱跨(如圖1)。

圖1 五種類型的建筑形體的生成規(guī)則示意圖(圖片來(lái)源:作者自繪)

同時(shí)通過(guò)數(shù)據(jù)增強(qiáng)的技術(shù),在參數(shù)中加入了隨機(jī)函數(shù),例如平面的長(zhǎng)寬、開洞的尺寸、建筑的高度、建筑上下層偏移的尺寸等。因此樣本雖然在拓?fù)潢P(guān)系上大致相同,但是細(xì)節(jié)形態(tài)卻不相同,從而一定程度上保證了訓(xùn)練的質(zhì)量。

如何將Rhino中的三維建筑形體轉(zhuǎn)化為神經(jīng)網(wǎng)絡(luò)能夠識(shí)別的多通道圖像數(shù)據(jù),筆者采用的方法是先在物體的中心位置的正上方創(chuàng)建預(yù)先設(shè)定好視野大小和焦距的攝像機(jī)物體,再創(chuàng)建不同高度的截平面與原建筑形體相交獲得相交平面,最后通過(guò)攝像機(jī)捕捉各層平面輸出為圖像,即可獲得固定大小和比例的建筑分層平面圖像(如圖2)。同時(shí),筆者將建筑各層平面輪廓圖處理成為黑白二值圖像,以方便神經(jīng)網(wǎng)絡(luò)的訓(xùn)練(如圖3)。

圖2 Rhino中獲取物件的各層平面輪廓的方法示意(圖片來(lái)源:作者自繪)

圖3 五種類型的建筑形體分層圖像數(shù)據(jù)庫(kù)(圖片來(lái)源:作者自繪)

3.2 卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練

筆者選用ResNet18作為網(wǎng)絡(luò)的基本框架,輸入的張量的維度統(tǒng)一為4*96*96。對(duì)于只有1~3層的建筑形體,獲得的建筑平面圖像只有1~3張,那么需要對(duì)數(shù)據(jù)進(jìn)行填充處理。筆者在此選用數(shù)值0填充,最終獲得的數(shù)據(jù)庫(kù)可如圖4中左圖所示,每一列為一個(gè)樣本數(shù)據(jù)。對(duì)于神經(jīng)網(wǎng)絡(luò)的倒數(shù)第二層,筆者選用神經(jīng)元個(gè)數(shù)為5的全連接神經(jīng)網(wǎng)絡(luò),再通過(guò)最后一層softmax層獲得樣本各個(gè)類別的可能性值,例如(0.2,0.2,0.5,0.05,0.05),如圖4右圖。最后通過(guò)樣本預(yù)測(cè)的類別(例如張量(0.2,0.2,0.5,0.05,0.05))與樣本的真實(shí)的類別(例如張量(1.0,0.0,0.0,0.0,0.0))的交叉熵作為模型的損失函數(shù)來(lái)優(yōu)化模型。

圖4 神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)示意圖(圖片來(lái)源:作者自繪)

通過(guò)設(shè)定好生成規(guī)則的建筑形體生成器和分層圖像采樣操作,共獲得了基本型形體、中庭型形體、U型形體、L型形體和并列型形體各4000個(gè),其中每種形體的一層、二層、三層、四層建筑各1000個(gè)。通過(guò)9:1的比例劃分訓(xùn)練集和測(cè)試集。經(jīng)過(guò)200代的訓(xùn)練,神經(jīng)網(wǎng)絡(luò)的訓(xùn)練集和測(cè)試機(jī)的準(zhǔn)確率均可以達(dá)到95%以上。

3.3 實(shí)驗(yàn)結(jié)果驗(yàn)證與分析

可以看到,訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型對(duì)于特定規(guī)則下生成的建筑形體,能夠很好地識(shí)別。為了驗(yàn)證模型的泛化能力,驗(yàn)證集選用了一批其他規(guī)則生成的建筑形體,例如擁有多個(gè)中庭的中庭型形體、發(fā)生偏轉(zhuǎn)的L型形體、多個(gè)建筑形體的U型形體、分散布置的并列型形體(如圖5)。

圖5 驗(yàn)證集測(cè)試結(jié)果(圖片來(lái)源:作者自繪)

如圖5所示,神經(jīng)網(wǎng)絡(luò)模型對(duì)于只有一種形體特征的建筑形體識(shí)別比較準(zhǔn)確,但是對(duì)于具有多個(gè)特征組合的建筑形體并不能很好地識(shí)別。在圖5倒數(shù)三個(gè)形體中,形體具有兩個(gè)特征,但是神經(jīng)網(wǎng)絡(luò)輸出的特征值只捕捉到了一個(gè)特征,而且是前兩層??赡苁怯?xùn)練樣本中通過(guò)填充空白數(shù)據(jù)的操作使得模型對(duì)層數(shù)越低的建筑平面越敏感,也可能是模型訓(xùn)練的程度過(guò)高,過(guò)于擬合訓(xùn)練集的數(shù)據(jù)。這一問(wèn)題可以通過(guò)分層標(biāo)記的方法解決,例如圖5最后一個(gè)形體,可以將樣本標(biāo)記為基本型、基本型、并列型、并列型,通過(guò)訓(xùn)練多個(gè)分類器來(lái)實(shí)現(xiàn)對(duì)形體的更精確的識(shí)別。

4 討論

當(dāng)前在城市建設(shè)的過(guò)程中,缺乏一套可以對(duì)建筑三維形態(tài)特征的內(nèi)在規(guī)律進(jìn)行解讀的有效工具。通過(guò)影響視線、光照、通風(fēng)等,建筑形體不但直接決定了建筑外部空間的舒適,也決定了建筑內(nèi)部空間的合理性。城市數(shù)據(jù)模型不斷完善,但是對(duì)建筑形體進(jìn)行描述的相關(guān)數(shù)據(jù)仍是一塊空白。

可以看到,通過(guò)訓(xùn)練好卷積神經(jīng)網(wǎng)絡(luò)來(lái)識(shí)別建筑三維形體特征這一方法是可行的。采用基于規(guī)則生成的形體作為訓(xùn)練得到數(shù)據(jù)庫(kù),通過(guò)在Rhino中分層切片的操作,完成對(duì)三維形體的二維圖像轉(zhuǎn)換,再通過(guò)訓(xùn)練一個(gè)多分類的卷積神經(jīng)網(wǎng)絡(luò),就能得到一個(gè)分類模型。通過(guò)這個(gè)模型,可以對(duì)城市中的三維建筑形態(tài)進(jìn)行定量分析,也可以作為建筑師分析形體的輔助手段。通過(guò)對(duì)不同形體的量化分析,可以完善城市建筑的數(shù)字化信息聯(lián)合,為后續(xù)的研究提供可靠的支撐。

但是,本實(shí)驗(yàn)還存在一些不足。首先,模型的可靠程度取決于數(shù)據(jù)庫(kù)的多樣性,而本次數(shù)據(jù)庫(kù)的樣本種類目前還比較簡(jiǎn)單,以整體空間內(nèi)較少的樣本訓(xùn)練的模型去預(yù)測(cè)其他樣本的類別,存在風(fēng)險(xiǎn)。其次就是實(shí)際建筑的形體往往復(fù)雜多變,目前實(shí)驗(yàn)的建筑形體生成和描述的方式還比較簡(jiǎn)單,對(duì)于復(fù)雜形體生成和描述的規(guī)則仍值得考慮。最后就是多通道多卷積核的方式對(duì)通道之間的數(shù)據(jù)并不敏感,每次發(fā)生關(guān)聯(lián)的地方只在卷積操作時(shí)通道之間的拼接,可以考慮將二維卷積核換成三維卷積核。

猜你喜歡
形體卷積神經(jīng)網(wǎng)絡(luò)
基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
神經(jīng)網(wǎng)絡(luò)抑制無(wú)線通信干擾探究
電子制作(2019年19期)2019-11-23 08:42:00
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
基于傅里葉域卷積表示的目標(biāo)跟蹤算法
西夏文形體研究述略
西夏學(xué)(2017年2期)2017-10-24 05:35:08
雞霉形體
基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
早期形體訓(xùn)練對(duì)產(chǎn)婦產(chǎn)后形體恢復(fù)的積極效果
基于支持向量機(jī)回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
绥江县| 若羌县| 开阳县| 交城县| 吐鲁番市| 家居| 呈贡县| 门头沟区| 县级市| 天门市| 松阳县| 锦屏县| 甘德县| 渑池县| 榕江县| 贵州省| 阿坝县| 宁城县| 安图县| 延津县| 高要市| 隆回县| 慈溪市| 永吉县| 娄烦县| 紫云| 砚山县| 钟山县| 德兴市| 张家口市| 林口县| 丁青县| 望江县| 礼泉县| 安陆市| 邯郸县| 云和县| 武冈市| 双峰县| 炎陵县| 革吉县|